제안의 힘 : 데이터 카탈로그가 분석가에게 권한을 부여하는 방법

작가: Lewis Jackson
창조 날짜: 11 할 수있다 2021
업데이트 날짜: 1 칠월 2024
Anonim
안녕하세요
동영상: 안녕하세요

테이크 아웃 : 호스트 Rebecca Jozwiak는 Dez Blanchfield, Robin Bloor 및 David Crawford와 데이터 카탈로그의 장점에 대해 설명합니다.




비디오를 보려면이 이벤트에 등록해야합니다. 비디오를 보려면 등록하십시오.

레베카 요 즈윅 : 신사 숙녀 여러분 안녕하세요, 2016 년 Hot Technologies에 오신 것을 환영합니다. 오늘 우리는“제안의 힘 : 데이터 카탈로그가 분석가에게 힘을 실어주는 방법”을 얻었습니다. 저는 오늘 호스트 인 Eric Kavanagh를 위해 오늘 호스트 인 Rebecca Jozwiak입니다 전 세계를 여행하고 있으니 참여해 주셔서 감사합니다. 올해는 덥습니다. 텍사스의 뜨거운 날씨 일뿐만 아니라 온통 뜨겁습니다. 모든 종류의 신기술이 폭발적으로 폭발하고 있습니다. IoT, 스트리밍 데이터, 클라우드 채택, Hadoop은 계속 성숙하고 채택되었습니다. 우리는 자동화, 머신 러닝을 가지고 있으며이 모든 것은 물론 데이터에 밑줄을 긋습니다. 그리고 오늘날 기업들은 점점 더 많은 데이터를 주도하고 있습니다. 물론, 그 시점은 지식과 발견으로 이어지고 더 나은 결정을 내리는 것입니다. 그러나 실제로 데이터에서 최대한의 가치를 얻으려면 쉽게 얻을 수 있어야합니다. 기업 내부의 일부 사람들을 잠 그거나 매장하거나 뇌에두면 기업 전체에 큰 도움이되지 않습니다.

그리고 데이터 카탈로그와 라이브러리 과정에 대해 생각하고있었습니다. 오래 전에 그곳에서 무언가를 찾아야 할 경우, 주제를 연구하거나 정보를 찾아야하는 경우 도서관으로갔습니다. 물론 카드 카탈로그 나 그곳에서 일한 게비 아가씨에게갔습니다. 그러나 방황하는 것도 재미있었습니다.보고 싶었을 때, 뭔가 깔끔한 것을 발견했을 수도 있다는 사실을 알면 모르는 흥미로운 사실을 발견 할 수 있지만 실제로 무언가를 찾아야한다면 찾고 계신 것을 알고 카드 카탈로그가 필요하다는 것은 물론 엔터프라이즈 카탈로그는 데이터 카탈로그입니다.이 카탈로그는 사용자가 사람들의 정보를 풍부하게 찾고 발견하고 공유하고 소비하며 실제로 도울 수 있도록 모든 데이터를 밝게 비출 수 있도록 도와줍니다 더 빠르고 쉬운 데이터.


오늘 우리는 데이터 과학자 인 Dez Blanchfield를 얻었고, 수석 분석가 인 Robin Bloor 박사도 Alation에서 데이비드 크로포드 (David Crawford)를 데려갔습니다. Dez와 연결됩니다. 데즈, 나는 당신에게 공을 전달하고 바닥은 당신입니다.

데즈 블랑 필드 : 감사합니다, 오늘 저를 주셔서 감사합니다. 이것은 제가 매일 관심을 갖고있는 거의 모든 조직에서 프리 쇼 밴터에서 아주 간략하게 언급 한 것과 동일한 문제를 발견하기 때문에 매우 관심이있는 문제입니다. 몇 년 이상 사업을 해 온 대부분의 조직은 조직에 다양한 데이터가 묻혀 있으며 다른 형식을 가지고 있으며 실제로 Lotus Notes로 돌아가는 데이터 세트가있는 클라이언트가 있습니다. 의사 인터넷으로서의 사례, 그리고 그들 모두는 실제로 데이터의 위치와 접근 방법, 접근 방법, 접근시기, 접근 방법에 대한이 도전에 직면하고 있습니다. 카탈로그, 모든 사람이 이용할 수있는 장소로 가져가는 방법 : A) 무엇이 있는지, 무엇이 들어 있는지 알고, B), 그것에 접근하고 사용하는 방법. 물론 가장 큰 과제 중 하나는 문제를 찾는 것입니다. 다른 큰 문제는 그 안에 무엇이 있고 어떻게 액세스하는지 아는 것입니다.

나는 수십 개의 데이터베이스를 가지고 있다는 것을 잘 알고 있지만 실제로 거기에 무엇이 있는지, 무엇이 있는지 알아내는 방법을 알지 못합니다. 우리는 프리 쇼 데이터에서 지금 발견 할 때 항상 걷는 경향이 있습니다. 사무실 주변에서 질문을하고 입방체 벽을 가로 질러 소리를 지르고 시도하고 알아 내십시오. 종종 내 경험은 프론트 데스크, 리셉션으로 방황하고 다른 사람이 당신이 누구인지 알고 있는지 묻는 것입니다. 다시 이야기하러갑니다. 누군가가 방금 만들었 기 때문에 데이터 세트를 알지 못하기 때문에 항상 IT 전문가가되는 것은 아니며, IT 환경에 존재하는 일종의 프로젝트를 발견 할 수도 있습니다. 프로젝트 관리자는 모든 것의 스프레드 시트를 사용했으며 자산과 사기 및 이름에 관한 엄청난 양의 소중한 정보를 얻었습니다. 프로젝트를 알고 그 사람을 알지 못하면 그 정보를 찾을 수 없습니다. 사용할 수 없으며 원본 파일을 가져와야합니다.


데이터와 관련하여 혼란스러워지는 문구가 있는데 반드시 동의하지는 않지만, 약간의 유쾌한 생각이라고 생각합니다. 즉, 일정량의 사람들은 데이터가 새로운 석유라고 생각합니다. 나중에도 몇 가지 측면에서 그 내용을 다룰 것입니다. 그러나 내가 분명히 주목 한 것은, 그러한 변화의 일환으로, 데이터를 가치있게 평가하는 법을 배운 비즈니스 조직이 경쟁사보다 훨씬 유리하다는 점입니다.

약 5-6 년 전에 IBM의 흥미로운 논문이 있었으며 호주에서 약 4,000 개의 회사를 조사했으며 모든 정보, 모든 성능 데이터, 모든 재무 데이터를 가져와 끓는 냄비에 넣었습니다. 그것을 호주 경제 대학에 보냈는데, 그들은 실제로 여기에서 일반적인 추세를 시작했습니다. 그리고 그것은 기술을 활용 한 회사들이 경쟁자들이 거의 따라 올 수없는 동료들과 경쟁사들에 비해 항상 경쟁 우위를 얻었고, 저는 생각합니다. 우리가 사람들이 가지고있는 데이터를 찾고, 데이터를 사용 가능하게하고, 아주 쉽게 소모품으로 사용할 수있게하는 방법을 명확하게 파악한 조직에서 사람들이 디지털 혁신이라고 부르는 것을 본 데이터의 경우가 매우 그렇습니다. 조직에 필요한 이유를 항상 알 필요없이 항상 조직에 패션을 제공하고 경쟁사에 비해 상당한 이점을 얻습니다.

이 슬라이드에는 몇 가지 예가 있습니다. 내 생각에 거의 모든 산업 부문에서 대규모의 혼란이 데이터에 의해 주도되고 있으며 현재 추세가 진행되어야 할 경우 내 견해는 오랜 브랜드가 마침내 이것이 의미하는 바에 도달하여 게임에 진입 할 때, 그들은 도매로 게임에 들어갈 것이기 때문에 시작되었습니다. 많은 데이터를 보유한 주요 소매 업체가 데이터에 대한 과거 분석을 적용하기 시작했을 때 데이터가 존재한다는 사실을 알고 있으면 일부 온라인 플레이어가 약간의 모닝콜을 받게됩니다.

그러나이 브랜드의 대부분을 통해 세계에서 가장 큰 택시 회사 인 Uber가 있습니다. 택시를 소유하지 않아서 마술처럼 만드는 것은 무엇이며 데이터는 무엇입니까? 가장 큰 숙박 시설 제공 업체 인 에어 비앤비에는 세계에서 가장 큰 전화 회사 인 WeChat이 있지만 실제 인프라와 송수화기, 전화선이 없습니다. 지구상에서 가장 큰 소매상 인 알리바바는 재고를 가지고 있지 않습니다. 단어에서 가장 큰 미디어 회사입니다. 마지막으로 지금은 14 억 명의 활성 데이터 사용자가 있다고 생각합니다. 근처에 있지는 않습니다. 누군가 지구의 1/4이 실제로 매일 거기에 있다고 주장하지만 실제로는 콘텐츠를 만들지 않는 콘텐츠 제공 업체가 있습니다. 제공하는 모든 데이터는 해당 콘텐츠에 의해 생성되지 않습니다. 가입자와 우리 모두이 모델을 알고 있습니다.

당신이 듣거나 듣지 못한 SocietyOne은 지역 브랜드입니다. 저는 몇몇 국가에서 실제로 P2P 대출을하는 은행이라고 생각합니다. 즉, 돈이 없습니다. 트랜잭션을 관리하고 그 아래에 데이터를 저장하기 만하면됩니다. Netflix는 모두 매우 익숙합니다. 여기에 흥미로운 원 라이너가 있습니다. Netflix가 호주에서 합법적으로 사용될 수 있었을 때 공식적으로 발표되었을 때 VPN을 사용할 필요가 없었으며 전 세계의 많은 사람들이 현지 지역에서 VPN을 이용할 수없는 경우 Netfix는 호주에서 시작하여 인터넷 링크의 국제 대역폭을 40 % 증가 시켰습니다. 따라서 호주는 인터넷 사용률을 거의 하루 만 두 배로 늘 렸습니다. 단 하나의 응용 프로그램, 즉 데이터를 가지고 노는 클라우드 호스팅 응용 프로그램 하나만있었습니다. 그냥 마음을 흔들리는 통계 일뿐입니다.

물론 우리는 모두 애플과 구글에 친숙하지만, 세계에서 가장 큰 소프트웨어 기업이지만 실제로 앱을 작성하지는 않습니다. 이 모든 조직과 일관된 것은 무엇입니까? 글쎄요, 데이터입니다. 데이터가 어디에 있는지 몰랐고 카탈로그를 작성하는 방법을 몰랐기 때문에 데이터를 얻지 못했습니다.

우리가 지금 찾고있는 것은 데이터라고하는 완전히 새로운 자산 클래스가 있고 회사가 깨어나고 있다는 것입니다. 그러나 그들은 항상 모든 데이터를 매핑하고 모든 데이터를 카탈로그 화하고 사용 가능하게 만드는 도구와 노하우 및 그 방법을 가지고 있지는 않지만 물리적 자산이 거의없는 회사는 기록적인 시간에 높은 시장 가치를 얻었습니다. 이 새로운 데이터 자산 클래스를 통해. 내가 말했듯이, 일부 오래된 플레이어는 이제 깨어 났고 확실히 이끌어 내고 있습니다.

나는 여정을 조금만 여행하는 사람들의 열렬한 팬입니다. 그래서 18 백에서 1800 년대 후반에 미국 시장에서 이것에 대해 더 많이 알게 될 것입니다. 매년 약 10 년마다 그 시점에서 그것들을 운영했다고 생각하지만, 매년 인구 조사를한다면 실제로 데이터 분석을하는 데 최대 8 년에서 9 년이 걸릴 수 있습니다. 그 데이터 세트는 종이에있는 상자에 남아 있었고 거의 아무도 그것을 찾을 수 없었습니다. 그들은이 보고서를 계속 펌핑했지만 실제 데이터를 얻기가 매우 어려웠으며, 1940 년대 2 차 세계 대전과 함께 또 다른 중요한 순간과 비슷한 상황을 겪었으며 Bletchley Park Bombe는 BOMBE라는 철자를 사용했습니다. 작은 데이터 세트를 통해 신호를 찾아 Enigma를 통해 코드를 해독하는 데 사용되는 엄청난 수의 분석 도구였습니다.

다시 말하지만 본질적으로 데이터를 카탈로그 화하지는 않지만 데이터에 태그를 지정하고 매핑하고 데이터 세트 내에서 패턴을 찾아서 찾을 수있게하는 장치입니다.이 경우 코드를 구분하고 키와 구를 찾아서 찾을 수 있습니다. 데이터 세트에서 정기적으로 데이터를 검색하므로 데이터에서 사물을 찾고 데이터 카탈로그 화로 이어지는 여정을 거쳤습니다.

그리고 이런 것들이 등장했습니다.이 거대한 저비용 랙 머신은 바로 기성품 머신입니다. 그리고 우리는 매우 흥미로운 일을했습니다. 그리고 그들과 함께 한 일 중 하나는 지구를 색인 할 수있는 매우 저렴한 비용의 클러스터, 그리고 매우 유명해진 유명 브랜드이지만 Google의 가장 일반적인 집입니다. 우리 모두가 들어 본 브랜드 – 실제 동사가되고 브랜드가 동사가되면 성공한다는 것을 알게됩니다. 그러나 Google이 비즈니스 세계에서 실현하지 못한 채 지구 전체를 특정 수준으로 색인화하고 전 세계의 데이터를 카탈로그 화하여 매우 쉽게 사용할 수 있다는 점에서 작은 한 줄짜리 수식으로 된 편리한 양식, 거의 아무것도 포함하지 않는 웹 페이지, 쿼리를 입력하면 이미 행성을 크롤링하고 색인을 생성하고 쉽게 사용할 수 있기 때문에 찾아서 찾습니다.

그리고 우리가 알아 차린 것은“글쎄요, 우리는 조직에서 이것을하지 않습니다. 왜 그렇습니까? 왜 지구 전체를 매핑하고 색인을 생성하고, 크롤링하고 색인을 생성하고, 사용 가능하게 만들고, 검색 한 다음, 찾을 대상을 클릭하여 어떻게 찾을 수있는 조직이 필요한가? 전 세계적으로 인트라넷을 위해 무언가를하는 작은 랙들이 많이 있지만, 여전히 전통적인 웹 페이지를 뛰어 넘는 아이디어에 사로 잡히고 있습니다. 또는 파일 서버.

이제이 차세대 데이터 카탈로그에 여러 가지 방법으로 들어가는 대신 포스트잇 노트와 워터 쿨러 대화를 통해 데이터 액세스를 발견하는 것이 더 이상 데이터 검색 및 카탈로그에 적합한 방법이 아니며 실제로는 실제로 그렇게 생각하지 않습니다. . 우리는 더 이상 메모를 전달하고 메모를 게시하고 채팅하는 사람들에게 그 모든 도전을 이끌 수 없습니다. 우리는 데이터 카탈로그 화에 대한 차세대 접근 방식이 등장한 영역을 뛰어 넘고 있습니다. 우리는 팔을 그 주위에 두어야합니다. 이것이 쉬운 문제라면 이미 여러 가지 방법으로 해결했을 것이지만, 쉬운 문제는 아니라고 생각합니다. 데이터를 인덱싱하고 호출하는 것만으로도 데이터의 일부를 파악하고 메타 데이터를 구축 할 수 있습니다. 우리가 발견 한 내용을 중심으로, 특히 셀프 서비스 및 분석을 위해 쉽고 소비 가능한 형태로 제공합니다. 여전히 해결해야 할 문제이지만 5 년 동안 퍼즐의 많은 부분이 잘 해결되고 사용 가능합니다.

아시다시피, 데이터를 분류하는 인간은 데이터 처리에서 다루는 가장 큰 악몽 중 하나이기 때문에 데이터를 분류하는 것은 실패의 레시피이며, 제 생각에 종이 양식을 작성하는 사람은 아마도 가장 악몽 인이 주제에 대해 정기적으로 이야기합니다. 우리는 빅 데이터 및 분석을 다루고, 날짜와 필드와 같은 간단한 것, 잘못된 형식으로 사람들이하는 일까지 지속적으로 수정해야합니다.

그러나 내가 말했듯이, 인터넷 검색 엔진이 매일 전 세계에서 색인을 생성하는 것을 보았으므로 이제는 검색 프로세스에서 비즈니스 데이터 세트에서 수행 할 수 있으며 도구 및 시스템이 현재 가능하다는 아이디어를 얻었습니다. 오늘 배우려고 할 때 쉽게 이용할 수 있습니다. 실제로 제 생각에는 트릭은 작업에 가장 적합한 도구 인 올바른 도구를 선택하는 것입니다. 그리고 그보다 더 적절하게,이 경로를 시작하는 데 도움이되는 올바른 부분을 찾으십시오. 오늘 우리는 그 소식을 듣게 될 것이라고 믿지만, 그렇게하기 전에 저는 대학 인 Robin Bloor로 가서 주제에 대한 그의 이야기를들을 것입니다. 로빈, 너에게 넘겨 줄 수있어?

로빈 블로어 : 네, 물론 가능합니다. 이것이 작동하는지 봅시다. 네, 그렇습니다. 알았어요. 저는 Dez와는 다른 방향에서 왔습니다.하지만 같은 장소에있게됩니다. 이것은 데이터 연결에 관한 것이므로 데이터 연결의 실제 지점을 실제로 살펴 보겠다고 생각했습니다.

데이터가 그 어느 때보 다 단편화되었다는 사실이 있습니다. 데이터의 양이 엄청나게 증가하고 있지만 실제로는 서로 다른 데이터 소스도 놀라운 속도로 증가하고 있으므로 데이터는 항상 조각화되고 있습니다. 그러나 특히 분석 응용 프로그램 때문에 이러한 응용 프로그램이 유일한 응용 프로그램은 아닙니다. 우리는이 모든 데이터에 연결해야 할 충분한 이유를 얻었으므로 어려운 장소에 갇혀 있으며 조각난 데이터의 세계에 갇혀 있습니다. 데즈가 새로운 석유라고 부르면서 데이터에 기회가 있습니다.

데이터에 관해서는 파일 시스템이나 데이터베이스에서 회전하는 디스크에 살았습니다. 이제는 훨씬 더 다양한 환경에, 파일 시스템에 있지만, 현재 Hadoop 인스턴스 또는 Spark 인스턴스에도 있습니다. 여러 종류의 데이터베이스에 있습니다. 얼마 전까지 만해도 관계형 데이터베이스를 표준화했습니다. 문서 데이터베이스가 필요하고 그래프 데이터베이스가 필요하기 때문에 지난 5 년 동안 창을 열었습니다. 변경되었습니다. 따라서 회전하는 디스크에서 살았지만 이제는 SSD에서 살았습니다. 최신 SSD의 양 – 확실히 최신 SSD 장치는 삼성에서 나옵니다 – 20 기가 바이트 – 이것은 엄청납니다. 이제 데이터의 주요 사본이 디스크가 아닌 메모리에있을 수 있다는 점에서 메모리에 있습니다. 우리는 그런 시스템을 구축하는 데 사용하지 않았습니다. 우리는 지금한다. 그리고 그것은 구름 속에 산다. 즉, 클라우드에서 이러한 것들 중 하나에 살 수 있음을 의미합니다. 클라우드에서 클라우드의 위치를 ​​반드시 알 필요는 없으며 주소 만 있습니다.

하둡은 지금까지 확장 가능한 데이터 저장소로 실패했다. 우리는 확장 가능한 스케일 아웃 데이터 저장소가되기를 바랐으며 모든 것을위한 하나의 파일 시스템이 될 것입니다. 무지개는 하늘에 기본적으로 나타나고 유니콘은 춤을 추며 그 어느 것도 일어나지 않았습니다. 즉, 데이터 전송 문제가 발생하고 데이터 전송이 필요하지 않지만 때때로 어려움도 있습니다. 수 테라 바이트의 데이터를 가져 와서 데이터를 집어 던지고 던지거나 네트워크에 대기 시간이 나타나거나 다양한 장소에 나타나게되면 데이터는 오늘날 중력을 가지고 있습니다. 데이터를 전송하려는 경우 타이밍이 중요합니다. 요즘에는 항상 한 장소에서 다른 장소로 하나의 데이터를 가져 오는 데 걸리는 시간에 대한 제한이 거의 있습니다. 예전에는 기계가 유휴 상태 일 때 배치 창으로 생각했던 적이 있었으며 데이터의 양에 관계없이 그냥 버릴 수 있었고 모든 것이 잘 작동했습니다. 우리는 훨씬 더 실시간 세계에 살고 있습니다. 따라서 타이밍이 중요합니다. 데이터를 이동하려는 즉시 데이터에 중력이 있으면 이동할 수 없습니다.

데이터 관리는 실제로이 모든 데이터를 관리해야한다는 의미에서 무료로 얻을 수 없으며 실제로 필요한 작업을 수행하기 위해 데이터를 가져 오려면 복제가 필요할 수 있습니다. 어디에 두지 마십시오. 정상적인 데이터 처리를 수행하기에 충분한 자원이 없을 수 있습니다. 따라서 데이터가 복제되고 데이터가 생각보다 많이 복제됩니다. 누군가 오래 전에 나에게 평균 데이터 조각이 적어도 2.5 배 복제되었다고 말했습니다. ESB 또는 Kafka는 데이터 흐름에 대한 옵션을 제공하지만 오늘날에는 아키텍처가 필요합니다. 요즘에는 실제로 데이터를 던지는 것이 무엇을 의미하는지에 대해 어떤 식 으로든 생각해야합니다. 따라서 실제로 데이터에 액세스 할 때 필요한 성능을 얻을 수있는 한 일반적으로 데이터에 액세스하는 것이 바람직합니다. 어쨌든 어려운 상황입니다. 데이터 쿼리의 관점에서, 우리는 SQL의 관점에서 생각할 수있었습니다. 우리는 이제 다른 쿼리의 형태, SQL을 알고 있습니다. 그러나 인접한, 또한 그래프 쿼리입니다. , 또한 검색을 수행해야했기 때문에 정규 표현식 검색 (패턴에 대한 복잡한 검색 및 실제 패턴 일치)이 실제로 발생하고 있습니다. 그리고 그들은 당신이 찾고있는 것을 얻거나 당신이 찾고있는 것을 얻을 수 있기 때문에 모두 유용합니다.

요즘 쿼리는 여러 데이터에 걸쳐 있으므로 항상 그렇게하지는 않았으며 종종 그렇게하면 성능이 저하됩니다. 따라서 상황에 따라 다르지만 사람들은 여러 데이터 소스에서 데이터를 쿼리 할 수 ​​있기를 기대하므로 한 종류 이상의 데이터 연합이 점점 더 최신 화되고 있습니다. 성능에 따라 다른 방식으로 수행하는 데이터 가상화도 매우 일반적입니다. 데이터 쿼리는 실제로 전체 프로세스가 아닌 프로세스의 일부입니다. 실제로 분석 성능을보고있는 경우 상황에 따라 실제 분석에 소요되는 시간이 데이터 수집보다 훨씬 오래 걸릴 수 있지만, 원하는 경우 데이터 쿼리가 절대적으로 필요하다는 점을 지적 할 가치가 있습니다. 여러 데이터 소스에 대한 분석이 필요합니다. 실제로는 실제로 확장 가능한 기능이 있어야합니다.

카탈로그에 대해서는카탈로그는 어떤 이유로 존재합니다. 최소한 우리는 디렉토리를 가지고 있고 데이터베이스에 스키마를 가지고 있으며 각 카탈로그를 가지고 있으며 어디를 가든 한 곳을 찾을 수 있고 실제로는 어떤 종류의 카탈로그가 있으며, 통합 된 글로벌 카탈로그는 분명히 좋은 아이디어입니다. 그러나 그런 회사는 거의 없습니다. 나는 이천 년-이천 공황-다시 공산주의자들이 얼마나 많은 실행 파일을 고정시킬 수 없었으며, 얼마나 많은 다른 데이터 저장소가 있었는지 신경 쓰지 않았 음을 기억합니다. 대부분의 회사는 글로벌 의미에서 어떤 데이터를 가지고 있는지 적극적으로 알지 못합니다. 그러나 실제로 글로벌 카탈로그를 보유해야하거나 데이터 소스의 증가와 지속적인 응용 프로그램 증가로 인해 발생하는 상황에 대한 글로벌 이미지를 확보하는 것이 점점 더 필요 해지고 있으며 특히 분석에 필요합니다. 한 가지 방법으로도 데이터 계보 및 문제와 같은 다른 문제가 있으며 보안을 위해 필요한 데이터 거버넌스의 여러 측면, 필요한 데이터가 무엇인지 모른다면 그것은 터무니없는 그것을 지배하려고합니다. 따라서 모든 데이터가 어떤 식 으로든 카탈로그 화되는 것은 사실 일뿐입니다. 문제는 카탈로그가 일관성이 있는지 여부와 실제로 카탈로그로 할 수있는 작업입니다. 그래서 저는 레베카로 돌아가겠습니다.

레베카 요 즈윅 : 알았어 고마워 로빈 다음으로 우리는 Alation에서 David Crawford를 얻었습니다. David 저는 공을 당신에게 넘겨주었습니다.

데이비드 크로포드 : 정말 고맙습니다. 이 쇼에 참여 해주셔서 감사합니다. 나는 이것이 시작될 것이라고 생각한다. 그래서 나의 역할은, 그 이론의 일부를 취하여 그것이 실제로 어떻게 적용되는지, 그리고 우리가 실제 고객을 이끌어 낼 수있는 결과를 보는 것입니다. 슬라이드에서 몇 가지를 살펴보면, 분석적으로 개선 할 수있는 결과에 대해 이야기하고 싶습니다. 토론에 동기를 부여하기 위해 우리는 그들이 어떻게 거기에 도달했는지 이야기 할 것입니다. 저는 정말 똑똑한 많은 사람들과 이러한 고객들과 긴밀히 협력하게되어서 운이 좋으며, 실제로 측정 할 수있는 소수의 사람들을 지적하고 데이터 카탈로그가 분석가에게 어떤 영향을 미치는지 이야기하고 싶습니다. 워크 플로우. 그리고 간단히 앞을 유지하기 위해 데이터 카탈로그와 이전의 중재 된 솔루션을 비교하면서 변화가 보이는 것 중 하나와 관계가 우리가 결합한 솔루션에 대해 실제로 생각하는 방식 중 하나는 분석가로부터 시작하는 것이라고 생각합니다. 거꾸로 작업하십시오. 말하자면, 분석가의 생산성 향상에 대해 설명하겠습니다. 컴플라이언스 또는 인벤토리를 보유하는 것이 아니라 분석가의 생산성을 높이는 도구를 만들고 있습니다.

금융 서비스 회사 스퀘어의 데이터 과학자와 대화 할 때, Nick이 한 사람이 있는데, 그의 방법에 대해 이야기 한 그는 보고서를 시작하기 위해 올바른 데이터 세트를 찾기 위해 몇 시간이 걸렸습니다. 시장 점유율에서 검색을 사용하여 몇 초 만에 검색을 수행 한 결과, Square를 사용하는 분석가를 끌어 내고 실례하고 Alation을 사용하는 분석가를 대상으로 CTO와 대화를 나 their습니다. 생산성 향상과 세계 최고의 소매 업체 중 하나 인 eBay는 정기적으로 SQL 분석을 수행하는 수천 명 이상의 직원을 보유하고 있으며 Deb Says와 밀접하게 협력하고 있습니다. 데이터 도구 팀의 관리자 인 그녀는 질의자가 Alation을 채택하고 카탈로그를 채택 할 때 데이터베이스에 대해 새 쿼리를 작성하는 속도가 두 배가되는 것을 발견했습니다.

이것이 실제 결과이며, 이들은 실제로 조직에 카탈로그를 적용하는 사람들이며, 설정하는 데 필요한 작업을 안내하고자합니다. 회사에서 카탈로그를 구축하는 방법과 가장 중요한 것은 자동으로 많은 일이 발생하기 때문에 Dez는 시스템에 대해 이야기하고 시스템에 대해 배우며 이것이 바로 현대 데이터 카탈로그가하는 일입니다. 따라서 데이터 센터에 Alation을 설치 한 다음 데이터 환경의 다양한 메타 데이터 소스에 연결합니다. 데이터베이스와 BI 도구에 중점을 두겠습니다. 기본적으로 존재하는 것에 대한 기술 메타 데이터를 추출 할 것입니다. 그렇다면 어떤 테이블입니까? 어떤 보고서? 보고서 정의 란 무엇입니까? 따라서 해당 기술 메타 데이터를 추출하고 해당 시스템 내부의 모든 개체에 대해 카탈로그 페이지가 자동으로 생성 된 다음 해당 기술 메타 데이터를 추출하여 사용 데이터 위에 계층화합니다. 이는 주로 데이터베이스에서 쿼리 로그를 읽음으로써 이루어지며 이는 매우 흥미로운 정보 소스입니다. 따라서 분석가가 쿼리를 작성할 때마다,보고 도구, 집에서 자라고 있는지 또는 선반에서, 대시 보드를 업데이트하기 위해보고 도구가 쿼리를 실행하는지 여부, 응용 프로그램에서 쿼리를 실행하여 데이터를 삽입 할 때 데이터 세트 –이 모든 것이 데이터베이스 쿼리 로그에 캡처됩니다. 카탈로그 유무에 관계없이 데이터베이스와 함께 쿼리 로그에 카탈로그가 캡처됩니다. 데이터 카탈로그가 수행 할 수있는 작업, 특히 Alations 카탈로그가 수행 할 수있는 작업은 해당 로그를 읽고 내부 쿼리를 요청한 후 해당 로그를 기반으로하는 흥미로운 사용 그래프를 작성하여 향후 사용자에게 알리기 위해 사용합니다. 과거 데이터 사용자가 사용한 데이터에 대한

그래서 우리는 모든 지식을 하나의 카탈로그로 가져오고, 이것을 실제로 구현하기 위해 이미 고객에게 배포 된 통합입니다. 따라서 Oracle, Teradata, Redshift, Vertica 및 기타 여러 가지를 보았습니다. 관계형 데이터베이스. Hadoop 세계에는 Hadoop 파일 시스템, Impala, Tez, Presto 및 Hive 위에 Hadoop에 대한 다양한 SQL, 관계형 메타 저장소가 있으며 Altiscale과 같은 클라우드 Hadoop 개인 공급자도 성공했습니다. 또한 Tableau Server, MicroStrategy 서버에 연결하고 대시 보드를 색인화하고 Plotly와 같은 데이터 과학 차트 도구와 통합 할 수있었습니다.

우리는이 모든 시스템에 연결하고,이 시스템을 고객에게 연결하고, 기술 메타 데이터를 가져 왔으며, 사용 데이터를 가져 왔으며, 데이터 카탈로그를 자동으로 프라이밍했습니다. 지식을 중앙 집중화하지만 데이터 카탈로그로 사물을 중앙 집중화하는 것만으로는 eBay, Square 및 시장 점유율에서 우리가 이야기 한 놀라운 생산성 향상을 제공하지 않습니다. 그러기 위해서는 실제로 분석가에게 지식을 전달하는 방식을 바꿔야합니다. 이를 준비하기 위해 질문 한 질문 중 하나는 "카탈로그가 실제로 분석가의 워크 플로에 어떤 영향을 줍니까?"였습니다.

그것이 우리가 하루 종일 생각하는 것에 대한 것이며, 생각의 변화에 ​​대해 이야기하기 위해, 풀 모델에 대한 푸시 구절에 대해 이야기하기 위해, 나는 Kindle에서 읽은 전후에 세계가 어떻게 생겼는지에 대해 빨리 비유하고 싶었습니다. 실제 책을 읽을 때 단어를 발견했을 때 단어의 정의를 잘 알고 있는지 확실하지 않은 경우, 당신은 아마 당신이 아닌 사기로부터 추측 할 수 있습니다. 소파에서 일어나 책장으로 걸어 가서 사전을 찾아서 먼지를 털어 내고 알파벳 순서의 단어 목록에서 올바른 위치로 뒤집어 놓을 것입니다. 그것의 뉘앙스. 따라서 실제로 일어나지 않습니다. 그래서 Kindle 앱을 구입하면 거기에서 책을 읽기 시작하고, 확실하지 않은 단어가 표시되고 단어를 터치합니다. 같은 화면에서 갑자기 모든 단어의 뉘앙스와 사용 예가 다른 단어의 사전 정의이며 약간 살짝 밀면 해당 주제에 대한 Wikipedia 기사가 표시됩니다. 다른 언어 나 다른 언어로 번역 할 수있는 번역 도구를 얻습니다. 갑자기 그 언어에 대한 지식이 훨씬 풍부 해져서 갈 때와 비교했을 때 엄청난 횟수로 발생합니다. 그 자료를 직접 가져 오십시오.

그리고 제가 논의하고자하는 것은 분석가의 워크 플로와 분석가가 데이터 문서를 다루는 방식은 실제로 독자가 사전과 상호 작용하는 방식, 물리적 인 것, 또는 Kindle과 우리가 실제로 생산성 향상을 본 방식은 카탈로그를 유출하지 않고 분석가의 워크 플로에 연결하는 것이므로 여기에서 데모를 해달라고 요청했습니다. 이 프레젠테이션의 초점을 맞추겠습니다. 그러나 나는 단지 데모에 대한 사기를 설정하고 싶다. 사용자가 필요할 때 데이터 지식을 사용자에게 제공하는 것에 대해 생각할 때 올바른 시간, 시간을 보내는 장소 및 분석을 수행하는 장소는 SQL 쿼리 도구라고 생각합니다. SQL 쿼리를 작성하고 실행하는 장소입니다. 그래서 우리는 하나를 만들고 그것을 만들었고 다른 쿼리 도구와 다른 점은 데이터 카탈로그와의 긴밀한 통합입니다.

우리의 쿼리 도구는 Alation Compose입니다. 웹 기반 쿼리 도구이며 잠시 후에 보여 드리겠습니다. 이전 슬라이드에서 보았던 모든 데이터베이스 로고에서 작동하는 웹 기반 쿼리 도구입니다. 특히 데모를 시도하려는 것은 카탈로그 정보가 사용자에게 제공되는 방식입니다. 그리고이 세 가지 다른 방식으로 진행됩니다. 데이터 관리자, 데이터 관리자, 어떤 식 으로든 관리자 또는 관리자 인 누군가가 다음과 같이 말할 수 있습니다. 워크 플로를 통해 적절한시기에 사용자에게 전달해야합니다. "

현명한 제안은 도구가 카탈로그에 대한 모든 집계 된 지식을 사용하여 사용자가 작성하는 쿼리의 개체 및 부분을 제안하는 방법입니다. 알아야 할 가장 중요한 점은 실제로 쿼리 로그를 활용하여 사용을 기반으로 제안하고 이전에 작성된 쿼리의 일부를 찾는 것입니다. 그리고 잘 보여주세요.

그리고 미리보기. 미리보기는 객체 이름을 입력 할 때 카탈로그가 알고있는 모든 것 또는 카탈로그가 해당 객체에 대해 알고있는 가장 관련성이 높은 것을 보여줍니다. 따라서 이전에 사용했던 데이터 샘플, 해당 객체의 논리적 이름 및 설명은 요청하지 않아도 데이터를 작성하는 동안 모두 나옵니다.

더 이상 이야기하지 않고 데모로 이동하면 Im이 표시 될 때까지 기다립니다. 여기서 보여 드릴 것은 쿼리 도구입니다. 전용 SQL 작성 인터페이스입니다. 특정 의미에서 카탈로그와 별도의 인터페이스입니다. Dez와 Robin은 카탈로그에 대해 이야기했으며 Im은 카탈로그 인터페이스를 약간 넘어서서 워크 플로를 직접 서비스하는 방식으로 바로 옮겼습니다.

여기에 SQL을 입력 할 수있는 장소를 보여 주면 맨 아래에는 참조하는 객체에 대한 정보가 표시됩니다. 그래서 Im은 쿼리를 입력하기 시작하고 이러한 개입 중 하나에 도달하면 중단됩니다. "select"를 입력하면 연도를 원합니다. 나는 이름을 원한다. 그리고 나는 급여 데이터를 찾아 볼 것입니다. 이것이 교육 데이터 세트입니다. 그것은 고등 교육 기관에 대한 정보를 가지고 있으며,이 표 중 하나에서 평균 교수 급여를보고 있습니다.

그래서 저는 실제로“봉급”이라는 단어를 입력했습니다. 그것은 열의 이름에 정확히 그런식이 아닙니다. 논리적 메타 데이터와 물리적 메타 데이터를 모두 사용하여 제안을합니다. 제가 여기서 지적하고자하는 것은 여기에 나타나는 노란색 상자입니다. 이 열에 경고가 있습니다. 나는 그것을 찾지 않고이 데이터를 올바르게 사용하는 방법에 대한 수업을 들지 않았습니다. 그것은 나에게 왔으며,이 데이터와 관련된 기밀 유지 계약에 관한 경고가되었습니다. 따라서 몇 가지 공개 규칙이 있습니다. Im이이 데이터를 쿼리 할 경우이 테이블에서 데이터를 가져 오면이를 공개하는 방법에주의해야합니다. 여기 거버넌스 정책이 있습니다. Im이 데이터를보고있을 때 알고있을 때이 정책을 훨씬 쉽게 준수 할 수 있도록하는 몇 가지 준수 문제가 있습니다.

그래서 저에게 그런 생각이 들었습니다. 그리고 저는 또한 수업료를 볼 것입니다. 여기에서 미리보기가 시작됩니다. 이 수업료 열에는 기관 테이블에 수업료 열이 있고 그 프로필을보고 있습니다. Alation은 테이블에서 샘플 데이터를 가져 와서 가져옵니다.이 경우 꽤 흥미로운 것을 보여줍니다. 그것은 나에게 값의 분포를 보여 주며, 0 값은 샘플에서 45 번 나타 났으며 다른 값보다 더 많이 나왔다는 것을 보여줍니다. 따라서 데이터가 누락되었을 수 있습니다.

Im 고급 분석가라면 이미 워크 플로의 일부일 수 있습니다. 특히 Im이 특히 세심한 사람이라면 미리 프로파일 링 쿼리를 많이 할 것입니다. Im이 새로운 데이터에 접근 할 때마다 항상 데이터 범위가 무엇인지 생각합니다. 그러나 데이터 분석을 처음 사용하는 경우이 데이터 세트를 처음 사용하는 경우 열이 있으면 항상 채워져 있다고 가정 할 수 있습니다. 또는 채워지지 않으면 0이 아니거나 null 또는 이와 비슷한 것으로 가정 할 수 있습니다. 그러나이 경우 우리는 많은 영점을 가지고 있으며 평균을 사용하면 데이터가 누락 된 것이 아니라 실제로 0이 있다고 가정하면 아마도 잘못되었을 것입니다.

그러나 Alation은이 미리보기를 워크 플로에 가져 와서이 정보를 살펴보고 초보 분석가에게 해당 데이터에 대해 알아볼 사항이 있는지 확인할 수있는 기회를 제공합니다. 미리보기가 있습니다.

다음으로해야 할 일은이 정보를 얻을 테이블을 찾는 것입니다. 그래서 우리는 현명한 제안을 봅니다. 그것은 항상 가고 있었지만 특히 여기에는 아무것도 입력하지 않았지만이 쿼리에 사용할 테이블을 제안 할 것입니다. 그리고 이것에 대해 알아야 할 가장 중요한 것은 사용 통계를 활용한다는 것입니다. 예를 들어, eBay와 같은 환경에서 단일 데이터베이스에 수십만 개의 테이블이 있고, 겨에서 밀을 칠 수있는 도구를 사용하고 이러한 통계를 사용하는 것이 실제로 중요합니다. 뭔가 가치있는 제안.

그래서이 표를 제안 할 것입니다. 미리보기를 볼 때 실제로 쿼리에서 이미 언급 한 세 개의 열을 강조 표시합니다. 그래서 세 개가 있지만 이름이 없다는 것을 알고 있습니다. 이름을 알아야하므로 조인을하려고합니다. 조인을 수행하면 이제 다시 미리 볼 수 있도록 이름을 가진 테이블이 있습니다. 그래서이 이름은 형식이 좋고, 대문자로 된 이름을 가지고 있습니다. 각 기관의 이름을 가진 하나의 행이있는 것처럼 보이므로 Im을 가져 가려고합니다. 이제 가입 조건이 필요합니다.

그리고 여기서 Alation이하고있는 일은 쿼리 로그를 다시 살펴보고이 두 테이블이 조인 된 이전 시간을보고 조인하는 다른 방법을 제안하는 것입니다. 다시 한번, 약간의 개입이 있습니다. 이 중 하나를 보면 집계 분석에만 사용해야한다는 경고가 표시됩니다. 기관별로 기관을 통해 무언가를 시도하면 잘못 될 수 있습니다. 반면, OPE ID를 가진 것은 대학 수준의 데이터를 원할 경우이 두 테이블을 조인하는 올바른 방법으로 승인됩니다. 그래서 나는 그것과 짧은 쿼리를하지만, 실제로 데이터가 무엇인지에 대한 통찰력이 없어도 쿼리를 작성했습니다. 필자는 실제로이 데이터 세트의 ER 다이어그램을 본 적이 없지만 관련 정보가 나에게 오기 때문에 이미이 데이터에 대해 많은 것을 알고 있습니다.

따라서 이러한 기능은 카탈로그가 통합 쿼리 도구를 통해 쿼리 작성시 워크 플로에 직접 영향을 미치는 세 가지 방법 중 하나입니다. 그러나 쿼리 도구를 카탈로그와 통합하면 얻을 수있는 또 다른 이점 중 하나는 쿼리를 마치고 저장하면 "기관 수업료 및 교수 급여"와 같은 제목을 넣을 수 있다는 것입니다. 카탈로그에 게시 할 수 있습니다. 이것을 다시 피드백하는 것이 매우 쉬워졌습니다. 게시하지 않아도 쿼리 로그의 일부로 캡처되지만 게시하면 실제로 모든 데이터 지식이 존재하는 중앙 위치의 일부가됩니다.

따라서 Alation의 모든 쿼리 검색을 클릭하면 Im이 표시됩니다. 여기에 카탈로그 인터페이스가 더 있습니다. 전체 쿼리 검색 방법을 보여주는 전용 쿼리 검색으로 이동했습니다. 그리고 새로 게시 된 쿼리가 맨 위에 있다는 것을 알 수 있습니다. 쿼리를 캡처 할 때 저자도 캡처 할 수 있습니다. 저자 인 저와 지금 알고있는 데이터 개체간에 이러한 관계를 설정합니다. 그리고이 쿼리와 이러한 데이터 개체에 대해 전문가로 설립되었습니다. 사람들이 데이터에 대해 배우고 갈 필요가있을 때 정말 도움이됩니다. 그러면 배우기에 적합한 사람을 찾을 수 있습니다. 그리고 Im이 고급 분석가이든, 고급 분석가이든, 실제로 데이터에 익숙하지 않은 사용자는 이것을보고 새로운 데이터 세트를 시작할 수있는 많은 예제를 볼 수 있습니다. SQL에 정통하지 않은 사람은 내가 활용할 수있는 보고서 인 미리 만들어진 쿼리를 찾을 수 있습니다.

Phil Mazanett의 SAT 평균 점수에 대한 설명입니다. 이것을 클릭하면 쿼리 자체에 대한 일종의 카탈로그 페이지가 나타납니다. 이 쿼리를 참조하는 작성된 기사에 대해 이야기하므로 사용법을 배우고 싶다면 읽어야 할 문서가 있습니다. 그리고 Compose 버튼을 클릭하여 쿼리 도구에서 열 수 있으며 편집하지 않고도 여기에서 직접 실행할 수 있습니다. 실제로, 간단한 보고서 작성 기능을 볼 수 있습니다. 여기서 쿼리 작성시 다음과 같은 템플릿 변수를 삽입 할 수 있습니다. 몇 가지 매개 변수.

그것이 제가 데모를 위해 가지고있는 것입니다. 슬라이드로 다시 전환하려고합니다.간단히 설명하자면, 데이터 관리자 인 관리자가 쿼리 도구에 표시되는 개체에 경고를 표시하여 Alation이 데이터 개체 사용에 대한 지식을 사용하여 현명한 제안을하는 방법, 가져 오는 방법을 보여주었습니다. 분석가가 특정 개체를 만질 때의 워크 플로를 개선하기위한 프로파일 링 및 기타 팁과 새로운 쿼리가 작성 될 때 이러한 종류의 모든 피드가 카탈로그로 다시 공급되는 방법에 대해 설명합니다.

분명히 회사를 대표하는 대변인입니다. 데이터 카탈로그에 대해 좋은 말을 할 것입니다. Safeway의 Kristie Allen은 고객 중 한 사람의 의견을 직접 듣고 싶다면 분석가 팀을 운영하고 마케팅 실험을 진행하기 위해 실제로 시계를 이겨야하는 시간과 전체적인 방법에 대한 멋진 이야기를합니다. 팀은 Alation을 사용하여 해당 프로젝트에서 매우 빠르게 협업하고 전환했습니다. 따라서이 bit.ly 링크를 따라 해당 스토리를 확인하거나 Alation이 데이터 카탈로그를 조직에 가져올 수있는 방법에 대해 조금만 듣고 싶다면 개인화 된 데모를 설정해 드리겠습니다. 고마워

레베카 요 즈윅 : 고마워, 데이비드 관객 Q & A로 돌아 가기 전에 Dez와 Robin에게 몇 가지 질문이 있는지 확인하십시오. 데즈, 먼저 가고 싶니?

데즈 블랑 필드 : 물론. 이 게시 된 쿼리 개념에 대한 아이디어를 작성 원본과 다시 연결하는 것을 좋아합니다. 나는 사내 앱 스토어에 대한이 아이디어의 오랜 챔피언이었으며 이것이 그것을 기반으로하는 정말 훌륭한 기초라고 생각합니다.

나는 당신이 이것을하는 것을보고있는 몇몇 조직들과 그들이 툴과 플랫폼을 활용하여 데이터를 발견하는 전체 여정에서 겪었던 성공 사례에 대해 약간의 통찰력을 얻었습니다. 내부 문화 및 행동 특성을 변화시킵니다. 이제 이러한 종류의 사내 앱 스토어를 다운로드 만하면 찾을 수있을뿐 아니라 실제로 그 지식을 유지하는 사람들과 함께 작은 커뮤니티를 개발할 수 있습니다.

데이비드 크로포드 : 네, 놀랐습니다. 우리는 과거 Adtech의 제품 관리자로서 이야기를 나눈 모든 고객들과 쿼리를 공유하는 것의 가치를 믿지만, 고객이 가장 먼저 이야기하는 첫 번째 것 중 하나에 대해 여전히 놀랐습니다. 그들이 Alation에서 얻는 가치.

저는 Invoice2go라는 고객 중 한 곳에서 쿼리 도구에 대한 사용자 테스트를하고 있었고, 비교적 새로운 제품 관리자를 보유하고 있다고 말했습니다. 그는 실제로 사용자 테스트 중에 프롬프트되지 않은 상태라고 말했습니다. 그리고 알 래스 (Alation)가 쉽게 할 수 있다는 점을 제외하고는 SQL도 마찬가지입니다.”물론 PM으로서 저는“무엇을했는지, 우리는 어떻게 했습니까?”라고 말했습니다. SQL로 빈 슬레이트로 시작하는 것은 매우 어려운 일이지만 기존 결과를 볼 수있는 기존 쿼리를 수정하면 다음과 같이 말할 수 있습니다. ,이 추가 열만 있으면됩니다. "또는"특정 범위의 날짜로 필터링해야합니다. "가 훨씬 쉬운 일입니다.

우리는 제품 관리자, 영업 운영 담당자, 픽업을 시작하고 항상 SQL을 배우고이 카탈로그를 사용하여 SQL을 배우기를 원하는 사람들과 같은 이러한 보조 역할을 보았습니다. 또한 많은 회사에서 일종의 오픈 소스를 시도하고 있음을 확인했습니다. 필자는 이러한 종류의 것들을 내부적으로 구축하여 쿼리를 추적하고 사용할 수있게 만들었으며 유용한 유용한 까다로운 디자인 문제가 있습니다. Hive에 작성된 모든 쿼리를 캡처하는 HiPal이라는 내부 도구가 있었지만 사용자가 올바른 방식으로 사용자를 방해하지 않으면 매우 긴 목록으로 끝납니다. 선택문. 그리고 쿼리가 나에게 유용한 지 또는 어떤 것이 좋은지 알아 내려고하는 사용자로서, 긴 select 문 목록을 살펴보면 거기에서 가치가없는 것을 얻는 데 훨씬 오래 걸릴 것입니다 처음부터 시작합니다. 우리는 올바른 것들을 앞으로 가져와 유용한 방법으로 제공하는 쿼리 카탈로그를 만드는 방법에 대해 매우 신중하게 생각했습니다.

데즈 블랑 필드 : 저는 우리 모두 아주 어린 나이부터 성인에 이르기까지 여러 가지 방법으로이 여정을 겪고 있다고 생각합니다. 많은 기술. 나는 개인적으로 코드를 자르는 법을 배우는 것과 똑같은 진짜 일을 겪었습니다. 저는 잡지를 읽은 다음 책을 훑어보고 특정 수준으로 공부 한 다음에 가서 더 많은 훈련과 교육을 받아야했습니다.

그러나 부주의하게도 나는 나 자신을 가르치고 잡지를 읽고 책을 읽고 다른 사람들의 프로그램을 자르고 코스를 갈 때조차도 다른 사람과 이야기하는 것만 큼 코스를 배우는 것으로 끝났다는 것을 알았습니다. 경험이있는 사람들. 그리고 데이터 분석에 적용한 흥미로운 발견은 기본적으로 동일한 견해를 보았 기 때문에 인간은 항상 똑똑합니다.

내가 정말로 이해하고 싶은 또 다른 것은 매우 높은 수준에서 많은 조직들이“그 시점에 도달하는 데 시간이 얼마나 걸립니까?”라고 묻는 것입니다. 사람들이 플랫폼을 사용할 때 시간 단위로 팁 포인트는 무엇입니까? 그들은 도구의 유형을 발견하기 시작했다? 사람들이이 일을 얼마나 빨리보고 있는지는 ROI에 대해 더 이상 걱정하지 않고 실제로 비즈니스 운영 방식을 바꾸고 있다는 사실을 깨닫는 순간 "a-ha"순간으로 바뀌는가? 그리고 그들은 잃어버린 예술을 발견했고, 정말 재미있는 일을 할 수있을 것으로 기대합니다.

데이비드 크로포드 : 네, 약간만 터치하면됩니다. 우리가 설치 될 때, 데이터 시스템에 직접 연결된 카탈로그에 대해 사람들이 좋아하는 좋은 것 중 하나는 페이지에서 채워야 할 곳에서 비워 둘 수 없다는 것입니다. 페이지. 그리고 이것은 빈 도구로 시작하여 문서화하려는 모든 것을위한 페이지를 작성해야하는 이전 데이터 솔루션의 경우에도 마찬가지입니다.

소프트웨어를 설치 한 후 며칠 안에 메타 데이터를 추출하여 많은 것들을 자동으로 문서화하기 때문에 툴에 80 % 이상의 데이터 환경을 담을 수 있습니다. 그런 다음 사람들이 도구를 사용하여 쿼리를 작성하자마자 자동으로 카탈로그에 다시 저장되어 표시되기 시작합니다.

나는 그것을 말하는데 지나치게 열망하고 싶지 않습니다. 나는 2 주가 한 달에 매우 보수적 인 추정치라고 생각합니다. 한 달에 2 주에서 한 달 동안, 실제로 돌아 서서 가치를 얻는 것처럼 느끼는 보수적 인 추정치, 지식을 공유하기 시작하고 데이터에 관한 정보를 찾을 수있는 것처럼 말입니다.

데즈 블랑 필드 : 생각할 때 정말 놀랍습니다. 효과적으로 인덱싱 및 카탈로그를 작성하는 일부 대규모 데이터 플랫폼이 제대로 구현 및 배포하고 제대로 작동하려면 최대 1 년이 소요될 수 있습니다.

Robin Bloor로 넘어 가기 전에 마지막으로 질문 한 것은 커넥터입니다. 나에게 즉시 튀어 나오는 것 중 하나는 분명히 모든 도전 과제가 정리되어 있다는 것입니다. 그래서 몇 가지 질문이 정말 빨리 있습니다. 하나, 커넥터는 얼마나 빨리 구현됩니까? 당연히 Oracle, Teradatas, DB2와 같은 가장 큰 플랫폼으로 시작해야합니다. 그러나 새로운 커넥터가 얼마나 정기적으로 제공되는지, 그리고 어느 정도의 처리 시간이 걸립니까? 표준 프레임 워크가 있다고 생각합니다. 그리고 당신은 얼마나 깊이 들어가 있습니까? 예를 들어, 전 세계의 Oracle 및 IBM, 심지어 Tereadata 및 가장 인기있는 최신 오픈 소스 플랫폼이 있습니다. 그들은 당신과 직접 일하고 있습니까? 스스로 발견하고 있습니까? 해당 플랫폼에 대한 내부 지식이 있어야합니까?

커넥터를 개발하는 것은 어떤 모습이며, 이러한 커넥터가 가능한 모든 것을 발견하도록 파트너쉽에 얼마나 깊이 관여하고 있습니까?

데이비드 크로포드 : 그래, 좋은 질문이다. 대부분 커넥터를 개발할 수 있다고 생각합니다. 우리는 더 젊은 신생 기업이었고 고객이 없었을 때 확실히했습니다. 내부 액세스 없이도 연결을 확실히 개발할 수 있습니다. 우리는 공개적으로 제공되지 않는 데이터 시스템에 대한 특별한 액세스 권한을 얻지 못하며 종종 내부 정보가 필요하지 않습니다. 우리는 데이터 시스템 자체가 이용할 수있는 메타 데이터 서비스를 이용합니다. 종종 그것들은 꽤 복잡하고 다루기가 어려울 수 있습니다. 특히 SQL Server가 쿼리 로그를 관리하는 방식, 몇 가지 다른 구성 및 실제로 작업 해야하는 것을 알고 있습니다. 올바르게 설정하려면 뉘앙스와 노브 및 다이얼을 이해해야하며, 그 전에 여러 번 수행 한 이후 고객과 함께 일하는 것입니다.

그러나 어느 정도까지는 사용 가능한 공개 API의 종류 또는 우리가 활용할 수있는 공개 인터페이스가 있습니다. 우리는 여러 회사와 파트너십을 맺고 있습니다. 대부분 인증의 근거이며, 우리가 일한다고 말하고 편안하게 테스트 할 수있는 리소스를 제공 할 수 있습니다. 때로는 플랫폼에 대한 초기 액세스 권한이 있는지 확인할 수도 있습니다. 우리는 새로운 버전으로 작업합니다.

새로운 연결을 바꾸려면 보수적 인 노력을 기울이고 6 주에서 2 개월을 다시 말해 보겠습니다. 그것은 얼마나 비슷한 지에 달려 있습니다. 따라서 일부 Postgre는 Redshift와 매우 유사하게 작동합니다. Redshift와 Vertica는 많은 세부 사항을 공유합니다. 그래서 우리는 그런 것들을 활용할 수 있습니다. 그러나 6 주에서 2 개월은 공정 할 것입니다.

또한 API도 제공합니다. – Alation을 메타 데이터 플랫폼으로 생각하기 때문에 사용할 수없는 것이 있으면 자동으로 손을 뻗어 커넥터를 직접 작성하여 시스템에 푸시 할 수있는 방법이 있습니다. 모든 것이 여전히 단일 검색 엔진에 집중되어 있습니다.

데즈 블랑 필드 : 환상적인. 알겠습니다. 그래서 그는 또한 많은 질문을 가지고 있기 때문에 로빈에게 그것을 넘겨 주려고했습니다. 남자 이름?

레베카 요 즈윅 : 로빈이 음소거 상태 일 수 있습니다.

데즈 블랑 필드 : 당신은 음소거에 자신을 얻었다.

로빈 블로어 : 그래 맞아. 죄송합니다. 나 자신을 음소거했습니다. 이것을 구현할 때 프로세스는 무엇입니까? 많은 곳에서 많은 데이터가있을 수 있기 때문에 궁금합니다. 어떻게 작동합니까?

데이비드 크로포드 : 그래 먼저 서버를 프로비저닝하고 네트워크 연결을 사용할 수 있는지 확인하고 포트가 열려 시스템에 실제로 액세스 할 수 있도록하는 일종의 IT 프로세스입니다. 그들은 모두 어떤 시스템으로 시작하고 싶은지 종종 알고 있습니다. 데이터 시스템 내부를 아는 것 – 때로는 도움이 될 것입니다. 시스템에있는 사용자의 수와 수를 사용하는 사용자를 이해하기 위해 쿼리 로그를 처음으로 살펴볼 수 있도록하십시오. 데이터베이스 위치에 수백 또는 수천 명의 사람들이있는 경우 실제로 로그인 위치를 알 수 없으므로 쿼리 로그에서 몇 개의 고유 사용자 계정이 있는지 확인할 수 있습니다. 실제로 한 달 안에 로그인하여 쿼리를 실행했습니다.

그래서 우리는 그것을 이용할 수 있지만 종종 가장 중요한 것들에서만 이용할 수 있습니다. 우리는 그것들을 설정하고 "우선 순위를 정하자"라고 말하는 과정을 거칩니다. 병렬로 발생할 수있는 다양한 활동이 있습니다. 쿼리 도구 사용 교육에 중점을 두었습니다. 일단 사람들이 쿼리 도구를 사용하기 시작하면, 우선 많은 사람들이 서로 다른 모든 시스템에 대한 단일 인터페이스라는 사실을 좋아합니다. 그들은 또한 웹 기반이며 원하지 않는 경우 설치를 포함하지 않는다는 사실을 좋아합니다. 보안 관점에서 볼 때 이들은 네트워크 관점에서 일종의 회사 IT 네트워크와 프로덕션 데이터 소스가있는 데이터 센터간에 단일 진입 점을 갖는 것을 좋아합니다. 따라서 Alation을 쿼리 도구로 설정하고 이러한 모든 시스템의 액세스 지점으로 Compose를 사용하기 시작합니다.

따라서 일단 교육이 진행되면 웹 기반 또는 서버 기반 쿼리 도구와 데스크톱에서 사용하는 도구와 웹 기반 도구의 차이점과 그 차이점에 대한 차이점을 이해해야합니다. 동시에 가장 유용한 정보는 가장 유용한 데이터를 식별하고 다시 쿼리 로그 정보를 활용하고“이봐, 사람들이이 정보를 이해하도록 도울 수 있습니다. 이 테이블에 대표 쿼리를 게시 할 수 있습니다.”때로는 사람들을 매우 빠르게 해내는 가장 효과적인 방법입니다. 자신의 검색어 기록을보고 이러한 내용을 게시하여 첫 번째 검색어로 표시되도록합니다. 사람들이 테이블 페이지를 보면 해당 테이블을 터치 한 모든 쿼리를 볼 수 있으며 거기서부터 시작할 수 있습니다. 그런 다음 제목과 설명을 이러한 개체에 추가하여 쉽게 찾고 검색 할 수 있으므로 사용 방법에 대한 뉘앙스를 알 수 있습니다.

계보를 생성 할 수 있도록 쿼리 로그를 철저히 검토해야합니다. 우리가하는 일 중 하나는 데이터가 한 테이블에서 다른 테이블로 이동할 때 쿼리 로그를 살펴 보는 것입니다. 그러면 데이터 테이블에 대해 가장 자주 묻는 질문 중 하나를 어디에서 얻을 수 있습니까? 그것을 어떻게 믿습니까? 그리고 우리가 보여줄 수있는 것은 어떤 다른 테이블에서 왔을뿐만 아니라 그 과정에서 어떻게 변환되었는지입니다. 다시 말하지만, 이것은 일종의 쿼리 로그에 의해 구동됩니다.

그래서 우리는 그러한 것들이 설정되고 시스템에 연계되어 있는지 확인하고, 테이블 페이지에서 설정할 수있는 가장 가치 있고 활용도가 높은 메타 데이터를 대상으로하므로 검색 할 때 유용한 것이 있습니다.

로빈 블로어 : 괜찮아. 다른 질문 – 청중으로부터 많은 질문이 있기 때문에 여기서 너무 많은 시간을 들이고 싶지 않습니다 – 다른 질문은 마음의 문제 일뿐입니다. 사람들이 어떤 식 으로든 무언가 어려움을 겪고 있기 때문에 많은 소프트웨어를 구입했습니다. 그렇다면 사람들을 알 레이션으로 이끄는 일반적인 고통은 무엇입니까?

데이비드 크로포드 : 네. 나는 몇 가지가 있다고 생각하지만, 우리가 자주 듣는 것 중 하나는 분석가 온 보딩이라고 생각합니다. "이 데이터에서 새로운 통찰력을 얻어야하는 단기적으로 10, 20, 30 명의 직원을 고용해야하는데 어떻게해야합니까?"분석가 온 보딩은 우리가 확실히 다루고있는 것입니다. 또한 수석 분석가가 다른 사람들의 데이터에 대한 질문에 대답하는 데 시간을 소비하지 않아도됩니다. 그것도 매우 빈번합니다. 그리고 둘 다 본질적으로 교육 문제입니다.

그리고 Alation을 채택한 사람들이 누군가가 일할 수있는 새로운 데이터 환경을 구축하고 싶을 때 또 다른 장소를 말하고 싶습니다. 사람들이 활용할 수 있도록 내부적으로이를 광고하고 마케팅하고 싶습니다. 그런 다음 Alation을 새로운 분석 환경의 프론트 엔드로 만드는 것은 매우 호소력이 있습니다. 문서를 얻었고 시스템에 대한 단일 액세스 지점을 제공하여 사람들이 우리에게 올 다른 곳을 소개했습니다.

로빈 블로어 : 좋아, 청중이 당신에게 다가가려고해서 레베카에게 전해 줄게

레베카 요 즈윅 : 예, 여기에는 정말 좋은 잠재 고객 질문이 많이 있습니다. 그리고 데이빗, 이건 특별히 당신에게 주어졌습니다. 사람들이 쿼리를 잘못 사용하는 것에 대해 약간의 경험을 가지고있는 것은 누군가로부터 왔습니다. 그는 우리가 사용자에게 권한을 부여할수록 컴퓨팅 리소스의 책임있는 사용을 통제하는 것이 더 어렵다고 말합니다. 따라서 잘못 안내되었지만 일반적인 검색어 문구가 전파되는 것을 막을 수 있습니까?

데이비드 크로포드 : 예,이 질문이 있습니다. 좋은 질문입니다. 자주 묻는 질문입니다. 사용자를 교육해야하는 이전 회사의 고통을 직접 목격했습니다. 예를 들어,“이 테이블은 로그 테이블이며 몇 년 동안 로그가 복원됩니다. 이 테이블에 쿼리를 작성하려면 날짜별로 제한해야합니다.”예를 들어, 이는 데이터베이스에 액세스하기 전에 이전 회사에서 진행 한 교육입니다.

이 문제를 해결하기 위해 몇 가지 방법이 있습니다. 쿼리 로그 데이터가이를 해결하는 데있어 고유 한 가치가 있다고 생각합니다. 데이터베이스가 쿼리 플래너를 사용하여 내부적으로 수행하는 작업과 다른 통찰력을 제공합니다. 그리고 우리가하는 일은 그러한 중재 중 하나입니다 – 우리는 제가 직접 보여준 수동 중재를 가지고 있습니다. 예를 들어 특정 조인에서 "이 기능을 사용하지 않습니다"라고 말할 수 있습니다. 스마트 제안에 표시되면 큰 붉은 깃발이 나타납니다. 이것이 사람들에게 접근하는 한 가지 방법입니다.

우리가하는 또 다른 일은 실행 시간 개입시 자동화됩니다. 실제로 쿼리를 실행하기 전에 쿼리의 구문 분석 트리를 사용합니다. 여기에는 특정 필터 또는 다른 몇 가지 작업이 포함되어 있습니다. 그러나 가장 귀중한 것들 중 하나이며 설명하기 가장 간단한 것은 필터가 포함되어 있습니까? 방금 제공 한 예와 같이이 로그 테이블은 쿼리하려는 경우 날짜 범위를 가져야하는 경우 표 페이지에서 해당 날짜 범위 필터를 적용하도록 지정할 수 있습니다. 누군가가 해당 필터를 포함하지 않는 쿼리를 실행하려고하면 실제로 큰 경고로 필터를 중지 시키며 "이러한 SQL을 쿼리에 추가해야합니다."라고 말합니다. . 실제로 쿼리를 사용하는 것을 완전히 금지하지는 않을 것입니다. 쿼리도 결국에는 쿼리를 실행해야합니다. 그러나 우리는 그들 앞에 꽤 큰 장벽을 두었고 성능을 향상시키기 위해 쿼리를 수정하기위한 구체적으로 적용 가능한 제안을 제안합니다.

또한 실제로는 쿼리 로그를 관찰하여 자동으로 수행하는 경우도 있습니다. 이 테이블에 대한 쿼리의 실제 비율이 특정 필터 또는 특정 조인 절을 활용한다는 것을 알면 실제로 해당 팝업을 표시합니다. 이를 중재에 홍보하십시오. 실제로 내부 데이터 세트에서 발생했습니다. 우리는 고객 데이터를 가지고 있으며, 사용자 ID는 있지만, 사용자 ID 세트는 모든 고객마다 사용자 ID를 가지고 있습니다. 고유하지 않으므로 고유 한 조인 키를 얻으려면 클라이언트 ID와 쌍을 이루어야합니다.그리고 쿼리를 작성하고 있는데 무언가를 분석하려고했는데 팝업이 나타났습니다.“다른 사람들은 모두 클라이언트 ID와 사용자 ID로이 테이블을 조인하는 것 같습니다. 당신은 그렇게하고 싶지 않습니까?”그리고 그것은 실제로 잘못된 분석을하지 못하게했습니다. 따라서 분석의 정확성과 성능 모두에서 작동합니다. 이것이 우리가 그 문제를 어떻게 해결하는지에 대한 것입니다.

레베카 요 즈윅 : 그것은 효과적이라고 생각합니다. 당신은 사람들이 자원을 낭비하는 것을 반드시 막지는 않을 것이라고 말했지만, 그들이하는 일이 최선이 아닐 수도 있다는 것을 그들에게 가르쳐 주었습니까?

데이비드 크로포드 : 우리는 항상 사용자가 악의적이지 않다고 가정하고 최선의 의도를 제시합니다.

레베카 요 즈윅 : 괜찮아. 또 다른 질문이 있습니다.“솔루션과 같은 카탈로그 관리자와 MDM 도구의 차이점은 무엇입니까? 또는 MDM은 자동으로 수행하지만 메타 데이터 수집의 기본 원칙은 동일하지만 쿼리 테이블의 선택 범위를 넓히면 실제로 다른 주체에 의존합니까? "

데이비드 크로포드 : 예, 전통적인 MDM 솔루션을 볼 때 가장 큰 차이점은 철학적 솔루션이라고 생각합니다. 사용자가 누구인지에 관한 것입니다. 프레젠테이션의 시작 부분에서 언급 한 것처럼 Alation, 우리가 창립했을 때 분석가가 더 많은 통찰력을 생성하고 더 빠르게 생성하며 더 정확한 통찰력을 얻을 수 있도록하는 목표를 가지고 설립 된 것 같습니다. 생산액. 나는 그것이 전통적인 MDM 솔루션의 목표라고 생각하지 않습니다. 이러한 솔루션은 SCC에 또는 내부적으로 다른 종류의 감사 목적으로 수집 된 데이터에 대한 보고서를 작성해야하는 사람들을 대상으로하는 경향이 있습니다. 때로는 분석가를 가능하게 할 수도 있지만, 실무자가 실무를 가능하게 할 경우 DBA와 같은 데이터 아키텍트를 활성화 할 가능성이 더 높습니다.

분석가의 입장에서 생각할 때 MDM 도구가 절대로하지 않는 쿼리 도구를 작성하기 시작합니다. 성능과 정확성뿐만 아니라 비즈니스 요구와 관련된 데이터를 이해하기 시작할 때입니다. 이 모든 것은 우리가 도구를 설계 할 때 우리 마음에 떠오르는 것입니다. 검색 알고리즘에 들어가고 카탈로그 페이지의 레이아웃에 들어가고 조직 전체의 지식을 제공 할 수 있습니다. 우리는 쿼리 도구를 구축하고 카탈로그를 직접 카탈로그에 구축했다는 사실에 들어갑니다. 어떤 사용자를 먼저 생각하십니까?

Rebecca Jozwiak : 좋습니다. 그것은 실제로 그것을 설명하는 데 도움이되었습니다. 그는 떠나야했기 때문에 기록 보관소를 얻기 위해 죽어 가고 있었지만 실제로 그의 질문에 대한 답변을 원했습니다. 그는 처음에는 여러 언어가 있다고 언급되었지만 SQL은 Compose 구성 요소 내에서 활용되는 유일한 언어입니까?

데이비드 크로포드 : 그렇습니다. 그리고 제가 알아 차 렸던 것 중 다른 유형의 데이터베이스, 문서 데이터베이스, 그래프 데이터베이스, 주요 가치 저장소의 폭발이 목격 한 것처럼 응용 프로그램 개발에 매우 ​​강력하다는 것입니다. 관계형 데이터베이스보다 더 나은 방법으로 특정 요구를 실제로 잘 처리 할 수 ​​있습니다.

그러나 데이터 분석으로 다시 가져 오거나 다시 가져올 때 – 임시보고 또는 데이터를 임시로 파기하려는 사람들에게 해당 정보를 제공하려는 경우 항상 관계형으로 돌아옵니다. 적어도 인간을위한 인터페이스. 그 중 일부는 SQL이 데이터 분석의 언어라는 용어이기 때문에 인간과 통합 도구에도 적용됩니다. 나는 이것이 Hadoop의 SQL이 인기가 있고 그것을 해결하려는 많은 시도가있는 이유라고 생각합니다. 결국 사람들이 알고있는 것이기 때문입니다. SQL을 작성하는 방법을 아는 사람은 수백만 명에 달하며 Mongo 집계 파이프 라인 프레임 워크 쿼리를 작성하는 방법을 아는 사람은 수백만 명에 달하지 않습니다. 또한 매우 다양한 플랫폼에서 통합하는 데 사용되는 표준 언어입니다. 따라서 대부분의 분석가가 사용하는 인터페이스이기 때문에 SQL 작성에 중점을 둔 곳은 특히 분석가가 사용하는 인터페이스이기 때문에 외부로 나가는 것이 매우 드물었습니다.

데이터 과학은 그들이 가장 외부에 투자하는 곳이라고 말하고, 그래서 우리는 Pig 나 SAS를 사용하는 것에 대해 가끔 질문을받습니다. 이것들은 Compose에서 확실히 다루지 않는 것들이며 카탈로그에서 캡처하고 싶습니다. 그리고 R과 Python도 보았습니다. 우리는 R 및 Python 스크립트 내부에서 Alation으로 작성된 쿼리를 사용할 수있는 인터페이스를 만들 수있는 몇 가지 방법이 있습니다. 따라서 데이터 과학자와 스크립팅 언어로 작업 할 때 소스 데이터가 관계형 인 경우가 종종 있기 때문에 데이터 베이스. SQL 쿼리로 시작한 다음 추가로 처리하고 R 및 Python 내에 그래프를 만듭니다. 또한 Alation에서 쿼리 또는 쿼리 결과를 가져 오는 스크립트로 가져올 수있는 패키지를 만들었으므로 혼합 워크 플로를 만들 수 있습니다.

레베카 요 즈윅 : 알았어 나는 시간의 정상을 약간 뛰어 넘었다는 것을 알고 있습니다. Im은 단지 하나 또는 두 가지 이상의 질문을 할 것입니다. 연결할 수있는 모든 다른 시스템에 대해 이야기했지만 외부 호스팅 데이터 및 내부 호스팅 데이터에 대해 단일 뷰에서 단일 플랫폼으로 검색 할 수 있습니까?

데이비드 크로포드 : 확실한. 몇 가지 방법이 있습니다. 내 말은, 외부 호스팅, 나는 상상할 수 있습니다, 나는 그것이 의미하는 바를 정확히 생각하려고합니다. 누군가가 AWS에서 호스팅하는 데이터베이스를 의미 할 수 있습니다. data.gov의 공개 데이터 소스를 의미 할 수 있습니다. 데이터베이스 계정으로 다른 응용 프로그램과 마찬가지로 로그인하여 메타 데이터를 추출하는 방법으로 데이터베이스에 직접 연결합니다. 따라서 계정이 있고 네트워크 포트가 열려 있으면 접속할 수 있습니다. 그리고 우리가 그러한 것들을 가지고 있지 않을 때, 우리는 가상 데이터 소스라고 불리는 것을 가지고 있습니다. 그것은 당신이 문서를 자동으로, 자신의 커넥터를 작성하거나, CSV 업로드처럼 문서를 작성함으로써 문서를 자동으로 밀어 넣을 수있게합니다. 내부 데이터와 함께 데이터. 그것은 모두 검색 엔진에 배치됩니다. 시스템 내부의 기사 및 기타 문서 및 대화 내에서 참조 가능합니다. 그래서 시스템에 직접 연결할 수 없을 때 처리하는 방식입니다.

레베카 요 즈윅 : 알겠습니다. 질문 하나만 더 드리겠습니다. 한 참석자는 "소스 데이터가 수정 될 때 소스 데이터가 업데이트 될 때 데이터 카탈로그의 내용을 어떻게 확인, 확인 또는 유지 관리해야합니까?"

데이비드 크로포드 : 예, 그 질문은 우리가 많이 얻습니다. 저는 우리가 생각하는 것과 같은 철학 중 하나를 생각합니다. 우리는 사용자가 악의적이라고 믿지 않습니다. 우리는 그들이 최고의 지식을 제공하려고 노력한다고 가정합니다. 그들은 데이터에 대해 고의적으로 사람들을 오도하지 않을 것입니다. 조직에서 문제가 발생하면 Alations가 올바른 도구가 아닐 수도 있습니다. 그러나 사용자가 좋은 의도를 가지고 있다고 생각하면 업데이트가 발생하는 곳으로 생각하고 일반적으로 우리가하는 일은 각 데이터 객체 또는 데이터의 각 섹션을 관리하는 관리자입니다. 또한 메타 데이터를 변경하면 해당 관리자에게 알릴 수 있으며이를 처리 할 수 ​​있습니다. 업데이트가 들어오는 것을 확인하고 확인합니다. 그들이 옳지 않다면, 돌아가서 수정하고 정보를 제공 할 수 있으며, 정보를 제공 한 사용자에게 다가 가서 배우도록 도울 수 있기를 바랍니다.

이것이 우리가 생각하는 기본 방식입니다. 이런 종류의 제안은 청중들과 경영진들에 의해 관리되므로 우리는 그 주변에 몇 가지 기능이 있습니다.

레베카 요 즈윅 : 알았어 그리고 사람들에게 Alation을 가장 잘 시작할 수있는 방법과 자세한 정보를 얻기 위해 구체적으로 어디를 갈 수 있는지 알려주십시오. 나는 당신이 한 비트를 공유한다는 것을 알고 있습니다. 그게 최고의 장소인가요?

데이비드 크로포드 : Alation.com/learnmore 좋은 방법이라고 생각합니다. 데모에 등록하기 위해 Alation.com 사이트에는 많은 훌륭한 리소스, 고객 백서 및 솔루션에 대한 뉴스가 있습니다. 그래서 시작하기에 좋은 곳이라고 생각합니다. 당신은 또한 수 .

레베카 요 즈윅 : 알았어 참석자 여러분, 오늘 모든 질문에 답하지 못한 경우 미안하지만, 그렇지 않은 경우 David 또는 그의 영업 팀 또는 Alation의 누군가에게 전달 될 것이므로 질문에 답변하고 Alation이 무엇인지 이해하는 데 도움을 줄 수 있습니다. 최선을 다하는 것.

그리고 여러분과 함께, 계속해서 서명하겠습니다. InsideAnalysis.com에서 언제든지 아카이브를 찾을 수 있습니다. Techopedia.com에서도 찾을 수 있습니다. 그들은 조금 더 빨리 업데이트되는 경향이 있으므로 반드시 확인하십시오. 오늘 David Crawford, Dez Blanchfield 및 Robin Boor에게 대단히 감사합니다. 훌륭한 웹 캐스트였습니다. 그걸로 작별 인사를하겠습니다. 고마워요 안녕.

데이비드 크로포드 : 감사합니다.