순방향 모멘텀 : 전통을 넘어서 관계형 이동

테이크 아웃 : 호스트 Eric Kavanaugh는 전문가 Dez Blanchfield, Robin Bloor 및 Bert Scalzo와 데이터베이스 기술의 혁신에 대해 논의합니다.

현재 로그인하지 않았습니다. 비디오를 보려면 로그인 또는 가입하십시오.

에릭 카바나 흐 : 신사 숙녀 여러분, 수요일은 동부 시간으로 수요일입니다. 저는 뉴 올리언즈에 있습니다. 여름이 다가옵니다. 더워요! 핫 테크놀로지의 시간입니다. 제 이름은 Eric Kavanagh입니다. 호스트입니다. Hot Technologies를 위해 여기서 공을 차려고합니다. 오늘의 주제는“전진 적 모멘텀 : 관계를 넘어 기존 관계로 전환”입니다. 여러분, 오늘 전화 상으로 데이터베이스 전문가 3 명을두고 있습니다. 따라서 어려운 질문은 부끄러워하지 않습니다. 우리는 오늘 당신에게 줄 좋은 콘텐츠를 많이 가지고 있습니다. 나에 대한 당신의 진실에 대한 자리가 충분합니다. 물론 올해는 덥습니다. 우리는 Techopedia의 친구들과 파트너쉽을 맺고있는이 쇼에서 최신 기술에 대해 이야기하고 있습니다. 우리는 오늘날 정보 관리의 기초로 나아가고 있습니다 (물론 데이터베이스). 우리는 여기에 어떻게 왔는지, 오늘 무슨 일이 일어나고 있는지, 앞으로 일어날 일에 대해 이야기 할 것입니다. 매우 흥미로운 것들이 많이 진행되고 있습니다.

분명히 우리는 데이터베이스 공간에서 심각한 혁신을 이루었습니다. 한동안은 조용했습니다. 비즈니스 분석가들과 이야기를 나누면 2005 년부터 2009 년 또는 '10 년 같은 해에 아마도 혁신 측면에서 너무 많은 일이 일어나지 않은 것 같습니다.그리고 갑자기 탈옥 등의 일이 일어 났고 이제는 흥미로운 일이 벌어지고 있습니다. 그것의 많은 것은 웹의 규모와 다른 흥미로운 일을하는 모든 멋진 웹 속성 때문입니다. 이것이 NoSQL 개념의 시작입니다. 그리고 그것은 두 가지 다른 것을 의미합니다. 그것은 SQL을 지원하지 않는 것처럼 SQL을 의미하지 않으며 SQL을 의미하는 것도 아닙니다. 일부 사람들이 사용한“NewSQL”이라는 용어가 있습니다. 그러나 SQL (Structured Query Language)은 실제로 기초이며 쿼리의 기초입니다.

그리고이 모든 NoSQL 엔진이 무슨 일이 있었는지 흥미 롭습니다. 글쎄, 그들은 나왔고 그것에 대해 많은 흥분이 있었고 몇 년 후 우리 모두 무엇을 듣기 시작 했습니까? 아, 하둡에 대한 SQL. 글쎄,이 회사들은 SQL 인터페이스를 NoSQL 툴에 집어 넣기 시작했으며, 프로그래밍 분야의 모든 사람들은 이것이 도전과 어려움을 겪고 있으며, 일부는 교차 와이어 등으로 이어질 것이라는 것을 알고 있습니다. 오늘 우리는 그 많은 것들에 대해 알아볼 것입니다.

3 명의 발표자가 있습니다. 텍사스에있는 로빈 블로어 인 시드니에서 데즈 블랜 필드가 전화를 걸었고, 버트 스칼 조도 텍사스에 있습니다. 우선, Dez Blanchfield로부터 듣겠습니다. 여러분, 우리는 #HotTech의 해시 태그에서 트윗 할 것이므로 웹 캐스트 콘솔의 Q & A 구성 요소 또는 채팅 창을 통해 의견이나 질문에 자유롭게 문의하십시오. 그리고 Dez Blanchfield와 함께 가져 가십시오.

데즈 블랑 필드 : 고마워, 에릭 안녕하세요 그래서 지난 10 년 동안 일어난 일에 대한 30,000 피트의 관점에서 장면을 설정하려고 노력할 것입니다. 데이터베이스 관리 시스템, 상업 또는 기술 관점의 영향 및 최근에 겪어 온 일부 트렌드를 통해 오늘날 우리가 주제와 관련한 대화로 이어질 수 있습니다.

여기의 표지 이미지는 모래 언덕이며, 그 위에 작은 모래 조각이 부는 바람이 있습니다. 그 결과, 모래 언덕은 한 공간에서 다른 공간으로 천천히 걸어갑니다. 그리고이 거대한 40, 50 피트 높이의 모래 산이 실제로 움직이는 놀라운 현상입니다. 그리고 그들은 매우 느리게 움직입니다. 그러나 그들은 확실히 움직입니다. 그리고 움직일 때, 그들은 풍경을 바꿉니다. 모래 언덕이 자연스러운 지역에서 시간을 보내면 볼만한 것이 있습니다. 언젠가 창 밖을 내다 볼 수 있고이 거대한 모래 산이 실제로 작은 작은 알갱이 자체로 움직였으며 바람이 천천히 한 곳에서 다른 곳으로 이동한다는 것을 깨달았습니다.

그리고 저는 여러면에서 그것이 꽤 오랫동안 데이터베이스 시스템의 세계라고 생각합니다. 아주 최근까지 아주 작은 모래 알갱이 형태의 작은 변화는 모래 언덕의 형태로 거대한 모래 산을 움직입니다. 지난 몇 년간 데이터베이스 플랫폼에 약간의 변화가 있었으며, 데이터베이스 시스템과 플랫폼 주변에서 중급의 메인 프레임을 통해 상당히 안정적이고 견고한 환경이었습니다. 그러나 최근에 우리는 상업적 요구와 기술 동인에게 상당히 중요한 일이 발생했습니다. 그 과정을 안내해 드리겠습니다.

데이터베이스의 기본 개념은 수년 동안 알고 있었지만 프리 쇼 밴터에서 들었 듯이 오늘 나와 연락하는 두 명의 전문가가 평생을 보냈다는 견해가 있습니다. 이 공간과 그들은 80 년대 초에 시작되었을 때 거기에 있다는 자랑거리를 공유하는 데 상당히 옳았습니다. 그러나 우리는 지난 10 년 동안이 엄청난 변화를 보았으며, Dr. Robin Bloor에게 전달하기 전에 우리를 빠르게 안내 할 것입니다.

우리는 이것을“더 크고, 더 좋고, 더 빠르고, 더 싼”경험이라고 부릅니다. 내가 말했듯이 데이터베이스의 정의가 변경되었습니다. 데이터베이스 플랫폼이 성능을 다루어야하는 환경과 기술 및 상업적 요구 사항도 바뀌 었습니다. 보다 복잡한 상업 또는보다 복잡한 기술 요구 사항을 처리하기위한 솔루션에 대한 수요가 증가했습니다. 제 생각에 실제로 의미하는 바를 정확히 살펴보면 90 년대가되었고 인터넷의 도입에 의해 데이터베이스 기술이 영향을 받았다는 것입니다. 규모. 우리는 단지 터미널 앞에 앉아있는 사람들에 대해 이야기하는 것이 아니라 원래 물리적 유형을 갖춘 텔레타이프 터미널과 종이에 132 개의 열이 나오는 텔레타이프 터미널과 비슷했습니다. 그런 다음 초기 녹색 화면 터미널, 키보드로 펀칭합니다.

그러나 우리 세계는 터미널과 직렬 케이블 또는 네트워크 케이블이 오랫동안 컴퓨터와 통신하고 있음을 알고 있습니다. 그런 다음 인터넷과 인터넷의 폭발적인 성장으로 인해 더 이상 컴퓨터에 연결하지 않아도됩니다. 데이터베이스 시스템에 가려면 웹 브라우저가 필요했습니다. 따라서 데이터베이스 기술은 세계를 색인화하는 데 사용 된 기본 검색 엔진 기술의 모든 규모를 처리하고 데이터베이스 형식 규모의 예에서 정보 색인을 저장하기 위해 극적으로 변화해야했습니다. 그리고 구글과 같은 사람들은 그것을 할 수있는 플랫폼을 제공했습니다. 그리고 모든 새로운 유형의 데이터베이스 스토리지와 쿼리 및 인덱싱이 생성되었습니다. 그리고 우리는 음악 사이트와 영화 사이트가 함께 왔습니다.

그리고 2000 년대에 우리는 닷컴 컴 붐을 보았고, 어떤 형태의 데이터베이스에 의해 구동되는 시스템을 사용하는 사람들이 훨씬 더 급격히 폭발했습니다. 이 단계에서 관계형 데이터베이스는 여전히 대부분의 부하를 처리하고 방금 더 큰 주석을 넣었으며 IBM 및 Sun 등의 사람들이 Unix 플랫폼을 실행하는 매우 중대형 시스템으로갔습니다. . 닷컴 컴 붐은 하드웨어, 성능 관점에서 일을 더 크고 빠르게 만들었고 데이터베이스 엔진에는 몇 가지 중요한 변화가 있었지만 더 좋은 점은 여전히 우리가 보았던 것과 같은 것이 었습니다. 장기.

그리고 우리는 웹 2.0 시대를 봤습니다. 그리고 갑자기 우리는 훨씬 더 간단한 데이터베이스 플랫폼을 필요로했고 수평 형태로 확장해야했기 때문에 엄청난 변화였습니다. 그리고 그것은 우리가 데이터베이스가 무엇인지에 대한 아이디어에 접근하는 방식에있어 중대한 변화였습니다. 우리는 여전히 제 생각에 여전히 따라 잡고 있습니다. 그리고 지금 우리는이 모든 문제를 다루고 있습니다. 저는 부정적인 의미가 아니라 긍정적 인 스핀, 우리가 빅 데이터라고 부르는 것에 대한이 논쟁, 그리고 엄청난 폭발이라고 말합니다. 저는 폭발을 의미합니다. 데이터베이스에 대해 이야기 할 때 우리가 가지고있는 옵션의 수와 관계형 쿼리 기능의 형태에 대한 그래프에서이 터무니없는 변화가 있습니다.

그리고 흥미롭게도 저는 개인적으로 빅 데이터가 실제로 빙산의 일각이라고 생각합니다. 우리는 빅 데이터의 영향과 현재 이용 가능한 선택 유형에 대해 약간 흥분하는 경향이 있습니다. 우리는 NoSQL 엔진, 그래프 엔진, 데이터를 던지고 처리 할 수있는 다양한 유형의 플랫폼을 모두 갖추고 있습니다. 사실, 오늘 우리와 함께있는 Eric Kavanagh와의 첫 대화 중 하나는 Apache Drill이라는 주제에 관한 대화였습니다. 모델 내부의 데이터 : 하드 드라이브에 저장된 원시 CSE 파일부터 페타 바이트 규모의 HDFS 파일 시스템에 이르기까지 모든 데이터. 또한 모든 종류의 흥미 진진한 식물의 구조화 및 비 구조화 데이터에 대한 SQL 스타일 쿼리를 수행 할 수 있습니다.

우리는“스마트 빌딩 (smart building)”을 보게 될 것입니다. 우리는 보안 및 열 관리를위한 스마트 빌딩을 가지고 있다고 생각하고 싶습니다. 그러나 저는 당신이 누구인지에 대해 더 많이 알고있는 스마트 빌딩에 대해 이야기하고 있습니다. 그리고 당신이 걸을 때, 그리고 현명한 일을 지능적으로 수행하는 방법을 알고있는 똑똑한 도시 (도시 수준의 전체 생태계)를 통해 그 수준에서 모든 종류의 깔끔한 작업을 수행합니다. 그리고 그 이상으로, 우리는 전 세계의 어느 누구도 완전히 파악했다고 생각하지 않는이 놀라운 것을 얻었습니다. 그것이 사물 인터넷의 형태입니다. 지난 10 년 동안이 모든 변화가 있었으며, 대략 20 년이 지나면 우리가 데이터베이스를 고려하는 세계에 영향을 미쳤습니다.

이를 가능하게하는 몇 가지 중요한 사항이 있습니다. 하드 드라이브 비용은 급격히 감소했으며, 여러 가지 방법으로 Hadoop 모델과 같은 일부 참조 아키텍처를 구동 할 수있게되었습니다. 많은 데이터를 가져 와서 많은 하드 드라이브에 분산 시켰습니다. 똑똑한 일을하세요. 그리고 실제로, 관계형 데이터베이스 또는 전통적인 DB 단위 모델에 대해 샤딩이 된 것입니다. 그리고 RAM은 매우 저렴 해져서 인 메모리와 같은 다른 레퍼런스 아키텍처로 플레이하고 매우 많은 양의 데이터를 파티셔닝하는 것과 같은 새로운 기회를 갖게되었습니다.

그리고 이것은 우리가 지금보고있는이 작은 그림을 보여주었습니다. 이것은 빅 데이터 환경에서 사용 가능한 플랫폼의 유형을 보여주는 다이어그램입니다. 그리고 읽기가 매우 어렵고 그 이유는 정보가 너무 많습니다. 모든 형태의 데이터베이스 시스템에 데이터를 넣고 쿼리하고 기존의 읽기-쓰기를 수행하는 방법에는 제조, 모델링 및 제조 옵션이 너무 많습니다. 또한 모든 표준을 준수하는 것은 아니며 실제로 기본 스타일 표준을 준수하는 사람은 거의 없지만 여전히 데이터베이스라고 생각합니다. ‘90 년대와 인터넷 규모에서 웹 2.0으로 전환 한 다음 빅 데이터를 통한 전체 성장으로 인해 의미하는 바에 대해 몇 가지 화면을 보여 드리도록하겠습니다. 이 빅 데이터 기술 풍경 그래프에 많은 옵션이있어 흥미 롭다고 생각되면 하나의 주요 카테고리를 살펴 보겠습니다.

마케팅 기술을 살펴 보겠습니다. 다음은 데이터베이스 관리 시스템 또는 mar-tech 공간 내의 데이터 관리를위한 옵션이므로 마케팅과 관련된 기술입니다. 이제 이것은 몇 년 전인 2011 년이었습니다. 5 년 전, 이것이 풍경의 모습입니다. 간단히 한 슬라이드로 돌아 가면, 오늘날의 데이터 환경은 데이터베이스 기술에 적용되는 다양한 브랜드와 제품에서 나타납니다. 이것이 바로 마케팅 기술에서 5 년 전의 한 분야의 모습입니다.

오늘의 견해로 가보면 이것이 겉 모습이며 완전히 뚫을 수 없습니다. 이 브랜드와 옵션의 벽일뿐 아니라 데이터베이스 클래스에 있다고 간주되는 다양한 소프트웨어 조합이 다양한 형태로 데이터를 캡처, 생성 또는 저장하고 검색 할 수 있습니다. 우리는 지금 매우 흥미롭고 용감한 시간을 보내고 있다고 생각합니다. 한때 당신은 주요 브랜드를 알 수 있었을 때 Oracle과 Informix, DB2 등에서 5-6 개의 다른 플랫폼을 알 수있었습니다. 약 20 년 전에 사용 가능한 모든 브랜드에 대한 전문가. 10 년 전에는 일부 브랜드가 떨어졌기 때문에 조금 더 쉬워졌으며 모든 브랜드가 닷컴 붐의 규모에 대처할 수있는 것은 아니었고 일부 회사는 막 파산했습니다.

오늘날 관계형 데이터베이스이든 지난 20 년 동안 우리가 알게 된 표준 데이터베이스 관리 플랫폼이든 관계없이 존재하는 모든 데이터베이스 기술에 대한 전문가가되는 것은 불가능합니다. 또는 Neo4j와 같은 최신 엔진 및 해당 유형과 같은 경우가 있습니다. 그래서 우리는 많은 옵션을 사용할 수있는 매우 용감한 세상에 들어서고 있으며 메모리 나 디스크에서 수평으로 플랫폼을 확장 할 수 있다고 생각합니다. 그러나 기술 및 비즈니스 의사 결정권자들은 기술 스택에 대해 매우 큰 결정을 내려야 할 필요가 있기 때문에 어려운시기라고 생각합니다. 18 개월 전은 더 흥미롭고 새로운 오픈 소스 데이터베이스 플랫폼에있어 무서운 숫자가 아닙니다. 그리고 플랫폼을 통합하기 시작하여 더욱 새롭고 흥미 진진 해졌습니다.

오늘이 모든 것이 전통적인 데이터베이스 플랫폼에 어떤 영향을 미쳤는지, 어떻게 대응하고 있는지, 그리고 기술 유형에 대해 대화를 나눌 것입니다. 이를 염두에두고 이제 로빈 블로어 박사에게 가서 통찰력을 얻으려고합니다. 로빈.

로빈 블로어 : 알았어, 고마워 예, 주제가 너무 큽니다. 데즈가 방금 보여준 삽화 중 하나를 조금만 먹었다면 은색 중 하나에 대해서만 긴 대화를 나눌 수 있습니다. 하지만 여러분은 데이터베이스를 사용할 수 있습니다. 저는 1980 년대부터 데이터베이스를 살펴 봤지만 모릅니다. 데이터베이스를 다른 방식으로 볼 수 있습니다. 그리고 제가 오늘 대화에 쏟을 것이라고 생각한 것 중 하나는 하드웨어 수준에서 파괴적인 일이 발생한 이유에 대해 이야기하는 것이 었습니다. 그리고 소프트웨어 수준에서도 실제로 많은 파괴적인 일이 발생했음을 명심해야합니다. 그래서 이것은 전체적인 그림이 아니라 하드웨어 일뿐입니다.

특히 오래 이야기하지 않았을뿐입니다. 하드웨어 사진 만주고 싶었습니다. 데이터베이스는 CPU, 메모리 및 디스크에 걸친 데이터 검색 기능이었으며 그 변화는 극적으로 변화하고 있습니다. 그리고 내가 말하는 이유는 실제로 한 일의 관점에서 데이터베이스를 이해하는 것을 배웠기 때문입니다. 실제로 CPU에있는 데이터와 메모리에서 CPU로 가져 오는 데이터 및 디스크에서 메모리로 가져 오는 데이터 및 CPU를 통한 데이터간에 대기 시간에 차이가 있습니다. 그리고 오래된 데이터베이스 아키텍처는 그 균형을 맞추려고했습니다. 그들은“이것은 매우 느리게 진행됩니다. 우리는 데이터를 디스크에 캐시하여 메모리에 저장합니다. 우리가 요청하는 데이터의 상당 부분이 이미 메모리에 있도록 정말 정확한 방식으로 시도하고 수행 할 것입니다. 그리고 실제로 가능한 빨리 데이터를 CPU에 전달할 것입니다.”

그리고 데이터베이스는 예전에는 소규모 클러스터 용으로 작성된 머신으로 작성되었습니다. 그리고 지금, 병렬 처리의 무지에 대해. 클러스터에서 약간의 성능을 얻으려면 여러 가지 작업을 동시에 수행해야합니다. 병렬 처리는 게임의 일부이며 현재와 같은 것은 아닙니다. 난 그냥 무슨 일이 있었는지 걸을 것입니다.

우선, 디스크. 디스크가 정말 끝났습니다. 데이터베이스와 관련하여 거의 끝났습니다. 데이터 보관에는 여러 가지 단점이 있으며 하둡에서 실행되는 매우 큰 데이터 레이크조차도 요즘 최악의 회전 디스크는 실행 가능할 것입니다. 실제로 디스크 회전의 문제점은 읽기 속도가 특별히 향상되지 않았다는 것입니다. CPU가 올라 가면서 무어의 법칙 속도는 6 년마다 더 빨라졌습니다. 그리고 기억은 일종의 깨달음을 얻었고, 그 두 사람은 합리적으로 속도를 맞추고 있었지만 완전히 매끄럽지는 않았지만 그렇게했습니다.

그러나 머리가 디스크 주위를 날아 다니는 디스크를 무작위로 읽습니다. 다른 것 외에는 물리적 인 움직임입니다. 디스크에서 임의 읽기를 수행하는 경우 메모리에서 읽는 속도와 비교할 때 디스크 속도가 엄청나게 느리므로 100,000 배 느립니다. 그리고 최근에 제가 깊이 살펴 봤던 대부분의 데이터베이스 아키텍처는 실제로 디스크에서 연속적으로 읽었습니다. 어떤 방법 으로든 디스크에서 가능한 한 많이 캐시하고 느린 장치를 꺼내 빠른 장치에 넣기를 원합니다. 그리고 당신이 할 수있는 많은 영리한 일들이 있지만 끝났습니다.

솔리드 스테이트 디스크 또는 플래시 드라이브는 실제로 회전 디스크를 매우 빠르게 대체하고 있습니다. 디스크에서 데이터가 구성되는 방식은 디스크 작동 방식에 따라 구성되기 때문에 다시 완전히 변경됩니다. 실제로 회전하는 표면을 가로 질러 움직이는 머리, 여러 회전하는 표면을 가로 질러 움직이는 여러 개의 머리에 관한 데이터입니다. 솔리드 스테이트 드라이브는 읽을 수있는 블록입니다. 첫 번째는 모든 기존 데이터베이스가 디스크 회전을 위해 설계되었으며 이제 SSD를 위해 다시 엔지니어링되고 있다는 것입니다. 새로운 데이터베이스가 가능할 수 있습니다. 지금 새 데이터베이스를 작성하는 사람은 회전 디스크를 무시하고 전혀 생각하지 않을 수 있습니다. 그러나 SSD의 주요 제조업체 인 삼성은 SSD가 실제로 무어의 법칙에 있다고 말합니다.

그것들은 디스크 회전보다 3-4 배 빠르지 만, 기본적으로 18 개월마다 훨씬 더 빨라질 것입니다. 속도는 두 배, 최대 약 6 년은 10 배입니다. 그러나 그것이 바로 그랬다면 잠시 후에 말씀 드리 겠지만, 그렇지 않습니다. 회전 디스크는 물론 보관 매체가되고 있습니다.

메모리에 대하여. 우선, RAM. CPU 당 RAM 간의 CPU 비율은 항상 증가하고 있습니다. 물론 어떤 방식 으로든 더 많은 속도를 제공 할 수 있습니다. 현재 보유하고있는 에이커의 메모리는 훨씬 더 많이 저장할 수 있기 때문입니다. 이것이 실제로하는 일은 MLTP 종류의 응용 프로그램 또는 임의 읽기 응용 프로그램에 대한 부담을 줄이는 것입니다. 이제 많은 메모리를 확보했기 때문에 더 쉽게 캐터링 할 수 있기 때문입니다. 메모리로 읽을 수 있습니다. 그러나 데이터 힙이 클수록 문제가 발생하므로 실제로는 큰 데이터가 그렇게 간단하지 않습니다.

그리고 인텔은 3D Xpoint를 갖춘 인텔과 위상 변화 메모리 인 PCM이라고 부르는 IBM을 통해 현재 SSD보다 10 배 이상 빠르다고 생각합니다. RAM과 같은 속도에 가깝습니다. 물론 저렴합니다. 이전에는 CPU, 메모리 및 디스크로 구성된이 데이터베이스 구조를 사용했으며 이제 4 계층 구조로 이동하고 있습니다. CPU, 메모리 또는 RAM, SSD보다 빠른 메모리, 비 휘발성 메모리, SSD가 있습니다. 그리고 이러한 새로운 기술은 비 휘발성입니다.

약 7 년 전에 발표 된 HP 멤 리스터가 아직 나오지 않았지만 아직 나타나지 않았습니다. 하지만 소문에 따르면 HP가 멤 리스터를 통해 게임을 약간 변경하게되므로 새로운 메모리 상황이 생겼습니다. 이것은 우리가 더 빠른 물건을 얻는 것과 같지 않습니다. 이것은 완전히 새로운 층을 가진 것과 같습니다. 그리고 SSD 액세스가 가능하다는 사실을 알게되었습니다. 여러 가지 회전 디스크가있는 경우를 제외하고는 회전 디스크를 병렬로 읽을 수 없습니다. 그러나 SSD 블록은 실제로 병렬로 읽을 수 있습니다. 병렬로 읽을 수 있기 때문에 단일 CPU에서 여러 프로세스에 걸쳐 여러 프로세스를 실제로 설정하고 SSD를 사용하면 간단한 읽기 속도보다 훨씬 빠릅니다.

그렇게하면 RAM 속도에 거의 도달 할 수있는 것으로 추정됩니다. 그리고 이것이 말하는 것은 메모리 아키텍처의 미래가 불분명하다는 것입니다. 현실은 다양한 주요 벤더들이 누구든지 하드웨어의 방향을 결정할 것이라고 생각합니다. 그러나 현재 시점에서 어디로 가는지 아무도 모릅니다. “어떤 일이 일어 날까 두려워하지 않습니다.”라고 말하는 일부 데이터베이스 엔지니어와 이야기를 나 they지만, 시작부터 최적화하는 방법을 모릅니다. 그리고 항상 그렇습니다. 흥미 롭습니다.

그리고 CPU가 있습니다. 멀티 코어 CPU는 단순한 멀티 코어 CPU가 아닙니다. 우리는 또한 L1, L2 및 L3 캐시, 특히 L3의 대량을 보유하고 있습니다. 거기에 많이 넣을 수 있습니다. 따라서 실제로 칩을 캐싱 매체로 사용할 수 있습니다. 그래서 게임이 바뀌 었습니다. 그리고 많은 공급 업체들이 실제로 벡터 처리 및 데이터 압축을 수행하여 CPU에서이 작업을 CPU로 드래그하여 CPU에서 훨씬 빠르게 진행되도록했습니다. 그렇다면 GPU가 장착 된 CPU가 분석 속도를 높이는 데 실제로 도움이된다는 사실을 알게됩니다. 그리고 그들은 특정 종류의 검색어에 매우 능숙합니다. 검색어에 따라 다릅니다.

CPU와 GPU가 장착 된 보드를 만들거나 AMD가 지금하고있는 것처럼 CPU와 GPU의 일종 인 APU를 생성합니다. 두 가지 기능을 모두 갖추고 있습니다. 이것은 다른 종류의 프로세서입니다. 그리고 인텔이 최근 발표 한 바에 따르면, 칩에 FPGA를 장착 할 것입니다. 그런 식으로 제 머리가 들어갔습니다.“어떻게 지구상에서 일어날까요?” CPU, GPU의 가능성과 CPU, FPGA의 가능성이 있습니다. 실제로 원하는 경우 동일한 보드에 CPU, GPU 및 FPGA를 넣을 수 있습니다. 실제로 어떻게 그런 식으로 운영 할 것인지는 모르겠지만 이와 같은 일을하는 회사는 알고 있으며 매우 빠른 쿼리 응답을 얻고 있습니다. 이것은 무시할 것이 아니며, 기존 벤더와 아마도 새로운 벤더가 사용할 것입니다. DBMS는 항상 병렬 이었지만 이제 병렬 가능성이 폭발적으로 확장되었습니다.이를 통해 다양한 방식으로 병렬화 할 수 있기 때문입니다.

마지막으로, 스케일 업 또는 스케일 아웃? 스케일 업은 실제로 가장 좋은 솔루션이지만 한 가지입니다. 하나의 노드에서 디스크의 CPU 및 메모리 성능을 절대적으로 최적화 할 수 있으면 노드 성능이 훨씬 향상됩니다. 더 적은 수의 노드를 사용하므로 더 저렴할 것입니다. 관리가 더 쉬워 질 것입니다. 안타깝게도 하드웨어에 의존하는 디자인이며 하드웨어가 변경됨에 따라 엔지니어가 하드웨어가 변경되는 속도만큼 빠르게 실행할 수 없다면 그렇게 할 수 없습니다. 또한 규모를 확장 할 때 어떤 작업을 수행할지에 대한 다양한 가정을하고 있기 때문에 작업 부하 문제가 발생합니다.

수평 확장, 즉 아키텍처가 수평 확장 전에 수평 확장을 강조하는 경우 실제로 두 가지를 모두 수행해야하는 경우 하나만 강조하면됩니다. 그러면 아키텍처가이를 처리하므로 네트워크 성능이 향상됩니다. 더 많은 노드가 있기 때문에 하드웨어 측면에서 비용이 많이 들지만 워크로드 문제가 적고 더 유연한 설계가 될 것입니다.

실제로 하드웨어 변경 사항을 모두 생각하면 손가락을 겨냥한 다음 어떻게 생각하는지에 대해 어떻게 생각하십니까? 그런 다음 데이터베이스 엔지니어는 최소한 저임금을 받는다는 것을 알고 있습니다. 따라서 하드웨어 계층 만 고려하면 데이터베이스 문제가 분명합니다. 이제이 모든 것을 버트에게 전달합니다.

에릭 카바나 흐 : 그게 다야! 버트?

버트 스 칼조 : 대단히 감사합니다. 이 슬라이드로 바로 들어가겠습니다. 나는 많은 슬라이드를 거쳐야하는데, 그들 중 상당수는 다소 빨리 갈 수 있습니다. 우리는이“순간 모멘텀 : 관계를 넘어 전통적인 관계”에 대해 이야기 할 것입니다. 더 이상 아버지의 데이터베이스가 아닙니다. 상황이 바뀌었고, 초기 연사가 말했듯이 지난 6-7 년 동안 풍경은 급격히 바뀌 었습니다.

나 자신은 80 년대 중반부터 데이터베이스 작업을 해왔다. Oracle, SQL Server, 벤치마킹 및 기타 몇 가지 사항에 대한 책을 썼습니다. “세상은 매우 빠르게 변하고 있습니다. 더 이상 크지 않을 것입니다. 그것은 느리게 치는 것입니다.”나는“적응하기 위해”추가했습니다. 그것은 Rupert Murdoch의 것입니다. 나는 이것이 사실이라고 정말로 믿는다. 10, 15, 20 년 전과 같은 방식으로 데이터베이스 작업을 수행 할 수 없습니다. 비즈니스가 원하는 방식으로해야합니다.

나는 내가 제시하고있는 것에 대해 약간의 일반적인 태도를 유지하려고 노력할 것이지만, 내가 말하고있는 대부분의 기능은 Oracle에서 발견되며 SQL Server, MySQL, MariaDB 및 기타 큰 기능에서 발견됩니다. 선수. 관계형 데이터베이스 혁명, 나는 이전 연설자들과 다시 동의합니다. 2010 년경을 보면, 빨간 경주 용 차에서 노란색 경주 용 차로갔습니다. 중대한 변화가 있었고 2020 년이되자 또 다른 급진적 인 변화가있을 것으로 믿습니다. 우리는 매우 흥미로운 시간에 있습니다.

자,이 슬라이드가 핵심입니다. 그래서 제가 그곳에 열쇠를 넣었습니다. 이 모든 변화가 진행되고 있으며 왼쪽에는 기술이 있고 오른쪽에는 비즈니스가 있습니다. 그리고 문제는 어느 것이 어느 원인이며 어느 것이 어느 것을지지하고 있는가입니다. 디스크가 다운되거나 디스크 크기가 커지고 새로운 유형의 디스크와 같은 하드웨어 변경 사항이 있으므로 이전 스피커에서 다루었습니다. 모든 최신 버전의 데이터베이스에서 메모리 가격이 떨어집니다. 그러나 오른쪽에는 데이터 보호 및 규정 준수, 데이터웨어 하우징, 비즈니스 인텔리전스, 분석, 필수 데이터 보존 기능이 있습니다. 방정식의 양변이 구동되고 방정식의 양변이이 모든 새로운 기능을 사용하게됩니다.

우선, 우리는 일반적인 SAS 회전 디스크를 얻었습니다. 현재 최대 10TB입니다. Western Digital의 HGST는 헬륨 드라이브라고 부르는 것을 보지 못했습니다. 현재 약 10 테라 바이트에 달합니다. 회전 디스크 비용이 꽤 낮아지고 있습니다. 앞에서 언급했듯이 최대 2 테라 바이트까지 솔리드 스테이트 디스크를 얻을 수 있지만 삼성은 20 테라 바이트 장치를 곧 출시 할 예정입니다. 비용이 합리화되고 있습니다. 내가 다른 것에 대해 이야기하지 않을 한 가지는 플래시 디스크의 개념입니다. PCIe, 즉 PCI Express와 NVMe는이 비 휘발성 메모리 표현에 대해 들어 본 적이 있거나 없을 수도 있습니다. 기본적으로 NVMe는 SAS 및 SATA를 대체 할 예정이며, 이는 무엇보다도 다른 통신 프로토콜입니다. 그러나이 디스크는 현재 최대 약 3TB입니다.

또한 일부 SAS 드라이브에는 표준 디스크를 사용하여 NVMe를 지원하는 SAS 또는 SATA와 다른 커넥터 인 U.2 커넥터가 제공되는 것으로 나타났습니다. 물론 디스크도 지원해야합니다. 그리고 M.2 커넥터가있는 SATA가 NVMe를 얻기 시작했습니다. 실제로 NVMe 플래시 디스크가 내장 된 노트북을 판매하는 노트북 공급 업체가 있으며, 이전에 사용했던 기술에 비해 비명을지를 것입니다.

많은 사람들이이 모든 섬광이 무엇인지 모릅니다. 오른쪽 하단을 보면 M.2의 예입니다. “음, 왼쪽에있는 mSATA 드라이브와 매우 비슷해 보입니다.”그러나 보시다시피, 핀과는 달리 두 개의 틈이 있고 조금 더 큽니다. 또한 M.2는 세 가지 크기로 제공 될 수 있습니다.

그런 다음 PCI Express 플래시와 NVMe 플래시가 있습니다. 이제 NVMe 플래시도 PCI Express이지만 PCI Express는 여전히 디스크 회전을 위해 작성된 SAS 또는 SATA 유형 컨트롤러 알고리즘이며 NVMe는 플래시를 위해 특별히 작성된 알고리즘 또는 기술입니다. 그리고 다시, 당신은이 모든 것을 보게 될 것입니다.

NVMe는 몇 가지를 제공합니다. 가장 큰 두 가지 개선 사항은 오른쪽 상단에서 대기 시간이 70 % 나 줄었다는 것입니다. 나는 실제로 그보다 더 높은 것을 보았습니다. 또한 오른쪽 하단에서 운영 체제가 NVMe 디스크와 통신 할 때 훨씬 적은 수준의 소프트웨어를 거치게됩니다. 기본적으로 운영 체제에 포함 된 NVMe 드라이버를 통해 미디어와 직접 통신합니다. 이 기술이 데이터베이스 세계를 근본적으로 바꾸는 데는 많은 이유가 있습니다.

많은 사람들이“음, NVMe는 얼마나 빠릅니까?”라고 말할 것입니다. 2004 년과 그 이전의 좋은 시절, 우리는 초당 300MB의 Ultra-320 SCSI를 가지고 있다면 흥분했습니다. 오늘날의 속도는 많은 사람들이 아마도 섬유 나 InfiniBand를 사용하는 것이며 아마도 그런 종류 일 것입니다. 오른쪽의 NVMe는 현재 기술이 끝나는 곳에서 시작합니다. 내가 얻는 것은 8 레인 링크가있는 PCI Express 3.0이 거의 8000에서 시작하며 최신 버전의 PCI Express, 버전 4 등이 올라 갈수록 올라갈 것입니다. NVMe는 위를 제외하고는 갈 곳이 없습니다.

자, 데이터베이스에서 어떤 변화가 있습니까? 이제 슬라이드의 오른쪽 상단에 기술이 등장했다고 생각하는 비즈니스 이유가 있습니다. 이 경우 데이터웨어 하우징과 필수 데이터 보존에 대한 규제 이유 때문에 데이터베이스가 압축을 시작하고 있습니다. 이제 일부 데이터베이스는 추가 기능으로 압축을 제공하고 일부는 표준에 기본 제공되는 압축을 제공합니다. 데이터베이스의 Enterprise Edition이라고 말하지만 Oracle과 같은 일부 데이터베이스는 더 나은 압축 버전을 가질 수 있습니다. 예를 들어 Exadata 플랫폼은 실제로 매우 특수한 압축을 지원할 수있는 하드웨어를 구축했으며 Exadata의 압축률은 40 배 압축률을 갖기 때문에 매우 중요합니다. 필자는 의무적 인 데이터 보존이라고 생각합니다. 사람들은 데이터를 더 오래 원합니다. 비즈니스는 분석 및 BI를 수행하기 위해 지난 5, 10, 15 년 분량의 데이터가 필요합니다.

이제 2008 년, 2009 년경에 나타나기 시작한 또 다른 기능은 파티셔닝이었습니다. 다시 말하지만, Oracle, SQL Server와 같은 데이터베이스 및 비용을 지불해야하는 두 데이터베이스에서이 사실을 알 수 있습니다. Oracle에서는 파티셔닝 옵션을 구입해야하며 SQL Server에서는 데이터 센터 에디션을 사용해야합니다. 그것은 전통적인 분할 및 정복 기법이며 여러분이하는 일은 맨 위에 논리적 인 큰 테이블이라는 개념이 있고 디스크에 놓으면 실제로 버킷으로 나뉩니다. 또한 이러한 버킷이 분리 기준으로 구성되어 있으며, 일반적으로 파티셔닝 기능을 참조하거나 호출 한 것을 확인할 수 있습니다. 마찬가지로 일부 데이터베이스 플랫폼에서 하위 파티션을 구성하여 더 나아갈 수도 있습니다.

다시 말하지만, 데이터웨어 하우징과 필수 데이터 보존으로 인해이 문제가 발생했다고 생각합니다.이 데이터베이스 중 일부에서는 최대 64,000 개의 파티션을 가질 수 있으며 일부 다른 데이터베이스에서는 최대 64,000 개의 하위 파티션을 믿습니다. 이를 통해 데이터를 관리 가능한 부분으로 나눌 수 있습니다. 또한 인덱스를 분할합니다. 옵션 일 필요는 없지만 색인을 분할 할 수도 있습니다. 이를 수행하는 이유 중 하나는 슬라이딩 데이터 창이 있기 때문일 수 있습니다. 10 년 분량의 데이터를 유지하려고하지만 오늘 밤의 일괄로드를 실행하기 위해 인덱스를 삭제하기 위해 현재 버킷에있는 행에서만 모든 단일 행에서 인덱스를 삭제하지 않아도됩니다. 대부분의 사람들은 계획에서 파티션 제거를 포기하고 쿼리 속도를 높이는 것이 큰 이점이라고 생각하지만 실제로 파티셔닝은 매우 훌륭한 관리 도구입니다. 정말 케이크 위에 착빙하는 것입니다.

이제 샤딩에 대해 들어봤을 것입니다.“글쎄, 왜이 슬라이드를 여기에 넣었습니까?”이것은 NoSQL 중 하나입니다. 이것은 하둡 유형 환경 중 하나입니다. Oracle 12c는 G8이 아닌 두 가지를 출시했지만 실제로 표시되거나 미리보기되는 것은 샤딩이 있습니다. Oracle과 같은 전통적인 데이터베이스 시스템을 사용하고 Hadoop 모델에서와 마찬가지로 샤드를 만들 수 있으므로 분할 및 정복 기법을 사용하여 분할 할 수 있습니다. 노드별로 그룹화하여 행 단위로 테이블을 작성하면 이는 일부 NoSQL 데이터베이스에서 볼 수있는 것과 같습니다. 실제로 MySQL에서는 클러스터링 기술 중 하나를 사용하여 실제로이 작업을 거의 수행 할 수 있지만 기존 데이터베이스에오고 있으며 Microsoft가 남겨두고 싶지 않다고 생각합니다. 이 두 게임은 항상 서로 개구리를 뛰어 넘어 다음 버전의 SQL Server에서 샤딩을 보게 될 것입니다.

데이터 라이프 사이클 관리, 다시 필수 데이터 보존, 비즈니스 인텔리전스 및 분석. 실제로 이것은 분할 및 정복 기법이며 일반적으로 DBA는 수동으로 수행합니다.“올해의 데이터는 빠른 디스크에 보관하고 작년의 데이터는 약간 느린 디스크에 보관할 것입니다. 지난 2 년 전까지는 더 느린 디스크에 보관 한 다음 보관 방법을 사용하겠습니다.”일반적으로 더 이상 테이프로 녹화되지 않으며 일반적으로 네트워크에 연결된 스토리지 또는 장치가 많은 장치가 있습니다. 스토리지 비용을 절감 할 수 있지만 비용 효율적이지만 여전히 디스크를 돌리고 있습니다.

이제 Oracle과 SQL Server 모두에서 실제로 규칙을 정의하는 옵션을 구입할 수 있으며 이는 백그라운드에서 자동으로 수행됩니다. 더 이상 스크립트를 작성할 필요가 없으며 아무 것도 할 필요가 없습니다. 6 월에 처음 나온 SQL Server 2016을 본 적이 있다면“Stretch Databases”라는 새로운 기능이 있습니다. 기본적으로 오른쪽 하단에서 여러 계층에서 클라우드로 직접 이동할 수 있습니다. 다시 말하지만이 기능은 데이터베이스에 내장 된 기능입니다. "데이터가 365 일이 지난 경우 클라우드로 이동하여 자동으로 수행하십시오."와 같이 말합니다.

이것은 정말 멋진 기능이 될 것입니다. 사실, 우리가 앞으로 보게 될 것이라고 생각합니다. 지역 데이터베이스를 유지할 하이브리드 데이터베이스가있을 것입니다. 그리고 일부는 구름에 있습니다. 그 전에 사람들은 "아, 온 프레미스를하려고합니까 아니면 클라우드에서하려고할지"생각하고있었습니다. 이제 우리는이 하이브리드 방식으로 두 기술의 결혼을보고 있습니다. 나는 이것이 꽤 클 것이라고 생각하고 Microsoft는 먼저 거기에 도착했다.

편집, 이것은 데이터 보호 및 규정 준수 때문입니다. 예전에는 응용 프로그램 개발자가 보고서에 이것을 표시 할 때 화면에 표시 할 때 데이터를 표시하고 확인해야 할 몇 가지 보안 사항이 있습니다. 그들은 보지 말아야 할 데이터를 보거나 숨기거나 수정해야합니다.”물론, 평소와 같이 응용 프로그램으로 데이터를 푸시 할 때 한 곳에서 수행되지 않으므로 다르게 수행되거나 그렇지 않습니다. 어떤 곳에서는 끝나지 않습니다. 이제 데이터베이스 시스템에서 실제로이 기능을 사용할 수 있습니다.

이제 SQL Server 2016에는이 기능이 내장되어 있으므로 데이터 센터 추가에 아직 선택적인 비용 항목이 아닙니다. Oracle 12에서는 수명주기 관리 애드온을 구매해야하지만 이는 새로운 것이지만 비즈니스가 주도하고 있습니다. 특히 지금 많은 양의 데이터를 유지하고 데이터 마이닝, BI 및 분석을 수행하고 있기 때문에 누가 어떤 데이터에 액세스하고 누가 무엇을 볼 수 있는지 확인해야합니다. 그들은 볼 수 있습니다.

마찬가지로 데이터 보호 및 규정 준수를 다시 살펴보십시오. 다이어그램에서 아래쪽 화살표와 위쪽 화살표를 보면 데이터베이스에 직접 암호화되어 데이터베이스에 직접 암호화되어 있으며이 암호화에 대해 중요한 것이 많은 데이터베이스 시스템에서 압축되고 있습니다. 디스크로 암호화 된 다음 메모리로 다시 읽고 해독합니다. 그것은 실제로 하나의 모델이며, 네트워크를 통해 해당 데이터를 실제 클라이언트 응용 프로그램과 통신 할 때만 실제로 수행하는 다른 모델이 있습니다.

이 경우에도 메모리의 데이터베이스 서버에도 여전히 클라이언트 응용 프로그램으로 전송 될 때만 암호화되고 해독 될 수 있습니다. 여기에는 두 가지 다른 모델이 있으며 데이터베이스에서이 모델을 찾을 수 있으며 실제로 최근에 추가 한 데이터베이스 중 하나는 버전 10.X의 MariaDB입니다. 나는 그들이 지금 10.1 또는 10.2에 있다고 생각합니다. 실제로이 암호화에 대한 벤치마킹을 수행했으며이 암호화를 얻기 위해 처리량이나 속도가 약 8 % 감소했습니다. 벤치마킹 테스트에서 암호화는 그렇게 많이 유발하지 않았으므로 매우 유용한 기능입니다.

이제 플래시 메모리와 SSD 및 이와 유사한 것들에 대해 앞에서 언급했습니다. 많은 사람들이 인식하지 못하는 Oracle 및 SQL Server의 기능 중 하나는 데이터베이스 서버에있는 플래시 또는 SSD를 가져 와서 데이터베이스에 다음과 같이 말할 수 있다는 것입니다. RAM을 우선적으로 취급하되, 메모리가 느린 것으로 가정하고이를 확장 캐시로 사용하십시오. "이제 SQL Server 2014에서"버퍼 풀 확장 "이라고 불리는이 프로그램은 무료입니다. Oracle에서는 11g R2로 출시되었으며 "데이터베이스 플래시 캐시"라고도하며 무료였습니다.

그러나 내 조언은이 기능을 신중하게 테스트하는 것입니다. 조회를 수행 할 때 캐시를 더 크게 만들 때마다 시간이 더 걸립니다. 3 테라 바이트 크기의 플래시 카드를 넣고 데이터베이스에“메모리에 추가”라고 말하면 실제로 살펴 보거나 플래시로 보는 시간으로 인해 속도가 느려지는 것을 발견 할 수 있습니다. 깨끗한? 수익이 감소하는 시점이 있습니다. 제 충고는 이것을 다시 테스트하고, 당신에게 맞는 것이 무엇인지 확인하는 것입니다.하지만 데이터베이스와 Oracle의 경우 SQL Server와 Oracle 모두에서 몇 년 동안 존재했습니다.

그런 다음 우리는 인 메모리 데이터베이스였던 할아버지에게 데려다주었습니다. 데이터베이스 가격이 하락했기 때문입니다. 아마도 이것이 발생했다고 생각하는 다른 이유는 많은 분석이 데이터에 매우 빠르게 액세스 할 수 있어야하므로 메모리에 있어야한다는 것입니다. 데이터베이스가이 데이터에 액세스하고 압축하고 암호화하고 저장하기 위해 사용하는 알고리즘은 경우에 따라 일부 데이터베이스는 계속해서 인 메모리를 행으로 저장할 수 있습니다.

경우에 따라 일부 데이터베이스는이를 열 지향으로 분류 할 수 있으며, 그 이유는 열 순서 대 행 순서로 저장하여 11 ~ 12 배 정도의 압축 수준을 달성하기 때문입니다. 이것은 SQL Server 2014에서 처음으로 나타 났으며 "Hekaton"이라고 불렀습니다. SQL Server 2016에서는 급격히 증가했으며 이름이 다른 이름으로 참조되어 Oracle 12c에서 나왔습니다. R2가 아닌 두 번째 릴리스를 말합니다. Oracle 12c에는 12.1.0.1과 12.1.0.2의 두 가지 릴리스가있었습니다. 데이터베이스의 R1 버전의 두 번째 릴리스입니다.

그리고 메모리 내 객체를 정의하는 방식은 두 데이터베이스에서 비슷합니다. 오른쪽 상단에서 SQL Server를 만들고 있는데 메모리 최적화와 내구성이 스키마에 불과하다는 것을 알 수 있습니다. 이 구문의 모든 의미를 다루지는 않겠습니다. Oracle에서는 실제로 훨씬 더 간단합니다. 테이블을 변경하고 인 메모리로 말하거나 변경하면됩니다. 오늘은 인 메모리이고 내일은 아니고 매우 유연하다고 말할 수 있습니다.

메모리 내 테이블을 사용하여 Oracle에서 몇 가지 테스트를 수행했으며 최상위 행에서 실행하는 데 거의 40 분이 걸리는 테스트가있었습니다. 이제 중요한 것은 맨 아래 두 줄에 도달했을 때, 런타임을 늘리거나 줄였습니다. 약 5 분 정도 말해야합니다. 압축 계수를 볼 때 실제로 메모리의 데이터는 3.6이었습니다. 4.6 배 작아졌습니다. 이 경우 열 중심 형식을 사용하고 압축하기 때문에 중요합니다. 그리고 무엇을 추측합니까? 실제로 메모리에 거의 4 배에서 5 배 많은 데이터를 수용하고있었습니다. 메모리 내 이점, 열 지향적 이점, 메모리 캐시에있는 데이터의 최대 5 배에 달하는 훨씬 더 많은 데이터의 이점을 얻을 수 있었으므로 이는 매우 강력한 기술입니다. Oracle과 SQL Server를 다시 한번 살펴보면 정말 멋진 기능입니다. 그걸로 질문에 답할 것 같아요.

에릭 카바나 흐 : Well Bert, 우선이 훌륭한 교육에 대해 매우 이타 적이었습니다. 너희들이하는 일에 대해 잠깐 얘기해 줄 수 있니? 당신이 말하고있는 것을 촉진 할 수있는 몇 가지 기술이 있기 때문입니다. 여러분이하는 일에 대해 잠시 이야기를 한 다음 여기 방정식에서 Dez와 Robin을 쓰러 뜨리겠습니다.

버트 스 칼조 : 네, IDERA라는 회사에서 일하고 있습니다. 우리는 텍사스에 있고, 휴스턴에 본사를두고 있으며, 지금은 실제로 오스틴에 앉아 있지만 달라스에 있습니다. 데이터베이스 도구를 만들고 문제를 해결하는 데 도움이되는 데이터베이스 도구를 만듭니다. 이 문제는 생산성만큼이나 간단 할 수 있습니다.이 경우 데이터베이스 관리 작업을 수행 할 수있는 DBArtisan이라는 도구가 있으며 12 개의 서로 다른 데이터베이스 플랫폼을 관리 할 수있는 도구입니다. SQL Server를 관리하고, Oracle을 관리하고, MySQL, DB2, Postgres를 관리 할 수 있으며, 도구, 실행 파일, GUI 디자인 및 일관된 일련의 워크 플로를 사용하고 있습니다. 또한 규정 준수를위한 도구를 만들고 규정 준수 요구 사항을 충족하는 데 도움이되는 SQL Compliance Manager라는 도구가 있습니다. SQL Security라는 또 다른 도구이므로 효과적이고 효율적으로 사용할 수있는 도구를 만들려고 노력하고 있으며 웹 사이트를 방문하면 정말 멋진 점이 있습니다. 프리웨어가 많이 있습니다. – 우리는 프리웨어가 20 ~ 25 개 정도 있다고 생각합니다. SQL Server 및 Windows 도움말 확인과 같은 훌륭한 프리웨어 항목이 기본적으로 제공되며 기본적으로 문제가 있는지 확인하고 문제가 있는지 여부와 완전히 무료인지 알려줍니다.

에릭 카바나 흐 : 그리고 당신은 정말

버트 스 칼조 : 확실히 첫 번째 것 —

에릭 카바나 흐 : 오늘날 시장의 이질성에 대해 말하고 있습니다. 실제로 2005 년에 마이클 스톤 브레이커 박사를 인터뷰 한 것을 기억하는 한 가지 크기의 모든 방정식이있었습니다. 컬럼 지향 데이터베이스 이동에 대한 평결에 대해 이야기하고 수년 동안 하나의 크기에 맞는 모든 관계형 모델이 어떻게 지배했는지에 대해 모든 것을 이야기하고 있었으며, 모든 변화가 일어날 것이라고 예측하고 있었으며 소년은 그에 대해 옳았습니다. 이제 우리는 다양한 옵션과 기회가있는이 다양하고 흥미로운 환경을 가지고 있지만, 당신은 그 모든 것을 관리 할 누군가가 필요합니다. 귀하의 회사는 수학 문제를 해결하는 데 매우 집중하여 이기종 헤더, 맞습니까?

버트 스 칼조 : 물론. “GUI 도구를 사용하고 싶지 않고 스크립트를 사용하여 모든 작업을 수행합니다.”라고 말하는 DBA가 항상있을 것입니다. 그들은 수퍼맨 유형의 DBA라고 생각하지만 괜찮습니다. 대부분의 사람들은 업무를 수행하고 싶습니다. Microsoft Word를 사용하여 문서를 작성합니다. Microsoft Outlook을 사용하여 내 작업을 수행합니다. 작업을 수행 할 수있는 도구가 있습니다. 우리는 같은 종류의 개념을 구축하고 있으며 데이터베이스 관리자와 개발자가 원하는 방식에 초점을 맞출 수 있도록 도구를 구축하고 있습니다.

에릭 카바나 흐 : 이해가 되겠지만 전문가에게 맡기십시오. 사람들은 자유롭게 뛰어들 수 있습니다. 청중으로부터 몇 가지 의견이 접수되었습니다. 아마도, Dez, 몇 가지 질문과 Robin 두 가지 질문?

데즈 블랑 필드 : 확실한. 내가 경험 한 엄청난 경험을 감안할 때, 내가 당신에게 던지고 싶은 첫 번째 질문 중 하나가이 중 하나가 느려지는 시점을 곧 알 수 있습니까? 아니면 우리가이 지속적인 성장 라인의 진입 점에 있다고 생각하십니까? 저는 회사가 직면하고있는 가장 큰 문제 중 하나라고 생각합니다. 그런 다음 비즈니스를 운영하기 위해 회사에 제공되는 기술을 지원하려는 사람들은 변화 속도가 너무 극적으로 높아서 모든 것을 따라 잡을 수 없다는 것입니다 다양한 기능, 소프트웨어, 시스템, 프레임 워크, 아키텍처, 새로운 코드가 등장하고 그 아래에있는 하드웨어가 현재의 변경 속도가 즉시 느려지고 있는가? 내 말은, 당신은 전체 IDERA 제품군과 같은 광범위한 플랫폼을 다루고 있습니다. 우리는 곧 속도를 늦출 것입니까, 아니면이 미친 런 어웨이화물 열차에 아직 오랫동안 있습니까?

버트 스 칼조 : 우리는이 성장 곡선의 처음 20 %에 도달 한 것으로 생각하고 먼 길을 갔으며 두 가지 추진력이 있습니다. 기술은 계속 발전하고 있습니다. 앞으로 나올 몇 가지 새로운 메모리 유형에 대해 언급했습니다. 환상적입니다. 삼성은 곧 20 테라 바이트 규모의 플래시 드라이브를 출시 할 예정이다. 그것은 변화 할 것입니다. 우리는 이러한 NoSQL과 클라우드 데이터베이스를 모두 가지고 있으며 계속 진행될 것입니다. 하지만 재밌는 점 중 하나는 Oracle 및 SQL Server와 같은 데이터베이스와 다른 데이터베이스를 볼 때 더 이상 관계형 데이터베이스가 아니라는 것입니다. 비정형 데이터를 Oracle에 넣을 수는 있지만 ACID 준수를 유지할 수 있습니다. 당신이 20 년 전에 저에게 말한 적이 있다면, 나는 당신이 마약을하고 있다고 말했을 것입니다.

데즈 블랑 필드 : 예, 멋져요 이제는 GIS와 같은 멋진 틈새 시장을 가진 엔진조차도 기본 기능보다 훨씬 뛰어납니다. DBA가 직면 한 문제와 DBA의 다양한 시대에 대해 많은 의견을 제시했지만, 해당 비즈니스 계층의 종류에 따라 세상은 어떤 모습입니까? 내 말은, 진단 관리자, 인벤토리 도구, 조각 모음으로 인해 DBA가이 변경에 어떻게 대처하고 어떻게 분류하는지에 이르기까지 다양한 플랫폼을 사용하는 사람들입니다. , 그들은 당신의 도구로 무엇을하고 있습니까?

버트 스 칼조 : 저는 거의 20 년 전에 돌아가서 DBA가 조직에서 매우 특정한 역할을 해결한다고 말할 것입니다. 이들은 일반적으로 하나의 데이터베이스 플랫폼에서 작동하며 두 개일 수 있으며 비교적 적은 수의 데이터베이스를 관리합니다. 이제 오늘과 데이터베이스 관리자에게 빨리 넘어 가면서 실제로 10 개의 데이터베이스 플랫폼을 알게됩니다. 그는 관리하고 있으며, 일부 경우 수천 개의 데이터베이스를 농담하지 않습니다. 그것은 SQL Server 세계 또는 MySQL 세계에 관한 것입니다. 그러나 여전히 Oracle 세계에서는 수백 개의 데이터베이스를 관리 할 수 있습니다. 또한 새로운 기능이 모두 나오고 새로운 플랫폼이 있으며 책임있는 데이터베이스가 모두 있습니다. 생산성을 높이고 몇 가지 학습에 도움이되는 도구를 찾고 있습니다.

예를 들어 보겠습니다. 테이블을 분할하려는 경우 매우 모호한 구문이며 하위 분할을 원하면 구문이 훨씬 어려워집니다. 내가하고 싶은 일을 알고 버킷을 만들고 싶습니다. DBArtisan과 같은 툴을 가지고 있다면“이봐 요. 여기에는 작업을 수행하는 방법보다는 수행하려는 작업에 집중할 수있는 멋진 화면이 있습니다. 완료되면 SQL 버튼을 보여 주면 SQL이 무엇인지 보여 주므로 실제로 배우고 마스터 할 수 있습니다.”

DBA는 업무를 수행하는 데 도움이되는 도구를 찾고 있지만 사용중인 새로운 내용을 모두 가르치는 데 도움이되는 도구를 찾고 있습니다. 제가 Oracle 사람이고 MySQL로 가서 “알겠습니다. DBArtisan 데이터베이스를 만드십시오. 이제 MySQL에서 데이터베이스를 만드는 것이 어떤지 궁금하고 구문을 배웠기 때문에 SQL을 보여주세요.”따라서 데이터베이스 전체에서 작업하는 데 도움을 줄뿐만 아니라 데이터베이스 간에도 교육하고 있습니다.

데즈 블랑 필드 : 좀 더 현대적이거나 더 현대적이지 않은 것은 아닙니다. 한때 데이터베이스는 데이터베이스입니다. 요즘에는 벤더들로부터 전통적으로 볼 수있는 기술이 쌓여 있고 오픈 소스와 마찬가지로 좋은 기술이라는 도전 과제로 여러분이 말하는 모든 것을 볼 수 있습니다. 데이터베이스 엔진과 쿼리 언어를 다루는 것뿐만 아니라 구조화되고 구조화되지 않은 데이터 유형도 처리합니다. 페타 바이트 급 HDFS 스펙트럼의 끝에서 모든 것을 처리해야하는 문제가 있습니다. 작은 컨테이너, 패킷 파일 및 다양한 로그 파일 형식으로

그리고 저는 그것이 지금 우리가보고있는 것이라고 생각합니다. 수퍼맨, 수퍼 우먼, 그들이 생각하는 것, 육체적으로, 그 정도의 변화를 정신적으로 처리 할 수없는 사람, 변형의 규모. 현재 제공하는 도구 모음은 여러 가지 방법으로 기본 세트에 거의 도달 할 시점에 도달하여 물리적으로 인해 데이터베이스 환경이 없어도 실행할 수 없습니다. 그들에게 많은 시체를 던질 수 없습니다. 나는 당신의 프리젠 테이션을 정말로 즐겼습니다. 로빈 블로어 박사에게 전달할 것입니다. 그가 당신에게 던질 많은 질문이 있다고 확신합니다.

로빈 블로어 : 괜찮아. 글쎄, 나는 확실히 질문이있다. Bert, 어디로 가는지 모르겠습니다. 며칠 전에 누군가가 최신 DU 데이터 보호에 대해 이야기하기 시작한 흥미로운 대화를 나 and습니다. 그들이 주장한 것들의 관점에서 draconian. 당신이 실제로 그것을 보았는지 궁금합니다. 익숙한가요?

버트 스 칼조 : 물론. 네.

로빈 블로어 : 2016 년, 알겠습니다.

버트 스 칼조 : 그리고 실제로

로빈 블로어 : 매우 흥미 롭습니다.

버트 스 칼조 : 실제로 데이터베이스 공급 업체에서 데이터베이스 용 플래시 제품을 만드는 데 도움이되는 플래시 공급 업체에서 한동안 일했으며 draconian이 완전히 중단되었다고 말할 수 있습니다. 내 말은 내 슬라이드 하나를 기억하면 일부 데이터베이스에서는 암호화를 수행하지만 서버 메모리 및 일부 데이터베이스에는 암호화를 넣습니다. 여전히 서버 메모리에 암호화되어 있으며, 다음과 같은 경우에만 해독됩니다. 클라이언트로 전송됩니다. 또한 미국 정부의 국방부 나 군대와 같은 정부 표준 중 일부는 플래시 수준까지 내려 가며 암호화 및 암호 해독을 지원한다는 것만 알고 싶지는 않습니다. 당신의 하드웨어, 그러나 누군가가 칩을 훔친 경우 – 당신이 알고있는 것, 서버에서 그것들을 뽑아 내고, 암호화 된 것을 가지고 있기 때문에 그들이 가질 수없는 스토리지를 가지고 있더라도 플래시 부분 자체가 아니라 개별 칩에 이르기까지 실제까지 줄어 듭니다. 그들은 칩별로 칩을 알고 싶었고 모든 것이 암호화되었습니다.

로빈 블로어 : 와. 많은 것들이 있다는 것을 의미합니다 – 당신이 알고있는 것은 단지 한두 개의 슬라이드 일 뿐이라고 생각합니다. 그러나 그것은 정말 흥미로운 시나리오라고 생각합니다. 예를 들어 정보의 개정은 특히 오늘날 기계 학습을 통해 이전에는 드러 낼 수 없었던 정보를 드러 낼 수있는 연역적 인 일을 할 수 있기 때문에 다양한 분야를 가리는 것보다 약간 영리해야합니다.

당신이 보호하려고 노력하고 있다면, 건강 정보를 생각해 봅시다. 그것은 건강 정보와 관련하여 미국에서 매우 매우 엄격한 규칙이지만 실제로 다양한 기계 학습 기술을 사용하여 누군가의 의료 정보를 누가 해결할 수 있습니까? 실제로입니다. 나는 그들이 당신이 흥미로운 부분이라고 생각하기 때문에 그것에 대해 할 말이 있는지 궁금합니다.

버트 스 칼조 : 예, 절대적으로이 예제를 사용하고 있습니다. 한 데이터베이스가 다른 데이터베이스보다 낫다고 말하려는 것이 아니라 방금 요청한 것에 대한 좋은 예입니다. 예를 들어 Oracle에서 John Smith 의료 기록을 볼 수없는 것처럼 데이터 행을 볼 수없는 경우 Oracle에서 "그 레코드를 선택하십시오"라고 말하면 차단되거나 볼 수있는 내용을 볼 수 있으며 수정 될 것입니다. "John Smith와 같은 테이블에서 계정 별을 선택하십시오"라고 말하면 0이됩니다.

SQL Server에서는 수정 작업을 수행 할 수 있지만 몇 가지 구멍이 있습니다. “존 스미스와 같은 테이블에서 계정 스타를 선택하십시오.”라고 말하면 실제로 하나를 다시 얻게되므로 존 스미스가 있다는 것을 알게됩니다. 하나는 다른 것보다 더 안전합니다. 이제 저는 그들이 고치길 기대합니다. 그들은 항상 서로 뛰어 넘는 개구리를칩니다. 그리고 다시 한 번, 예를 보여주기위한 것 이외의 데이터베이스를 구별하려고하지는 않습니다. – 지금 이야기하고있는 것을 살펴보십시오. 기술적으로는 선택 계정만큼 간단한 것도 수정으로 인해 잘라야합니다. 말하자면, 행의 존재 외에는 아무것도 개정되지 않습니다.

로빈 블로어 : 그래 맞아. 재미 있네요 시간이 많이 걸리지 않아서 또 다른 일반적인 질문은 실제로 개선에 관한 것입니다.나는 당신이 당신이 우리에게 당신이 실행 한 다양한 테스트 결과의 예를 보여주고 있다는 것을 알고 있다는 것을 알고 있다는 것을 의미합니다. – 전통적인 데이터베이스를 지배 데이터베이스라고 부릅니다. SQL Server와 Oracle, 당신은 그들이 완성을 앞설 것이라고 생각하십니까? 아니면 그들이 실제로 시장에 내놓는 다양한 종류의 혼란에 빠질 것이라고 생각하십니까? 당신의 의견은 무엇입니까?

버트 스 칼조 : 예를 들어, 볼러 이후 시대의 마이크로 소프트는 나에게 살아있는 지옥에 깊은 인상을주었습니다. 이 확장 데이터베이스는 Linux에서 SQL Server를 받고, Linux에서 .NET을 받고, Linux에서 PowerShell을 가져옵니다. 기존 데이터베이스 공급 업체가 뒤쳐 질 것이라고 생각하지 않습니다. 그들이 결정했다고 생각합니다.“이봐, 새로운 사람들, 신생 기업들이 무언가를 정의하게 해주세요. 샤딩이 무엇인지, 어떻게 완성해야 하는지를 파악하게하고, 모든 연구 개발을 완료 한 후에는 사용자가 원하는 것을 정확히 알았으므로 이제 샤딩을 Oracle에 추가하겠습니다.” "이봐 요, 당신이 지배적 인 선수 일 때는 사람들이 당신을 떠나지 않기 때문에 두 번째 또는 세 번째가 나쁘지 않습니다."

로빈 블로어 : 예, 그것이 사용 된 전략이라는 것을 의미합니다. 나는 IBM이 그 모든 것을 수행 했었다는 것을 의미합니다. 전체 제품 범위에서 누군가가 전혀 생각하지 못했던 벽에서 완전히 벗어난 것을 떠 올릴 때까지는 합리적으로 잘 평가하지만 계획을 세울 수는 없습니다. 어쨌든

청중의 질문, 에릭?

에릭 카바나 흐 : 네,하지만 당신은 아마도 한 번만 생각하고 버트가 달려야한다는 것을 알고 있습니다. 여기에 Oracle 12c의 샤딩 아키텍처에 대한 내용이 있습니다. 귀하의 의견으로는 무엇을 의미한다고 생각하십니까?

버트 스 칼조 : 오라클은 다른 모든 데이터베이스 벤더들이 가지고있는 모든 것을 흡수하거나 제공하고 있습니다. 예를 들어, 비정형 데이터를 Oracle에 넣을 수 있습니다. 구조화되지 않은 데이터를 넣은 다음 관계형 데이터베이스라고하는 방법을 모르므로 이해가되지 않지만 할 수는 있습니다. 이제 오라클은 샤딩을 추가하고 있습니다. 따라서 오라클은 다음과 같이 말합니다. 시장이 원하는 것이 무엇이든, 시장이 원하는 것을 원하고 솔루션을 제공하기를 원하므로 우리는 데이터베이스를 제공 할 것입니다.”

추가 항목이 표시 될 것 같습니다. Oracle 랙이나 실제 애플리케이션 클러스터가 아니라 기본적으로 해당 샤딩을 수행하는 전통적인 Hadoop 유형 클러스터링에서 Hadoop과 같은 데이터베이스 노드 클러스터링을 보는 것에 놀라지 않을 것입니다. 하둡처럼 Oracle과 같은 데이터베이스를 배포 할 수 있다고 생각합니다. 이러한 추세는 계속 될 것입니다. 이 큰 데이터베이스 공급 업체는 수십억 달러를 벌고 시장을 잃고 싶지 않기 때문에 어떤 것에 적응하거나 어떤 것도 채택하려고합니다.

에릭 카바나 흐 : 글쎄, 나는 꽤 오랫동안 오픈 소스 공급 업체를 따라 왔으며 전통적인 닫힌 문 기술에 미치는 영향이 얼마나 큰지 궁금해하고 잠시 동안은 그렇게 느꼈기 때문에 재밌습니다. 오픈 소스 벤더들은 진지한 진전을 보였습니다. 이제 시장을 살펴보면서 여러분이 말하는 것을 보았습니다. 큰 사람들이 수학을했고 연필을 날카롭게했으며 그들이 어떻게 직조 할 수 있는지 알아 냈습니다. 많은 것들을 그들의 아키텍처에 적용했습니다. IBM이든 Oracle이든 SAP이든 지난달 SapphireNow 컨퍼런스에 참석했고 그 회사의 절반을 책임지고있는 Steve Lucas는 SAP가 HANA 클라우드 플랫폼에 통합하고 있다고 밝혔습니다. 경쟁사. 당신이 그것에 대한 수학을하면, 그것은 매우 인상적인 진술이며 큰 사람들이 곧 아무데도 가지 않을 것이라고 나에게 이야기합니다.

버트 스 칼조 : 아니요, 두 가지 모두에 돈을 걸었습니다. 내 말은, 마이크로 소프트의 주식은 최근에 약 $ 50 였고 몇 년 전만해도 25 살 이었다는 것을 의미합니다. 좋은 일을하지 않으면 단기간에 주식 가격을 두 배로 올리지 않을 것입니다. Windows 10부터 1 년 동안 무료로 제공되는 것부터 다른 현명한 일까지 모든 것을 수행하는 것은이 확장 데이터베이스 기능이 경이로운 것입니다. 앞으로 일어날 일은 많은 사람들이 "내 데이터베이스를 Azure로 마이그레이션 해 보자"라고 말한 것이 아니라 직접 Azure가 아니라 Azure에서 끝나는 것입니다. 그것은 보관 될 것이기 때문에 마 법적으로 마이그레이션 할 것입니다. 이 새로운 확장 데이터베이스 기능을 사용하여 Azure의 채택이 급증 할 것입니다.

에릭 카바나 흐 : 그것은 시장에서도 Mac에서도 볼 수있는 트렌드 중 하나입니다. Mac에서 문서를 저장하기 위해 문서를 저장하면 최신 Mac이 바로 클라우드를 따라갑니다. 그 전략에는 많은 의미가 있으며, 전략도 살펴 보았습니다.“좋아요, 여러분은 클라우드 환경에 한 조각 씩 나를 유혹하고, 언젠가는 영화를보고 싶을 때 신용 카드 유효 기간이 만료되었습니다.”

버트 스 칼조 : 네,하지만 당신은 그것을합니다.

에릭 카바나 흐 : 네. 사실입니다.

버트 스 칼조 : 당신은 모든 것을 넣었습니다.

에릭 카바나 흐 : 글쎄, 모든 것이 아닙니다.

버트 스 칼조 : 아니 내말은-

에릭 카바나 흐 : 그래, 계속해

버트 스 칼조 : 이러한 사회적 추세는 사업에 도달하고 있습니다. 이제 기업은 여전히해야 할 일이 많이 있지만 이러한 추세를보고 동일한 종류의 일을하고 있습니다. Oracle이나 Microsoft가 사라지는 것을 보지 못했습니다. 실제로, 나는 하락이있을 때마다 두 가지 모두에서 주식을 구매할 것입니다.

에릭 카바나 흐 : 네 확실합니다. 여러분, idera.com, I-D-E-R-A 닷컴으로 가십시오. Bert이 말했듯이, 그들은 거기에 많은 무료 물건을 가지고 있으며 그것은 시장에서 새로운 트렌드 중 하나입니다-당신에게 놀 수있는 무료 물건을주고, 당신을 사로 잡은 다음, 당신은 진짜 물건을 사러갑니다.

여러분, 이것은 또 다른 뜨거운 기술이었습니다. 오늘 시간을 내 주셔서 감사합니다. Bert, Dez, 그리고 Robin도 마찬가지입니다. 다음 주에 여러분과 대화 할 것입니다. 당신이 어떤 아이디어를 가지고 있다면, 진정으로 당신의 아이디어를 느끼십시오. 다음에 연락 드리겠습니다. 안녕.