하둡 및 빅 데이터를 사용한 데이터 도난 발견

작가: Roger Morrison
창조 날짜: 20 구월 2021
업데이트 날짜: 1 칠월 2024
Anonim
1-2.  빅데이터 플랫폼
동영상: 1-2. 빅데이터 플랫폼

콘텐츠


출처 : Ximagination / Dreamstime.com

테이크 아웃 :

빅 데이터와 Hadoop의 결합 된 힘이 결합되어 데이터 도난을 식별하고 중단합니다.

오늘날 기업과 정부 기관의 데이터 노출로 인한 데이터 도난의 위험이 급격히 증가하고 있으며 매일 새로운 사례가 확인되고 있습니다. 이러한 종류의 데이터 도난은 기밀 정보를 공개하고 많은 돈을 잃게되므로 조직에 큰 타격을 줄 수 있습니다. 데이터를 쉽게 보호 할 수 없으며 현장에서 많은 고급 기술이 실패합니다. 이러한 도난에 대한 가장 무서운 것은 탐지하기가 매우 어렵다는 것입니다. 때로는이를 감지하는 데 몇 개월 또는 몇 년이 걸릴 수 있습니다. 그렇기 때문에 조직은 데이터가 항상 안전하게 유지되도록 강력한 조치를 취해야합니다. 이러한 방법 중 하나는 사기성 범죄 웹 사이트를 탐지하고 다른 조직에도 알리기 위해 Hadoop과 빅 데이터의 조합을 사용하는 것입니다.

왜 데이터를 보호해야합니까?

앞에서 언급했듯이 매일 새로운 데이터 도난 사례가보고됩니다. 이러한 유형의 데이터 도난은 정부 기관, 비즈니스 또는 데이트 웹 사이트 등 모든 회사에서 발생할 수 있습니다. 데이터 도난만으로도 상당한 자본 손실이 발생할 수 있습니다. 얼마를 요청할 수 있습니까? 매년 약 455 억 달러!

회사에서 사용하는 현재 보안 시스템은 몇 가지 간단한 데이터 도용 기술에 대응할 수 있지만 조직 내부의 더 복잡한 시도 나 위협에는 대응할 수 없습니다. 또한, 이러한 경우를 식별하는 데 많은 시간이 걸리므로 범죄자들은 ​​보안 시스템의 허점을 쉽게 조작 할 수 있습니다.

이러한 위협에 대처하는 방법

이러한 종류의 데이터 도난의 수와 복잡성이 증가함에 따라 해커는 보안 시스템을 조작하는 새로운 기술을 찾고 있습니다. 따라서 중요한 기밀 데이터를 유지 관리하는 조직은 단순한 보안 위협에 대해서만 대응할 수있는 현재 보안 아키텍처를 변경해야합니다. 이러한 종류의 도난을 피하기 위해서는 실용적인 해결책 만 유용 할 수 있습니다. 회사는 사전 계획을 세워야하는 모든 종류의 도난에 대비해야합니다. 이를 통해 그러한 상황에 신속하게 대응하고 대처할 수 있습니다.


많은 회사가 다른 회사가 자신의 데이터를 도둑으로부터 보호 할 수있는 솔루션을 제공하기 위해 이니셔티브를 채택했습니다. 이러한 회사의 예로는 Terbium Labs가 있습니다. Terbium Labs는 빅 데이터와 하둡을 활용하여 이러한 위협을 효과적으로 탐지하고 대응하는 새로운 방법을 사용합니다.

Terbium의 새로운 기술이 데이터 보안에 어떤 도움을 줄 수 있습니까?

회사가 위협에 신속하게 대응할 수 있도록 Terbium이 사용하는 기술을 Matchlight라고합니다. 이 강력한 기술을 사용하여 숨겨진 부분을 포함하여 웹을 검색하여 모든 종류의 기밀 데이터를 찾을 수 있습니다. 그러한 데이터를 찾으면 즉시 사용자에게보고합니다. 이 응용 프로그램은 매우 정확합니다. 실제로는 "핑거"라고하는 회사 기밀 데이터의 고유 서명을 만듭니다. 회사 기밀 데이터의 고유 서명을 생성 한 후 응용 프로그램은 데이터를 웹에서 찾은 데이터의 "핑거"와 정확하게 일치시킵니다. 따라서이 빅 데이터 응용 프로그램을 사용하면 웹에서 증거를 찾아 데이터 도난 사례를 효과적으로 식별 할 수 있습니다. 인터넷, 다크 웹 또는 경쟁 회사의 웹 사이트와 같이 승인 된 장소 이외의 장소에서 데이터가 발견되면 도난당한 정보와 해당 위치에 대해 모회사에 즉시 알립니다.

"핑거링"기술

Matchlight는 핑거링이라는 특수 기술을 통합하여 번거 로움없이 많은 양의 데이터를 일치시킬 수 있습니다. 응용 프로그램은 먼저 기밀 데이터의 손가락을 찾습니다. 그 후, 데이터베이스에 저장되며 인터넷에서 수집 된 손가락 데이터와 정기적으로 비교됩니다. 이 데이터는 이제 웹에서 데이터의 노출을 감지하는 데 사용될 수 있습니다. 일치하는 데이터 서명이 발견되면 클라이언트 회사에 자동으로 경고하여 계획된 보안 조치를 즉시 구현할 수 있습니다.


어떤 데이터 유형이 포함됩니까?

Matchlight는 모든 종류의 데이터 유형을 찾을 수 있습니다. 여기에는 사진 파일, 문서, 응용 프로그램 및 코드가 포함될 수 있습니다. 이 솔루션은 매우 강력하여 매우 복잡한 전체 데이터 세트를 한 번에 처리 할 수 ​​있습니다. 이로 인해 많은 회사들이 데이터 보안을 위해 Matchlight를 사용하고 있으며 Terbium의 현재 데이터베이스에는 3,400 억 개가 넘는 손가락이 포함되어 있으며 매일 증가하고 있습니다.

버그 없음, 스트레스 없음-인생을 파괴하지 않고 인생을 바꾸는 소프트웨어를 만드는 단계별 가이드

아무도 소프트웨어 품질에 신경 쓰지 않으면 프로그래밍 기술을 향상시킬 수 없습니다.

하둡은 어떻게 도움이됩니까?

Terbium은 데이터베이스에서 방대한 양의 데이터를 효과적으로 처리하기 위해 강력한 빅 데이터 처리 플랫폼이 필요했습니다. 그들은 이것을 위해 하둡을 선택했습니다. 그러나 효과적인 빅 데이터 처리에 사용될 수있는 빠르고 효율적인 Hadoop 버전이 필요했습니다. 이를 위해 그들은 네이티브 코드로 실행되는 기업을위한 Hadoop 배포가 가장 적합한 옵션이라고 생각했습니다. 리소스를 많이 사용하게되므로 JVM 버전을 선택하지 않았습니다.

Terbium의 공동 창립자 인 Danny Rogers 씨는 하둡의 중요성에 주목했습니다. 그는 Matchlight의 효율성은 Hadoop에 의존하는 데이터 수집의 효율성에 달려 있다고 말했다. 이는 조직의 데이터 보안을 보장하는 데 Hadoop의 중요성을 보여줍니다.

데이터 보안 분야에서의 하둡 전망

Terbium은 빠르게 인기를 얻고 있으며 이미 일부 Fortune 500 대 기업이 도난당한 데이터를 추적하기 위해 Matchlight 서비스를 사용하기 시작했습니다. 이러한 회사에는 의료 회사, 기술 제공 업체, 은행 및 기타 금융 서비스 제공 업체가 포함됩니다. 결과도 놀랍습니다. 이 회사는 공격자가 도난당한 약 30,000 개의 신용 카드 정보 레코드와 6,000 개의 새로운 주소를 복구했으며 첫날의 첫 몇 초 동안 모두 복구했습니다. 이것들은 분명히 다크 웹에서 판매되었습니다.

도난당한 데이터를 발견하기 위해 Hadoop을 사용하는 이점

머신 러닝, 클라우드 기반 데이터베이스 및 매우 안정적이고 정확한 엔터프라이즈 급 Hadoop 버전 간의 강력한 통합 유형은 회사에 많은 이점을 제공 할 수 있습니다. 이러한 클라우드 기반 데이터베이스는 대량의 데이터를 축적 할 수 있으며,이 데이터는 Hadoop의 도움으로 인터넷에서 서명을 몇 초만에 일치시키기 위해 응용 프로그램에서 활용합니다. 따라서 하둡은 전체 검색 속도를 크게 향상시킬 수 있습니다. 이로 인해 기업은 필요한 평균 검색 시간 (200 일) 대신 매우 짧은 시간 (예 : 몇 초) 내에 도난당한 데이터를 찾을 수 있습니다.

MapR 배포 만 필요한 이유

Matchlight는 Hadoop의 MapR 배포 만 사용합니다. 이것은 여러 가지 이유 때문입니다. 첫 번째 이유는 엔터프라이즈 급 버전의 Hadoop이 기본 코드에서 실행되므로 모든 리소스를 효과적으로 활용하기 때문입니다. 또한 클라우드 기반이기 때문에 스토리지 비용이 거의 사용되지 않습니다. 또한 매우 빠르기 때문에 많은 수의 데이터 핑거를 쉽게 관리 할 수 ​​있습니다. 최신 보안, 높은 안정성 및 손쉬운 백업 및 복구와 같은 다양한 추가 비즈니스 급 기능을 제공합니다.

결론

하둡은 조직의 데이터 보안 분야에서 매우 유용한 것으로 입증되었습니다. 많은 회사에서 MapR을 사용하여 데이터를 효과적으로 관리하고 데이터를 도난 당할 경우 실행 계획을 세웁니다.이러한 조직의 데이터를 보호하고 몇 개월이 아닌 몇 초 만에 데이터 도난을 식별 할 수있는 많은 새로운 회사들도 등장하고 있습니다.