아파치 카프카

작가: Louise Ward
창조 날짜: 5 2 월 2021
업데이트 날짜: 28 6 월 2024
Anonim
[English subtitle]Basic of BIGDATA 💁What is apache kafka?
동영상: [English subtitle]Basic of BIGDATA 💁What is apache kafka?

콘텐츠

정의-Apache Kafka는 무엇을 의미합니까?

Apache Kafka는 신속하고 확장 가능하며 내결함성이있는 실시간 데이터 피드 처리를 제공하도록 설계된 오픈 소스 발행-구독 시스템입니다. 전통적인 엔터프라이즈 메시징 소프트웨어와 달리 Kafka는 회사를 통해 흐르는 모든 데이터를 처리하고 거의 실시간으로 처리 할 수 ​​있습니다.


Kafka는 스칼라로 작성되었으며 원래 LinkedIn에 의해 개발되었습니다. 그 이후로 많은 회사들이이를 사용하여 실시간 플랫폼을 구축했습니다.

Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

Techopedia는 Apache Kafka를 설명합니다.

Kafka는 트랜잭션 로그와 많은 유사성을 가지고 있으며 주제에 대한 피드를 유지합니다. 생산자는 주제에 데이터를 쓰고 소비자는 해당 주제를 읽고 분산 된 시스템 형식으로 여러 노드에 분할되고 복제됩니다. Kafka는 각 주제 파티션을 로그로 취급하고 파티션의 각 파티션에 고유 한 오프셋이 할당된다는 점에서 고유합니다. 특정 시간 동안 모든 정보를 유지하며 소비자는 각 로그에서 자신의 위치를 ​​추적해야합니다. 이는 브로커가이 추적을 담당했던 이전 시스템과 다르며, 이는 소비자 수가 증가함에 따라 시스템 확장이 크게 제한되었습니다. 이 구조를 통해 Kafka는 많은 소비자를 지원하고 매우 적은 오버 헤드로 많은 양의 데이터를 유지할 수 있습니다.

카프카를 사용할 수 있습니다 :

  • 전통적인 중개인으로서
  • 웹 사이트 활동 추적
  • 로그 집계
  • 빅 데이터 스트림 처리

Kafka는 Apache Storm, Apache HBase 및 Apache Spark와 함께 스트리밍 데이터의 실시간 분석 및 렌더링에 사용될 수 있습니다.