하둡 생태계

작가: Roger Morrison
창조 날짜: 18 구월 2021
업데이트 날짜: 19 6 월 2024
Anonim
Hadoop Ecosystem의 이해와 활용 - Hadoop 소개 & Hadoop 1
동영상: Hadoop Ecosystem의 이해와 활용 - Hadoop 소개 & Hadoop 1

콘텐츠

정의-하둡 에코 시스템은 무엇을 의미합니까?

Hadoop 에코 시스템은 Apache Hadoop 소프트웨어 라이브러리의 다양한 구성 요소뿐만 아니라 이러한 유형의 소프트웨어 프로젝트를 위해 Apache Software Foundation에서 제공하는 액세서리 및 도구와 함께 작동하는 방식을 나타냅니다.


Hadoop은 Java 기반 프레임 워크로 대규모 데이터 세트를 처리하고 분석하는 데 매우 인기가 있습니다.

Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

Techopedia는 Hadoop 생태계를 설명합니다

핵심 Hadoop 패키지 및 해당 액세서리는 대부분 Apache에서 라이센스 한 오픈 소스 프로젝트입니다. Hadoop 에코 시스템의 아이디어는 방대한 양의 데이터를 처리하기위한 프레임 워크 인 MapReduce와 정교한 파일 처리 시스템 인 HDFS (Hadoop Distributed File System)와 같은 핵심 Hadoop 세트의 여러 부분을 사용하는 것입니다. 하둡 리소스 관리자 인 YARN도 있습니다.

Apache는 이러한 Hadoop의 핵심 요소 외에도 개발자를위한 다른 종류의 액세서리 또는 보완 도구를 제공했습니다. 여기에는 데이터 분석 도구 인 Apache Hive가 포함됩니다. 빅 데이터 처리를위한 일반적인 엔진 인 Apache Spark; 데이터 흐름 언어 인 Apache Pig; 데이터베이스 툴인 HBase; 또한 다양한 아파치 리소스의 사용을 함께 관리하는 데 도움을주기 때문에 Hadoop 에코 시스템 관리자로 간주 될 수있는 Ambarl도 있습니다. 하둡이 데이터 수집의 사실상의 표준이되고 많은 조직에서 유비쿼터스가됨에 따라 관리자와 개발 리더는 하둡 생태계와 일반적인 하둡 설정에 어떤 종류의 일이 있는지에 대해 배우고 있습니다.