아파치 돼지

작가: Robert Simon
창조 날짜: 16 6 월 2021
업데이트 날짜: 13 할 수있다 2024
Anonim
헬기 사격(feat. Trex Arms)
동영상: 헬기 사격(feat. Trex Arms)

콘텐츠

정의-Apache Pig는 무엇을 의미합니까?

Apache Pig는 대용량 데이터 세트를 분석하는 데 사용되는 플랫폼입니다. 데이터 분석 프로그램을 표현하는 고급 언어와 이러한 프로그램을 평가하기위한 인프라로 구성됩니다. Pig의 가장 중요한 특징 중 하나는 구조가 상당한 병렬화에 반응한다는 것입니다.


Pig는 Hadoop 플랫폼에서 작동하여 HDFS (Hadoop Distributed File System)에서 데이터를 쓰고 데이터를 읽고 하나 이상의 MapReduce 작업을 통해 처리를 수행합니다. Apache Pig는 오픈 소스로 제공됩니다.

Apache Pig는 Pig Programming Language 또는 Hadoop Pig라고도합니다.

Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

Techopedia는 Apache Pig를 설명합니다.

Apache Pig에는 Pig Latin 언어와 Pig 엔진의 두 부분이 있습니다. Pig Latin 언어는 사용자가 하나 이상의 입력에서 데이터 흐름을 읽고 처리해야하는 방식과 저장 위치를 ​​설명 할 수있는 스크립팅 언어입니다.

Pig Latin의 주요 특성 중 일부는 다음과 같습니다.

  • 손쉬운 프로그래밍 : 다양한 상호 연결된 데이터 변환으로 구성된 복잡한 작업이 데이터 흐름 시퀀스로 명확하게 인코딩됩니다. 이를 통해 작성, 이해 및 유지 관리가 간단 해집니다.
  • 최적화 가능성 : 작업이 인코딩되는 방식으로 시스템이 자동 실행을 최적화 할 수 있습니다. 이를 통해 사용자는 효율성 대신 의미론에주의를 기울일 수 있습니다.
  • 확장 성 : 사용자는 특수 목적 처리를 수행하기위한 고유 한 기능을 만들 수 있습니다. Pig 엔진은 Pig Latin으로 작성된 데이터 흐름의 실행을 담당합니다. 표준 관계형 데이터베이스 관리 시스템 (RDBMS) 설계와 매우 유사하게 Apache Pig는 데이터 처리를 수행하는 연산자 외에도 구문 분석기, 최적화 프로그램 및 유형 검사기로 구성됩니다. Pig에는 트랜잭션, 데이터 카탈로그 또는 데이터 스토리지를 직접 처리하거나 실행 프레임 워크를 사용하는 기능이 포함되지 않습니다.