아파치 스파크

작가: Eugene Taylor
창조 날짜: 8 팔월 2021
업데이트 날짜: 22 6 월 2024
Anonim
아파치 스파크 개념 설명1
동영상: 아파치 스파크 개념 설명1

콘텐츠

정의-Apache Spark는 무엇을 의미합니까?

Apache Spark는 데이터 분석에 사용되는 오픈 소스 프로그램입니다. Apache Hadoop 및 오늘날의 분석 커뮤니티를위한 기타 오픈 소스 리소스를 포함하여 더 큰 도구 세트의 일부입니다.


전문가들은이 상대적으로 새로운 오픈 소스 소프트웨어를 데이터 분석 클러스터 컴퓨팅 도구로 설명합니다. 복잡한 파일 처리를 용이하게하는 특정 Hadoop 구성 요소 인 HDFS (Hadoop Distributed File System)와 함께 사용할 수 있습니다.

일부 IT 전문가는 Apache Hadoop MapReduce 구성 요소를 대체 할 수있는 Apache Spark를 사용한다고 설명합니다. MapReduce는 개발자가 많은 양의 데이터를 처리하는 데 도움이되는 클러스터링 도구입니다. Apache Spark의 설계를 이해하는 사람들은 경우에 따라 MapReduce보다 몇 배 더 빠를 수 있다고 지적합니다.

Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

Techopedia는 Apache Spark를 설명합니다.

현대의 Apache Spark 사용에 대한보고에 따르면 기업은 다양한 방식으로 사용하고 있습니다. 한 가지 일반적인 용도는 데이터를 집계하고보다 세련된 방식으로 데이터를 구성하는 것입니다. Apache Spark는 분석 기계 학습 작업 또는 데이터 분류에도 도움이 될 수 있습니다.

일반적으로 조직은 이러한 종류의 작업에 Apache Spark를 사용할 수있는 효율적이고 다소 자동화 된 방식으로 데이터를 수정해야하는 문제에 직면 해 있습니다. 일부는 Spark를 사용하면 프로그래밍에 대해 잘 모르고 분석 처리에 참여하려는 사람들에게 액세스 할 수 있음을 의미합니다.

Apache Spark에는 Python 및 관련 소프트웨어 언어 용 API가 포함되어 있습니다.