하둡 분산 파일 시스템 (HDFS)

작가: Judy Howell
창조 날짜: 28 칠월 2021
업데이트 날짜: 23 6 월 2024
Anonim
하둡 분산 파일 시스템
동영상: 하둡 분산 파일 시스템

콘텐츠

정의-HDFS (Hadoop Distributed File System) 란 무엇입니까?

HDFS (Hadoop Distributed File System)는 표준 또는 저사양 하드웨어에서 실행되는 분산 파일 시스템입니다. Apache Hadoop에서 개발 한 HDFS는 표준 분산 파일 시스템처럼 작동하지만 MapReduce 알고리즘, 높은 내결함성 및 대규모 데이터 세트의 기본 지원을 통해 더 나은 데이터 처리량 및 액세스를 제공합니다.


Microsoft Azure 및 Microsoft 클라우드 소개 | 이 가이드를 통해 클라우드 컴퓨팅에 관한 모든 내용과 클라우드에서 비즈니스를 마이그레이션하고 운영하는 데 Microsoft Azure가 어떻게 도움이되는지 알아 봅니다.

Techopedia는 HDFS (Hadoop Distributed File System)를 설명합니다.

HDFS는 일반적으로 수백 및 수천 개의 동시 연결된 노드로 여러 시스템에 배치 된 많은 양의 데이터를 저장하고 각 데이터 인스턴스를 하나의 그룹과 다른 그룹으로 세 개의 다른 사본으로 복제하여 데이터 안정성을 제공합니다. 이러한 복사본은 오류 발생시 교체 될 수 있습니다.

HDFS 아키텍처는 클러스터로 구성되며 각 클러스터는 별도의 시스템에 설치된 단일 NameNode 소프트웨어 도구를 통해 액세스하여 해당 클러스터 파일 시스템 및 사용자 액세스 메커니즘을 모니터링하고 관리합니다. 다른 머신은 하나의 DataNode 인스턴스를 설치하여 클러스터 스토리지를 관리합니다.

HDFS는 Java로 작성되었으므로 응용 프로그램 통합 및 접근성을 위해 Java API (Application Programming Interface)를 기본적으로 지원합니다. 표준 웹 브라우저를 통해 액세스 할 수도 있습니다.