본문 바로가기

Database/GPDB Database Administrator Guide 한글판 작업

[GPDB DBA Guide v5.1 한글판] #외부 데이터 작업 (External Data)

[GPDB DBA Guide v5.1 한글판] #외부 데이터 작업 (External Data)


##서론 참고##

2018/08/20 - [GPDB Database Administrator Guide 한글판 작업] - Greenplum database administrator 한글판 작업 시작 및 안내사항


외부 데이터 작업 (External Data)


외부 테이블은 데이터가 일반 Greenplum 테이블에 저장되어 있는것 처럼 액세스 할 수 있도록 합니다. 데이터를 외부 테이블에서 읽거나 쓸 수 있습니다.


External table은 데이터베이스 외부에 있는 데이터를 베이스로 하는 Greenplum 데이터 테이블입니다. External table 역시 읽거나 쓸 수 있습니다. SELECT 및 INSERT와 같은 SQL문으로 일반 데이터베이스 테이블처럼 사용 할 수 있으며, 다른 테이블과 join할 수 있습니다. External table은 데이터를 로드하고 언로드하는 데 가장 많이 사용됩니다.


웹 기반 External table은 HTTP서버 또는 운영체제 프로세스에서 제공하는 데이터에 대한 액세스를 제공합니다. 웹 기반 External table에 대한 자세한 내용은 외부 웹 테이블 만들기 및 사용을 참조하시기바랍니다.


##섹션 리스트##


※ External Table의 정의

- External table은 외부 데이터를 일반 데이터베이스의 데이터인것 처럼 액세스 할 수 있도록 합니다. Greenplum 데이터베이스 안팎으로 데이터를 이동하는데 사용되는 경우가 많습니다.


※ PXF를 사용하여 HDFS 및 Hive 데이터 액세스

- 관리하는 데이터가 이미 외부 소스에 존재할 수 있습니다. Greenplum 데이터베이스의 PXF (Extension Framework)는 외부 데이터 소스를 Greenplum 데이터베이스 테이블 정의에 매핑하는 내장 커넥터를 통해 이 외부 데이터에 액세스 할 수 있습니다.


※ gphdfs로 HDFS 데이터 액세스

- Greenplum 데이터베이스는 gphdfs 프로토콜을 사용하여 Hadoop Distributed File System의 병렬 아키텍처로 데이터 파일을 효율적으로 읽고 씁니다.


Greenplum 병렬 파일 서버 사용(gpfdist)

- gpfdist 프로토콜은 최상의 성능을 제공하며, 설정이 쉽습니다. gpfdist는 External table 읽기를 위해 Greenplum 데이터베이스 시스템의 모든 세그먼트를 최적으로 사용합니다.


◎상위 주제 : #Greenplum Database Administrator 가이드


* 원본 보기 (https://gpdb.docs.pivotal.io/510/admin_guide/external/g-working-with-file-based-ext-tables.html)

Image result for greenplum



* 해당 섹션 리스트 제목에 링크가 없는 것은 아직 하위 경로 번역 작업이 이루어 지지 않음을 미리 알려 드립니다. (하위 경로 번역이 이루어 지면 섹션 제목에 링크가 활성화 됩니다.)


By.sTricky