데이터 로딩 기능 요약¶
이 항목에서는 COPY INTO <테이블> 명령을 사용하여 파일에서 Snowflake 테이블로 데이터를 로드할 수 있도록 지원되는 기능에 대한 빠른 참조를 제공합니다.
이 항목의 내용:
데이터 파일 세부 정보¶
다음 테이블은 데이터 로드에서 사용되는 파일에 대한 일반 세부 정보를 설명합니다.
기능 | 지원됨 | 참고 |
---|---|---|
파일 위치 | 로컬 환경 | 파일은 우선 내부 (Snowflake) 스테이지에 복사(“스테이징”)된 다음, 테이블로 로딩됩니다. |
Amazon S3 | 사용자가 제공하는 버킷에서 직접 파일을 로딩할 수 있습니다. | |
Google Cloud Storage | 사용자가 제공하는 버킷에서 직접 파일을 로딩할 수 있습니다. | |
Microsoft Azure 클라우드 저장소
| 사용자가 제공하는 컨테이너에서 파일을 직접 로딩할 수 있습니다. | |
파일 형식 | 구분 기호로 분리된 파일(CSV, TSV 등) | 모든 유효한 구분 기호가 지원되며, 기본값은 쉼표(즉, CSV)입니다. |
| ||
파일 인코딩 | 파일 형식별 | 구분된 파일(CSV, TSV 등)의 경우 기본 문자 세트는 UTF-8입니다. 다른 문자 세트를 사용하려면 로드에 사용할 인코딩을 명시적으로 지정해야 합니다. 지원되는 문자 세트의 목록은 (이 항목에서) 구분된 파일용으로 지원되는 문자 세트 를 참조하십시오. |
반정형 파일 형식(JSON, Avro 등)에서는 UTF-8 문자 세트만 지원됩니다. | ||
Snowflake는 tar(테이프 아카이브) 파일에서 데이터를 로드하는 기능을 지원하지 않습니다. |
구분된 파일에서 지원되는 문자 세트¶
다음 테이블에서는 구분된 파일(CSV, TSV 등)에서 데이터를 로드할 수 있도록 지원되는 인코딩 문자 세트를 보여줍니다.
문자 세트 |
| 지원되는 언어 | 참고 |
---|---|---|---|
Big5 |
| 중국어 번체 | |
EUC-JP |
| 일본어 | |
EUC-KR |
| 한국어 | |
GB18030 |
| 중국어 | |
IBM420 |
| 아랍어 | |
IBM424 |
| 히브리어 | |
IBM949 |
| 한국어 | |
ISO-2022-CN |
| 중국어 간체 | |
ISO-2022-JP |
| 일본어 | |
ISO-2022-KR |
| 한국어 | |
ISO-8859-1 |
| 덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어 | |
ISO-8859-2 |
| 체코어, 헝가리어, 폴란드어, 루마니아어 | |
ISO-8859-5 |
| 러시아어 | |
ISO-8859-6 |
| 아랍어 | |
ISO-8859-7 |
| 그리스어 | |
ISO-8859-8 |
| 히브리어 | |
ISO-8859-9 |
| 터키어 | |
ISO-8859-15 |
| 덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어 | 유로화 기호를 포함하여, 8자를 제외하면 ISO-8859-1과 동일합니다. |
KOI8-R |
| 러시아어 | |
Shift_JIS |
| 일본어 | |
UTF-8 |
| 모든 언어 | 구분된 파일(CSV, TSV 등)에서 데이터를 로딩하는 경우 UTF-8이 기본값입니다. . . 지원되는 다른 모든 파일 형식(JSON, Avro 등)에서 데이터를 로딩할 뿐 아니라 언로딩하는 경우 UTF-8이 유일하게 지원되는 문자 세트입니다. |
UTF-16 |
| 모든 언어 | |
UTF-16BE |
| 모든 언어 | |
UTF-16LE |
| 모든 언어 | |
UTF-32 |
| 모든 언어 | |
UTF-32BE |
| 모든 언어 | |
UTF-32LE |
| 모든 언어 | |
windows-874 |
| 태국어 | |
windows-949 |
| 한국어 | |
windows-1250 |
| 체코어, 헝가리어, 폴란드어, 루마니아어 | |
windows-1251 |
| 러시아어 | |
windows-1252 |
| 덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어 | |
windows-1253 |
| 그리스어 | |
windows-1254 |
| 터키어 | |
windows-1255 |
| 히브리어 | |
windows-1256 |
| 아랍어 |
스테이징된 파일의 압축¶
다음 테이블은 로드하기 위해 Snowflake가 데이터 파일 압축을 처리하는 방법을 설명합니다. 옵션은 파일이 스테이징, 압축 해제 또는 압축 상태인지의 여부에 따라 다릅니다.
기능 | 지원됨 | 참고 |
---|---|---|
비압축 파일 | gzip | Snowflake 스테이지에서 압축되지 않은 파일을 스테이징하는 경우 파일은 gzip을 사용하여 자동으로 압축됩니다. 단, 압축이 명시적으로 비활성화된 경우에는 제외됩니다. |
이미 압축된 파일 |
| Snowflake가 이러한 압축 방법을 자동으로 감지하거나 사용자가 파일 압축에서 사용된 방법을 명시적으로 지정할 수 있습니다. Brotli 압축 파일은 자동 감지가 지원되지 않으므로 Brotli 압축 파일을 스테이징하거나 로드할 때는 사용된 압축 방법을 명시적으로 지정해야 합니다. Snowflake는 압축된 tar(테이프 아카이브) 파일 업로드를 지원하지 않습니다. |
스테이징된 파일의 암호화¶
다음 테이블은 로드하기 위해 Snowflake가 데이터 파일의 암호화를 처리하는 방법을 설명합니다. 옵션은 파일이 암호화되지 않고 스테이징되었는지 또는 이미 암호화되었는지에 따라 다릅니다.
기능 | 지원됨 | 참고 |
---|---|---|
암호화되지 않은 파일 | 128비트 또는 256비트 키 | 데이터 로딩 및 언로딩 작업을 위해 내부 스테이지에 저장되는 모든 파일은 서버 측에서 강력한 AES-256 암호화를 사용하여 자동으로 암호화됩니다. 기본적으로, Snowflake는 (256비트 키를 구성하는 옵션과 함께) 128비트 키를 사용하여 추가적인 클라이언트 측 암호화를 제공합니다. |
이미 암호화된 파일 | 사용자 제공 키 | 이미 암호화된 파일을 외부 클라우드 저장소에서 Snowflake로 로드할 수 있으며, 이 경우 파일을 암호화하기 위해 사용한 키를 Snowflake에 제공해야 합니다. |