Backend/Bigquery

Bigquery에 DTS 기능 이용하기 - Data Transfer Service

amelia-suyeon 2023. 7. 4. 22:16

Google Cloud Platform에서 제공하는 Data Transfer Service를 이용하여 Google Cloud Bucket에 있는 데이터를 Bigquery에 손쉽게 적재할 수 있다!

 

필자는 이미 GCS에 올려놓은 test 데이터를 이용해서 적재해보도록 하겠다!

 

1. 빅쿼리 탭에서 데이터 전송을 클릭한다.

 

 

 

2. 전송 만들기를 클릭

 

 

3. 소스 유형 선택하기 -> 필자의 경우 Google Cloud Storage 선택

여러 소스를 선택할 수 있으며, aws s3 버킷도 가능함!

 

 

4. 전송 구성 이름 , 일정 옵션을 지정해준다.

반복 간격 : 배치 간격 시간 지정

지금 시작 및 일정한 시간에 시작 : 현재 or 시작 할 시간 지정 가능 

 

 

5. 하이라이트 된 부분 지정해서 입력

데이터 세트 :  bigquery의 데이터 세트 중 어디에 넣을 것인지 지정

destination table: 스키마가 지정된 빈 테이블의 테이블 명 

cloud storage url : cloud strorage의 경로 -> 찾아보기를 눌러서 존재하는 곳의 경로 클릭

append :  기존 대상 테이블에 새 데이터를 추가하는 옵션! (mirror: 복사본을 덮어 쓴다. 말 그대로 미러링!)

data format : 원하는 파일 형태 지정 해줌! 

 

 

6. csv 옵션 지정하기 

필자는 csv로 파일을 지정 했기 때문에 필드를 구분하는 기호로는 , 를 사용했다. (default = ,)

그리고 skip 할 header row, 즉 파일에 컬럼명 추가되어 있는 경우 1로 적어준다! 

 

 

 

7. 저장 을 누르면 아래와 같은 화면이 등장한다!

-> 수정이 필요하면 빨간 동그라미 클릭! 

 

 

8. 마지막 Destination table에 들어가서 미리 보기로 데이터가 들어있다면 성공!