Backend/Bigquery
Bigquery 이용하여 간단한 where 조건문 걸기
amelia-suyeon
2023. 8. 9. 16:28
필자는 공공데이터에서 받은 서울시 지하철 데이터를 이용하여, 조건문이 들어간 데이터를 뽑으려고 한다.
궁금했던 점은 2023년 상반기 동안 집과 가까운 2호선 홍대입구역에 얼마나 많은 사람들이 타고 내리는지 중점을 두었다.
그리고, 탄 사람보다 내린 사람이 더 많은 날을 집계하는 쿼리를 만들어 보았다.
SELECT use_date,line_num, line_name, sum(total_num) as total_num, sum(take_off_num) as tot_take_off
FROM `{gcp 프로젝트이름}.{데이터세트 ID}.card_subway_month_total`
WHERE total_num<take_off_num
and line_num ='2호선'
and line_name = '홍대입구'
GROUP BY 1,2,3
1. where 조건문의 첫번째 필터링은 전체 보다 < 탄 사람이 많은가
2. 두번째는 2호선 , 그리고 홍대입구 역
3. 위를 필터링 한 후, 날짜, 호선, 호선 이름을 group by를 통해 날짜 별로 묶어주었다.
( 조건에 맞는 결과들을 모아서 조금 더 구체적인 결과를 위해)
group by를 사용할 때, 주의할 점!
select 에서 사용된 컬럼중 그룹핑 할 조건을 모두 기입해줘야 한다
-> 예를 들어, 날짜로만 묶고 싶어도, line_num, line_name을 같이 적어주지 않으면, group by 불가!
위 쿼리에 대한 결과는 아래에 볼 수 있다.