GROUP BY
란?
GROUP BY
는 SQL에서 데이터를 특정 컬럼 기준으로 그룹화하는 명령어임.
이를테면, 여러 직원들의 입사 연도 데이터가 있다 치면, 이 데이터를 연도별로 그룹화해서 각 연도에 몇 명의 직원이 입사했는지 알고 싶을 때GROUP BY
를 활용할 수 있음.
SELECT 입사연도, COUNT(*) AS 입사인원
FROM 직원
GROUP BY 입사연도;
결과예시
입사연도 | 직원수 |
---|---|
2020 | 15 |
2021 | 20 |
2022 | 25 |
이 쿼리는 각 입사 연도별로 몇 명의 직원이 있었는지를 계산해줌.
GROUP BY ROLLUP
이란?
GROUP BY ROLLUP
은 GROUP BY
의 확장판임. 이 명령어를 사용하면, 지정한 컬럼들에 대해 더 상세한 계층적인 집계 데이터를 만들어낼 수 있음.
예를 들어서, 연도별, 부서별 직원 수를 분석하고 싶은데, 이때 전체 직원 수도 함께 알고 싶다면 ROLLUP
을 쓸 수 있음.
기본 사용법:
ROLLUP
을 쓰고 싶다면, GROUP BY
절 다음에 ROLLUP
키워드를 넣고, 괄호 안에 집계하고 싶은 컬럼들을 순서대로 나열하면 됨.
이렇게 하면, 지정한 컬럼에 대한 각각의 집계 정보뿐만 아니라, 컬럼들의 조합에 대한 집계 정보까지 계층적으로 얻을 수 있음.
예시 쿼리:
SELECT 입사연도, 부서, COUNT(*) AS 직원수
FROM 직원
GROUP BY ROLLUP (입사연도, 부서);
결과예시
입사연도 | 부서 | 직원수 |
---|---|---|
2020 | 인사 | 3 |
2020 | 개발 | 10 |
2020 | 마케팅 | 5 |
2020 | NULL | 18 |
2021 | 인사 | 2 |
2021 | 개발 | 8 |
2021 | 마케팅 | 4 |
2021 | NULL | 14 |
NULL | NULL | 32 |
이 쿼리는 다음과 같은 결과를 줌:
- 각 입사 연도 및 부서별 직원 수
- 각 입사 연도별 전체 직원 수
- 전체 직원 수
ROLLUP
을 사용하면, 기본적인 그룹화뿐만 아니라, 그룹화된 결과들을 더 큰 범위의 합계나 평균 등으로 다시 한번 요약해서 볼 수 있게 해준다.
이는 보다 광범위한 인사이트를 얻을 수 있게 해주는데 데이터 분석을 할 때, 이러한 계층적 집계 기능은 매우 유용하게 활용될 수 있다.
CUBE
란?
GROUP BY CUBE
는 GROUP BY
명령어의 또 다른 확장판으로, 다차원적인 집계를 가능하게 해줌.CUBE
를 사용하면, 지정한 컬럼들의 모든 가능한 조합에 대해 집계 결과를 생성할 수 있어, 복잡한 데이터 분석과 보고에 유용함.
기본 사용법:
GROUP BY CUBE
를 사용하려면, GROUP BY
절 다음에 CUBE
키워드를 넣고, 괄호 안에 집계하고자 하는 컬럼들을 나열하면 됨.
이렇게 하면, 지정한 컬럼들 각각에 대한 집계뿐만 아니라, 그 컬럼들의 모든 가능한 조합에 대한 집계 결과도 함께 생성됨.
예시 쿼리:
SELECT 입사연도, 부서, COUNT(*) AS 직원수
FROM 직원
GROUP BY CUBE (입사연도, 부서);
결과예시
입사연도 | 부서 | 직원수 |
---|---|---|
2020 | 인사 | 3 |
2020 | 개발 | 10 |
2020 | 마케팅 | 5 |
2020 | NULL | 18 |
2021 | 인사 | 2 |
2021 | 개발 | 8 |
2021 | 마케팅 | 4 |
2021 | NULL | 14 |
NULL | 인사 | 5 |
NULL | 개발 | 18 |
NULL | 마케팅 | 9 |
NULL | NULL | 32 |
이 쿼리는 다음과 같은 결과를 줌:
- 각 입사 연도 및 부서별 직원 수
- 각 입사 연도별 전체 직원 수
- 각 부서별 전체 직원 수
- 전체 직원 수
CUBE
를 사용하면, 데이터를 다양한 방식으로 분석할 수 있으며, 이는 보다 광범위한 인사이트를 얻는 데 도움이 될 수 있음.
특히 복수의 차원에서 데이터를 분석하고자 할 때 CUBE
는 각 차원의 조합에 대한 모든 가능한 집계 결과를 제공함으로써,
데이터 분석의 깊이와 범위를 확장시켜 줄 수 있다.
'기타' 카테고리의 다른 글
[SQL] 서브쿼리 (스칼라, 인라인 뷰, 중첩 서브쿼리) (0) | 2024.02.25 |
---|---|
[SQL] 정규화와 반정규화 (0) | 2024.02.18 |
[SQL] CASE 문 (0) | 2024.02.02 |
[SQL] INNER JOIN (0) | 2024.02.01 |
ELB - ALB,NLB (0) | 2023.09.02 |