🛕GROUP BY trong SQL

Group by trong SQL là gì? Cách dùng Group by khi lập trình bằng SQL như thế nào?

Lệnh GROUP BY trong SQL Server được dùng để lấy dữ liệu tóm tắt dựa trên một hoặc nhiều nhóm. Các nhóm có thể được tạo thành từ một hoặc nhiều cột. Ví dụ, truy vấn GROUP BY sẽ được dùng để đếm số lượng nhân viên trong mỗi phòng ban, hoặc tính tổng lương của một bộ phận.

Bạn phải dùng các hàm tổng hợp như COUNT(), MAX(), MIN(), SUM(), AVG()… trong truy vấn SELECT. Kết quả câu lệnh GROUP BY trong SQL Server trả về một hàng cho từng giá trị của cột GROUP BY.

Cú pháp:

SELECT column1, column2,...columnN FROM table_name
[WHERE]
[GROUP BY column1, column2...columnN]
[HAVING]
[ORDER BY]

Mệnh đề SELECT có thể bao gồm cột được dùng với SQL GROUP BY. Vì thế, để bao gồm các cột khác trong hàm GROUP BY, dùng các hàm tổng hợp như COUNT(), MAX(), MIN(), SUM(), AVG() với những cột đó.

Đặc điểm nổi bật của GROUP BY trong SQL:

  • Được dùng để tạo thành nhóm các bản ghi.

  • Đứng sau mệnh đề WHERE nếu có và trước HAVING.

  • Có thể bao gồm một hoặc nhiều cột để tạo thành một hoặc nhiều nhóm dựa trên cột đó.

  • Chỉ các cột GROUP BY có thể được dùng bao gồm trong mệnh đề SELECT. Để dùng các cột khác trong SELECT, dùng hàm tổng hợp.

Để các bạn dễ theo dõi cách sử dụng GROUP BY trong SQL Server và tiện làm ví dụ, chúng ta sẽ sử dụng bảng dữ liệu dưới đây trong toàn bộ bài viết.

Bảng có tên Quantrimang.com, có 4 cột là IDChuyenmuc, Muccon, Chuyenmuclon, Sobai và 6 hàng như sau:


+------------+----------+-------------+-------+
|IDChuyenmuc |  Muccon  |Chuyenmuclon | Sobai |
+------------+----------+-------------+-------+
|    1       |SQL Server|Lap trinh    | 101   |
|    2       |Facebook  |Mang xa hoi  | 152   |
|    3       |Python    |Lap trinh    | 101   |
|    4       |JavaScript|Lap trinh    | 122   |
|    5       |Chrome    |Web          | 94    |
|    6       |Instagram |Mang xa hoi  | 165   |
+------------+----------+-------------+-------+

Cú pháp mệnh đề GROUP BY trong SQL Server

SELECT
    bieu_thuc1,  bieu_thuc2,...  bieu_thuc_n, 
       ham_tong_hop (bieu_thuc)
FROM
    ten_bang
[WHERE dieukien]
GROUP BY
    bieu_thuc1,
    bieu_thuc2,...;

Tên biến hoặc giá trị biến:

  • bieu_thuc1, bieu_thuc2,... bieu_thuc_n: Biểu thức không nằm bên trong hàm tổng hợp và phải nằm trong mệnh đề GROUP BY.

  • ham_tong_hop: Có thể là các hàm như SUM, COUNT, MIN, MAX hoặc AVG.

  • ten_bang: Bảng cần lấy bản ghi từ đó, phải có ít nhất 1 bảng trong mệnh đề FROM.

  • WHERE dieukien: Tùy chọn. Đây là điều kiện mà bản ghi phải đáp ứng để được chọn.

Ví dụ - dùng hàm SUM

SELECT Chuyenmuclon, SUM(Sobai) AS "Tong"
  FROM [Quantrimang.com]
  GROUP BY Chuyenmuclon;

Ví dụ này dùng hàm tính tổng SUM để trả về tên Chuyenmuclon và tổng số bài viết (Sobai) (theo tên chuyên mục lớn).

Vì bạn đưa ra 1 cột (Chuyenmuclon) trong lệnh SELECT và không nằm trong hàm SUM nên sẽ phải dùng mệnh đề GROUP BY.

Khi đó ta có bảng kết quả trả về như sau:


+--------------+------+
| Chuyenmuclon | Tong |
+--------------+------+
|Lap trinh     | 324  |
|Mang xa hoi   | 317  |
|Web           | 94   |
+--------------+------+

Ví dụ - dùng hàm COUNT

SELECT  COUNT(Chuyenmuclon), Chuyenmuclon
  FROM [Quantrimang.com]
  WHERE Chuyenmuclon = 'Lap trinh'
  GROUP BY Chuyenmuclon;

Ở ví dụ này, hàm COUNT sẽ trả về số lượng Chuyenmuccon của Chuyenmuclon Lap trinh:


+------+--------------+
|      | Chuyenmuclon |
+------+--------------+
|  3   |  Lap trinh   |
+------+--------------+

Nếu không muốn lấy tên cột mà chỉ cần trả về số lượng mục con, bạn chạy lệnh sau:

SELECT  COUNT(Chuyenmuclon)
  FROM [Quantrimang.com]
  WHERE Chuyenmuclon = 'Lap trinh'
  GROUP BY Chuyenmuclon;

Kết quả trả về sẽ chỉ có số 3.

Ví dụ - dùng hàm MIN

SELECT Chuyenmuclon, MIN(Sobai) AS 'So luong it nhat'
 FROM [Quantrimang.com]
 GROUP BY Chuyenmuclon;

Mệnh đề GROUP BY dùng với hàm MIN ở trên sẽ trả về Chuyenmuclon và số lượng bài ít nhất của mục lớn đó.

Ví dụ - dùng hàm MAX

SELECT Chuyenmuclon, MAX(Sobai) AS 'So bai cao nhat'
 FROM [Quantrimang.com]
 GROUP BY Chuyenmuclon;

Ví dụ cuối cùng này trả về tên của Chuyenmuclon và số bài cao nhất của chuyên mục.

Ví dụ - Dùng với mệnh đề HAVING

Nếu đang băn khoăn tự hỏi làm thế nào lọc kết quả sau khi nhóm, mệnh đề HAVING sẽ giúp bạn giải quyết vấn đề này.

SELECT r.name, COUNT(*) AS albums
FROM albums l, artists r
WHERE artist_id=r.id
GROUP BY artist_id
HAVING albums > 1;

Lưu ý, mệnh đề HAVING theo sau GROUP BY. Mặt khác, về cơ bản, đó là sự thay thế đơn giản cho WHERE với HAVING. Kết quả:

+------------+--------+
| name | albums |
+------------+--------+
| Pink Floyd | 2 |
| Adele | 2 |
+------------+--------+

Bạn vẫn có thể dùng điều kiện WHERE để lọc kết quả trước khi nhóm. Nó sẽ hoạt động cùng với mệnh đề HAVING để lọc sau khi nhóm:

SELECT r.name, COUNT(*) AS albums
FROM albums l, artists r
WHERE artist_id=r.id
AND release_year > 1990
GROUP BY artist_id
HAVING albums > 1;

Kết quả: Chỉ một nghệ sĩ trong cơ sở dữ liệu đã phát hành nhiều hơn 1 album sau năm 1990.

+-------+--------+
| name | albums |
+-------+--------+
| Adele | 2 |
+-------+--------+

Last updated