Tiếp tục với series kiến thức về SQL cho Data Analyst, hôm nay UniGap bật mí cho các bạn Data Analyst những tips để tối ưu truy vấn câu lệnh SQL trong công việc nhé.

Vậy tại sao vấn đề tối ưu câu lệnh SQL nên được Data Analyst quan tâm?  

Câu trả lời là: việc tối ưu các truy vấn câu lệnh SQL giúp giảm lượng thời gian người dùng cần để nhận được kết quả sau khi chạy (run) câu lệnh truy vấn; bên cạnh đó, việc này cũng giúp làm giảm resource (tài nguyên, chi phí) được sử dụng để xử lý truy vấn. Hơn hết, có thể bạn chưa biết, việc viết các câu lệnh tối ưu có thể khiến bạn có thêm điểm cộng trong mắt sếp đấy nhé. 

Trong bài học này, bạn sẽ học cách xác định thời điểm có thể cải thiện các truy vấn của mình và cách cải thiện chúng.

1. Tips tối ưu câu lệnh SQL 01: Chỉ SELECT fields, thay vì SELECT *

Bạn chỉ nên select để xem những dữ liệu cần thiết từ bảng thay vì xem hết tất cả dữ liệu, việc này giúp làm giảm chi phí truy vấn (query cost) và xử lý những dữ liệu không mong muốn.

 

  • DON’T

cau-lenh-sql-unigap

  • DO

cau-lenh-sql-unigap-1

2. Tips tối ưu câu lệnh SQL 02: Giảm table size 

Để cải thiện tốc độ truy vấn, bạn nên lọc dữ liệu để chỉ lấy các quan sát bạn cần mà thôi. Cách bạn làm điều này sẽ phụ thuộc hoàn toàn vào vấn đề mà bạn đang cố gắng giải quyết. Ví dụ: nếu bạn có dữ liệu chuỗi thời gian, việc giới hạn trong 1 thời gian ngắn sẽ có thể giúp truy vấn của bạn chạy nhanh hơn nhiều, đặc biệt là lúc bạn chỉ đang thực hiện EDA  (Exploratory Data Analysis) mà thôi.

cau-lenh-sql-unigap-2

 

3. Tips tối ưu câu lệnh SQL 03: Hạn chế truy vấn con được liên kết (linked subqueries)

Linked subqueries phụ thuộc vào truy vấn từ cấp độ gốc (parent) hoặc từ nguồn bên ngoài (external source). Nó chạy từng hàng một, vì vậy tốc độ chu kỳ trung bình sẽ bị ảnh hưởng rất nhiều nếu dùng linked subqueries

 

  • DON’T

cau-lenh-sql-unigap-image4

  • DO

cau-lenh-sql-unigap-image1

4. Tips tối ưu câu lệnh SQL 04: Dùng WHERE thay vì HAVING

Mệnh đề HAVING dùng để lọc các hàng (rows) sau khi tất cả các hàng được chọn và nó hoạt động giống như một bộ lọc. Các câu lệnh HAVING được xác định theo thứ tự thao tác SQL sau các câu lệnh WHERE. Do đó, việc thực hiện truy vấn WHERE sẽ nhanh hơn.

  • DON’T

cau-lenh-sql-unigap-image5

  • DOcau-lenh-sql-unigap-image7

Hy vọng bài viết trên có thể giúp các bạn có thêm những tips hay và áp dụng thành công được ngay trong công việc Data Analyst của mình nhé!

Data Coaching 1 on 1 – người bạn đồng hành giúp các bạn đạt mục tiêu apply Data Analyst thành công

Data Coaching 1 on 1 là dự án coaching của công ty TNHH UniGap – với sứ mệnh thu hẹp khoảng cách giữa trường đại học và nơi làm việc bằng phương pháp phù hợp, chi phí tối ưu và mục tiêu được cam kết.

phuong-phap-coaching-1-on-1-unigap
Trải nghiệm ngay phương pháp Coaching để nhanh chóng đạt mục tiêu

Khoá Data Analyst Coaching 1 on 1 là khoá coaching giúp các bạn đang tự học Data Analyst đạt mục tiêu apply Data Analyst thành công trong 6 tháng. Đặc biệt phù hợp với các bạn dưới 27 tuổi, đang muốn tham gia ngành Data và cần có một đội ngũ thực chiến chuyên nghiệp đồng hành để giúp bạn đi nhanh hơn, cam kết đạt mục tiêu thành công.

Bạn có thể liên hệ để đặt lịch tư vấn miễn phí tại đây.

Data Coaching 1 on 1 – UniGap /Right mindset – True Success/

Nhận tin bài viết mới miễn phí



    WORKSHOP MIỄN PHÍ CHIA SẺ KIẾN THỨC CHUYÊN NGÀNH

    Đăng ký workshop

    NHẬN NGAY BỘ EBOOK & TÀI LIỆU TỰ HỌC MIỄN PHÍ

    Ebook miễn phí