Nhiều người vẽ biểu đồ thời gian để xem dữ liệu đã đi đâu. Nhưng người làm phân tích giỏi sẽ dùng nó để biết dữ liệu sẽ đi đến đâu.
Và để làm được điều đó, bạn cần những mô hình giúp nhận diện quy luật ẩn trong thời gian.
Trong bài này, mình tổng hợp lại 2 mô hình dự đoán xu hướng mùa vụ mình hay dùng nhất — vừa hiệu quả, vừa dễ hiểu, ngay cả khi bạn không làm data vẫn có thể tự thử.
1. Mô hình Prophet (Phát triển bởi Meta/Facebook)
-
Định nghĩa: Prophet là một mô hình “phân rã” (decomposition). Nó xem chuỗi thời gian là tổng của nhiều thành phần và dự đoán riêng lẻ từng cái.
-
Mục đích: Nó được thiết kế để dự báo thực tế trong kinh doanh (business forecasting) một cách dễ dàng, nhanh chóng cho cả người không chuyên.
-
Phương pháp: Nó hoạt động theo cơ chế “Ghép hình LEGO”:
Y(t) = Trend(t) + Seasonality(t) + Holiday(t) + Lỗi-
Trend: Hướng đi lâu dài của dữ liệu (tăng, giảm, bão hòa…).
-
Seasonality: “nhịp điệu” lặp lại theo thời gian
-
Holiday: các sự kiện, ngày lễ (Tết, Black Friday…).
-
-
Prophet hoạt động tốt khi:
-
Có xu hướng và mùa vụ rõ ràng
-
Dữ liệu liên tục và đủ dài
-
Ít nhiễu, ít gián đoạn
-
Không có cú sốc bất thường chưa khai báo
-
- Hướng dẫn thực hiện:
1. Chuẩn bị dữ liệu: Định dạng file đầu vào chỉ với 2 cột có tên bắt buộc:
ds(chứa ngày tháng)y(chứa giá trị cần dự đoán)2. Thêm ngày lễ: Tạo một danh sách (dataframe) riêng chứa tên và ngày của các sự kiện, ngày lễ.3. Huấn luyện (Fit): Khởi tạo mô hình Prophet (có thể đính kèm danh sách ngày lễ) và yêu cầu nó “học” (fit) từ dữ liệu đã chuẩn bị.4. Dự đoán (Predict): Tạo một “khung thời gian tương lai” (ví dụ: 30 ngày tới) và yêu cầu mô hình “dự đoán” (predict) cho khung thời gian này.
2. Mô hình Auto-ARIMA (SARIMA tự động)
-
Định nghĩa: Đây là một thuật toán “tìm kiếm tự động”. Nó tự động tìm ra các tham số (p,d,q)(P,D,Q)m tốt nhất cho mô hình SARIMA.
-
Mục đích: Áp dụng sức mạnh của mô hình thống kê SARIMA (tiêu chuẩn vàng) mà không cần kiến thức chuyên sâu về thống kê để chọn tham số.
-
Phương pháp: Nó hoạt động bằng cách “Tìm kiếm thông minh”: Nó sẽ thử nhiều kết hợp tham số SARIMA và dùng một tiêu chí (như AIC) để chấm điểm và chọn ra mô hình vừa vặn nhất.
-
Mô hình SARIMA có nhiều tham số:
-
p,d,qp, d, qp,d,q: mô tả phần ARIMA cơ bản (tự hồi quy, sai phân, nhiễu trắng).
-
P,D,Q,mP, D, Q, mP,D,Q,m: mô tả phần mùa vụ (Seasonal). → Tổ hợp của 7 giá trị này rất lớn, nên nếu thử tay thì cực tốn thời gian.
-
-
Thuật toán “tự động” sẽ:
-
Sinh ra nhiều bộ tham số khác nhau (ví dụ p=1,2,3…, q=0,1,2…, v.v.).
-
Huấn luyện mô hình SARIMA cho từng bộ, tính toán độ lỗi hoặc tiêu chí đánh giá (thường dùng AIC – Akaike Information Criterion).
-
Chọn ra bộ tham số nào cho AIC thấp nhất, tức là mô hình “phù hợp dữ liệu tốt nhất nhưng không quá phức tạp.”
-
-
-
Ứng dụng tốt nhất:
-
Dữ liệu thời tiết, tiêu thụ điện, tài chính, tồn kho.
-
Dữ liệu có chu kỳ “tự nhiên” mạnh (dữ liệu hàng tháng, hàng quý).
-
Khi mô hình cần độ chính xác thống kê cao và không bị ảnh hưởng bởi các sự kiện bên ngoài.
-
Dữ liệu “sạch” và có tính chu kỳ ổn định.
-
Hướng dẫn thực hiện:
1. Chuẩn bị dữ liệu: Chỉ cần một chuỗi số liệu (time series) theo đúng thứ tự thời gian.2. Huấn luyện (Fit): Yêu cầu mô hình “tự động tìm kiếm” (auto-fit).
- Điều quan trọng nhất: Phải chỉ định chu kỳ mùa vụ (ví dụ:
m=12cho dữ liệu hàng tháng, hoặcm=7cho dữ liệu hàng ngày theo tuần).3. Dự đoán (Predict): Yêu cầu mô hình dự đoán cho “n” bước tiếp theo (ví dụ: 12 bước tới).
Hope it helps.
🎁 Nhận Ngay Tài Liệu Data Analysis Cơ Bản
Bao gồm:
Bộ 10 sách: Thống kê, Tư duy phân tích
Bộ 4 slide phân tích chuyên nghiệp
Bạn muốn nâng cấp Tư duy & Kỹ năng phân tích?
Nếu những tài liệu này hữu ích với bạn, và bạn muốn có lộ trình học có hệ thống + mentor trực tiếp + dự án thực tế, bạn có thể tham khảo khóa học thực chiến của mình.
📚
Lộ trình có hệ thống
Lộ trình có hệ thống rõ ràng được chắc lọc giúp bạn đi từ những kiến thức cơ bản đến chuyên sâu
🎓
Mentor trực tiếp
Nhận hỗ trợ 1-1, feedback chi tiết và làm bài tập kèm hỗ trợ từ mentor project
🎯
Dự án thực tế
3 capstone projects dự án xây dựng portfolio ấn tượng
💎
Chứng nhận + Portfolio
Chứng nhận hoàn thành + Website portfolio chuyên nghiệp
Khóa học nâng cấp Tư duy & Kỹ năng phân tích chuyên nghiệp:
Master Analytical Thinking & Data Analysis with Power BI
⏰ Khai giảng: 16/12/2025 • 🎓 Ưu đãi Early Bird đến 10/12