06/08/2025
900 lượt đọc
Khi bạn bắt đầu tiếp cận với thống kê, toán ứng dụng hay phân tích dữ liệu tài chính, rất nhanh thôi bạn sẽ gặp một khái niệm quen thuộc đến mức... tưởng chừng ai cũng đã biết: standard normal distribution. Nhưng điều thú vị là, càng đi sâu vào thế giới định lượng – từ quản trị rủi ro, phân tích thị trường, đến thiết kế chiến lược giao dịch – bạn sẽ càng nhận ra rằng không ai thực sự hiểu đủ về nó nếu chỉ dừng lại ở sách giáo khoa.
Vậy phân phối chuẩn tắc (standard normal distribution) là gì? Vì sao nó quan trọng? Và đặc biệt, khi áp dụng vào thực tế, chúng ta nên dùng nó thế nào cho đúng?
Standard normal distribution là một trường hợp đặc biệt của phân phối chuẩn (normal distribution), khi trung bình (mean) bằng 0 và độ lệch chuẩn (standard deviation) bằng 1. Khi đó, ta có công thức hàm mật độ xác suất (PDF) như sau:
Trong đó, z là một biến ngẫu nhiên liên tục, và giá trị của nó đại diện cho khoảng cách từ trung bình theo đơn vị độ lệch chuẩn. Z càng lớn (hoặc âm cực trị), xác suất để biến cố đó xảy ra càng nhỏ.
Đây chính là nguồn gốc của khái niệm z-score – chỉ số dùng để đo xem một giá trị cụ thể nằm cách bao nhiêu độ lệch chuẩn so với trung bình. Z = 0 có nghĩa là đúng ở trung bình. Z = 2 có nghĩa là giá trị đó nằm cách trung bình 2 lần độ lệch chuẩn.
Standard normal distribution có ba tính chất rất đáng chú ý:
Nói cách khác, nếu dữ liệu của bạn phân phối chuẩn tắc, thì xác suất để xảy ra một giá trị cực đoan nằm ngoài 3 độ lệch chuẩn là chỉ khoảng 0.3%, tức cực kỳ hiếm. Và chính điều đó khiến phân phối chuẩn trở thành tiêu chuẩn vàng cho mọi so sánh thống kê.
Câu trả lời nằm ở định lý trung tâm giới hạn (central limit theorem). Định lý này nói rằng, khi bạn lấy mẫu ngẫu nhiên đủ lớn từ bất kỳ phân phối nào, phân phối của trung bình mẫu sẽ tiến gần đến phân phối chuẩn.
Trong nhiều mô hình tài chính, machine learning hay khoa học dữ liệu, cái ta quan tâm là trung bình (mean) – chẳng hạn như:
→ Nhờ vậy, bạn có thể áp dụng các kỹ thuật thống kê (z-test, p-value, confidence interval…) mà không cần giả định quá nhiều về dữ liệu ban đầu.
Standard normal distribution không nằm trên giấy. Nó đi vào từng ngóc ngách trong phân tích dữ liệu, tài chính, y học, kỹ thuật, machine learning, và đặc biệt là các hệ thống giao dịch định lượng. Dưới đây là những ứng dụng cụ thể:
Z-score thường được dùng để phát hiện các điểm bất thường hoặc cơ hội giao dịch. Ví dụ, nếu bạn đang giao dịch theo cặp (pair trading), z-score của spread giữa hai cổ phiếu vượt quá ±2 có thể là tín hiệu mở vị thế kỳ vọng spread quay về trung bình.
Trong thống kê, khi bạn kiểm tra xem một chiến lược giao dịch có thực sự hiệu quả không, bạn thường thực hiện kiểm định giả thuyết (hypothesis testing). Z-score cho bạn biết độ lệch chuẩn giữa hiệu suất kỳ vọng và hiệu suất quan sát. Từ đó, bạn tra ra p-value, để quyết định có bác bỏ giả thuyết không.
Ví dụ: bạn backtest một chiến lược và thấy lợi nhuận trung bình mỗi ngày là 0.2%. Sau 100 phiên, bạn tính được z = 2.3. Dựa vào bảng phân phối chuẩn, p-value tương ứng là khoảng 0.021 → có thể nói chiến lược này có ý nghĩa thống kê ở mức 5%.
VaR – một chỉ số đo lường mức lỗ tối đa kỳ vọng tại một mức độ tin cậy – cũng được tính dựa vào phân phối chuẩn. Nếu bạn cần tính VaR tại mức 99%, bạn sẽ tra được z = 2.33.
Mô hình định giá quyền chọn nổi tiếng Black–Scholes sử dụng hàm phân phối tích lũy chuẩn (cumulative distribution function) để định giá quyền chọn mua và bán. Nếu không có phân phối chuẩn tắc, mô hình này sụp đổ hoàn toàn.
Standard normal distribution là công cụ mạnh mẽ, nhưng không phải lúc nào cũng nên dùng bừa bãi. Dưới đây là vài điều bạn nên lưu tâm:
Standard normal distribution là một trong những khái niệm cơ bản nhưng cực kỳ quyền lực. Nó là ngôn ngữ chung để chuyển mọi loại dữ liệu khác nhau về cùng một hệ quy chiếu. Từ đó, chúng ta có thể đánh giá xác suất, rủi ro, hiệu suất – và đưa ra quyết định khách quan hơn.
Tuy nhiên, điều quan trọng hơn là biết khi nào nên dùng và khi nào nên nghi ngờ nó. Một chiến lược giao dịch có thể “cực kỳ tốt” trên giấy khi phân phối lợi nhuận là chuẩn, nhưng ngoài thực tế lại rất dễ sụp đổ nếu thị trường xuất hiện cú sốc.
Thế nên, hiểu về phân phối chuẩn không chỉ là học một công thức hay tra bảng z, mà là hiểu bản chất của xác suất trong thế giới đầy biến động và bất định này
Hãy xây dựng và kiểm thử chiến lược giao dịch phái sinh của bạn trên nền tảng QMTRADE trước khi sử dụng tiền thật để tránh những rủi ro không đáng có.
.webp)
0 / 5
Trong giao dịch theo hệ thống, khoảnh khắc khó chịu nhất không phải là một phiên thua lỗ lớn, mà là một chuỗi thua đều đặn kéo dài. Ở thị trường Việt Nam, đặc biệt với phái sinh VN30F1M, sáu tháng liên tục không hiệu quả là đủ để khiến phần lớn trader bắt đầu nghi ngờ mọi thứ mình đang làm.
Một trong những giả định ngầm nhưng có ảnh hưởng lớn nhất đến cách nhà đầu tư tiếp cận thị trường là việc coi thị trường tài chính như một cỗ máy. Theo cách nhìn này, nếu hiểu đủ rõ các biến số đầu vào, nếu xây dựng được mô hình đủ tinh vi, ta có thể dự đoán chính xác đầu ra – giá sẽ đi đâu, khi nào, và bao xa.
Mô hình head and shoulders (vai đầu vai) là một trong những mô hình phân tích kỹ thuật cơ bản nhưng rất mạnh mẽ trong việc dự đoán xu hướng thị trường. Mô hình này rất phổ biến trong các giao dịch chứng khoán cơ sở và phái sinh, đặc biệt là tại các thị trường có độ biến động cao như Việt Nam. Được coi là mô hình đảo chiều, head and shoulders thường xuất hiện sau một xu hướng tăng, báo hiệu rằng giá có thể đảo chiều giảm, hoặc có thể xuất hiện ngược lại sau một xu hướng giảm, báo hiệu sự đảo chiều thành tăng.
Khi trader mới bước vào thị trường, đặc biệt là phái sinh VN30, một trong những câu chuyện được kể nhiều nhất là: “Có market maker kéo giá quét stop”. Sau vài lần bị hit stop rất gọn, đúng đỉnh đúng đáy, cảm giác đó là hoàn toàn thật. Nhưng nếu dừng lại ở mức “có ai đó săn mình”, thì rất dễ đi lạc hướng.
Nếu phải mô tả thị trường tài chính giai đoạn 2026 bằng một cụm từ, thì đó là: khó định hình nhưng không hề yên ắng. Sau nhiều năm thị trường bị dẫn dắt bởi những câu chuyện lớn – từ COVID, kích thích tiền tệ, lạm phát cho tới AI – nhà đầu tư dần nhận ra một vấn đề: những narrative này không còn vận hành theo đường thẳng. Lãi suất không tăng mạnh nữa nhưng cũng không quay về mức cực thấp. Lạm phát hạ nhiệt nhưng vẫn dai dẳng. AI tiếp tục thay đổi nền kinh tế, nhưng lợi nhuận không còn phân bổ đồng đều như giai đoạn đầu. Trong một môi trường như vậy, đầu tư dựa trên một kịch bản duy nhất trở nên cực kỳ mong manh.
Với rất nhiều người bước vào trading định lượng, data mining gần như là phản xạ tự nhiên đầu tiên. Bạn có dữ liệu giá, có indicator, có máy tính đủ mạnh, vậy thì việc “quét” hàng trăm, hàng nghìn tổ hợp tham số để tìm ra chiến lược có lợi nhuận nghe rất hợp lý. Cảm giác này đặc biệt mạnh với những ai có nền tảng kỹ thuật: code chạy được, backtest ra equity curve đẹp, drawdown thấp, Sharpe cao – mọi thứ trông rất khoa học và thuyết phục.
Được nghiên cứu và phát triển bởi các chuyên gia từ QMTrade và cộng đồng nhà đầu tư chuyên nghiệp.
Truy cập ngay!