30/10/2025
924 lượt đọc
Khái niệm thị trường hiệu quả (Efficient Market Hypothesis – EMH) được Eugene Fama phát triển từ thập niên 1970, nhưng gốc rễ của nó bắt nguồn từ đầu thế kỷ XX với công trình của Louis Bachelier. Theo EMH, giá chứng khoán tại mọi thời điểm đã phản ánh đầy đủ các thông tin sẵn có; do đó, không nhà đầu tư nào có thể đạt được lợi nhuận vượt trội một cách bền vững. Dưới góc độ thống kê, điều này đồng nghĩa với việc chuỗi lợi nhuận của tài sản là ngẫu nhiên, không có tự tương quan và tuân theo một quá trình ngẫu nhiên (random walk).
Để kiểm tra mức độ “ngẫu nhiên” của lợi nhuận, nhiều kiểm định đã được phát triển: từ Autocorrelation Test, Variance Ratio Test đến Hurst Exponent. Trong đó, Run Test là một trong những phương pháp đơn giản nhưng hiệu quả nhất, giúp nhận diện nhanh liệu thị trường có đang vận hành theo quán tính hay không.
Run Test hoạt động trên nguyên tắc đếm số chuỗi lợi nhuận cùng dấu (tăng hoặc giảm liên tiếp). Một chuỗi dương dài (nhiều phiên tăng liên tiếp) hay chuỗi âm dài (nhiều phiên giảm liên tiếp) là dấu hiệu của momentum – tức là giá cổ phiếu có xu hướng duy trì hướng di chuyển của nó. Trong thị trường hiệu quả, điều này rất hiếm, vì biến động giá phải tuân theo phân phối ngẫu nhiên. Ngược lại, khi số chuỗi dài xuất hiện nhiều hơn mức kỳ vọng thống kê, ta có thể kết luận rằng thị trường phi hiệu quả ở mức độ nhất định, nghĩa là vẫn còn “dấu vết dự đoán được” trong dữ liệu.
Để minh họa, ta sẽ áp dụng Run Test lên dữ liệu giá cổ phiếu của VN30 Index (hoặc một mã cụ thể như VCB – Vietcombank) trong giai đoạn 2018–2024. Dữ liệu có thể tải từ Yahoo Finance, hoặc lấy từ các API trong nước như TCBS. Sau đó, ta tiến hành các bước cơ bản sau bằng Python.
Bước 1. Tính lợi nhuận hàng ngày (Daily Return):
Ở đây, ta tính tỷ suất lợi nhuận hàng ngày đơn giản bằng công thức:
Bước 2. Xác định chuỗi tăng/giảm (Runs):
Ta sử dụng numpy.sign() để xác định dấu của lợi nhuận (+ hoặc -), sau đó đếm số chuỗi cùng dấu liên tiếp:
Bước 3. Phân tích kết quả:
Trong ví dụ thực tế với dữ liệu VN30 (2018–2024), ta thu được:
Nếu thị trường hoàn toàn ngẫu nhiên, số chuỗi kỳ vọng phải xấp xỉ 772. Như vậy, việc xuất hiện ít chuỗi hơn kỳ vọng chứng tỏ giá có sự dính kết về chiều hướng, tức là tồn tại momentum effect. Điều này hàm ý thị trường Việt Nam chưa hoàn toàn hiệu quả theo định nghĩa EMH.
Để định lượng sâu hơn, ta có thể tính giá trị Z theo công thức kiểm định chuẩn, so sánh với ngưỡng ý nghĩa 5%. Nếu giá trị Z vượt quá ±1.96, ta bác bỏ giả thuyết ngẫu nhiên (tức là thị trường phi hiệu quả). Trong phần lớn các mẫu thử của VN30, giá trị |Z| dao động từ 2.3 đến 3.1 – đủ mạnh để khẳng định thị trường Việt Nam có tính xu hướng đáng kể trong ngắn hạn.
Kết quả của Run Test gợi mở nhiều điều thú vị về đặc trưng hành vi và cấu trúc thị trường Việt Nam. Việc các chuỗi tăng hoặc giảm kéo dài xuất hiện thường xuyên phản ánh rõ nét yếu tố tâm lý bầy đàn – khi nhà đầu tư cá nhân chiếm phần lớn giao dịch và thường hành động theo cảm xúc hơn là dữ liệu. Ngoài ra, độ trễ thông tin (information lag) và sự thiếu đồng bộ trong công bố dữ liệu tài chính cũng khiến giá cổ phiếu phản ứng chậm, tạo ra những chuỗi quán tính dễ nhận diện.
Dưới góc nhìn của giao dịch định lượng (quant trading), đây không phải là nhược điểm mà là cơ hội chiến lược. Khi thị trường còn phi hiệu quả, các chiến lược dựa trên thống kê như momentum, mean reversion hay pairs trading có thể tạo ra lợi nhuận vượt trội. Tuy nhiên, để vận dụng được, nhà đầu tư cần dữ liệu đáng tin cậy, có độ phân giải đủ cao (daily hoặc intraday), và phải thường xuyên kiểm định mô hình bằng các phương pháp thống kê nghiêm ngặt như Ljung-Box test, Durbin-Watson, hoặc ADF (Augmented Dickey-Fuller) để đảm bảo tính ổn định.
Từ góc độ hệ thống, Run Test cũng chỉ ra tầm quan trọng của minh bạch dữ liệu. Ở các thị trường phát triển như Mỹ, FDIC hay SEC bắt buộc mọi tổ chức tài chính phải công khai dữ liệu chuẩn hóa, tạo điều kiện cho các mô hình phân tích hoạt động chính xác. Trong khi đó, tại Việt Nam, dữ liệu tài chính vẫn chủ yếu ở dạng PDF hoặc bán cấu trúc, gây khó khăn cho các nhà phân tích định lượng. Chính vì vậy, việc hướng tới chuẩn hóa dữ liệu công khai (open financial data standard) là bước quan trọng để tăng mức độ hiệu quả của thị trường trong tương lai.
Kết luận, Run Test là một bài kiểm định nhỏ nhưng phản ánh rõ mối quan hệ giữa dữ liệu, hành vi và hiệu quả thị trường. Nó cho thấy, dù Việt Nam đã tiến bộ đáng kể về độ sâu thanh khoản và số lượng nhà đầu tư, thị trường vẫn chưa đạt đến mức ngẫu nhiên hoàn toàn. Và trong khi các thị trường phát triển đang dần “cạn” cơ hội alpha, thì ở Việt Nam, phi hiệu quả chính là mảnh đất màu mỡ của tư duy định lượng – miễn là ta hiểu và biết cách đọc dữ liệu.
0 / 5
Trong lĩnh vực quantitative finance, có một số công cụ mạnh mẽ nhưng ít được chú ý đến so với những mô hình phổ biến như Deep Learning hay SMA crossover. Một trong những công cụ mạnh mẽ đó chính là Mô hình Không gian Trạng thái (State-space models) và Bộ lọc Kalman (Kalman filter). Mặc dù có vẻ phức tạp, nhưng những công cụ này lại cực kỳ hữu ích và mạnh mẽ khi áp dụng vào việc phân tích và dự đoán thị trường tài chính. Mặc dù nghe có vẻ như là những mô hình nguyên thủy, thực tế chúng là những công cụ cực kỳ mạnh mẽ và bền bỉ (robust), đặc biệt trong môi trường thay đổi nhanh chóng của các thị trường tài chính.
Khi thực hiện bất kỳ chiến lược giao dịch nào trên thị trường tài chính, một yếu tố không thể thiếu chính là khả năng giải thích (interpretability) của mô hình giao dịch. Điều này đặc biệt quan trọng trong bối cảnh môi trường biến động và khi quản lý rủi ro là yếu tố sống còn đối với các quỹ đầu tư và các trader chuyên nghiệp. Mỗi chiến lược giao dịch không chỉ cần phải hiệu quả mà còn phải dễ hiểu, có thể giải thích một cách rõ ràng tại sao tín hiệu mua/bán lại được đưa ra trong một tình huống cụ thể.
Trong thực tế, rất nhiều ý tưởng giao dịch nghe qua đều có vẻ hợp lý. Ví dụ như mua khi giá vượt MA dài hạn, mua khi cổ phiếu breakout kèm thanh khoản tăng, hoặc đứng ngoài khi thị trường chung nằm dưới đường trung bình dài hạn. Nếu chỉ nhìn chart bằng mắt, rất dễ cảm thấy những ý tưởng như vậy “có vẻ đúng”. Vấn đề là cảm giác đó không đủ để dùng tiền thật. Với QM Capital, giá trị đầu tiên và lớn nhất của vectorized backtesting không phải là để khoe một equity curve đẹp, mà là để biến một ý tưởng mơ hồ thành một bộ quy tắc kiểm tra được.
Khi mới học quant trading, nhiều người thường tập trung gần như toàn bộ vào phần mô hình. Họ nghĩ rằng nếu dự báo đúng hơn một chút, hoặc nếu tìm được một tín hiệu chính xác hơn phần còn lại của thị trường, thì kết quả giao dịch chắc chắn sẽ tốt. Cách nghĩ này không sai hoàn toàn, nhưng mới đúng một nửa. Trong giao dịch thực tế, dự báo chỉ là điểm bắt đầu. Sau đó còn một bước quan trọng hơn nhiều: biến tín hiệu đó thành vị thế thật, giao dịch thật, lợi nhuận thật.
Nếu phải chọn một rủi ro làm hỏng nhiều chiến lược định lượng nhất, thì đó thường không phải là thiếu mô hình hiện đại, mà là overfitting. Nói đơn giản, overfitting xảy ra khi mô hình học quá kỹ dữ liệu quá khứ đến mức nó không chỉ học tín hiệu thật, mà còn học luôn cả nhiễu. Khi nhìn lại lịch sử, mọi thứ trông rất đẹp: độ chính xác cao, equity curve mượt, drawdown dễ chịu, Sharpe ratio hấp dẫn. Nhưng đến khi đem sang giai đoạn mới, hoặc live trading, mô hình bắt đầu hỏng rất nhanh.
Có một hiểu lầm rất phổ biến khi mới bước vào quant trading: cứ nghe đến “quant” là nghĩ ngay đến deep learning, transformers, reinforcement learning, foundation models, hay ít nhất cũng phải có một thứ gì đó đủ phức tạp để nghe giống phòng lab hơn là bàn giao dịch. Nhưng nếu nhìn vào cách nhiều tổ chức thật đang vận hành, bức tranh lại bớt hào nhoáng hơn nhiều.
Được nghiên cứu và phát triển bởi các chuyên gia từ QMTrade và cộng đồng nhà đầu tư chuyên nghiệp.
Truy cập ngay!