31/03/2026
12 lượt đọc
Có một hiểu lầm rất phổ biến khi mới bước vào quant trading: cứ nghe đến “quant” là nghĩ ngay đến deep learning, transformers, reinforcement learning, foundation models, hay ít nhất cũng phải có một thứ gì đó đủ phức tạp để nghe giống phòng lab hơn là bàn giao dịch. Nhưng nếu nhìn vào cách nhiều tổ chức thật đang vận hành, bức tranh lại bớt hào nhoáng hơn nhiều. Trong báo cáo về machine learning trong algorithmic trading, cơ quan giám sát thị trường Hà Lan AFM ghi rất rõ rằng các trading firms mà họ khảo sát có xu hướng ưu tiên những mô hình supervised đơn giản như linear regression và logistic regression hơn các mô hình phức tạp như neural networks. Đây là một quan sát rất đáng nhớ, vì nó cho thấy ngoài đời thật, mô hình được dùng không nhất thiết là mô hình “ấn tượng” nhất về công nghệ, mà thường là mô hình kiểm soát được, hiểu được, và tích hợp được vào quy trình giao dịch.
Lý do sâu hơn nằm ở bản chất của dữ liệu tài chính. Thị trường là một môi trường có signal-to-noise ratio thấp: tín hiệu thật thường yếu, ngắn, dễ đổi chế độ; còn nhiễu thì dày đặc. Trong tài liệu của Robeco cho CFA Institute Research Foundation, chính các tác giả cũng nhấn mạnh rằng ứng dụng machine learning trong đầu tư đòi hỏi “great care” vì thị trường tài chính khác hẳn những miền dữ liệu nơi ML thường tỏa sáng, và một trong các nỗi lo lớn nhất là overfitting. Họ còn ghi rất rõ rằng với lượng dữ liệu tài chính vốn bị giới hạn, mô hình đơn giản thường có thể làm tốt hơn trong kiểm định ngoài mẫu so với mô hình quá giàu tham số. Nói ngắn gọn: trong một môi trường mà tín hiệu thật vừa ít vừa mong manh, mô hình càng phức tạp càng dễ “học nhầm” phần nhiễu rồi tưởng đó là edge.
Đây là chỗ mà rất nhiều người mới dễ đi sai hướng. Họ thấy một mô hình phức tạp có thể tăng accuracy thêm một chút trong sample, rồi mặc định điều đó sẽ chuyển hóa thành PnL tốt hơn. Nhưng trong trading, accuracy đẹp không tự động biến thành lợi nhuận bền. Chỉ cần tín hiệu đó kém ổn định hơn một chút, turnover cao hơn một chút, hoặc khó giải thích hơn một chút, thì tất cả phần “thông minh thêm” của mô hình có thể biến mất sau chi phí giao dịch, slippage, capacity, hoặc một cú regime shift. Thị trường không trả tiền cho độ khó kỹ thuật. Thị trường chỉ trả tiền cho thứ còn sống được sau khi đã đi qua dữ liệu mới, chi phí thật và áp lực rủi ro thật.
Vì vậy, điểm đầu tiên cần sửa trong tư duy là thế này: simple models không thắng vì chúng đơn giản; chúng thắng vì trong một môi trường rất nhiễu, ít tham số hơn thường đồng nghĩa với ít chỗ để tự lừa mình hơn. Đây không phải một lập luận chống lại AI. Đây là một lập luận ủng hộ tính phù hợp giữa mô hình và bài toán. Nếu bài toán vốn dĩ nhiều nhiễu, dữ liệu hạn chế và chế độ thị trường luôn thay đổi, thì mô hình càng “tham” càng dễ mắc sai lầm đắt tiền.
Khi nói đến simple models, điều cần tránh là hiểu sai rằng đây chỉ là những công thức sơ cấp. Trong quant trading, “simple” thường có nghĩa là ít degrees of freedom hơn, cấu trúc rõ ràng hơn, dễ regularize hơn, và dễ kiểm tra hơn. Ví dụ điển hình nhất là linear regression và logistic regression. Chúng không cố mô tả mọi đường cong của dữ liệu. Chúng chủ động chấp nhận rằng mình chỉ giữ lại những mối quan hệ đơn giản, bền hơn, dễ kiểm soát hơn. AFM thậm chí lấy chính linear regression làm ví dụ trong mô tả một trading algorithm đơn giản dùng machine learning để dự báo theoretical price rồi ra quyết định giao dịch, cho thấy loại mô hình này không hề “quê” trong môi trường giao dịch điện tử.
Các mô hình dựa trên cây cũng vậy. Dân mới học ML rất hay xem cây quyết định hay random forest nhẹ như thứ “nhập môn”, nhưng trong tài chính, điểm mạnh của chúng không nằm ở vẻ ngoài đơn giản, mà ở chỗ chúng thường bắt được các pattern đủ mạnh mà vẫn giữ được khả năng giải thích. Với dữ liệu tài chính, nơi feature interactions có thể có nhưng sample size không thật sự hào phóng, một mô hình tree-based vừa phải thường hữu ích hơn một kiến trúc quá nặng nhưng khó biết đang học cái gì. Tài liệu của Robeco cũng đi theo đúng logic đó: lợi ích lớn của ML trong tài chính không phải là phức tạp bằng mọi giá, mà là biết dùng cấu trúc phi tuyến khi nó thật sự có giá trị, đồng thời vẫn phải giữ explainability và khả năng kiểm tra ngoài mẫu.
State-space models và Kalman filter là một ví dụ khác về “đơn giản nhưng không ngây thơ”. Đây không phải loại mô hình làm người đọc choáng ngợp, nhưng nó cực kỳ hợp với một thế giới mà tham số thay đổi theo thời gian. Một slide chuyên đề về financial time series modeling năm 2025 ghi rất rõ rằng Kalman filter efficiently fits state space models to financial data, enabling essential time-varying modeling. Nói theo ngôn ngữ giao dịch: nếu bạn tin rằng beta, spread, hoặc quan hệ giữa các biến không đứng yên, thì một mô hình có khả năng cập nhật liên tục theo dữ liệu mới thường có ý nghĩa hơn nhiều so với việc cố fit một quan hệ “bất biến” trên cả mẫu lịch sử dài. Với các bài toán như pairs trading, dynamic hedge ratio hay signal smoothing, loại mô hình này rất thực dụng.
Nếu cần ví dụ từ quỹ thật, AQR là một case rất rõ. Trong Form ADV của họ, AQR mô tả mình là một firm research-driven, systematic, và ghi thẳng rằng họ chuyên về quantitative investment analysis dựa trên các proprietary models sử dụng valuation, momentum và các yếu tố khác để hình thành quan điểm đầu tư rồi triển khai trong một quy trình có kỷ luật. Cùng lúc đó, một white paper năm 2025 của AQR cũng nhắc lại rằng quantitative active management có gốc rễ từ factor investing, tức là tìm những đặc điểm như value hay momentum để giải thích returns. Nghe qua thì rất “cũ”, nhưng chính những thứ “cũ” đó lại là phần lõi của rất nhiều hệ thống chuyên nghiệp.
Research Affiliates cũng là một ví dụ rất đáng nói. Trong bài tháng 3/2026, họ mô tả rất rõ rằng quy trình systematic active equity của họ tích hợp ba tín hiệu chính là value, quality và momentum. Họ nhấn mạnh ba điểm quan trọng: ba tín hiệu này economically distinct, imperfectly correlated, và khi dùng cùng nhau thì giúp danh mục có smoother performance, shallower drawdowns và greater adaptability. Điều đáng học ở đây là: trong mắt một tổ chức như Research Affiliates, sự tinh xảo không nằm ở việc bổ sung thêm một mô hình ngày càng phức tạp, mà nằm ở việc kết hợp vài tín hiệu đủ rõ lý do kinh tế theo cách bổ trợ nhau và kiểm soát được rủi ro triển khai.
Man AHL là ví dụ thứ ba, và còn “thô” hơn nữa theo nghĩa tốt. Trong tài liệu “Trend-Following: What’s Not to Like?”, họ viết rất thẳng rằng trend-following ở bề mặt là một chiến lược rất đơn giản: mua thứ đang lên và bán thứ đang xuống. Nhưng ngay sau đó họ cho thấy thứ “đơn giản” đó không hề yếu: kể từ 1986, chỉ số Barclay BTOP50 — đại diện chủ yếu cho các chương trình trend-following — có annualized return khoảng 7,0%, chỉ thấp hơn world equities 0,7 điểm phần trăm, nhưng đạt được điều đó với lower risk, smaller drawdowns, và thường làm tốt nhất khi equities gặp khó. Đây là ví dụ rất mạnh cho ý tưởng của bài này: nhiều chiến lược chuyên nghiệp bền bỉ không được xây trên một tín hiệu huyền bí, mà trên một logic rất đơn giản nhưng được thực thi cực kỳ nghiêm.
Một trong những chỗ dễ làm người mới sốc nhất là nhận ra trading không phải cuộc thi dự báo, mà là cuộc thi triển khai. AFM nói rất rõ rằng dù trading algorithm có dùng machine learning, các hành động mà nó được phép làm ngoài đời thực thường vẫn rất hạn chế và hard-coded: gửi lệnh mua, gửi lệnh bán, hủy lệnh. Câu này tưởng nhỏ, nhưng ý nghĩa rất lớn: ngoài đời, model không hoạt động như một “bộ não toàn năng”. Nó là một module nằm trong một chuỗi rất dài gồm dữ liệu, feature pipeline, decision logic, risk controls, execution, monitoring và compliance. Nếu một mô hình phức tạp làm tăng thêm độ mong manh ở bất kỳ đoạn nào trong chuỗi đó, thì phần “thông minh” thêm có thể không đáng cái giá phải trả.
Robeco đi sâu hơn ở đúng điểm này khi nói về implementation gap. Tài liệu của họ chỉ ra những chuyện rất thật như: alpha có thể đẹp trên nhóm small-cap hay micro-cap, nhưng trading cost ngoài đời khiến gap giữa paper alpha và realizable alpha nới rộng; hoặc một chiến lược long-short có thể rất hấp dẫn trong nghiên cứu, nhưng shorting ngoài thực tế có thể bất khả thi hoặc quá tốn kém vì thiếu borrow hoặc borrow cost quá cao. Đây là chỗ mà mô hình đơn giản thường có lợi thế kín đáo: vì chúng dễ hiểu hơn, người làm chiến lược dễ thấy ngay alpha của mình đang phụ thuộc vào đâu, nhạy với cost ở đâu, và có đang vô tình sống nhờ một giả định execution quá đẹp hay không.
Khả năng giải thích cũng là một lợi thế rất thật chứ không phải chuyện “đạo đức AI”. Robeco viết khá rõ rằng trong đầu tư, với hàng tỷ USD liên quan, asset owners đòi hỏi managers phải giải thích được quyết định đầu tư và attribution của performance. Một mô hình linear, logistic hay tree-based gọn không phải lúc nào cũng cho alpha cao nhất trong sample, nhưng khi chiến lược có vấn đề, bạn thường biết mình đang sai ở feature nào, logic nào, regime nào nhanh hơn rất nhiều. Trong trading, tốc độ chẩn đoán lỗi và tốc độ thích nghi quan trọng không kém độ chính xác ban đầu. Đó là lý do vì sao “interpretable” trong quant không chỉ là tính đẹp của bài thuyết trình, mà là một thành phần của risk management.
Chỗ này càng dễ thấy hơn nếu nhìn lại ví dụ AQR và Research Affiliates. Cả hai đều nhấn mạnh các yếu tố như value, momentum, quality vì chúng có lý do kinh tế rõ, không chồng lấp quá mức, và có thể được tích hợp vào portfolio construction một cách có kỷ luật. Research Affiliates thậm chí còn viết rất rõ một câu đáng nhớ: every additional signal introduces estimation error, complexity, and implementation risk. Đây gần như là câu tóm lược hoàn hảo cho cả bài. Trong thị trường thật, mỗi lớp phức tạp thêm không chỉ mang lại khả năng học thêm một tín hiệu; nó còn mang theo estimation error, operational risk và nguy cơ implementation sai. Vì thế, những quỹ sống lâu không phải lúc nào cũng là quỹ có model “đỉnh” nhất, mà thường là quỹ biết rất rõ complexity nào đáng giữ và complexity nào nên bỏ.
Nếu phải rút toàn bộ câu chuyện này thành một lời khuyên có thể dùng ngay, thì mình nghĩ là thế này: hãy bắt đầu từ mô hình đơn giản, và chỉ thêm độ phức tạp khi đã có bằng chứng rõ rằng nó đáng để thêm. Bằng chứng đó không phải là backtest trong sample đẹp hơn một chút. Bằng chứng đó phải là out-of-sample tốt hơn một cách ổn định hơn, cost-adjusted tốt hơn, dễ triển khai không kém, và không làm hệ thống khó kiểm soát hơn quá nhiều. Nếu không đạt được những điều đó, mô hình phức tạp hơn chỉ là một cách tinh vi để overfit.
Một lộ trình học thực tế hơn cho người mới thường là: học thật chắc linear regression và logistic regression; hiểu calibration, regularization, cross-validation và feature leakage; sau đó học cách tree-based models thay đổi bias-variance tradeoff ra sao; rồi mới sang state-space/Kalman cho các bài toán tham số động; cuối cùng nếu thật sự có lý do, dữ liệu và hạ tầng đủ tốt thì mới leo lên những mô hình nặng hơn. Cách đi này nghe chậm, nhưng ngoài đời lại nhanh hơn rất nhiều, vì nó giúp bạn hiểu tại sao một tín hiệu tồn tại, tín hiệu chết ở đâu, và khi chiến lược xấu đi thì cần sửa phần nào trước. Người không hiểu một linear model đang làm gì thì thường cũng khó mà hiểu được transformer của mình đang làm sai ở đâu.
Điều cuối cùng đáng nhớ là sự tinh xảo thật của các quỹ quant hàng đầu thường không nằm ở kiến trúc mô hình. Nó nằm ở feature engineering, data cleaning, portfolio construction, execution và risk management. AQR mô tả rất rõ rằng ngoài factor inputs, thứ tạo nên quy trình đầu tư của họ còn là signal construction methodology, optimization process và trading approach. Research Affiliates nhấn mạnh robustness across regimes. Man AHL cho thấy một nguyên lý đơn giản như trend-following vẫn có thể tạo ra kết quả dài hạn cạnh tranh nếu được quản trị rủi ro và triển khai nghiêm túc. Tức là, nếu bạn muốn học thứ gần với “cách quỹ thật làm”, thì nên bớt hỏi “model mới nào hot” và bắt đầu hỏi “pipeline của mình đã đủ sạch, đủ bền, đủ triển khai được chưa”.
Kết lại, lý do simple models vẫn sống khỏe trong quant trading không phải vì giới tài chính chậm tiến. Ngược lại, chính vì thị trường quá khắc nghiệt nên những thứ sống được qua chu kỳ thường là những thứ có cấu trúc rõ, ít chỗ để tự lừa mình, dễ giải thích, dễ sửa, và đủ bền để đi xuyên qua noise, cost và regime change.
0 / 5
Nếu nhìn theo kiểu tin tức, ngày đáo hạn phái sinh thường bị gắn với những cụm như rung lắc, kéo trụ, ép ATC. Nhưng với quant trading, cách hỏi như vậy vẫn còn cảm tính. Câu hỏi đúng hơn là: ngày đáo hạn có tạo ra một mẫu biến động lặp lại, đủ ổn định, đủ rõ, để mình đưa vào bộ lọc của hệ thống hay không. Đây là một câu hỏi rất hợp với thị trường Việt Nam, vì hợp đồng tương lai VN30 có lịch đáo hạn cố định vào thứ Năm lần thứ ba của tháng đáo hạn, nên bản thân nó đã là một event định kỳ, rất phù hợp để làm event study. Ngoài ra, hợp đồng VN30 hiện có hệ số nhân 100.000 đồng mỗi điểm chỉ số, nên đây không phải một sản phẩm quá nhỏ để bỏ qua khi nhìn hành vi của nhóm cổ phiếu trụ.
Một trong những lỗi phổ biến nhất của nhà đầu tư cá nhân ở Việt Nam là quyết định mua trước, rồi mới mở chart ra sau để tìm lý do xác nhận. Có thể là một mã được nhắc nhiều trong room chat, một câu chuyện đầu tư công đang nóng, một cổ phiếu bất động sản “đã giảm quá sâu”, hay một mã ngân hàng “nghe nói sắp vào sóng”. Cách ra quyết định như vậy nghe quen vì nó rất đời thường, nhưng chính nó làm nhiều người kẹt hàng hàng tháng trời. Mua xong thì chart không chạy. Hoặc tệ hơn, chart vẫn tiếp tục bleed xuống nhưng người cầm hàng cứ bấu víu vào câu chuyện vì không biết nhìn chart thế nào để thừa nhận rằng mình đang đứng sai phía.
Điều làm nhiều tài khoản lỗ nặng không phải là vì trader luôn nhìn sai thị trường. Nhiều khi họ nhìn đúng xu hướng, nhưng vẫn thua vì vào sai kích thước vị thế. Đây là lỗi rất phổ biến. Khi thị trường êm, họ đánh lớn vì thấy giá đi đẹp. Đến lúc thị trường rung mạnh hơn, họ vẫn giữ đúng size cũ. Kết quả là một giai đoạn biến động lớn có thể xóa sạch thành quả của nhiều tuần trước đó.
Sai lầm rất phổ biến của người mới là thấy chỉ số tăng mạnh một phiên rồi kết luận thị trường đã tạo đáy. Thực tế, một nhịp hồi kỹ thuật thường có 3 đặc điểm: giá bật lên sau chuỗi giảm sâu, tâm lý bớt hoảng loạn, nhưng khối lượng chưa thật sự cải thiện và chỉ số vẫn chưa vượt lại các vùng kỹ thuật quan trọng. Phiên ngày 17/03/2026 là ví dụ khá rõ. VN-Index tăng 17,08 điểm, đóng cửa ở 1.710,29 điểm, số mã tăng là 179 so với 147 mã giảm, nhưng giá trị khớp lệnh HoSE chỉ khoảng 20,9 nghìn tỷ đồng, vẫn dưới trung bình 20 phiên. Cùng lúc đó, phân tích kỹ thuật của AseanSC cho thấy VN-Index khi ấy vẫn đóng cửa dưới MA10, MA20 và MA50, tức là xu hướng ngắn hạn chưa thực sự đảo chiều, nên nhịp tăng này nghiêng nhiều hơn về một nhịp hồi kỹ thuật hơn là tín hiệu xác nhận tiền lớn quay lại.
Điều đầu tiên người mới cần nhớ là thị trường gần như luôn đi trước nền kinh tế thật một nhịp. Khi chu kỳ vĩ mô bắt đầu đổi pha, tiền không chờ đến lúc GDP, lợi nhuận doanh nghiệp hay tín dụng tăng rõ ràng rồi mới vào. Nó thường phản ứng ngay khi có dấu hiệu áp lực lãi suất bớt căng, thanh khoản dễ thở hơn, hoặc rủi ro hệ thống giảm xuống. Việt Nam năm 2023 là ví dụ rất dễ kiểm chứng. Trong năm đó, Ngân hàng Nhà nước giảm lãi suất điều hành 4 lần; Reuters ghi rõ lãi suất tái cấp vốn và tái chiết khấu đều giảm tổng cộng 150 điểm cơ bản. Cùng giai đoạn đó, VNDIRECT ghi nhận đến ngày 25/5/2023 VN-Index đã lên 1.064,6 điểm, tăng 5,7% từ đầu năm, và thanh khoản bình quân 3 sàn trong tháng 5 lên 13.905 tỷ đồng mỗi phiên, tăng 4,7% so với tháng trước. Nghĩa là tiền đã bắt đầu quay lại thị trường ngay khi điều kiện tài chính bớt xấu, dù nền kinh tế thực lúc đó vẫn còn khó.
Khi mới học quant trading, rất nhiều người có chung một cảm giác phấn khích. Chỉ cần tải dữ liệu giá về, viết vài dòng Python, gắn thêm một vài điều kiện như MA cắt nhau, RSI quá bán hay breakout đỉnh cũ, rồi chạy backtest là có ngay một đường vốn tăng rất đẹp. Nhìn vào kết quả đó, ai cũng dễ nghĩ rằng mình vừa tìm ra một chiến lược có thể kiếm tiền thật. Nhưng vấn đề nằm ở chỗ backtest chỉ cho ta biết chiến lược sẽ trông như thế nào nếu quá khứ diễn ra đúng như dữ liệu đang có trong máy. Nó không hề đảm bảo rằng khi bước ra thị trường thật, nơi có độ trễ, có chi phí, có tâm lý và có những biến động bất ngờ, chiến lược đó vẫn giữ được hiệu quả như vậy.
Được nghiên cứu và phát triển bởi các chuyên gia từ QMTrade và cộng đồng nhà đầu tư chuyên nghiệp.
Truy cập ngay!