Overfitting là “kẻ thù số 1” trong quant trading

02/04/2026

12 lượt đọc

Vì sao mô hình càng phức tạp chưa chắc càng tốt, và vì sao những mô hình đơn giản vẫn là vũ khí rất mạnh

Có một hiểu lầm mà gần như ai mới bước vào quant trading cũng từng mắc phải: cứ nghĩ rằng mô hình càng phức tạp thì càng thông minh, và đã thông minh hơn thì chắc chắn sẽ kiếm tiền tốt hơn. Cách nghĩ này nghe rất hợp lý nếu nhìn từ bên ngoài. Trong nhiều lĩnh vực khác, mô hình càng mạnh, càng nhiều tầng, càng nhiều tham số thì thường càng xử lý được những bài toán khó. Nhưng thị trường tài chính lại là một môi trường rất khác. Ở đây, thứ quyết định không phải là mô hình có “giải thích” quá khứ đẹp đến đâu, mà là nó có còn hoạt động được khi bước sang dữ liệu mới hay không. Chính ở chỗ đó, overfitting trở thành một rủi ro cực kỳ nguy hiểm. Nó không làm mô hình trông ngu đi. Ngược lại, nó làm mô hình trông quá đẹp, quá mượt, quá thuyết phục. Và cũng vì thế mà nó mới là thứ khiến rất nhiều người tưởng mình đã tìm ra edge, trong khi thực ra chỉ đang tìm ra một cách khớp lại lịch sử thật khéo.

Phần 1: Overfitting là gì, và vì sao trong trading nó nguy hiểm hơn rất nhiều so với cách người ta tưởng tượng

Hiểu đơn giản nhất, overfitting là tình huống mô hình học quá kỹ dữ liệu quá khứ đến mức nó không chỉ học phần tín hiệu thật, mà còn học luôn cả những nhiễu, những trùng hợp ngẫu nhiên, những đặc điểm chỉ xuất hiện trong một giai đoạn rất cụ thể của lịch sử. Nếu nói bằng ngôn ngữ đời thường hơn, đó là lúc mô hình không còn “hiểu bản chất” nữa mà chỉ đang “nhớ bài”. Nó giống như một học sinh không hiểu quy luật của bài toán, nhưng lại thuộc lòng đáp án của bộ đề cũ. Khi gặp đề mới, mọi thứ bắt đầu vỡ ra rất nhanh. Trong quant trading, điều này thể hiện rất rõ qua một mô hình có kết quả backtest cực kỳ hấp dẫn trên dữ liệu huấn luyện, nhưng vừa đem qua giai đoạn khác là hiệu suất sụp xuống rõ rệt. Đó chính là lý do người làm quant chuyên nghiệp luôn ám ảnh với câu hỏi: mô hình này đang học tín hiệu thật, hay chỉ đang học cách chiều lòng quá khứ?

Điều làm overfitting trở nên đặc biệt nguy hiểm trong trading là dữ liệu tài chính vốn đã rất khó ngay từ bản chất. Nó không sạch sẽ, không ổn định, và không có những quy luật bền như nhiều bài toán khác trong machine learning. Giá cổ phiếu, hợp đồng tương lai hay tín hiệu vĩ mô luôn chịu ảnh hưởng của vô số lớp thông tin cùng lúc: dòng tiền, tâm lý, chính sách, lãi suất, thanh khoản, chu kỳ ngành, vị thế nhà đầu tư, thậm chí cả những sự kiện bất ngờ hoàn toàn không thể đưa vào mô hình trước đó. Trong một môi trường như vậy, tín hiệu thật vốn đã nhỏ, còn nhiễu lại rất dày. Điều đó có nghĩa là nếu mô hình quá linh hoạt, quá nhiều tham số, hoặc được tinh chỉnh quá nhiều trên dữ liệu cũ, nó rất dễ nhầm giữa “một mẫu lặp lại thật sự” với “một sự trùng hợp nhìn rất giống tín hiệu”. Đây là lý do nhiều chiến lược nhìn trên backtest rất đẹp nhưng sang live trading lại cho cảm giác như biến thành một con người khác: không phải vì thị trường “ghét” mô hình đó, mà vì mô hình từ đầu đã không học đúng thứ cần học.

Một cách để hình dung overfitting cho dễ là tưởng tượng bạn đang cố vẽ một đường đi qua dữ liệu quá khứ. Nếu dùng một đường rất đơn giản, nó có thể không chạm vào mọi điểm, nhưng nó sẽ nắm được hướng lớn. Nếu dùng một đường quá phức tạp, bạn có thể bẻ cong nó để chạm gần như tất cả điểm dữ liệu cũ. Nhìn vào, bạn sẽ thấy nó “khớp hoàn hảo”. Nhưng chính sự hoàn hảo đó lại là dấu hiệu phải nghi ngờ, vì ngoài đời, thị trường tương lai không cần lặp lại từng cú uốn nhỏ của quá khứ để cho bạn kiếm tiền. Nó chỉ cần giữ lại những mối quan hệ lớn và đủ bền. Một mô hình càng cố giải thích mọi chi tiết nhỏ của dữ liệu cũ thì càng dễ chết khi những chi tiết đó không lặp lại. Đây là lý do vì sao trong quant trading, người ta không quá quan tâm mô hình đẹp thế nào trong in-sample, mà quan tâm nó còn đứng được thế nào khi bước ra out-of-sample.

Và đây là điểm rất đáng nhớ: overfitting không chỉ là vấn đề của deep learning hay những mô hình “nặng đô”. Ngay cả một chiến lược rule-based, nhìn qua có vẻ rất thủ công, vẫn có thể overfit nếu người làm chiến lược chỉnh quá nhiều ngưỡng, quá nhiều lookback, quá nhiều điều kiện cho đến khi kết quả lịch sử trở nên hoàn hảo. Nhiều người cứ nghĩ mình không dùng AI nên sẽ không bị overfit, nhưng thực tế thì hễ còn tối ưu quá mức theo dữ liệu cũ, hễ còn bẻ hệ thống cho vừa với lịch sử, thì overfitting vẫn xảy ra. Nó không phụ thuộc vào việc mô hình có nghe hiện đại hay không. Nó phụ thuộc vào việc bạn đã cho mô hình quá nhiều tự do để “chiều” quá khứ hay chưa.

Phần 2: Vì sao mô hình ít tham số lại thường bền hơn, và vì sao những “lão tướng” như Linear Regression, Logistic Regression hay Kalman Filter vẫn chưa lỗi thời

Khi nói mô hình đơn giản thường bền hơn trong trading, điều đó không có nghĩa là chúng tốt hơn trong mọi hoàn cảnh, hay rằng các mô hình phức tạp không có giá trị. Ý đúng hơn là: trong một bài toán rất nhiễu, rất ít tín hiệu thật và luôn thay đổi như thị trường tài chính, mô hình càng ít tham số thì càng ít chỗ để tự lừa mình hơn. Đây là chỗ khái niệm “few degrees of freedom” trở nên rất quan trọng. Mỗi tham số thêm vào cho mô hình đồng nghĩa với một mức tự do mới để nó uốn mình theo dữ liệu cũ. Nếu dữ liệu đủ lớn, đủ giàu tín hiệu, đủ ổn định, thì sự linh hoạt đó có thể là lợi thế. Nhưng trong trading, đa số trường hợp lại không như vậy. Dữ liệu thường ngắn hơn người ta tưởng, tín hiệu thường yếu hơn người ta hy vọng, và regime thị trường thường đổi nhanh hơn mô hình kịp thích nghi. Vì thế, một mô hình ít tham số, rõ ràng, dễ regularize thường lại có xác suất sống sót tốt hơn.

Linear Regression là ví dụ điển hình nhất. Nhiều người mới nhìn nó như một thứ quá cơ bản, quá “học vỡ lòng”, nhưng chính vì nó cơ bản nên nó lại ép người làm mô hình phải trung thực. Nếu bạn dùng hồi quy tuyến tính để kiểm tra tác động của momentum, volatility hay quality lên expected return, bạn gần như không có nhiều chỗ để ẩn sự mơ hồ. Mô hình sẽ buộc bạn đối diện với một câu hỏi rõ ràng: biến nào đang thực sự có thông tin, dấu tác động của nó là gì, và quan hệ đó có còn tồn tại khi sang giai đoạn mới hay không. Linear Regression không cố tỏ ra thông minh. Nó không cố mô tả mọi ngoằn ngoèo của dữ liệu. Nó chỉ cố nắm những quan hệ lớn nhất, rõ nhất. Và trong trading, rất nhiều khi chính điều đó mới là thứ đáng tiền. Một chiến lược không cần hiểu “mọi thứ” để kiếm tiền. Nó chỉ cần giữ được vài mối quan hệ đủ bền để không chết ngay khi thị trường đổi gió.

Logistic Regression cũng tương tự, nhưng thậm chí còn hợp với nhiều bài toán trading hơn vì nó không ép bạn phải dự báo một con số lợi suất chính xác. Trong rất nhiều trường hợp, thứ trader cần không phải là “giá sẽ tăng bao nhiêu”, mà là “xác suất tăng có đang nhỉnh hơn bình thường hay không”, hoặc “xác suất thắng của kèo này có đáng để bỏ vốn hay không”. Khi dùng Logistic Regression, bạn đang chuyển một bài toán tài chính vốn rất nhiễu thành một bài toán xác suất dễ quản trị hơn. Mô hình không còn cố làm quá nhiều việc. Nó chỉ trả lời một câu hỏi khiêm tốn hơn, nhưng nhiều khi hữu ích hơn: xác suất một outcome có đang nghiêng về phía nào. Đó là một kiểu “simple” rất mạnh trong quant trading: thay vì cố đoán đúng thị trường với độ chính xác giả tạo, bạn chỉ xây một công cụ đánh giá xác suất, rồi để phần portfolio construction và risk management làm nốt phần còn lại.

Kalman Filter lại là một ví dụ rất hay về chuyện mô hình đơn giản không có nghĩa là mô hình thô sơ. Nó mạnh không phải vì phức tạp, mà vì nó giải đúng một vấn đề tài chính rất thực: các tham số trong thị trường thường không cố định. Beta thay đổi. Spread thay đổi. Mức nhiễu thay đổi. Cấu trúc xu hướng cũng thay đổi. Nếu bạn dùng một mô hình tĩnh để mô tả một thế giới luôn động, thì dù mô hình đó có đẹp mấy cũng rất dễ lỗi thời. Kalman Filter có giá trị ở chỗ nó cho phép mình cập nhật dần dần ước lượng theo dữ liệu mới, nghĩa là vừa đủ linh hoạt để thích nghi, nhưng không đến mức quá “tham” và tự fit vào từng nhịp nhiễu. Đó là kiểu robustness rất quý trong quant trading: không quá cứng, không quá mềm, mà vừa đủ để bám theo sự thay đổi thực sự của thị trường.

Nếu nhìn từ bên ngoài, có thể các mô hình như vậy không tạo cảm giác “wow” như một kiến trúc neural network nhiều tầng. Nhưng nếu nhìn từ góc độ sống sót ngoài đời, điểm mạnh của chúng lại rất rõ. Chúng dễ giải thích hơn, nên khi chiến lược hỏng, bạn nhanh tìm được nguyên nhân hơn. Chúng dễ regularize hơn, nên xác suất fit nhầm nhiễu thấp hơn. Chúng dễ retrain hơn, nên khi regime đổi, bạn không mất quá nhiều thời gian để đưa mô hình về trạng thái mới. Và quan trọng nhất, chúng thường cho bạn một loại niềm tin khác: không phải niềm tin kiểu “model này chắc rất thông minh”, mà là niềm tin kiểu “mình hiểu nó đang làm gì, hiểu nó có thể hỏng ở đâu, và hiểu cách sửa khi nó bắt đầu hỏng”. Trong trading, loại niềm tin thứ hai quý hơn rất nhiều.

Phần 3: Ví dụ và bài học thực tế

Để thấy vì sao overfitting nguy hiểm và vì sao mô hình đơn giản lại đáng tin hơn, có thể tưởng tượng một tình huống rất quen. Một người mới làm quant xây một chiến lược chọn cổ phiếu từ rất nhiều feature: momentum ngắn hạn, momentum dài hạn, RSI, MACD, volume surprise, volatility, định giá, quality, growth, cộng thêm rất nhiều ngưỡng vào lệnh và thoát lệnh. Sau đó họ backtest trên vài năm dữ liệu rồi tối ưu dần: đổi lookback từ 10 sang 15 rồi sang 21, đổi stop-loss từ mức này sang mức kia, thêm điều kiện lọc thanh khoản, thêm điều kiện loại trừ nhóm ngành, thêm quy tắc nếu thị trường chung xấu thì giảm tỷ trọng. Cuối cùng, họ nhận được một đường equity rất đẹp. Sharpe ratio cao, drawdown thấp, hiệu suất vượt benchmark. Nhìn vào, cảm giác gần như chắc chắn rằng mình đã tìm được một hệ thống tốt. Nhưng vấn đề là: rất có thể họ chỉ mới tìm được một bộ cài đặt rất hợp với giai đoạn vừa rồi. Khi dữ liệu mới xuất hiện, hoặc khi hành vi thị trường đổi khác, toàn bộ phần tối ưu tinh vi kia bắt đầu mất tác dụng. Đó chính là overfitting trong hình dạng rất thực tế của một chiến lược “được chỉnh quá kỹ”.

Ngược lại, một người khác có thể làm một việc khiêm tốn hơn. Họ chỉ dùng vài feature thực sự có lý do rõ ràng, ví dụ xu hướng giá, mức biến động, thanh khoản và một yếu tố cơ bản đơn giản. Sau đó họ dùng một Linear Regression hoặc Logistic Regression để xem các biến này có thật sự mang thông tin ngoài mẫu hay không. Kết quả của họ có thể không đẹp bằng người đầu tiên trên dữ liệu cũ. Nhưng nếu bước ra dữ liệu mới mà mô hình vẫn còn giữ được phần nào hiệu quả, thì đó mới là thứ đáng giá. Đây là điều rất khó chấp nhận với người mới, vì nhìn bằng mắt thì mô hình đơn giản thường “thua” về độ đẹp. Nhưng trong quant trading, rất nhiều khi chiến thắng nằm ở chỗ chấp nhận ít đẹp hơn trên giấy để đổi lấy nhiều ổn định hơn ngoài đời.

Một ví dụ khác rất dễ hiểu là chuyện tìm đáy và bắt breakout. Nếu bạn xây một hệ thống quá phức tạp để dự báo đúng từng nhịp đảo chiều, mô hình có thể trông cực kỳ ấn tượng trong quá khứ. Nhưng chỉ cần chu kỳ thị trường thay đổi một chút, hoặc cấu trúc dòng tiền khác đi, nó sẽ bắt đầu trả tín hiệu sai. Trong khi đó, một mô hình rất đơn giản chỉ dùng vài đặc trưng như xu hướng trung hạn, độ biến động và xác suất duy trì động lượng có thể không bao giờ bắt đúng đáy. Nhưng nó lại có cơ hội sống lâu hơn, vì nó không cố làm một việc quá tinh vi so với chất lượng dữ liệu đang có.

Với người mới làm quant, bài học thực tế không phải là “đừng bao giờ đụng vào mô hình phức tạp”. Bài học đúng hơn là: hãy bắt đầu bằng mô hình đơn giản đủ để hiểu vì sao nó thắng và vì sao nó thua. Nếu một Linear Regression hay Logistic Regression không tạo ra được bất kỳ tín hiệu out-of-sample nào tử tế, thì nhiều khả năng việc nhảy lên một kiến trúc phức tạp hơn chỉ làm bạn overfit tinh vi hơn, chứ không tạo ra edge thật. Còn nếu một mô hình đơn giản đã cho thấy một chút tín hiệu có ý nghĩa, lúc đó mới đáng hỏi xem liệu sự phức tạp bổ sung có thật sự cải thiện được chất lượng ngoài mẫu không.

Điều cuối cùng rất đáng nhớ là thế này: trong trading, mô hình tốt không phải là mô hình kể lại quá khứ đẹp nhất. Mô hình tốt là mô hình còn dùng được khi bước ra khỏi quá khứ. Đó là lý do overfitting là kẻ thù số 1, và cũng là lý do vì sao những “lão tướng” như Linear Regression, Logistic Regression hay Kalman Filter vẫn không biến mất. Không phải vì giới quant thiếu công nghệ. Mà vì họ hiểu rất rõ một điều: trong thị trường tài chính, thứ sống sót lâu nhất thường không phải là thứ hào nhoáng nhất, mà là thứ bền nhất.

Nếu bạn muốn, tôi viết tiếp phần sau theo đúng mạch này: Linear Regression trong quant trading: vì sao một mô hình tưởng rất cơ bản lại là nơi tốt nhất để bắt đầu.

Chia sẻ bài viết

Đánh giá

Hãy là người đầu tiên nhận xét bài viết này!

Đăng ký nhận tin

Nhập Email để nhận được bản tin mới nhất từ QM Capital.

Bài viết liên quan

Vì sao các quỹ quant lớn vẫn kiếm tiền bằng những mô hình rất đơn giản?
31/03/2026
93 lượt đọc

Vì sao các quỹ quant lớn vẫn kiếm tiền bằng những mô hình rất đơn giản? C

Có một hiểu lầm rất phổ biến khi mới bước vào quant trading: cứ nghe đến “quant” là nghĩ ngay đến deep learning, transformers, reinforcement learning, foundation models, hay ít nhất cũng phải có một thứ gì đó đủ phức tạp để nghe giống phòng lab hơn là bàn giao dịch. Nhưng nếu nhìn vào cách nhiều tổ chức thật đang vận hành, bức tranh lại bớt hào nhoáng hơn nhiều.

Ngày đáo hạn phái sinh có tạo ra một “anomaly” đủ rõ để đưa vào hệ thống giao dịch hay không?
31/03/2026
45 lượt đọc

Ngày đáo hạn phái sinh có tạo ra một “anomaly” đủ rõ để đưa vào hệ thống giao dịch hay không? C

Nếu nhìn theo kiểu tin tức, ngày đáo hạn phái sinh thường bị gắn với những cụm như rung lắc, kéo trụ, ép ATC. Nhưng với quant trading, cách hỏi như vậy vẫn còn cảm tính. Câu hỏi đúng hơn là: ngày đáo hạn có tạo ra một mẫu biến động lặp lại, đủ ổn định, đủ rõ, để mình đưa vào bộ lọc của hệ thống hay không. Đây là một câu hỏi rất hợp với thị trường Việt Nam, vì hợp đồng tương lai VN30 có lịch đáo hạn cố định vào thứ Năm lần thứ ba của tháng đáo hạn, nên bản thân nó đã là một event định kỳ, rất phù hợp để làm event study. Ngoài ra, hợp đồng VN30 hiện có hệ số nhân 100.000 đồng mỗi điểm chỉ số, nên đây không phải một sản phẩm quá nhỏ để bỏ qua khi nhìn hành vi của nhóm cổ phiếu trụ.

Làm sao biết một chart có đáng mua hay không chỉ trong vài giây?
29/03/2026
144 lượt đọc

Làm sao biết một chart có đáng mua hay không chỉ trong vài giây? C

Một trong những lỗi phổ biến nhất của nhà đầu tư cá nhân ở Việt Nam là quyết định mua trước, rồi mới mở chart ra sau để tìm lý do xác nhận. Có thể là một mã được nhắc nhiều trong room chat, một câu chuyện đầu tư công đang nóng, một cổ phiếu bất động sản “đã giảm quá sâu”, hay một mã ngân hàng “nghe nói sắp vào sóng”. Cách ra quyết định như vậy nghe quen vì nó rất đời thường, nhưng chính nó làm nhiều người kẹt hàng hàng tháng trời. Mua xong thì chart không chạy. Hoặc tệ hơn, chart vẫn tiếp tục bleed xuống nhưng người cầm hàng cứ bấu víu vào câu chuyện vì không biết nhìn chart thế nào để thừa nhận rằng mình đang đứng sai phía.

Công thức giúp tài khoản bớt “gãy” khi thị trường xấu: cách dùng volatility targeting trong giao dịch thực tế
28/03/2026
102 lượt đọc

Công thức giúp tài khoản bớt “gãy” khi thị trường xấu: cách dùng volatility targeting trong giao dịch thực tế C

Điều làm nhiều tài khoản lỗ nặng không phải là vì trader luôn nhìn sai thị trường. Nhiều khi họ nhìn đúng xu hướng, nhưng vẫn thua vì vào sai kích thước vị thế. Đây là lỗi rất phổ biến. Khi thị trường êm, họ đánh lớn vì thấy giá đi đẹp. Đến lúc thị trường rung mạnh hơn, họ vẫn giữ đúng size cũ. Kết quả là một giai đoạn biến động lớn có thể xóa sạch thành quả của nhiều tuần trước đó.

Khi nào biết dòng tiền đang quay lại thật, chứ không chỉ là một nhịp hồi kỹ thuật?
26/03/2026
153 lượt đọc

Khi nào biết dòng tiền đang quay lại thật, chứ không chỉ là một nhịp hồi kỹ thuật? C

Sai lầm rất phổ biến của người mới là thấy chỉ số tăng mạnh một phiên rồi kết luận thị trường đã tạo đáy. Thực tế, một nhịp hồi kỹ thuật thường có 3 đặc điểm: giá bật lên sau chuỗi giảm sâu, tâm lý bớt hoảng loạn, nhưng khối lượng chưa thật sự cải thiện và chỉ số vẫn chưa vượt lại các vùng kỹ thuật quan trọng. Phiên ngày 17/03/2026 là ví dụ khá rõ. VN-Index tăng 17,08 điểm, đóng cửa ở 1.710,29 điểm, số mã tăng là 179 so với 147 mã giảm, nhưng giá trị khớp lệnh HoSE chỉ khoảng 20,9 nghìn tỷ đồng, vẫn dưới trung bình 20 phiên. Cùng lúc đó, phân tích kỹ thuật của AseanSC cho thấy VN-Index khi ấy vẫn đóng cửa dưới MA10, MA20 và MA50, tức là xu hướng ngắn hạn chưa thực sự đảo chiều, nên nhịp tăng này nghiêng nhiều hơn về một nhịp hồi kỹ thuật hơn là tín hiệu xác nhận tiền lớn quay lại.

Chu kỳ vĩ mô đổi pha thì tiền thường đi đâu trước?
26/03/2026
633 lượt đọc

Chu kỳ vĩ mô đổi pha thì tiền thường đi đâu trước? C

Điều đầu tiên người mới cần nhớ là thị trường gần như luôn đi trước nền kinh tế thật một nhịp. Khi chu kỳ vĩ mô bắt đầu đổi pha, tiền không chờ đến lúc GDP, lợi nhuận doanh nghiệp hay tín dụng tăng rõ ràng rồi mới vào. Nó thường phản ứng ngay khi có dấu hiệu áp lực lãi suất bớt căng, thanh khoản dễ thở hơn, hoặc rủi ro hệ thống giảm xuống. Việt Nam năm 2023 là ví dụ rất dễ kiểm chứng. Trong năm đó, Ngân hàng Nhà nước giảm lãi suất điều hành 4 lần; Reuters ghi rõ lãi suất tái cấp vốn và tái chiết khấu đều giảm tổng cộng 150 điểm cơ bản. Cùng giai đoạn đó, VNDIRECT ghi nhận đến ngày 25/5/2023 VN-Index đã lên 1.064,6 điểm, tăng 5,7% từ đầu năm, và thanh khoản bình quân 3 sàn trong tháng 5 lên 13.905 tỷ đồng mỗi phiên, tăng 4,7% so với tháng trước. Nghĩa là tiền đã bắt đầu quay lại thị trường ngay khi điều kiện tài chính bớt xấu, dù nền kinh tế thực lúc đó vẫn còn khó.

video-image

Truy Cập Miễn Phí Thư Viện Bot Tín Hiệu Giao Dịch Tự Động

Được nghiên cứu và phát triển bởi các chuyên gia từ QMTrade và cộng đồng nhà đầu tư chuyên nghiệp.

Truy cập ngay!