Trang chủ
/ Kiến thức chung
/ Overfitting là “kẻ thù số 1” trong quant trading

Overfitting là “kẻ thù số 1” trong quant trading

02/04/2026

624 lượt đọc

Vì sao mô hình càng phức tạp chưa chắc càng tốt, và vì sao những mô hình đơn giản vẫn là vũ khí rất mạnh

Có một hiểu lầm mà gần như ai mới bước vào quant trading cũng từng mắc phải: cứ nghĩ rằng mô hình càng phức tạp thì càng thông minh, và đã thông minh hơn thì chắc chắn sẽ kiếm tiền tốt hơn. Cách nghĩ này nghe rất hợp lý nếu nhìn từ bên ngoài. Trong nhiều lĩnh vực khác, mô hình càng mạnh, càng nhiều tầng, càng nhiều tham số thì thường càng xử lý được những bài toán khó. Nhưng thị trường tài chính lại là một môi trường rất khác. Ở đây, thứ quyết định không phải là mô hình có “giải thích” quá khứ đẹp đến đâu, mà là nó có còn hoạt động được khi bước sang dữ liệu mới hay không. Chính ở chỗ đó, overfitting trở thành một rủi ro cực kỳ nguy hiểm. Nó không làm mô hình trông ngu đi. Ngược lại, nó làm mô hình trông quá đẹp, quá mượt, quá thuyết phục. Và cũng vì thế mà nó mới là thứ khiến rất nhiều người tưởng mình đã tìm ra edge, trong khi thực ra chỉ đang tìm ra một cách khớp lại lịch sử thật khéo.

Phần 1: Overfitting là gì, và vì sao trong trading nó nguy hiểm hơn rất nhiều so với cách người ta tưởng tượng

Hiểu đơn giản nhất, overfitting là tình huống mô hình học quá kỹ dữ liệu quá khứ đến mức nó không chỉ học phần tín hiệu thật, mà còn học luôn cả những nhiễu, những trùng hợp ngẫu nhiên, những đặc điểm chỉ xuất hiện trong một giai đoạn rất cụ thể của lịch sử. Nếu nói bằng ngôn ngữ đời thường hơn, đó là lúc mô hình không còn “hiểu bản chất” nữa mà chỉ đang “nhớ bài”. Nó giống như một học sinh không hiểu quy luật của bài toán, nhưng lại thuộc lòng đáp án của bộ đề cũ. Khi gặp đề mới, mọi thứ bắt đầu vỡ ra rất nhanh. Trong quant trading, điều này thể hiện rất rõ qua một mô hình có kết quả backtest cực kỳ hấp dẫn trên dữ liệu huấn luyện, nhưng vừa đem qua giai đoạn khác là hiệu suất sụp xuống rõ rệt. Đó chính là lý do người làm quant chuyên nghiệp luôn ám ảnh với câu hỏi: mô hình này đang học tín hiệu thật, hay chỉ đang học cách chiều lòng quá khứ?

Điều làm overfitting trở nên đặc biệt nguy hiểm trong trading là dữ liệu tài chính vốn đã rất khó ngay từ bản chất. Nó không sạch sẽ, không ổn định, và không có những quy luật bền như nhiều bài toán khác trong machine learning. Giá cổ phiếu, hợp đồng tương lai hay tín hiệu vĩ mô luôn chịu ảnh hưởng của vô số lớp thông tin cùng lúc: dòng tiền, tâm lý, chính sách, lãi suất, thanh khoản, chu kỳ ngành, vị thế nhà đầu tư, thậm chí cả những sự kiện bất ngờ hoàn toàn không thể đưa vào mô hình trước đó. Trong một môi trường như vậy, tín hiệu thật vốn đã nhỏ, còn nhiễu lại rất dày. Điều đó có nghĩa là nếu mô hình quá linh hoạt, quá nhiều tham số, hoặc được tinh chỉnh quá nhiều trên dữ liệu cũ, nó rất dễ nhầm giữa “một mẫu lặp lại thật sự” với “một sự trùng hợp nhìn rất giống tín hiệu”. Đây là lý do nhiều chiến lược nhìn trên backtest rất đẹp nhưng sang live trading lại cho cảm giác như biến thành một con người khác: không phải vì thị trường “ghét” mô hình đó, mà vì mô hình từ đầu đã không học đúng thứ cần học.

Một cách để hình dung overfitting cho dễ là tưởng tượng bạn đang cố vẽ một đường đi qua dữ liệu quá khứ. Nếu dùng một đường rất đơn giản, nó có thể không chạm vào mọi điểm, nhưng nó sẽ nắm được hướng lớn. Nếu dùng một đường quá phức tạp, bạn có thể bẻ cong nó để chạm gần như tất cả điểm dữ liệu cũ. Nhìn vào, bạn sẽ thấy nó “khớp hoàn hảo”. Nhưng chính sự hoàn hảo đó lại là dấu hiệu phải nghi ngờ, vì ngoài đời, thị trường tương lai không cần lặp lại từng cú uốn nhỏ của quá khứ để cho bạn kiếm tiền. Nó chỉ cần giữ lại những mối quan hệ lớn và đủ bền. Một mô hình càng cố giải thích mọi chi tiết nhỏ của dữ liệu cũ thì càng dễ chết khi những chi tiết đó không lặp lại. Đây là lý do vì sao trong quant trading, người ta không quá quan tâm mô hình đẹp thế nào trong in-sample, mà quan tâm nó còn đứng được thế nào khi bước ra out-of-sample.

Và đây là điểm rất đáng nhớ: overfitting không chỉ là vấn đề của deep learning hay những mô hình “nặng đô”. Ngay cả một chiến lược rule-based, nhìn qua có vẻ rất thủ công, vẫn có thể overfit nếu người làm chiến lược chỉnh quá nhiều ngưỡng, quá nhiều lookback, quá nhiều điều kiện cho đến khi kết quả lịch sử trở nên hoàn hảo. Nhiều người cứ nghĩ mình không dùng AI nên sẽ không bị overfit, nhưng thực tế thì hễ còn tối ưu quá mức theo dữ liệu cũ, hễ còn bẻ hệ thống cho vừa với lịch sử, thì overfitting vẫn xảy ra. Nó không phụ thuộc vào việc mô hình có nghe hiện đại hay không. Nó phụ thuộc vào việc bạn đã cho mô hình quá nhiều tự do để “chiều” quá khứ hay chưa.

Phần 2: Vì sao mô hình ít tham số lại thường bền hơn, và vì sao những “lão tướng” như Linear Regression, Logistic Regression hay Kalman Filter vẫn chưa lỗi thời

Khi nói mô hình đơn giản thường bền hơn trong trading, điều đó không có nghĩa là chúng tốt hơn trong mọi hoàn cảnh, hay rằng các mô hình phức tạp không có giá trị. Ý đúng hơn là: trong một bài toán rất nhiễu, rất ít tín hiệu thật và luôn thay đổi như thị trường tài chính, mô hình càng ít tham số thì càng ít chỗ để tự lừa mình hơn. Đây là chỗ khái niệm “few degrees of freedom” trở nên rất quan trọng. Mỗi tham số thêm vào cho mô hình đồng nghĩa với một mức tự do mới để nó uốn mình theo dữ liệu cũ. Nếu dữ liệu đủ lớn, đủ giàu tín hiệu, đủ ổn định, thì sự linh hoạt đó có thể là lợi thế. Nhưng trong trading, đa số trường hợp lại không như vậy. Dữ liệu thường ngắn hơn người ta tưởng, tín hiệu thường yếu hơn người ta hy vọng, và regime thị trường thường đổi nhanh hơn mô hình kịp thích nghi. Vì thế, một mô hình ít tham số, rõ ràng, dễ regularize thường lại có xác suất sống sót tốt hơn.

Linear Regression là ví dụ điển hình nhất. Nhiều người mới nhìn nó như một thứ quá cơ bản, quá “học vỡ lòng”, nhưng chính vì nó cơ bản nên nó lại ép người làm mô hình phải trung thực. Nếu bạn dùng hồi quy tuyến tính để kiểm tra tác động của momentum, volatility hay quality lên expected return, bạn gần như không có nhiều chỗ để ẩn sự mơ hồ. Mô hình sẽ buộc bạn đối diện với một câu hỏi rõ ràng: biến nào đang thực sự có thông tin, dấu tác động của nó là gì, và quan hệ đó có còn tồn tại khi sang giai đoạn mới hay không. Linear Regression không cố tỏ ra thông minh. Nó không cố mô tả mọi ngoằn ngoèo của dữ liệu. Nó chỉ cố nắm những quan hệ lớn nhất, rõ nhất. Và trong trading, rất nhiều khi chính điều đó mới là thứ đáng tiền. Một chiến lược không cần hiểu “mọi thứ” để kiếm tiền. Nó chỉ cần giữ được vài mối quan hệ đủ bền để không chết ngay khi thị trường đổi gió.

Logistic Regression cũng tương tự, nhưng thậm chí còn hợp với nhiều bài toán trading hơn vì nó không ép bạn phải dự báo một con số lợi suất chính xác. Trong rất nhiều trường hợp, thứ trader cần không phải là “giá sẽ tăng bao nhiêu”, mà là “xác suất tăng có đang nhỉnh hơn bình thường hay không”, hoặc “xác suất thắng của kèo này có đáng để bỏ vốn hay không”. Khi dùng Logistic Regression, bạn đang chuyển một bài toán tài chính vốn rất nhiễu thành một bài toán xác suất dễ quản trị hơn. Mô hình không còn cố làm quá nhiều việc. Nó chỉ trả lời một câu hỏi khiêm tốn hơn, nhưng nhiều khi hữu ích hơn: xác suất một outcome có đang nghiêng về phía nào. Đó là một kiểu “simple” rất mạnh trong quant trading: thay vì cố đoán đúng thị trường với độ chính xác giả tạo, bạn chỉ xây một công cụ đánh giá xác suất, rồi để phần portfolio construction và risk management làm nốt phần còn lại.

Kalman Filter lại là một ví dụ rất hay về chuyện mô hình đơn giản không có nghĩa là mô hình thô sơ. Nó mạnh không phải vì phức tạp, mà vì nó giải đúng một vấn đề tài chính rất thực: các tham số trong thị trường thường không cố định. Beta thay đổi. Spread thay đổi. Mức nhiễu thay đổi. Cấu trúc xu hướng cũng thay đổi. Nếu bạn dùng một mô hình tĩnh để mô tả một thế giới luôn động, thì dù mô hình đó có đẹp mấy cũng rất dễ lỗi thời. Kalman Filter có giá trị ở chỗ nó cho phép mình cập nhật dần dần ước lượng theo dữ liệu mới, nghĩa là vừa đủ linh hoạt để thích nghi, nhưng không đến mức quá “tham” và tự fit vào từng nhịp nhiễu. Đó là kiểu robustness rất quý trong quant trading: không quá cứng, không quá mềm, mà vừa đủ để bám theo sự thay đổi thực sự của thị trường.

Nếu nhìn từ bên ngoài, có thể các mô hình như vậy không tạo cảm giác “wow” như một kiến trúc neural network nhiều tầng. Nhưng nếu nhìn từ góc độ sống sót ngoài đời, điểm mạnh của chúng lại rất rõ. Chúng dễ giải thích hơn, nên khi chiến lược hỏng, bạn nhanh tìm được nguyên nhân hơn. Chúng dễ regularize hơn, nên xác suất fit nhầm nhiễu thấp hơn. Chúng dễ retrain hơn, nên khi regime đổi, bạn không mất quá nhiều thời gian để đưa mô hình về trạng thái mới. Và quan trọng nhất, chúng thường cho bạn một loại niềm tin khác: không phải niềm tin kiểu “model này chắc rất thông minh”, mà là niềm tin kiểu “mình hiểu nó đang làm gì, hiểu nó có thể hỏng ở đâu, và hiểu cách sửa khi nó bắt đầu hỏng”. Trong trading, loại niềm tin thứ hai quý hơn rất nhiều.

Phần 3: Ví dụ và bài học thực tế

Để thấy vì sao overfitting nguy hiểm và vì sao mô hình đơn giản lại đáng tin hơn, có thể tưởng tượng một tình huống rất quen. Một người mới làm quant xây một chiến lược chọn cổ phiếu từ rất nhiều feature: momentum ngắn hạn, momentum dài hạn, RSI, MACD, volume surprise, volatility, định giá, quality, growth, cộng thêm rất nhiều ngưỡng vào lệnh và thoát lệnh. Sau đó họ backtest trên vài năm dữ liệu rồi tối ưu dần: đổi lookback từ 10 sang 15 rồi sang 21, đổi stop-loss từ mức này sang mức kia, thêm điều kiện lọc thanh khoản, thêm điều kiện loại trừ nhóm ngành, thêm quy tắc nếu thị trường chung xấu thì giảm tỷ trọng. Cuối cùng, họ nhận được một đường equity rất đẹp. Sharpe ratio cao, drawdown thấp, hiệu suất vượt benchmark. Nhìn vào, cảm giác gần như chắc chắn rằng mình đã tìm được một hệ thống tốt. Nhưng vấn đề là: rất có thể họ chỉ mới tìm được một bộ cài đặt rất hợp với giai đoạn vừa rồi. Khi dữ liệu mới xuất hiện, hoặc khi hành vi thị trường đổi khác, toàn bộ phần tối ưu tinh vi kia bắt đầu mất tác dụng. Đó chính là overfitting trong hình dạng rất thực tế của một chiến lược “được chỉnh quá kỹ”.

Ngược lại, một người khác có thể làm một việc khiêm tốn hơn. Họ chỉ dùng vài feature thực sự có lý do rõ ràng, ví dụ xu hướng giá, mức biến động, thanh khoản và một yếu tố cơ bản đơn giản. Sau đó họ dùng một Linear Regression hoặc Logistic Regression để xem các biến này có thật sự mang thông tin ngoài mẫu hay không. Kết quả của họ có thể không đẹp bằng người đầu tiên trên dữ liệu cũ. Nhưng nếu bước ra dữ liệu mới mà mô hình vẫn còn giữ được phần nào hiệu quả, thì đó mới là thứ đáng giá. Đây là điều rất khó chấp nhận với người mới, vì nhìn bằng mắt thì mô hình đơn giản thường “thua” về độ đẹp. Nhưng trong quant trading, rất nhiều khi chiến thắng nằm ở chỗ chấp nhận ít đẹp hơn trên giấy để đổi lấy nhiều ổn định hơn ngoài đời.

Một ví dụ khác rất dễ hiểu là chuyện tìm đáy và bắt breakout. Nếu bạn xây một hệ thống quá phức tạp để dự báo đúng từng nhịp đảo chiều, mô hình có thể trông cực kỳ ấn tượng trong quá khứ. Nhưng chỉ cần chu kỳ thị trường thay đổi một chút, hoặc cấu trúc dòng tiền khác đi, nó sẽ bắt đầu trả tín hiệu sai. Trong khi đó, một mô hình rất đơn giản chỉ dùng vài đặc trưng như xu hướng trung hạn, độ biến động và xác suất duy trì động lượng có thể không bao giờ bắt đúng đáy. Nhưng nó lại có cơ hội sống lâu hơn, vì nó không cố làm một việc quá tinh vi so với chất lượng dữ liệu đang có.

Với người mới làm quant, bài học thực tế không phải là “đừng bao giờ đụng vào mô hình phức tạp”. Bài học đúng hơn là: hãy bắt đầu bằng mô hình đơn giản đủ để hiểu vì sao nó thắng và vì sao nó thua. Nếu một Linear Regression hay Logistic Regression không tạo ra được bất kỳ tín hiệu out-of-sample nào tử tế, thì nhiều khả năng việc nhảy lên một kiến trúc phức tạp hơn chỉ làm bạn overfit tinh vi hơn, chứ không tạo ra edge thật. Còn nếu một mô hình đơn giản đã cho thấy một chút tín hiệu có ý nghĩa, lúc đó mới đáng hỏi xem liệu sự phức tạp bổ sung có thật sự cải thiện được chất lượng ngoài mẫu không.

Điều cuối cùng rất đáng nhớ là thế này: trong trading, mô hình tốt không phải là mô hình kể lại quá khứ đẹp nhất. Mô hình tốt là mô hình còn dùng được khi bước ra khỏi quá khứ. Đó là lý do overfitting là kẻ thù số 1, và cũng là lý do vì sao những “lão tướng” như Linear Regression, Logistic Regression hay Kalman Filter vẫn không biến mất. Không phải vì giới quant thiếu công nghệ. Mà vì họ hiểu rất rõ một điều: trong thị trường tài chính, thứ sống sót lâu nhất thường không phải là thứ hào nhoáng nhất, mà là thứ bền nhất.

Nếu bạn muốn, tôi viết tiếp phần sau theo đúng mạch này: Linear Regression trong quant trading: vì sao một mô hình tưởng rất cơ bản lại là nơi tốt nhất để bắt đầu.

Chia sẻ bài viết

Đánh giá

(0)

0 Đánh giá

0 / 5

0 nhận xét

Hãy là người đầu tiên nhận xét bài viết này!

Đăng ký nhận tin

Nhập Email để nhận được bản tin mới nhất từ QM Capital.

Overfitting là “kẻ thù số 1” trong quant trading

Phần 1: Overfitting là gì, và vì sao trong trading nó nguy hiểm hơn rất nhiều so với cách người ta tưởng tượng

Phần 2: Vì sao mô hình ít tham số lại thường bền hơn, và vì sao những “lão tướng” như Linear Regression, Logistic Regression hay Kalman Filter vẫn chưa lỗi thời

Phần 3: Ví dụ và bài học thực tế

Đánh giá

Đăng ký nhận tin

Tạo Bot giao dịch tự động với QMTrade

Chợ Bot Giao Dịch Tự Động

Bài viết liên quan

Understanding Market Sentiment: Đọc vị thị trường để đưa ra quyết định giao dịch chính xác C

Vì sao trader thua không phải vì thiếu kiến thức, mà vì thiếu kỷ luật? C

Trading không phải là đoán đúng, mà là xây dựng lợi thế C

Những mô hình nhiều nến đáng chú ý trong giao dịch chứng khoán và phái sinh Việt Nam - Phần 2 C

Cách hình thành các mô hình giá phổ biến trong phân tích kỹ thuật - Phần I C

Techniques for Trading Patterns: 4 Kỹ thuật quan trọng trong giao dịch chứng khoán và phái sinh Việt Nam C

Truy Cập Miễn Phí Thư Viện Bot Tín Hiệu Giao Dịch Tự Động