02/04/2026
363 lượt đọc
Vì sao mô hình càng phức tạp chưa chắc càng tốt, và vì sao những mô hình đơn giản vẫn là vũ khí rất mạnh
Có một hiểu lầm mà gần như ai mới bước vào quant trading cũng từng mắc phải: cứ nghĩ rằng mô hình càng phức tạp thì càng thông minh, và đã thông minh hơn thì chắc chắn sẽ kiếm tiền tốt hơn. Cách nghĩ này nghe rất hợp lý nếu nhìn từ bên ngoài. Trong nhiều lĩnh vực khác, mô hình càng mạnh, càng nhiều tầng, càng nhiều tham số thì thường càng xử lý được những bài toán khó. Nhưng thị trường tài chính lại là một môi trường rất khác. Ở đây, thứ quyết định không phải là mô hình có “giải thích” quá khứ đẹp đến đâu, mà là nó có còn hoạt động được khi bước sang dữ liệu mới hay không. Chính ở chỗ đó, overfitting trở thành một rủi ro cực kỳ nguy hiểm. Nó không làm mô hình trông ngu đi. Ngược lại, nó làm mô hình trông quá đẹp, quá mượt, quá thuyết phục. Và cũng vì thế mà nó mới là thứ khiến rất nhiều người tưởng mình đã tìm ra edge, trong khi thực ra chỉ đang tìm ra một cách khớp lại lịch sử thật khéo.
Hiểu đơn giản nhất, overfitting là tình huống mô hình học quá kỹ dữ liệu quá khứ đến mức nó không chỉ học phần tín hiệu thật, mà còn học luôn cả những nhiễu, những trùng hợp ngẫu nhiên, những đặc điểm chỉ xuất hiện trong một giai đoạn rất cụ thể của lịch sử. Nếu nói bằng ngôn ngữ đời thường hơn, đó là lúc mô hình không còn “hiểu bản chất” nữa mà chỉ đang “nhớ bài”. Nó giống như một học sinh không hiểu quy luật của bài toán, nhưng lại thuộc lòng đáp án của bộ đề cũ. Khi gặp đề mới, mọi thứ bắt đầu vỡ ra rất nhanh. Trong quant trading, điều này thể hiện rất rõ qua một mô hình có kết quả backtest cực kỳ hấp dẫn trên dữ liệu huấn luyện, nhưng vừa đem qua giai đoạn khác là hiệu suất sụp xuống rõ rệt. Đó chính là lý do người làm quant chuyên nghiệp luôn ám ảnh với câu hỏi: mô hình này đang học tín hiệu thật, hay chỉ đang học cách chiều lòng quá khứ?
Điều làm overfitting trở nên đặc biệt nguy hiểm trong trading là dữ liệu tài chính vốn đã rất khó ngay từ bản chất. Nó không sạch sẽ, không ổn định, và không có những quy luật bền như nhiều bài toán khác trong machine learning. Giá cổ phiếu, hợp đồng tương lai hay tín hiệu vĩ mô luôn chịu ảnh hưởng của vô số lớp thông tin cùng lúc: dòng tiền, tâm lý, chính sách, lãi suất, thanh khoản, chu kỳ ngành, vị thế nhà đầu tư, thậm chí cả những sự kiện bất ngờ hoàn toàn không thể đưa vào mô hình trước đó. Trong một môi trường như vậy, tín hiệu thật vốn đã nhỏ, còn nhiễu lại rất dày. Điều đó có nghĩa là nếu mô hình quá linh hoạt, quá nhiều tham số, hoặc được tinh chỉnh quá nhiều trên dữ liệu cũ, nó rất dễ nhầm giữa “một mẫu lặp lại thật sự” với “một sự trùng hợp nhìn rất giống tín hiệu”. Đây là lý do nhiều chiến lược nhìn trên backtest rất đẹp nhưng sang live trading lại cho cảm giác như biến thành một con người khác: không phải vì thị trường “ghét” mô hình đó, mà vì mô hình từ đầu đã không học đúng thứ cần học.
Một cách để hình dung overfitting cho dễ là tưởng tượng bạn đang cố vẽ một đường đi qua dữ liệu quá khứ. Nếu dùng một đường rất đơn giản, nó có thể không chạm vào mọi điểm, nhưng nó sẽ nắm được hướng lớn. Nếu dùng một đường quá phức tạp, bạn có thể bẻ cong nó để chạm gần như tất cả điểm dữ liệu cũ. Nhìn vào, bạn sẽ thấy nó “khớp hoàn hảo”. Nhưng chính sự hoàn hảo đó lại là dấu hiệu phải nghi ngờ, vì ngoài đời, thị trường tương lai không cần lặp lại từng cú uốn nhỏ của quá khứ để cho bạn kiếm tiền. Nó chỉ cần giữ lại những mối quan hệ lớn và đủ bền. Một mô hình càng cố giải thích mọi chi tiết nhỏ của dữ liệu cũ thì càng dễ chết khi những chi tiết đó không lặp lại. Đây là lý do vì sao trong quant trading, người ta không quá quan tâm mô hình đẹp thế nào trong in-sample, mà quan tâm nó còn đứng được thế nào khi bước ra out-of-sample.
Và đây là điểm rất đáng nhớ: overfitting không chỉ là vấn đề của deep learning hay những mô hình “nặng đô”. Ngay cả một chiến lược rule-based, nhìn qua có vẻ rất thủ công, vẫn có thể overfit nếu người làm chiến lược chỉnh quá nhiều ngưỡng, quá nhiều lookback, quá nhiều điều kiện cho đến khi kết quả lịch sử trở nên hoàn hảo. Nhiều người cứ nghĩ mình không dùng AI nên sẽ không bị overfit, nhưng thực tế thì hễ còn tối ưu quá mức theo dữ liệu cũ, hễ còn bẻ hệ thống cho vừa với lịch sử, thì overfitting vẫn xảy ra. Nó không phụ thuộc vào việc mô hình có nghe hiện đại hay không. Nó phụ thuộc vào việc bạn đã cho mô hình quá nhiều tự do để “chiều” quá khứ hay chưa.
Khi nói mô hình đơn giản thường bền hơn trong trading, điều đó không có nghĩa là chúng tốt hơn trong mọi hoàn cảnh, hay rằng các mô hình phức tạp không có giá trị. Ý đúng hơn là: trong một bài toán rất nhiễu, rất ít tín hiệu thật và luôn thay đổi như thị trường tài chính, mô hình càng ít tham số thì càng ít chỗ để tự lừa mình hơn. Đây là chỗ khái niệm “few degrees of freedom” trở nên rất quan trọng. Mỗi tham số thêm vào cho mô hình đồng nghĩa với một mức tự do mới để nó uốn mình theo dữ liệu cũ. Nếu dữ liệu đủ lớn, đủ giàu tín hiệu, đủ ổn định, thì sự linh hoạt đó có thể là lợi thế. Nhưng trong trading, đa số trường hợp lại không như vậy. Dữ liệu thường ngắn hơn người ta tưởng, tín hiệu thường yếu hơn người ta hy vọng, và regime thị trường thường đổi nhanh hơn mô hình kịp thích nghi. Vì thế, một mô hình ít tham số, rõ ràng, dễ regularize thường lại có xác suất sống sót tốt hơn.
Linear Regression là ví dụ điển hình nhất. Nhiều người mới nhìn nó như một thứ quá cơ bản, quá “học vỡ lòng”, nhưng chính vì nó cơ bản nên nó lại ép người làm mô hình phải trung thực. Nếu bạn dùng hồi quy tuyến tính để kiểm tra tác động của momentum, volatility hay quality lên expected return, bạn gần như không có nhiều chỗ để ẩn sự mơ hồ. Mô hình sẽ buộc bạn đối diện với một câu hỏi rõ ràng: biến nào đang thực sự có thông tin, dấu tác động của nó là gì, và quan hệ đó có còn tồn tại khi sang giai đoạn mới hay không. Linear Regression không cố tỏ ra thông minh. Nó không cố mô tả mọi ngoằn ngoèo của dữ liệu. Nó chỉ cố nắm những quan hệ lớn nhất, rõ nhất. Và trong trading, rất nhiều khi chính điều đó mới là thứ đáng tiền. Một chiến lược không cần hiểu “mọi thứ” để kiếm tiền. Nó chỉ cần giữ được vài mối quan hệ đủ bền để không chết ngay khi thị trường đổi gió.
Logistic Regression cũng tương tự, nhưng thậm chí còn hợp với nhiều bài toán trading hơn vì nó không ép bạn phải dự báo một con số lợi suất chính xác. Trong rất nhiều trường hợp, thứ trader cần không phải là “giá sẽ tăng bao nhiêu”, mà là “xác suất tăng có đang nhỉnh hơn bình thường hay không”, hoặc “xác suất thắng của kèo này có đáng để bỏ vốn hay không”. Khi dùng Logistic Regression, bạn đang chuyển một bài toán tài chính vốn rất nhiễu thành một bài toán xác suất dễ quản trị hơn. Mô hình không còn cố làm quá nhiều việc. Nó chỉ trả lời một câu hỏi khiêm tốn hơn, nhưng nhiều khi hữu ích hơn: xác suất một outcome có đang nghiêng về phía nào. Đó là một kiểu “simple” rất mạnh trong quant trading: thay vì cố đoán đúng thị trường với độ chính xác giả tạo, bạn chỉ xây một công cụ đánh giá xác suất, rồi để phần portfolio construction và risk management làm nốt phần còn lại.
Kalman Filter lại là một ví dụ rất hay về chuyện mô hình đơn giản không có nghĩa là mô hình thô sơ. Nó mạnh không phải vì phức tạp, mà vì nó giải đúng một vấn đề tài chính rất thực: các tham số trong thị trường thường không cố định. Beta thay đổi. Spread thay đổi. Mức nhiễu thay đổi. Cấu trúc xu hướng cũng thay đổi. Nếu bạn dùng một mô hình tĩnh để mô tả một thế giới luôn động, thì dù mô hình đó có đẹp mấy cũng rất dễ lỗi thời. Kalman Filter có giá trị ở chỗ nó cho phép mình cập nhật dần dần ước lượng theo dữ liệu mới, nghĩa là vừa đủ linh hoạt để thích nghi, nhưng không đến mức quá “tham” và tự fit vào từng nhịp nhiễu. Đó là kiểu robustness rất quý trong quant trading: không quá cứng, không quá mềm, mà vừa đủ để bám theo sự thay đổi thực sự của thị trường.
Nếu nhìn từ bên ngoài, có thể các mô hình như vậy không tạo cảm giác “wow” như một kiến trúc neural network nhiều tầng. Nhưng nếu nhìn từ góc độ sống sót ngoài đời, điểm mạnh của chúng lại rất rõ. Chúng dễ giải thích hơn, nên khi chiến lược hỏng, bạn nhanh tìm được nguyên nhân hơn. Chúng dễ regularize hơn, nên xác suất fit nhầm nhiễu thấp hơn. Chúng dễ retrain hơn, nên khi regime đổi, bạn không mất quá nhiều thời gian để đưa mô hình về trạng thái mới. Và quan trọng nhất, chúng thường cho bạn một loại niềm tin khác: không phải niềm tin kiểu “model này chắc rất thông minh”, mà là niềm tin kiểu “mình hiểu nó đang làm gì, hiểu nó có thể hỏng ở đâu, và hiểu cách sửa khi nó bắt đầu hỏng”. Trong trading, loại niềm tin thứ hai quý hơn rất nhiều.
Để thấy vì sao overfitting nguy hiểm và vì sao mô hình đơn giản lại đáng tin hơn, có thể tưởng tượng một tình huống rất quen. Một người mới làm quant xây một chiến lược chọn cổ phiếu từ rất nhiều feature: momentum ngắn hạn, momentum dài hạn, RSI, MACD, volume surprise, volatility, định giá, quality, growth, cộng thêm rất nhiều ngưỡng vào lệnh và thoát lệnh. Sau đó họ backtest trên vài năm dữ liệu rồi tối ưu dần: đổi lookback từ 10 sang 15 rồi sang 21, đổi stop-loss từ mức này sang mức kia, thêm điều kiện lọc thanh khoản, thêm điều kiện loại trừ nhóm ngành, thêm quy tắc nếu thị trường chung xấu thì giảm tỷ trọng. Cuối cùng, họ nhận được một đường equity rất đẹp. Sharpe ratio cao, drawdown thấp, hiệu suất vượt benchmark. Nhìn vào, cảm giác gần như chắc chắn rằng mình đã tìm được một hệ thống tốt. Nhưng vấn đề là: rất có thể họ chỉ mới tìm được một bộ cài đặt rất hợp với giai đoạn vừa rồi. Khi dữ liệu mới xuất hiện, hoặc khi hành vi thị trường đổi khác, toàn bộ phần tối ưu tinh vi kia bắt đầu mất tác dụng. Đó chính là overfitting trong hình dạng rất thực tế của một chiến lược “được chỉnh quá kỹ”.
Ngược lại, một người khác có thể làm một việc khiêm tốn hơn. Họ chỉ dùng vài feature thực sự có lý do rõ ràng, ví dụ xu hướng giá, mức biến động, thanh khoản và một yếu tố cơ bản đơn giản. Sau đó họ dùng một Linear Regression hoặc Logistic Regression để xem các biến này có thật sự mang thông tin ngoài mẫu hay không. Kết quả của họ có thể không đẹp bằng người đầu tiên trên dữ liệu cũ. Nhưng nếu bước ra dữ liệu mới mà mô hình vẫn còn giữ được phần nào hiệu quả, thì đó mới là thứ đáng giá. Đây là điều rất khó chấp nhận với người mới, vì nhìn bằng mắt thì mô hình đơn giản thường “thua” về độ đẹp. Nhưng trong quant trading, rất nhiều khi chiến thắng nằm ở chỗ chấp nhận ít đẹp hơn trên giấy để đổi lấy nhiều ổn định hơn ngoài đời.
Một ví dụ khác rất dễ hiểu là chuyện tìm đáy và bắt breakout. Nếu bạn xây một hệ thống quá phức tạp để dự báo đúng từng nhịp đảo chiều, mô hình có thể trông cực kỳ ấn tượng trong quá khứ. Nhưng chỉ cần chu kỳ thị trường thay đổi một chút, hoặc cấu trúc dòng tiền khác đi, nó sẽ bắt đầu trả tín hiệu sai. Trong khi đó, một mô hình rất đơn giản chỉ dùng vài đặc trưng như xu hướng trung hạn, độ biến động và xác suất duy trì động lượng có thể không bao giờ bắt đúng đáy. Nhưng nó lại có cơ hội sống lâu hơn, vì nó không cố làm một việc quá tinh vi so với chất lượng dữ liệu đang có.
Với người mới làm quant, bài học thực tế không phải là “đừng bao giờ đụng vào mô hình phức tạp”. Bài học đúng hơn là: hãy bắt đầu bằng mô hình đơn giản đủ để hiểu vì sao nó thắng và vì sao nó thua. Nếu một Linear Regression hay Logistic Regression không tạo ra được bất kỳ tín hiệu out-of-sample nào tử tế, thì nhiều khả năng việc nhảy lên một kiến trúc phức tạp hơn chỉ làm bạn overfit tinh vi hơn, chứ không tạo ra edge thật. Còn nếu một mô hình đơn giản đã cho thấy một chút tín hiệu có ý nghĩa, lúc đó mới đáng hỏi xem liệu sự phức tạp bổ sung có thật sự cải thiện được chất lượng ngoài mẫu không.
Điều cuối cùng rất đáng nhớ là thế này: trong trading, mô hình tốt không phải là mô hình kể lại quá khứ đẹp nhất. Mô hình tốt là mô hình còn dùng được khi bước ra khỏi quá khứ. Đó là lý do overfitting là kẻ thù số 1, và cũng là lý do vì sao những “lão tướng” như Linear Regression, Logistic Regression hay Kalman Filter vẫn không biến mất. Không phải vì giới quant thiếu công nghệ. Mà vì họ hiểu rất rõ một điều: trong thị trường tài chính, thứ sống sót lâu nhất thường không phải là thứ hào nhoáng nhất, mà là thứ bền nhất.
Nếu bạn muốn, tôi viết tiếp phần sau theo đúng mạch này: Linear Regression trong quant trading: vì sao một mô hình tưởng rất cơ bản lại là nơi tốt nhất để bắt đầu.
0 / 5
Trong giao dịch, rất nhiều người dành phần lớn thời gian để học cách đọc biểu đồ, học mô hình nến, học RSI, MACD, Bollinger Bands hay Fibonacci. Những thứ đó đều hữu ích. Nhưng sau một thời gian đủ dài, gần như ai cũng sẽ gặp cùng một vấn đề: biết tín hiệu nhưng vẫn vào sai lệnh, thấy mô hình đúng mà kết quả vẫn không như kỳ vọng. Lý do nằm ở chỗ thị trường không vận hành chỉ bằng kỹ thuật. Thị trường vận hành bằng kỳ vọng, định vị dòng tiền và cảm xúc tập thể. Nói cách khác, nếu chỉ đọc chart mà không đọc được tâm lý thị trường, chúng ta mới chỉ nhìn thấy “hình dạng” của giá, chứ chưa hiểu “động cơ” khiến giá vận động.
Jesse Livermore là một trong những cái tên kinh điển nhất trong lịch sử trading. Điều khiến ông trở thành huyền thoại không chỉ nằm ở những thương vụ lớn, mà nằm ở cách ông quan sát thị trường và đúc kết ra các nguyên tắc giao dịch vượt thời gian. Dù thị trường ngày nay đã có thuật toán, dữ liệu lớn, phái sinh, margin, HFT và rất nhiều công cụ hiện đại, những bài học của Livermore vẫn còn nguyên giá trị, bởi bản chất sâu nhất của thị trường chưa từng thay đổi: con người vẫn bị chi phối bởi tham lam, sợ hãi, hy vọng và cái tôi.
Đọc bài review của Steve Burns về cuốn The Man Who Solved the Market: Jim Simons, QM Capital thấy đây không chỉ là câu chuyện về một cá nhân xuất chúng, mà là một cách nhìn rất khác về thị trường tài chính. Jim Simons không bước vào thị trường với tư duy “hôm nay mua mã nào” hay “ngày mai thị trường tăng hay giảm”. Ông bước vào thị trường với niềm tin rằng: trong giá cả có những mẫu hình lặp lại, và nếu có đủ dữ liệu, đủ năng lực toán học, đủ công nghệ và đủ kỷ luật, con người có thể tìm ra lợi thế từ những mẫu hình đó.
Ở Phần 1, chúng ta đã nói về cách hình thành các mô hình giá phổ biến. Sang Phần 2, trọng tâm không còn là “mô hình đó trông như thế nào”, mà là mô hình nào có thể tạo tín hiệu tăng, mô hình nào cảnh báo tín hiệu giảm, và quan trọng hơn là trader nên đọc chúng ra sao trong thực chiến.
Trong phân tích kỹ thuật, mô hình giá không chỉ là những đường kẻ trên biểu đồ. Mỗi mô hình thực chất là một “bản ghi” về tâm lý thị trường: bên mua đang mạnh lên hay yếu đi, bên bán đang phân phối hay mất kiểm soát, dòng tiền đang tích lũy hay rút ra. Khi nhìn một mô hình, điều quan trọng không phải là cố tìm cho giống hình mẫu trong sách, mà là hiểu được câu chuyện cung – cầu đang diễn ra phía sau.
Trong giao dịch tài chính, đặc biệt là ở thị trường chứng khoán Việt Nam và phái sinh VN30, phần lớn trader thường bắt đầu bằng việc tìm kiếm tín hiệu vào lệnh. Họ học các mô hình giá, đường trung bình, RSI, MACD, Bollinger Bands, volume, nến Nhật và rất nhiều chỉ báo khác. Tuy nhiên, vấn đề không nằm ở việc thiếu tín hiệu. Vấn đề lớn hơn là trader không biết tín hiệu nào đáng tin, vào lệnh ở đâu, sai thì thoát ở đâu, và khi nào nên kiên nhẫn chờ giá điều chỉnh thay vì mua đuổi.
Được nghiên cứu và phát triển bởi các chuyên gia từ QMTrade và cộng đồng nhà đầu tư chuyên nghiệp.
Truy cập ngay!