Vom Backtest zur Live-Strategie: die fünf häufigsten Fallen.
Eine Strategie, die im Backtest 47 % pro Jahr macht, geht live oft pleite. Nicht weil der Code falsch ist — sondern weil der Backtest fast immer mehr verspricht, als der Markt halten kann. Die fünf Fallen, die ich am häufigsten sehe — und wie man sie umgeht.
Wenn jemand mir einen Backtest mit Sharpe 3,2 zeigt, ist meine erste Reaktion nicht „cool", sondern „wo ist der Fehler?". Nicht aus Misstrauen, sondern aus Erfahrung. Echte Strategien haben in den seltensten Fällen einen Sharpe über 2 — und Backtests mit 3+ enthalten in 90 % der Fälle einen oder mehrere der folgenden Bugs.
1. Overfitting — das beliebteste Eigentor.
Sie haben einen Indikator, der „eigentlich" funktioniert, aber noch nicht perfekt ist. Sie optimieren die Parameter: Lookback von 14 auf 22, Threshold von 1,5 auf 1,8, Filter hinzu. Plötzlich macht der Backtest 60 % Equity-Kurve und schöne, flache Drawdowns. Sie gehen live. Drei Wochen später sind Sie im Minus.
Was passiert ist: Sie haben nicht eine Strategie optimiert, sondern eine Strategie auf das historische Rauschen gefittet. Mit jedem Parameter, den Sie an die Vergangenheit anpasst, steigt die In-Sample-Performance und sinkt die Out-of-Sample-Erwartung.
Gegenmittel: Walk-Forward-Analyse
Teilen Sie Ihre Daten in Blöcke: optimieren Sie auf Block 1, testen Sie auf Block 2. Optimieren Sie auf Block 2, testen Sie auf Block 3. Und so weiter. Wenn die Out-of-Sample-Performance über die Blöcke hinweg stabil ist, haben Sie etwas. Wenn nicht: Sie haben eine Kurve auf Rauschen gefittet. Die meisten Tradingplattformen — MT5 inklusive — bieten dafür eingebaute Funktionen. Nutzen Sie sie.
2. Look-Ahead-Bias — der unsichtbare Mörder.
Ihr Backtest verwendet Informationen, die der Strategie zum Zeitpunkt der Entscheidung real nicht zur Verfügung standen. Das passiert subtil, oft unbemerkt:
- Sie nutzen den Schlusskurs einer Daily-Kerze, um zur Eröffnung am gleichen Tag eine Order zu platzieren.
- Sie bauen einen Indikator auf fundamentale Daten ein, die zum Zeitpunkt der Veröffentlichung in der Datenbank standen — aber in Wirklichkeit erst Tage später öffentlich wurden.
- Sie filterst Aktien nach Eigenschaften, die erst durch die spätere Kursentwicklung bekannt wurden („Aktien mit positiver Jahresentwicklung").
Gegenmittel: nur Daten der Vergangenheit
Frage Sie bei jedem Datenpunkt: „War das zum Zeitpunkt der Entscheidung real verfügbar?" Bei Indikatoren auf High/Low: das High einer Kerze steht erst nach Schluss fest. Bei Fundamentaldaten: Reporting-Lag von mindestens einem Quartal einplanen. Bei Filtern: der Filter muss zum Zeitpunkt der Entscheidung wissbar sein, nicht im Rückblick.
3. Survivorship-Bias — das Friedhof-Problem.
Sie testen eine Aktien-Strategie auf dem aktuellen S&P 500. Schöne Equity-Kurve. Was Sie übersehen haben: Sie testen sie nur auf den Unternehmen, die heute noch im S&P 500 sind. Wirecard, Lehman Brothers, General Motors (pre-bankruptcy), Enron — alles draußen aus Ihren Daten. Sie haben eine Strategie auf einem Universum getestet, in dem die Verlierer bereits aussortiert sind.
Gegenmittel: Point-in-Time-Universen
Verwenden Sie einen Datenanbieter, der zu jedem historischen Datum das damalige Index-Universum kennt — inklusive der später ausgeschiedenen Firmen. Bei großen Anbietern (Refinitiv, FactSet, Norgate) Standard. Bei kostenlosen Daten oft fehlend. Wer mit Yahoo Finance backtested, sollte sich der Limitation bewusst sein.
4. Slippage und Spread — der Realitäts-Schock.
Im Backtest wird zum gewünschten Kurs ausgeführt. Live wird zum nächsten verfügbaren Kurs ausgeführt — und der ist bei volatilen Märkten oft 0,2 % bis 1 % entfernt. Bei einer Strategie mit 0,4 % erwartetem Edge pro Trade frisst Slippage allein die gesamte Edge auf.
Hinzu kommen Spreads (besonders bei CFDs, Forex außerhalb der Hauptzeiten und ausgewählten Aktien) und Kommissionen, die in vielen Backtests entweder gar nicht oder zu niedrig modelliert sind.
Gegenmittel: pessimistische Annahmen
Modellieren Sie im Backtest mindestens:
- Den aktuellen Spread × 1,5 als Worst-Case-Spread
- Pro Trade 2 Ticks Slippage für liquide Märkte, mehr für illiquide
- Die realen Kommissionen Ihres Brokers (inkl. Exchange-Fees bei Futures)
- Bei Forex-Strategien: Swap-Kosten für Übernacht-Positionen
Wenn Ihre Strategie das übersteht und immer noch profitabel ist, haben Sie eine echte Edge. Wenn nicht, wissen Sie es bevor Sie Geld verlieren.
5. Der Liquiditäts-Killer — die unsichtbare Skalierungsgrenze.
Ihre Backtest-Performance auf Small-Caps sieht atemberaubend aus. Mit 5.000 € pro Trade — auf Aktien, die täglich 50.000 € Volumen haben. Wenn Sie das in echt versuchen, bewegst Sie den Kurs selbst. Die ersten 10 % der Order werden zum gewünschten Preis ausgeführt, der Rest zieht den Kurs um 2 % hoch — gegen Sie.
Gegenmittel: maximales Order-Volumen relativ zum Tagesvolumen
Faustregel: nie mehr als 1 % des durchschnittlichen Tagesvolumens pro Order. Besser 0,5 %. Bei kleinen Strategien irrelevant — bei wachsendem Kapital der wichtigste Skalierungsgrenzwert. Implementieren Sie ihn von Anfang an als Filter, dann müssen Sie sich später nicht von liebgewonnenen Setups verabschieden, die einfach nicht skalieren.
Das ehrliche Sharpe-Realitäts-Update.
Wenn Sie alle fünf Fallen aus einem ursprünglich glänzenden Backtest entfernst, schrumpft der Sharpe-Ratio typischerweise um 30–60 %. Aus einem Sharpe 3 wird ein Sharpe 1,2. Das ist kein Bug, sondern das Feature — die ehrlichere Zahl ist das, was Sie live tatsächlich erwarten können.
Strategien mit ehrlichem Sharpe von 1 bis 1,5 sind übrigens gute Strategien. Die meisten Hedgefonds haben Live-Sharpes in diesem Bereich. Wer mit einem Sharpe 3 live geht, geht mit ziemlicher Sicherheit nicht mit Sharpe 3 nach Hause.
Sie haben eine Strategie, bei der Sie nicht sicher sind, ob sie eine dieser Fallen enthält? 30 Minuten Erstgespräch buchen — ich schaue mir den Backtest an.