← Alle Insights

Datenqualität im Trading: warum „kostenlos" teuer wird.

Yahoo Finance, Investing.com, kostenlose CSV-Downloads — was Sie an Daten kostenlos bekommen, sieht aus wie Daten und ist es oft nicht. Was schief geht, woran man es merkt, und wann sich saubere Daten wirklich lohnen.

Jeder, der einen Backtest baut, fängt mit kostenlosen Daten an. Das ist auch okay — solange man weiß, was man hat. Problematisch wird es, wenn jemand eine Strategie mit 80 % Trefferquote backtested, live geht und nach drei Wochen feststellt: die Realität sah anders aus, weil die Daten anders waren als der Markt.

Die fünf häufigsten Daten-Probleme.

1. Splits nicht adjustiert

Apple hat 2014 einen 7-zu-1-Split gemacht, 2020 nochmal 4-zu-1. Wenn Ihre Aktien-Daten den Pre-Split-Preis von 700 USD enthalten und Sie das mit dem heutigen Preis von 175 USD vergleichen, ist Ihre Berechnung wertlos. Saubere Daten haben einen Adjusted Close, der alle Splits einrechnet.

Test: Schauen Sie sich AAPL im 5-Jahres-Chart an. Bei sauberen Daten ist kein „Bruch" im Juni 2014 oder August 2020 zu sehen. Bei rohen Daten springen die Preise an diesen Tagen abrupt nach unten.

2. Dividenden nicht eingerechnet

Wenn Sie eine Aktie mit 4 % Dividendenrendite über 10 Jahre backtesten und die Dividenden ignorieren, fehlen Ihnen 40 % der Total-Return. Ihre Buy-and-Hold-Strategie sieht plötzlich schwach aus, obwohl die echte Performance gut war. Lösung: Total-Return-Daten, die Dividenden reinvestiert behandeln.

3. Survivorship-Bias

Wenn Ihre Datenbank nur die Aktien enthält, die heute noch im S&P 500 sind, fehlen Ihnen alle Verlierer und Pleiten. Eine Strategie auf S&P-500-Universum mit Yahoo-Finance-Daten ist effektiv eine Strategie auf „die 500 stärksten US-Firmen der letzten 30 Jahre" — also auf eine Stichprobe mit eingebautem Selection-Bias.

Konkretes Beispiel: eine Strategie, die „kaufe alle S&P-500-Aktien, halte 5 Jahre" funktioniert in Survivorship-biased Daten überragend. Auf Point-in-Time-Daten (inkl. Lehman, Enron, Bear Stearns, WorldCom) deutlich schwächer.

4. Falsche Zeitstempel

Kostenlose Daten haben oft End-of-Day-Daten ohne präzise Zeitstempel. Wenn Sie eine Strategie mit Daily-Close-Signal und intraday-Ausführung backtesten, wissen Sie nicht, ob Sie zum 16:00-Close oder erst zum nächsten Tag um 9:30 öffnen ausführen. Das ist eine Differenz, die im Backtest gerne ignoriert wird und live 20–50 Basispunkte pro Trade kostet.

5. Tick-Daten-Qualität

Für Intraday-Strategien brauchen Sie Tick-Daten. Kostenlose Quellen liefern oft:

Eine Scalping-Strategie auf solche Daten ist Glücksspiel — der Backtest sagt nichts über die Live-Performance aus.

Welche Quellen für was?

Für Anfänger / niedrige Anforderungen

Für ernsthafte Backtests auf Aktien

Für Forex / CFDs

Für Futures

Daten-Qualitäts-Check vor jedem Backtest.

Bevor Sie irgendeine Strategie backtesten, schauen Sie auf diese fünf Dinge:

  1. Stetigkeit: Lücken in der Datenreihe? Gibt es Tage ohne Daten, die eigentlich Handelstage waren?
  2. Adjustments: Sind Splits adjustiert? Sind Dividenden eingerechnet (Total Return)?
  3. Universum: Ist die Aktien-Liste Point-in-Time oder Survivorship-biased?
  4. OHLC-Plausibilität: Stimmt High > Open/Close > Low? Klingt trivial, ist aber bei manchen Quellen verletzt.
  5. Volumen-Daten: Bei illiquiden Tagen oft null Volume — was bei sauberen Quellen NaN sein sollte.

Was es wirklich kostet, falsche Daten zu nutzen.

Eine Strategie, die auf Yahoo-Finance-Daten Sharpe 1,8 liefert, hat auf Norgate-Daten typischerweise Sharpe 1,1–1,3. Der Unterschied ist nicht „Yahoo ist schlecht", sondern: in Yahoo fehlen die Verlierer, die Drawdowns, die Splits-Tag-Discontinuities. Ihr Strategie-Test hat sich also in ein zu rosiges Universum verliebt.

Die 50 €/Monat für Norgate sind eine der besten Investitionen, die Sie als Backtester machen können — wenn Sie ernsthaft auf US-Aktien backtesten. Für Forex-Trader sind die Broker-Daten oft ausreichend, vorausgesetzt der Broker ist vernünftig.

Sie haben einen Backtest, bei dem Sie nicht sicher sind, ob die Daten ehrlich waren? Erstgespräch buchen — wir schauen die Datenquelle und die häufigsten Biases durch.