Liquiditäts-Forecasting mit ML: wann der Markt eng wird.
Volatilität bekommt die Schlagzeilen. Aber wer große Positionen bewegt, zahlt fast immer für Liquidität — nicht für Volatilität. Ein Modell, das einigermaßen vorhersagt, wann Spreads sich weiten und Volumen einbricht, ist im Risiko- und Execution-Management wertvoller als das fünfte Signalmodell.
Warum Liquidität wichtiger ist als Volatilität.
Volatilität sagt Ihnen, wie weit der Preis sich bewegen kann. Liquidität sagt Ihnen, wieviel Sie bewegen können, bevor der Preis Ihnen ausweicht. Für jeden Trade ab einer halbwegs ernsthaften Größe entscheidet Liquidität über Execution-Kosten — und damit über das tatsächlich realisierte P&L.
Ein VWAP-Algo, der die Marktorder über 4 Stunden streckt, basiert auf einer Volumen-Annahme. Wenn das tatsächliche Volumen 40 % unter Erwartung liegt, ist die Order entweder unausgeführt oder hat den Markt unnötig bewegt. Beides kostet — oft mehr als die durchschnittliche Vola-Bewegung des Tages.
Bid-Ask-Spread-Forecasting.
Der einfachste Liquiditäts-Indikator ist der Spread. Forecast-Ansätze, geordnet nach Komplexität:
- Rolling-Median: Median des Spreads über die letzten N Minuten als Erwartung für die nächste Minute. Funktioniert verblüffend gut, weil Spreads stark autokorreliert sind.
- HAR-Style-Regressionen: Heterogeneous-Autoregressive-Modelle (analog zu Realized-Volatility-Forecasts), mit Spread-Werten auf 1-Min-, 5-Min-, 30-Min-Ebene als Features.
- Gradient-Boosting auf Mikrostruktur-Features: zusätzliche Features wie Order-Book-Imbalance, jüngste Trade-Intensität, Time-of-Day-Dummies. Marginale Verbesserung gegenüber HAR.
- LSTM/Transformer: in Papers gut, in Live-Produktion selten besser als sauber konstruierte Lookback-Features.
Konkret bei Aktien: ein Spread-Forecast mit Rolling-30-Min-Median und einer Volatilitäts-Adjustierung erklärt etwa 70 % der Varianz des nächsten 5-Minuten- Spreads. Mehr Modell holt 5–10 % zusätzliche erklärte Varianz heraus — selten den Operations-Aufwand wert, außer bei sehr großem Notional.
Volume-Forecasting für VWAP-Algos.
VWAP-Strategien benötigen eine Schätzung des intraday Volumen-Profils. Standardansatz: historisches durchschnittliches Volumen pro 5-Minuten-Bucket über die letzten N Tage, adjustiert für aktuelle Aktivität.
ML-Verbesserungen:
- Adaptive Bucket-Gewichte: Gewichte für Buckets, die sich an aktuelle Marktbedingungen anpassen (höhere Gewichte für Tage mit ähnlicher Open-Drift, ähnlichem VIX-Level).
- Event-Klassifikation: Earnings-Days, FOMC-Days, Optionsverfall haben charakteristische Volumen-Profile. Klassifizieren und separate Modelle pro Klasse anwenden.
- Intraday-Update: nach der ersten Stunde Handel die Volumen-Schätzung für den Rest des Tages neu kalibrieren, basierend auf Open-zu-erwartet-Open-Ratio.
Konkretes Codebeispiel für das Intraday-Update:
def update_volume_forecast(realized_open_vol, expected_open_vol,
expected_full_day):
ratio = realized_open_vol / expected_open_vol
ratio = clip(ratio, 0.5, 2.0) # robust gegen Outlier
return expected_full_day * ratio
Liquidity-Stress-Indikatoren.
Über Spread und Volumen hinaus gibt es Stress-Maße, die kollabierende Liquidität früher anzeigen:
- Amihud Illiquidity: |Return| pro Volumen. Klassisch, robust, leicht zu berechnen.
- Kyle-Lambda: Preis-Impact pro signiertem Volumen. Komplexer, aber präziser.
- Order-Book-Depth-Decay: wie schnell die kumulative Liquidität in den Tiefen des Orderbuchs abnimmt. In Crisis-Phasen extrem hilfreich.
- VPIN (Volume-Synchronized Probability of Informed Trading): erfasst Toxizität, korreliert mit nachfolgender Liquiditäts-Verschlechterung.
Ein einfaches Stress-Modell: Z-Score dieser Indikatoren über ein 60-Tage-Fenster, gewichtete Summe als Stress-Index. Werte über 2 signalisieren erhöhtes Liquiditäts-Risiko — relevant für Hedge-Entscheidungen und für die Frage, ob geplante Trades aufgeschoben werden sollten.
Anwendungen: Slippage-Modelle und Order-Splitting.
Liquiditäts-Forecasts fließen direkt in Pre-Trade-Cost-Analyse ein. Typische Anwendungen:
- Slippage-Modell: erwartete Impact-Kosten = f(Order-Size, prognostizierter Spread, prognostiziertes Volumen, Volatilität). Auf Basis dieses Modells entscheidet das System, ob ein Trade rentabel ist.
- Order-Splitting: bei prognostiziert engen Liquiditätsphasen werden Orders feiner gesplittet und über längere Horizonte verteilt.
- Trade-Pausierung: bei Stress-Index oberhalb Schwellwert werden nicht-zeitkritische Trades verschoben.
Datenquellen.
Realistische Quellen für Liquiditäts-Daten:
- L1-Daten (Best-Bid/Ask, Volume): von jedem Broker und über Polygon, Databento, Alpaca.
- L2/L3-Daten (Orderbuch-Tiefe): Databento, Refinitiv, Iress. Bei Crypto direkt von den Exchange-WS-APIs kostenfrei.
- Trades-Tape mit Trade-Sign-Klassifikation: TAQ (kostenpflichtig), Polygon für US-Equities, Exchange-direkt für Futures.
- VIX-Term-Structure als Makro-Liquiditäts-Proxy: CBOE, kostenfrei.
Meine Praxis: oft schlägt einfach komplex.
Aus eigener Erfahrung: ein 5-Minuten-Median-Spread mit Volatilitäts-Adjustierung ist in den meisten realen Anwendungen kaum schlechter als ein Gradient-Boosted Tree mit 40 Features. Die Marginalverbesserung durch ML rechtfertigt selten die Betriebskosten — außer bei sehr hohem Trading-Volumen.
Wo ML konsistent Wert liefert: Event-Klassifikation (heute ist ein FOMC-Tag, das Volumen-Profil sieht anders aus), Regime-Erkennung (Crisis vs. Normal vs. Low-Vol), und non-lineare Interaktionen zwischen Stress-Indikatoren. Nicht beim reinen Punkt-Forecast des Spreads.
Meine Empfehlung an Mandanten: starten Sie mit der einfachsten möglichen Baseline, messen Sie tatsächliche Slippage gegen prognostizierte über mindestens 3 Monate, und investieren Sie erst dann in ML-Komplexität, wenn Sie eine konkrete Schwäche der Baseline identifiziert haben.
Sie wollen Ihre Execution-Kosten quantifizieren und Slippage-Modelle aufbauen? Erstgespräch buchen — wir starten bei den tatsächlichen Daten Ihrer letzten 100 Trades.