9 Min. Lesezeit · KI · November 2029

KI im Market-Making: warum Retail das nicht repliziert.

Akademische Papers zu Reinforcement Learning im Market-Making füllen Bände. Die praktische Realität ist nüchterner: Market-Making ist ein Geschäft, das nicht am Algorithmus, sondern an Infrastruktur und Rebates entschieden wird. Was Sie als Privatanleger daraus mitnehmen können, ist trotzdem nicht null — nur etwas anderes, als die Demos zeigen.

Was Market-Making mathematisch ist.

Ein Market-Maker stellt gleichzeitig Bid- und Ask-Quotes, hofft auf Ausführung beider Seiten und verdient den Spread. Das Standard-Modell stammt von Avellaneda und Stoikov (2008): der optimale Quote-Mittelpunkt verschiebt sich gegen das aktuelle Inventar, der Quote-Spread hängt von Volatilität, Risikoaversion und Restlaufzeit ab.

Formal in vereinfachter Form:

r(s, q, t) = s - q * γ * σ² * (T - t)
δ_bid + δ_ask = γ * σ² * (T - t) + (2/γ) * ln(1 + γ/k)

mit Inventar q, Mid-Price s, Risikoaversion γ, Volatilität σ und Order-Flow-Intensität k. Das Modell ist elegant und liefert einen sauberen Startpunkt. Es ignoriert allerdings Adverse Selection, Latenz, Queue-Position und Rebate-Struktur — also alles, woran Market- Making in der Realität gewonnen oder verloren wird.

RL im Market-Making — akademisch viel, praktisch wenig.

Reinforcement Learning, insbesondere Deep-Q-Learning und PPO, ist seit Jahren ein beliebtes Forschungsthema. Die typische Setup: ein Agent lernt, Quotes zu setzen, um kumulierte Profite minus Inventar-Strafe zu maximieren. In Simulation funktioniert das oft beeindruckend.

In der Praxis kollidiert RL mit drei harten Wänden:

Simulator-Realismus: der Order-Flow, gegen den der Agent trainiert, ist meist endogen — also vom Agenten selbst beeinflusst. Echte Märkte reagieren auf Quotes anders als der Simulator annimmt.
Latenz und Queue: die meisten RL-Setups ignorieren, dass die Reihenfolge der Order-Ankunft im Orderbuch entscheidet, wer gefüllt wird. Wer 200 Mikrosekunden zu spät ist, steht hinten in der Schlange.
Adverse Selection: gefüllte Quotes sind selektionsverzerrt. Wer auf der Ask-Seite gefüllt wird, hatte häufig den falschen Preis. Klassische MM-Modelle erfassen das mit Toxizitäts-Maßen (VPIN), RL meist nicht.

Co-Location und FPGAs — die unsichtbare Barriere.

Echtes Market-Making auf Aktien-, Futures- oder Options-Märkten findet auf Hardware statt, die in derselben Halle wie das Exchange-Matching-Engine steht. Co-Location kostet bei großen Börsen sechs- bis siebenstellige Beträge pro Jahr, FPGAs für die Order-Logik weitere mittlere sechsstellige Summen.

Der Punkt ist nicht, dass Retail-Trader das nicht bezahlen können — der Punkt ist, dass der Edge in dieser Latenz liegt. Wer 5 Millisekunden langsamer als der schnellste MM auf demselben Ticker ist, wird systematisch nur dann gefüllt, wenn die schnellen MMs ihren Quote bereits zurückgezogen haben. Das ist Adverse Selection in Reinkultur. Kein RL-Modell kompensiert diese strukturelle Schwäche.

Was Retail-Trader vom MM-Konzept lernen können.

Auch wenn echtes Market-Making nicht replizierbar ist — drei Erkenntnisse aus der MM-Theorie machen Sie als Trader besser:

Spread ist nicht kostenlos: Marktorders zahlen den halben Spread plus Slippage. Wer in liquiden Produkten Marktorders feuert, gibt seinen Edge an MMs ab. Limit-Orders sind die Standardwahl, wenn Sie nicht zeitkritisch sind.
Limit-Order-Plazierung ist nicht trivial: zu nah an der Mitte = niedrige Fill-Wahrscheinlichkeit. Zu weit weg = ungefüllter Order. Das Avellaneda-Stoikov-Konzept der inventory-abhängigen Verschiebung kann auch in vereinfachter Form helfen: wenn Sie bereits long sind, plazieren Sie aggressivere Sell-Limits und passivere Buy-Limits.
Order-Flow-Toxizität verstehen: wenn Ihre Limit-Orders immer sofort gefüllt werden, sind Sie wahrscheinlich auf der falschen Seite. Adverse Selection trifft auch nicht-MM-Trader.

MM-light auf Crypto — möglich, aber schwierig.

Auf großen Crypto-Börsen (Binance, OKX, Coinbase) gibt es API-basierte MM-Programme mit Rebates für Maker-Orders. Hier ist die Eintrittsbarriere niedriger als auf traditionellen Börsen — keine Co-Location nötig, REST/WS-APIs öffentlich, Tick-Größen generös. Einige Privatanleger und kleine Firmen verdienen damit Geld.

Was Sie realistisch erwarten können: niedrige einstellige Sharpe-Ratios, hohe Operations-Last (Bugs in Order-Logik kosten viel Geld schnell), starke Konkurrenz durch professionelle Crypto-MMs. Wer das ohne 3–6 Monate dedizierte Entwicklung angeht, verliert Geld. Wer es ernsthaft baut, kann ein zusätzliches Standbein schaffen — aber kein passives Einkommen.

Konkret nutzbare Bausteine:

Avellaneda-Stoikov als Starting-Point für Quote-Logik
Inventar-Targeting mit linearer Skew-Funktion
Kill-Switch bei Spread-Anomalien (z. B. Spread > 5× Median der letzten 5 Min)
Klare Position-Caps und Hard-Stops

Meine ehrliche Empfehlung.

Für die allermeisten Privatanleger ist Market-Making kein sinnvoller Ansatz. Der Aufwand übersteigt den realistischen Ertrag, und die meisten Edges, die in Demos glänzen, verschwinden in echter Adverse Selection.

Was ich konkret empfehle: MM-Theorie lesen (Stoikov, O'Hara, Lopez de Prado), das Verständnis für Order-Flow und Spread verbessern, dann passive Limit-Order- Plazierung in der eigenen Strategie professionalisieren. Das senkt Transaktionskosten oft um 30–50 Basispunkte pro Trade — und das ist ein Edge, den Sie tatsächlich heben können.

Wenn Sie unbedingt MM machen wollen: Crypto, kleine Position, dokumentierter Lernpfad, kein Live-Geld vor 3 Monaten Simulation. Und keine Illusion, dass ein RL-Modell die Infrastruktur-Lücke schließt.

Sie wollen Order-Execution und Limit-Plazierung in Ihrem Workflow verbessern? Erstgespräch buchen — wir analysieren Ihre tatsächlichen Slippage-Kosten.