8 Min. Lesezeit · Infrastruktur · Mai 2026

Latency-Optimierung: was zählt, was nur Marketing ist.

„Wir handeln in Mikrosekunden“ steht auf vielen Anbieter-Webseiten. Für die allermeisten Retail-Algo-Trader ist das irrelevant. Wer 20 Millisekunden vom Datenfeed bis zur Order-Bestätigung erreicht, schlägt die meisten Privatanleger schon — und gibt für jede weitere Mikrosekunde unverhältnismäßig viel aus.

Was Latenz im Trading überhaupt bedeutet.

Drei Begriffe, die regelmäßig vermischt werden:

Tick-to-Trade: Zeit vom Eingang eines Marktdaten-Updates bis zur Order, die das Haus verlässt. Die Kernmetrik für reaktive Strategien.
Time-to-Market: Zeit, bis Ihre Order an der Börse angekommen ist (nicht nur beim Broker liegt). Hier kommt der physische Weg ins Spiel.
End-to-End: Tick beim Datenanbieter → Order an der Börse → Bestätigung zurück. Das ist die Zahl, die wirklich zählt, weil sie zeigt, ob Sie schnell genug auf Ihre eigene Order reagieren können.

Latenz-Anforderungen je Strategie-Typ.

HFT / Market-Making: einstellige bis dreistellige Mikrosekunden. Hier zählt jeder Cache-Miss. Außerhalb institutioneller Setups praktisch nicht erreichbar.
Statistical Arbitrage / Latency Arb: 100 µs – 5 ms. Sub-Millisekunde nur mit Co-Location und FPGA, darüber mit guter Hardware und Bare-Metal noch realistisch.
Intraday Mean-Reversion / Momentum: 10–100 ms. Mit einem guten VPS am richtigen Standort und sauberem Python-Code absolut machbar.
Swing / Daytrading auf 5m–1h Bars: 100 ms – 2 s. Hier ist Latenz kein Engpass — Strategie-Qualität ist es.
Daily oder höher: Sekunden bis Minuten egal. Ein Cron-Job auf einem beliebigen Server reicht.

Die ehrliche Frage zuerst: welche Strategie fahren Sie? Wenn Ihr Edge bei 5-Minuten-Bars liegt, ist jede Stunde, die Sie in Latenz-Tuning stecken, eine Stunde, die Sie nicht in Strategie-Forschung stecken.

Wo die Latenz tatsächlich entsteht.

End-to-End zerlegt:

Datenfeed → Ihre Maschine: 1–50 ms, abhängig von Distanz und Provider.
Deserialisierung / Parsing: 10 µs – 5 ms. JSON ist langsam, FIX / Protobuf / Binary deutlich schneller.
Strategie-Entscheidung: bei Python typisch 0,1–5 ms, abhängig davon, was Sie tun.
Order-Konstruktion und API-Call: 0,5–10 ms.
Netzwerk zu Broker: 1–80 ms.
Broker-interne Verarbeitung: 0,5–50 ms. Diese Zahl ist die Lotterie — Retail-Broker werben mit „< 10 ms“, die Realität ist oft anders.
Broker → Exchange: 0,1–10 ms je nach Co-Location-Setup des Brokers.

Wenn Sie diese Zerlegung ehrlich für Ihren Stack machen, sehen Sie, wo wirklich optimiert werden muss. Meist sind es nicht die Stellen, die man vermutet.

Was Sie selbst kontrollieren können.

VPS-Standort: hosten Sie nahe an Ihrem Broker, nicht nahe an sich selbst. Interactive Brokers Europa? Equinix LD4 / FR2 / AM3. Wer in München sitzt und einen VPS in Frankfurt mietet, gewinnt 10–30 ms gegenüber dem heimischen DSL.
Network-Path: traceroute zum Broker. Wenn Pakete via USA gehen, obwohl Sie in Europa sind, wechseln Sie den Provider.
Code-Optimierung: Python ist okay, aber NumPy > Pandas in Hot-Paths, Numba/Cython für Decision-Loops, Cython oder C++ wenn Sie wirklich unter 1 ms wollen.
API-Wahl: FIX und WebSocket-Streaming sind ein bis zwei Größenordnungen schneller als REST. Wer noch HTTP-Polling für Marktdaten nutzt, verliert mehr Zeit als jede CPU-Optimierung wieder hereinholt.

Der Co-Location-Mythos.

Co-Location heißt: Ihr Server steht im selben Rechenzentrum wie die Matching-Engine der Börse, mit zertifiziertem Kabel-Path. Kosten: 1.000–5.000 € pro Monat, dazu Cross-Connect-Gebühren, dazu Mindestvolumen pro Monat oft sechs- bis siebenstellig.

Für 99,9 % der Retail-Trader: Geldverschwendung. Sie haben keine Strategie, deren Edge in den letzten 500 Mikrosekunden liegt. Und falls doch — die Konkurrenz in dieser Disziplin hat FPGAs, eigene Glasfaser zwischen Exchanges und Teams aus zehn Quant-Devs. Sie werden den Wettlauf nicht gewinnen.

Was Sie stattdessen tun: einen ordentlichen VPS in einem nahen Rechenzentrum mieten. Hetzner Falkenstein, OVH Frankfurt, AWS eu-central-1, je nach Broker-Standort. Kosten: 30–150 €/Monat. Latenz-Gewinn gegenüber Heim-DSL: 20–80 ms. Das ist real.

Latenz tatsächlich messen.

Ohne Messung ist Optimierung Bauchgefühl. Minimaler Ansatz: jeden Verarbeitungsschritt mit hochauflösenden Timestamps versehen und in eine Time-Series-DB loggen:

import time

def handle_tick(tick):
    t0 = time.perf_counter_ns()          # Tick angekommen

    signal = strategy.evaluate(tick)
    t1 = time.perf_counter_ns()          # Signal berechnet

    if signal:
        order = build_order(signal)
        t2 = time.perf_counter_ns()      # Order konstruiert

        broker.send(order)
        t3 = time.perf_counter_ns()      # Order rausgeschickt

        metrics.record({
            "eval_us":  (t1 - t0) / 1_000,
            "build_us": (t2 - t1) / 1_000,
            "send_us":  (t3 - t2) / 1_000,
            "total_us": (t3 - t0) / 1_000,
        })

Nach einer Woche Live-Betrieb haben Sie Verteilungen statt Vermutungen. P50, P95, P99 sind interessanter als der Mittelwert — denn der eine Trade im Monat, der bei P99 = 800 ms hängt, kostet Sie womöglich mehr als die anderen 99 % bringen.

FPGAs, Kernel-Bypass, Custom-Hardware.

Ab dem unteren Mikrosekunden-Bereich beginnt eine andere Welt: Netzwerkkarten mit Kernel-Bypass (Solarflare, Mellanox), FPGAs, die Decoding und Strategie-Logik direkt in Silizium ausführen, custom-getapte Fiber zwischen Exchanges. Das ist die Welt von Jane Street, Citadel, Optiver, IMC. Für institutionelles HFT zwingend. Für alle anderen: irrelevant.

Wenn Sie hier ernsthaft mitspielen wollen, brauchen Sie ein Team aus FPGA-Ingenieuren und Quants, ein Budget im niedrigen siebenstelligen Bereich pro Jahr und eine Strategie, die die Investition trägt. Wer diesen Artikel liest, ist mit hoher Wahrscheinlichkeit nicht in dieser Situation — und das ist völlig in Ordnung.

Realistische Verbesserungen für Retail.

Aus meinen Mandaten heraus, ehrlich:

Wechsel von Heim-DSL auf VPS am Broker-Standort: −30 bis −80 ms.
Wechsel von REST-Polling auf WebSocket-Streaming: −100 bis −500 ms Reaktionszeit.
Wechsel von Pandas-Pipeline auf NumPy / Numba im Hot-Path: −2 bis −20 ms.
Wechsel von JSON auf Binary-Protokoll (FIX, Protobuf): −1 bis −5 ms.

Realistische Untergrenze für Retail mit gutem Setup: 10–50 ms end-to-end. Darunter wird es teuer und der Grenznutzen sinkt steil. Wer das erreicht, ist bei den allermeisten Strategien limitiert von der Strategie-Qualität, nicht von der Latenz.

Sie wollen wissen, wo Ihre tatsächliche End-to-End-Latenz heute liegt — und welche Optimierungen sich für Ihre Strategie wirklich rechnen? Unverbindlich anfragen — wir messen, zerlegen und priorisieren gemeinsam.