Odchylenia, które płacą: dlaczego handel parami wciąż działa
Handel parami (pairs trading) to kwintesencja podejścia market neutral: zarabiasz nie na kierunku rynku, lecz na odchyleniach względnych między dwoma powiązanymi instrumentami. Gdy relacja cen – tzw. spread – odchyla się od długoterminowej równowagi, strategia zajmuje pozycje długą i krótką, licząc na powrót do średniej. W epoce szybkiego przepływu informacji i rosnącej konkurencji takie okazje nie zniknęły – po prostu stały się bardziej wymagające w zakresie modelowania, weryfikacji i egzekucji.
Ten artykuł to praktyczny przewodnik po projektowaniu i wdrażaniu metod określanych często jako statystyczny arbitraż. Wpleciemy w treść słowo kluczowe „strategie statistical arbitrage pairs” oraz drugorzędne frazy (handel parami, mean reversion, kointegracja, market neutral), ale przede wszystkim skupimy się na metodyce: jak zidentyfikować dobrą parę, jak zbudować solidny sygnał, jak testować bez złudzeń, jak skalować portfel par i jak unikać pułapek.
Czym naprawdę jest statystyczny arbitraż w wydaniu par
W skrócie: arbitraż statystyczny opiera się na założeniu, że niektóre relacje między aktywami mają tendencję do powrotu do stanu równowagi. W handlu parami tę równowagę reprezentuje spread zdefiniowany jako liniowa kombinacja cen (np. cena A minus beta razy cena B). Jeśli spread jest stacjonarny, możemy wyznaczać sygnały na podstawie jego odchyleń standardowych, z-score lub modelu procesów średniopowrotnych.
Korelacja kontra kointegracja
Korelacja mówi o krótkoterminowej współzmienności, ale nie gwarantuje stabilnej relacji w czasie. Kointegracja to silniejszy koncept: dwie (lub więcej) niestacjonarne serie mają wspólną kombinację liniową, która jest stacjonarna. Dla handlu parami to złoty standard, bo oznacza, że spread oscyluje wokół długookresowej średniej.
- Engle–Granger (dwustopniowy): regresja A na B, test stacjonarności reszt (ADF/KPSS).
- Johansen (wielowymiarowy): gdy budujesz koszyki lub szukasz więcej niż jednego wektora kointegrującego.
W praktyce korelacja jest dobra na etap filtracji wstępnej, ale do otwierania pozycji szukaj kointegracji lub przynajmniej stabilnego procesu spreadu.
Mean reversion, spread i z-score
Jeśli spread jest stacjonarny, jego odchylenia od średniej mają skłonność do zanikania. Sygnał budujemy zwykle na z-score: różnica między aktualną wartością a średnią, podzielona przez odchylenie standardowe. Wejścia i wyjścia definiują progi (np. ±2 na wejście, ±0 na wyjście). Alternatywą jest model Ornsteina–Uhlenbecka, który pozwala oszacować half-life (czas połowicznego powrotu) i dobrać horyzont utrzymywania pozycji.
Jak wybierać pary: od intuicji do dowodu statystycznego
Odpowiednia selekcja par ma większy wpływ na wyniki niż dowolny „magiczny” wskaźnik. Oto sprawdzony pipeline.
Filtr wstępny: fundamenty i płynność
- Wspólny czynnik: ten sam sektor/branża (np. dwa banki, dwa ETF-y sektorowe), podobny model biznesowy.
- Płynność: dzienny obrót, spread bid–ask, głębokość księgi zleceń.
- Stabilność notowań: brak długich przestojów, korporacyjnych reżimów cenowych (split, reverse split – skorygowane w danych).
- Ekspozycja rynkowa: zbliżona beta do indeksu – ułatwia neutralizację ryzyka rynkowego.
Testy stacjonarności i kointegracji
Po filtrze wstępnym przechodzimy do dowodów:
- ADF i KPSS: badaj stacjonarność spreadu/reziduum po regresji OLS.
- Engle–Granger: wyznacz współczynnik hedgingowy (beta), przetestuj stacjonarność reszt.
- Johansen: gdy pracujesz z koszykiem (baskets) lub chcesz wielowymiarowych relacji.
- Breaki strukturalne: testy Chow/CUSUM; reżimy (Markov switching) – rynek się zmienia.
Nie zakładaj, że raz znaleziona kointegracja będzie wieczna. Odświeżaj estymację i weryfikuj reżimy, szczególnie podczas publikacji wyników, zmian polityki dywidend, M&A.
Hedging: OLS, filtr Kalmana i PCA
Współczynnik hedgingowy (beta) determinuje, jak skalujesz pozycje w parze. Klasyczne podejścia:
- Regresja OLS: szybka i interpretowalna. Minus: statyczna beta.
- Filtr Kalmana: dynamiczny współczynnik hedgingowy śledzący zmiany strukturalne.
- PCA: gdy budujesz market neutral na ekspozycję do głównego komponentu (beta do wspólnego czynnika zamiast pojedynczego instrumentu).
Dobrze skalibrowany hedge to mniejszy błąd modelu i stabilniejszy spread – fundament skutecznych strategie statistical arbitrage pairs.
Sygnały i reguły transakcyjne: precyzja zamiast intuicji
Z-score, OU i adaptacyjne progi
Standardem jest z-score liczony na ruchomym oknie. Pamiętaj, że długość okna wpływa na responsywność i ryzyko nadmiernego dopasowania. Wersja zaawansowana:
- Model OU: estymuj siłę mean reversion (kappa), wariancję szumu i half-life. Progi wejścia skaluj do bieżącej zmienności.
- Volatility targeting: skaluj wielkość pozycji, by utrzymywać docelową dzienną zmienność portfela (np. 8–12% rocznie).
- Adaptive thresholds: dynamiczne progi wejścia/wyjścia oparte na percentylach rozkładu spreadu w oknie.
Wejścia, wyjścia i kontrola ryzyka pozycji
- Entry: z-score powyżej +2 (sprzedaj spread: short A, long B) lub poniżej −2 (kup spread: long A, short B).
- Exit: powrót do zera lub do węższego pasma (np. ±0.5), ewentualnie time-stop (np. 10 dni bez konwergencji).
- Stop-loss: twardy (np. z-score ±3.5) lub probabilistyczny (opuść, gdy prawdopodobieństwo powrotu spada poniżej progu).
- Rebalans: odświeżaj hedge ratio, gdy dryfuje (np. co X dni lub po przekroczeniu progu zmiany).
Rygorystyczne zasady egzekucji i konsekwencja to warunek, by odchylenia realnie płaciły w ramach strategie statistical arbitrage pairs.
Neutralność ekspozycji: beta-neutral vs dollar-neutral
- Dollar-neutral: ta sama kwota long i short. Proste, ale nie neutralizuje ryzyka rynkowego.
- Beta-neutral: skalujesz pozycje tak, by suma bet względem rynku była bliska zeru. Lepsze dla market neutral.
- Factor-neutral: neutralizacja na wiele czynników (wartość, momentum, wielkość) – szczególnie w portfelach wielu par.
Backtest bez złudzeń: jak nie oszukać samego siebie
Największym wrogiem skuteczności jest overfitting. Solidny backtest musi uwzględniać realia handlu i nie może patrzeć w przyszłość.
In-sample, out-of-sample i walk-forward
- In-sample: kalibracja parametrów (okno, progi, half-life).
- Out-of-sample: test na niewidzianych danych – dopiero tu liczą się metryki.
- Walk-forward: cykliczny re-fit i test (np. 6 miesięcy kalibracji, 1 miesiąc testu), wielokrotnie powtarzany.
- Cross-validation czasowa: segmentacja szeregów z zachowaniem porządku czasowego.
Uczciwe koszty: poślizg, spread i impact
- Poślizg: modeluj jako funkcję płynności i wolumenu zlecenia.
- Spread bid–ask: uwzględnij pół-spread i narzut za agresywną egzekucję.
- Market impact: rośnie nieliniowo z wielkością zlecenia – istotne przy skalowaniu.
- Opłaty: prowizje, opłaty giełdowe, finansowanie shortów, dywidendy i podatki u źródła.
Bez rzetelnego TCA (Transaction Cost Analysis) nawet najlepsze strategie statistical arbitrage pairs w arkuszu kalkulacyjnym nie przejdą próby rynku.
Metryki, które mają znaczenie
- Sharpe i Sortino: jakość zwrotów skorygowana o ryzyko.
- t-stat alf: statystyczna istotność nadwyżkowych zwrotów.
- Max drawdown i Ulcer Index: głębokość i „ból” obsunięć.
- Stabilność parametryczna: wrażliwość wyników na zmianę progów i okien.
- Asymetria/skewness i kurtoza: ogony rozkładu, ryzyko rzadkich zdarzeń.
Zarządzanie ryzykiem i konstrukcja portfela par
Pojedyncza para bywa kapryśna. Prawdziwa moc arbitrażu statystycznego tkwi w portfelu niezależnych względnie strategii/relacji.
Alokacja kapitału i budżet ryzyka
- Równa zmienność: każda para dostaje ekspozycję tak, by wnosiła podobną zmienność do portfela.
- Kelly frakcjonowany: wykorzystuj szacunek edge i wariancji, ale ostrożnie – w praktyce ułamkowy Kelly.
- Risk parity: równoważenie wkładu w ryzyko między parami/faktorami.
Kontrola zmienności i ryzyka ogonów
- Target volatility: dzienna/tygodniowa regulacja dźwigni.
- VaR/ES: szacunek ryzyka krańcowego na poziomie pary i całego portfela.
- Stress-testy: symuluj scenariusze skrajne (flash crash, zamrożenie płynności, reżim wysokiej korelacji).
- Regime detection: wskaźniki reżimu (np. VIX, spread kredytowy) do adaptacji progów i dźwigni.
Dywersyfikacja i zależności krzyżowe
Łącz pary z różnych sektorów i klas aktywów, ale monitoruj korelacje krzyżowe. Zbyt podobne pary kumulują ryzyko. Używaj heatmap korelacji PnL, analizy klastrów i limitów ekspozycji sektorowej.
Od prototypu do produkcji: dane, egzekucja, monitoring
Dane i higiena badawcza
- Survivorship bias: korzystaj z historycznych składów indeksów i danych delistingu.
- Look-ahead bias: testuj z opóźnieniami publikacji danych i realnymi oknami dostępności.
- Corporate actions: weryfikuj poprawność korekt (dywidendy, splity, prawa poboru).
- Jakość ticków: czyszczenie outlierów, synchronizacja timestampów między instrumentami.
Egzekucja i mikrostruktura
- Smart routing: rozbijanie zleceń, wybór miejsc notowań o najlepszej płynności.
- Passive vs aggressive: balans między kosztem poślizgu a ryzykiem braku realizacji.
- Internalizacja/krzyżowanie: jeśli dostępne – niższy impact.
- Latency: dla strategii krótkiego horyzontu decyduje o przewadze.
Monitoring i utrzymanie
- Drift modelu: alarmy, gdy rozkład spreadu lub parametry OU odbiegają od historii.
- Health-check egzekucji: real-time TCA, odchylenie ceny realizacji od mid.
- Rekalibracja: cykliczny re-fit par, wymiana słabnących relacji, kontrola reżimów.
Nowoczesne rozszerzenia: poza klasyczną parą
Uczenie maszynowe
- Selekcja par: klasyfikatory przewidujące stabilność relacji (np. gradient boosting, random forest) na cechach: kointegracja historyczna, stabilność beta, podobieństwo fundamentalne.
- Predykcja spreadu: modele sekwencyjne (LSTM/Transformer) lub stanowe (Kalman) dla lepszych sygnałów.
- Detekcja reżimów: HMM/Markov switching do adaptacji progów i dźwigni.
Pary międzyrynkowe i alternatywne rynki
- ETF–ETF: SPY vs IVV, QQQ vs QLD (z uwzględnieniem dźwigni i tracking error).
- Futures: kalendarzowe spready, cross-commodity (np. crack spread).
- FX: syntetyczne pary przez krzyżowanie, arbitraż trójkątny.
- Krypto: wysokie koszty i różny microstructure, ale częste nieefektywności między giełdami.
Rynki alternatywne zwiększają przestrzeń okazji, ale wymagają specyficznej kalibracji i infrastruktury.
Koszyki i stat arb wielowymiarowy
Zamiast jednej pary buduj koszyk: instrument docelowy vs portfel hedge’ujący (beta-calibrated). Użyj Johansena lub PCR/PLS, by ekstrapolować wspólny czynnik. To naturalny krok w skalowaniu strategie statistical arbitrage pairs.
Studium przypadku: prosta para ETF i parametry krok po kroku
Przykład edukacyjny na ETF-ach śledzących ten sam indeks: SPY i IVV.
- Filtr: ten sam indeks (S&P 500), wysoka płynność, niski tracking error.
- Hedge ratio: regresja log-cen SPY na IVV (OLS) na 252-dniowym oknie; otrzymujemy beta ≈ 1.00.
- Spread: s(t) = ln(SPY) − 1.00 × ln(IVV).
- Stacjonarność: test ADF rezidualu istotny na 1% – przechodzimy do sygnału.
- Sygnał: z-score na 60-dniowym oknie; wejście przy |z| ≥ 2.2, wyjście przy |z| ≤ 0.3.
- Ryzyko: target vol 10% rocznie, time-stop 7 dni, stop-loss przy |z| ≥ 3.5.
- Koszty: pół-spread + poślizg 0.5–1.5 bp na ETF; prowizja zgodnie z brokerem.
- Backtest: walk-forward (12m fit / 1m test) przez 8 lat.
Wyniki przykładowe (ilustracyjne): Sharpe ~1.1 po kosztach, max drawdown ~4.5%, procent wygranych ~58%, przeciętny czas trzymania pozycji 2–5 dni. Największe obsunięcia w okresach skoków spreadu kredytowego; poprawa po wprowadzeniu detekcji reżimów i zawężeniu godzin handlu do okresów wysokiej płynności.
Wnioski: proste pary na bliskich substytutach bywają „arbitrażem quasi-mechanicznym”, ale przewaga jest niska i wrażliwa na koszty. Dlatego w portfelu warto łączyć je z parami sektorowymi (np. BAC vs JPM) oraz koszykami faktorowymi, zachowując rygor testów kointegracji i kontroli ryzyka.
Najczęstsze błędy i jak ich unikać
- Mylenie korelacji z kointegracją: korelacja bywa złudna; testuj spread, nie same ceny.
- Overfitting progów: progi dobrane „co do pikselka” – rozsypują się out-of-sample.
- Ignorowanie kosztów: brak TCA to prosta droga do strat mimo „zielonego” backtestu.
- Brak kontroli reżimów: parametry stałe w zmiennych warunkach rynkowych to proszenie się o problemy.
- Niedostateczna higiena danych: survivorship bias i look-ahead psują metryki.
- Nadmierna dźwignia: mean reversion bywa kapryśny; dźwignia wzmacnia tail risk.
- Brak dywersyfikacji: poleganie na jednej „złotej” parze to ryzyko specyficzne bez premii.
Checklist: od prototypu do działającej strategii
- Definicja wszechświata: sektor, płynność, fundamenty, dane bez biasów.
- Selekcja par: pre-filtr korelacyjny, testy kointegracji, stabilność hedge ratio.
- Model spreadu: z-score/OU, adaptacyjne progi, half-life, volatility targeting.
- Reguły trade’ów: entry/exit, stop-loss, time-stop, rebalans hedga.
- Backtest: walk-forward, out-of-sample, stresy, koszty i impact.
- Portfel: alokacja ryzyka, neutralność beta/faktorowa, limity ekspozycji.
- Egzekucja: smart routing, optymalizacja zleceń, monitoring TCA.
- Monitoring: drift, alerty, rekalibracja, zarządzanie reżimami.
FAQ: krótkie odpowiedzi na ważne pytania
Czy strategie statistical arbitrage pairs działają na wszystkich rynkach? Działają tam, gdzie relacje są wystarczająco stabilne, koszty akceptowalne, a płynność pozwala na egzekucję. Rynki niszowe dają większy edge, ale też większe koszty i ryzyko strukturalne.
Ile par w portfelu? Zwykle 10–50 niezależnych par daje sensowną dywersyfikację, ale zależy od kapitału i płynności. Lepiej mniej, ale jakościowych.
Jak często rekalibrować? W praktyce co 1–4 tygodnie dla hedge ratio i co 3–6 miesięcy dla całego wszechświata par, plus rekalibracja po detekcji reżimu.
Jak mierzyć stabilność pary? Rolling ADF/KPSS rezidualu, rolling beta (OLS/Kalman), testy breaków, Hurst exponent bliski 0–0.5 dla spreadu.
Podsumowanie: odchylenia płacą, gdy masz proces
Skuteczne strategie statistical arbitrage pairs nie polegają na „sprytnym wykresie”, lecz na procesie: rzetelna selekcja, testy kointegracji, dobrze skalibrowany hedging, dyscyplina sygnałów, uczciwa wycena kosztów i rygor zarządzania ryzykiem. Wtedy odchylenia rzeczywiście płacą – konsekwentnie i przewidywalnie.
Jeśli zaczynasz, zacznij od prostych par w obrębie jednego sektora/ETF, zbuduj solidny pipeline danych i testów, a dopiero później rozszerzaj zasięg o koszyki i międzyrynkowe relacje. Rynki nagradzają nie tyle „geniusz”, ile konsekwencję i kontrolę ryzyka.
Uwaga: materiał ma charakter edukacyjny i nie stanowi rekomendacji inwestycyjnej. Handel z dźwignią i krótką sprzedażą wiąże się z podwyższonym ryzykiem.