Finanse i ubezpieczenia

Odchylenia, które płacą: strategie handlu parami oparte na statystycznym arbitrażu

Agata Malicka
2026-04-30

Odchylenia, które płacą: dlaczego handel parami wciąż działa

Handel parami (pairs trading) to kwintesencja podejścia market neutral: zarabiasz nie na kierunku rynku, lecz na odchyleniach względnych między dwoma powiązanymi instrumentami. Gdy relacja cen – tzw. spread – odchyla się od długoterminowej równowagi, strategia zajmuje pozycje długą i krótką, licząc na powrót do średniej. W epoce szybkiego przepływu informacji i rosnącej konkurencji takie okazje nie zniknęły – po prostu stały się bardziej wymagające w zakresie modelowania, weryfikacji i egzekucji.

Ten artykuł to praktyczny przewodnik po projektowaniu i wdrażaniu metod określanych często jako statystyczny arbitraż. Wpleciemy w treść słowo kluczowe „strategie statistical arbitrage pairs” oraz drugorzędne frazy (handel parami, mean reversion, kointegracja, market neutral), ale przede wszystkim skupimy się na metodyce: jak zidentyfikować dobrą parę, jak zbudować solidny sygnał, jak testować bez złudzeń, jak skalować portfel par i jak unikać pułapek.

Czym naprawdę jest statystyczny arbitraż w wydaniu par

W skrócie: arbitraż statystyczny opiera się na założeniu, że niektóre relacje między aktywami mają tendencję do powrotu do stanu równowagi. W handlu parami tę równowagę reprezentuje spread zdefiniowany jako liniowa kombinacja cen (np. cena A minus beta razy cena B). Jeśli spread jest stacjonarny, możemy wyznaczać sygnały na podstawie jego odchyleń standardowych, z-score lub modelu procesów średniopowrotnych.

Korelacja kontra kointegracja

Korelacja mówi o krótkoterminowej współzmienności, ale nie gwarantuje stabilnej relacji w czasie. Kointegracja to silniejszy koncept: dwie (lub więcej) niestacjonarne serie mają wspólną kombinację liniową, która jest stacjonarna. Dla handlu parami to złoty standard, bo oznacza, że spread oscyluje wokół długookresowej średniej.

Engle–Granger (dwustopniowy): regresja A na B, test stacjonarności reszt (ADF/KPSS).
Johansen (wielowymiarowy): gdy budujesz koszyki lub szukasz więcej niż jednego wektora kointegrującego.

W praktyce korelacja jest dobra na etap filtracji wstępnej, ale do otwierania pozycji szukaj kointegracji lub przynajmniej stabilnego procesu spreadu.

Mean reversion, spread i z-score

Jeśli spread jest stacjonarny, jego odchylenia od średniej mają skłonność do zanikania. Sygnał budujemy zwykle na z-score: różnica między aktualną wartością a średnią, podzielona przez odchylenie standardowe. Wejścia i wyjścia definiują progi (np. ±2 na wejście, ±0 na wyjście). Alternatywą jest model Ornsteina–Uhlenbecka, który pozwala oszacować half-life (czas połowicznego powrotu) i dobrać horyzont utrzymywania pozycji.

Jak wybierać pary: od intuicji do dowodu statystycznego

Odpowiednia selekcja par ma większy wpływ na wyniki niż dowolny „magiczny” wskaźnik. Oto sprawdzony pipeline.

Filtr wstępny: fundamenty i płynność

Wspólny czynnik: ten sam sektor/branża (np. dwa banki, dwa ETF-y sektorowe), podobny model biznesowy.
Płynność: dzienny obrót, spread bid–ask, głębokość księgi zleceń.
Stabilność notowań: brak długich przestojów, korporacyjnych reżimów cenowych (split, reverse split – skorygowane w danych).
Ekspozycja rynkowa: zbliżona beta do indeksu – ułatwia neutralizację ryzyka rynkowego.

Testy stacjonarności i kointegracji

Po filtrze wstępnym przechodzimy do dowodów:

ADF i KPSS: badaj stacjonarność spreadu/reziduum po regresji OLS.
Engle–Granger: wyznacz współczynnik hedgingowy (beta), przetestuj stacjonarność reszt.
Johansen: gdy pracujesz z koszykiem (baskets) lub chcesz wielowymiarowych relacji.
Breaki strukturalne: testy Chow/CUSUM; reżimy (Markov switching) – rynek się zmienia.

Nie zakładaj, że raz znaleziona kointegracja będzie wieczna. Odświeżaj estymację i weryfikuj reżimy, szczególnie podczas publikacji wyników, zmian polityki dywidend, M&A.

Hedging: OLS, filtr Kalmana i PCA

Współczynnik hedgingowy (beta) determinuje, jak skalujesz pozycje w parze. Klasyczne podejścia:

Regresja OLS: szybka i interpretowalna. Minus: statyczna beta.
Filtr Kalmana: dynamiczny współczynnik hedgingowy śledzący zmiany strukturalne.
PCA: gdy budujesz market neutral na ekspozycję do głównego komponentu (beta do wspólnego czynnika zamiast pojedynczego instrumentu).

Dobrze skalibrowany hedge to mniejszy błąd modelu i stabilniejszy spread – fundament skutecznych strategie statistical arbitrage pairs.

Sygnały i reguły transakcyjne: precyzja zamiast intuicji

Z-score, OU i adaptacyjne progi

Standardem jest z-score liczony na ruchomym oknie. Pamiętaj, że długość okna wpływa na responsywność i ryzyko nadmiernego dopasowania. Wersja zaawansowana:

Model OU: estymuj siłę mean reversion (kappa), wariancję szumu i half-life. Progi wejścia skaluj do bieżącej zmienności.
Volatility targeting: skaluj wielkość pozycji, by utrzymywać docelową dzienną zmienność portfela (np. 8–12% rocznie).
Adaptive thresholds: dynamiczne progi wejścia/wyjścia oparte na percentylach rozkładu spreadu w oknie.

Wejścia, wyjścia i kontrola ryzyka pozycji

Entry: z-score powyżej +2 (sprzedaj spread: short A, long B) lub poniżej −2 (kup spread: long A, short B).
Exit: powrót do zera lub do węższego pasma (np. ±0.5), ewentualnie time-stop (np. 10 dni bez konwergencji).
Stop-loss: twardy (np. z-score ±3.5) lub probabilistyczny (opuść, gdy prawdopodobieństwo powrotu spada poniżej progu).
Rebalans: odświeżaj hedge ratio, gdy dryfuje (np. co X dni lub po przekroczeniu progu zmiany).

Rygorystyczne zasady egzekucji i konsekwencja to warunek, by odchylenia realnie płaciły w ramach strategie statistical arbitrage pairs.

Neutralność ekspozycji: beta-neutral vs dollar-neutral

Dollar-neutral: ta sama kwota long i short. Proste, ale nie neutralizuje ryzyka rynkowego.
Beta-neutral: skalujesz pozycje tak, by suma bet względem rynku była bliska zeru. Lepsze dla market neutral.
Factor-neutral: neutralizacja na wiele czynników (wartość, momentum, wielkość) – szczególnie w portfelach wielu par.

Backtest bez złudzeń: jak nie oszukać samego siebie

Największym wrogiem skuteczności jest overfitting. Solidny backtest musi uwzględniać realia handlu i nie może patrzeć w przyszłość.

In-sample, out-of-sample i walk-forward

In-sample: kalibracja parametrów (okno, progi, half-life).
Out-of-sample: test na niewidzianych danych – dopiero tu liczą się metryki.
Walk-forward: cykliczny re-fit i test (np. 6 miesięcy kalibracji, 1 miesiąc testu), wielokrotnie powtarzany.
Cross-validation czasowa: segmentacja szeregów z zachowaniem porządku czasowego.

Uczciwe koszty: poślizg, spread i impact

Poślizg: modeluj jako funkcję płynności i wolumenu zlecenia.
Spread bid–ask: uwzględnij pół-spread i narzut za agresywną egzekucję.
Market impact: rośnie nieliniowo z wielkością zlecenia – istotne przy skalowaniu.
Opłaty: prowizje, opłaty giełdowe, finansowanie shortów, dywidendy i podatki u źródła.

Bez rzetelnego TCA (Transaction Cost Analysis) nawet najlepsze strategie statistical arbitrage pairs w arkuszu kalkulacyjnym nie przejdą próby rynku.

Metryki, które mają znaczenie

Sharpe i Sortino: jakość zwrotów skorygowana o ryzyko.
t-stat alf: statystyczna istotność nadwyżkowych zwrotów.
Max drawdown i Ulcer Index: głębokość i „ból” obsunięć.
Stabilność parametryczna: wrażliwość wyników na zmianę progów i okien.
Asymetria/skewness i kurtoza: ogony rozkładu, ryzyko rzadkich zdarzeń.

Zarządzanie ryzykiem i konstrukcja portfela par

Pojedyncza para bywa kapryśna. Prawdziwa moc arbitrażu statystycznego tkwi w portfelu niezależnych względnie strategii/relacji.

Alokacja kapitału i budżet ryzyka

Równa zmienność: każda para dostaje ekspozycję tak, by wnosiła podobną zmienność do portfela.
Kelly frakcjonowany: wykorzystuj szacunek edge i wariancji, ale ostrożnie – w praktyce ułamkowy Kelly.
Risk parity: równoważenie wkładu w ryzyko między parami/faktorami.

Kontrola zmienności i ryzyka ogonów

Target volatility: dzienna/tygodniowa regulacja dźwigni.
VaR/ES: szacunek ryzyka krańcowego na poziomie pary i całego portfela.
Stress-testy: symuluj scenariusze skrajne (flash crash, zamrożenie płynności, reżim wysokiej korelacji).
Regime detection: wskaźniki reżimu (np. VIX, spread kredytowy) do adaptacji progów i dźwigni.

Dywersyfikacja i zależności krzyżowe

Łącz pary z różnych sektorów i klas aktywów, ale monitoruj korelacje krzyżowe. Zbyt podobne pary kumulują ryzyko. Używaj heatmap korelacji PnL, analizy klastrów i limitów ekspozycji sektorowej.

Od prototypu do produkcji: dane, egzekucja, monitoring

Dane i higiena badawcza

Survivorship bias: korzystaj z historycznych składów indeksów i danych delistingu.
Look-ahead bias: testuj z opóźnieniami publikacji danych i realnymi oknami dostępności.
Corporate actions: weryfikuj poprawność korekt (dywidendy, splity, prawa poboru).
Jakość ticków: czyszczenie outlierów, synchronizacja timestampów między instrumentami.

Egzekucja i mikrostruktura

Smart routing: rozbijanie zleceń, wybór miejsc notowań o najlepszej płynności.
Passive vs aggressive: balans między kosztem poślizgu a ryzykiem braku realizacji.
Internalizacja/krzyżowanie: jeśli dostępne – niższy impact.
Latency: dla strategii krótkiego horyzontu decyduje o przewadze.

Monitoring i utrzymanie

Drift modelu: alarmy, gdy rozkład spreadu lub parametry OU odbiegają od historii.
Health-check egzekucji: real-time TCA, odchylenie ceny realizacji od mid.
Rekalibracja: cykliczny re-fit par, wymiana słabnących relacji, kontrola reżimów.

Nowoczesne rozszerzenia: poza klasyczną parą

Uczenie maszynowe

Selekcja par: klasyfikatory przewidujące stabilność relacji (np. gradient boosting, random forest) na cechach: kointegracja historyczna, stabilność beta, podobieństwo fundamentalne.
Predykcja spreadu: modele sekwencyjne (LSTM/Transformer) lub stanowe (Kalman) dla lepszych sygnałów.
Detekcja reżimów: HMM/Markov switching do adaptacji progów i dźwigni.

Pary międzyrynkowe i alternatywne rynki

ETF–ETF: SPY vs IVV, QQQ vs QLD (z uwzględnieniem dźwigni i tracking error).
Futures: kalendarzowe spready, cross-commodity (np. crack spread).
FX: syntetyczne pary przez krzyżowanie, arbitraż trójkątny.
Krypto: wysokie koszty i różny microstructure, ale częste nieefektywności między giełdami.

Rynki alternatywne zwiększają przestrzeń okazji, ale wymagają specyficznej kalibracji i infrastruktury.

Koszyki i stat arb wielowymiarowy

Zamiast jednej pary buduj koszyk: instrument docelowy vs portfel hedge’ujący (beta-calibrated). Użyj Johansena lub PCR/PLS, by ekstrapolować wspólny czynnik. To naturalny krok w skalowaniu strategie statistical arbitrage pairs.

Studium przypadku: prosta para ETF i parametry krok po kroku

Przykład edukacyjny na ETF-ach śledzących ten sam indeks: SPY i IVV.

Filtr: ten sam indeks (S&P 500), wysoka płynność, niski tracking error.
Hedge ratio: regresja log-cen SPY na IVV (OLS) na 252-dniowym oknie; otrzymujemy beta ≈ 1.00.
Spread: s(t) = ln(SPY) − 1.00 × ln(IVV).
Stacjonarność: test ADF rezidualu istotny na 1% – przechodzimy do sygnału.
Sygnał: z-score na 60-dniowym oknie; wejście przy |z| ≥ 2.2, wyjście przy |z| ≤ 0.3.
Ryzyko: target vol 10% rocznie, time-stop 7 dni, stop-loss przy |z| ≥ 3.5.
Koszty: pół-spread + poślizg 0.5–1.5 bp na ETF; prowizja zgodnie z brokerem.
Backtest: walk-forward (12m fit / 1m test) przez 8 lat.

Wyniki przykładowe (ilustracyjne): Sharpe ~1.1 po kosztach, max drawdown ~4.5%, procent wygranych ~58%, przeciętny czas trzymania pozycji 2–5 dni. Największe obsunięcia w okresach skoków spreadu kredytowego; poprawa po wprowadzeniu detekcji reżimów i zawężeniu godzin handlu do okresów wysokiej płynności.

Wnioski: proste pary na bliskich substytutach bywają „arbitrażem quasi-mechanicznym”, ale przewaga jest niska i wrażliwa na koszty. Dlatego w portfelu warto łączyć je z parami sektorowymi (np. BAC vs JPM) oraz koszykami faktorowymi, zachowując rygor testów kointegracji i kontroli ryzyka.

Najczęstsze błędy i jak ich unikać

Mylenie korelacji z kointegracją: korelacja bywa złudna; testuj spread, nie same ceny.
Overfitting progów: progi dobrane „co do pikselka” – rozsypują się out-of-sample.
Ignorowanie kosztów: brak TCA to prosta droga do strat mimo „zielonego” backtestu.
Brak kontroli reżimów: parametry stałe w zmiennych warunkach rynkowych to proszenie się o problemy.
Niedostateczna higiena danych: survivorship bias i look-ahead psują metryki.
Nadmierna dźwignia: mean reversion bywa kapryśny; dźwignia wzmacnia tail risk.
Brak dywersyfikacji: poleganie na jednej „złotej” parze to ryzyko specyficzne bez premii.

Checklist: od prototypu do działającej strategii

Definicja wszechświata: sektor, płynność, fundamenty, dane bez biasów.
Selekcja par: pre-filtr korelacyjny, testy kointegracji, stabilność hedge ratio.
Model spreadu: z-score/OU, adaptacyjne progi, half-life, volatility targeting.
Reguły trade’ów: entry/exit, stop-loss, time-stop, rebalans hedga.
Backtest: walk-forward, out-of-sample, stresy, koszty i impact.
Portfel: alokacja ryzyka, neutralność beta/faktorowa, limity ekspozycji.
Egzekucja: smart routing, optymalizacja zleceń, monitoring TCA.
Monitoring: drift, alerty, rekalibracja, zarządzanie reżimami.

FAQ: krótkie odpowiedzi na ważne pytania

Czy strategie statistical arbitrage pairs działają na wszystkich rynkach? Działają tam, gdzie relacje są wystarczająco stabilne, koszty akceptowalne, a płynność pozwala na egzekucję. Rynki niszowe dają większy edge, ale też większe koszty i ryzyko strukturalne.

Ile par w portfelu? Zwykle 10–50 niezależnych par daje sensowną dywersyfikację, ale zależy od kapitału i płynności. Lepiej mniej, ale jakościowych.

Jak często rekalibrować? W praktyce co 1–4 tygodnie dla hedge ratio i co 3–6 miesięcy dla całego wszechświata par, plus rekalibracja po detekcji reżimu.

Jak mierzyć stabilność pary? Rolling ADF/KPSS rezidualu, rolling beta (OLS/Kalman), testy breaków, Hurst exponent bliski 0–0.5 dla spreadu.

Podsumowanie: odchylenia płacą, gdy masz proces

Skuteczne strategie statistical arbitrage pairs nie polegają na „sprytnym wykresie”, lecz na procesie: rzetelna selekcja, testy kointegracji, dobrze skalibrowany hedging, dyscyplina sygnałów, uczciwa wycena kosztów i rygor zarządzania ryzykiem. Wtedy odchylenia rzeczywiście płacą – konsekwentnie i przewidywalnie.

Jeśli zaczynasz, zacznij od prostych par w obrębie jednego sektora/ETF, zbuduj solidny pipeline danych i testów, a dopiero później rozszerzaj zasięg o koszyki i międzyrynkowe relacje. Rynki nagradzają nie tyle „geniusz”, ile konsekwencję i kontrolę ryzyka.

Uwaga: materiał ma charakter edukacyjny i nie stanowi rekomendacji inwestycyjnej. Handel z dźwignią i krótką sprzedażą wiąże się z podwyższonym ryzykiem.

Kategorie