(Nad)mierne dopasowanie danych w tradingu
Choć tytuł może nie co przerażać, to nadmierne dopasowanie danych w tradingu występuje niezwykle często. Z czym się to wiąże oraz jak się tego wystrzegać? Wyjaśnię w tym krótkim artykule.
Każda strategia powinna zostać przetestowana na danych historycznych. Dlaczego na takich? Ponieważ dane odnośnie kształtowania się ceny, dotyczą przeszłości. Te obok teraźniejszej ceny, są jedynymi informacjami znanymi inwestorom na rynkach kapitałowych. Czy testowanie strategii gwarantuje sukces danemu traderowi? Choć mogę tym zniszczyć czyjeś przekonania, to prawda jest taka że nie! Choćbyśmy testowali latami strategie, nie mamy żadnej gwarancji, że na niej cokolwiek zarobimy! Po co zatem to robić?
Dane historyczne, czyli perfekcyjne łapanie dołków i szczytów
Jeśli tak jak ja, jesteś uczestnikiem rynku CFD od wielu lat, to zapewne nie raz widziałeś jak na stronie MQL pojawiają się strategie, które zarabiają po 200% rocznie (a czasem nawet i 1000%). Wówczas patrząc na te niesłychane sukcesy, automatycznie zastanawiamy się „o co chodzi?”. Bo jeśli, ktoś dysponuje tak dobrą strategią tradingową (do tego zautomatyzowaną), to dlaczego jeszcze nie pracuje dla hegemonów świata finansjery? Czemu oferuje to za kilkaset, czy kilka tysięcy dolarów? Dlaczego nie weźmie kredytu pod zastaw swojego domu i wszystkiego nie zainwestuje w swój projekt? Wszystkie te pytania są retoryczne, ponieważ jest na nie jedna dobra odpowiedź: „Bo wie”.
A co wie?
Wie to, że stworzona strategia jest nadmiernie dopasowana (z ang. overfitting) do danych historycznych. Jak to się robi? Jest kilka sposobów na to, ale efekt zawsze ten sam – model, który nie da się wykorzystać w rzeczywistym tradingu. Mamy coś co idealnie sprawdzi się w testerze strategii, natomiast tylko w wybranym okresie. Weźmy np. dane historyczne z ostatniego pół roku na WIG20 i szukajmy okazji do zajęcia pozycji krótkiej, bądź długiej. Innymi słowy, szukamy dołków i szczytów.
Następnie powstaje pytanie, jaki sygnał zwiastował dołek, albo szczyt? Jeszcze tego nie widzisz? Nie ma problemu, wystarczy dodać kilka wskaźników technicznych, które wygenerują odpowiedni sygnał. Następnie dorzucenie kolejnego i kolejnego… by zostały już tylko te sygnały, które faktycznie wskazują na szczyt, bądź dołek. W ten sposób tworzymy strategię, która doskonale odwzorowuje zachowanie historyczne ceny. Czy w przyszłości strategia może generować zysk? No cóż… może ale nie musi i… zazwyczaj tego nie robi.
Dopasowanie danych w tradingu, a szukanie potencjału strategii
Skoro można stworzyć strategię, która będzie dopasowana idealnie do danych historycznych, to jaki w ogóle jest sens w analizowaniu wykresów? Tutaj dochodzimy do kluczowego pytania, które urosło do rangi sporu. Sporu, który od pewnego czasu dzieli polską scenę traderską na dwa obozy – gloryfikujących analizę techniczną oraz tych, którzy ją negują. Gdzie zatem leży prawda? A ta jak zwykle leży, gdzieś pośrodku, przez nikogo nie dostrzegana.
Faktem jest, że patrzenie na wykres historyczny i wskazywanie na cudowne działanie określonej formacji jest śmieszne. Osoby preferujące takie podejście, często mają w zwyczaju odpowiednio filtrować sygnały, po to by wskazać na te idealne 10, czy 15 transakcji, które zawsze się sprawdzają. Podstawowym błędem jest zbyt mała liczba sygnałów. 10, a nawet i 20 transakcji to może i dużo na jedną sesję, ale zdecydowanie za mało na ocenę strategii. Im więcej sygnałów, tym lepiej. Oczywiście tutaj też potrzebny jest rozsądek. Nie chcemy dojść do sytuacji, w której nasza strategia na np. amerykański indeks Dow Jones jest oparta na sygnałach generowanych z przełomu XIX i XX wieku. Ilość danych jest ważna, ale pamiętaj, że równie ważna jest ich świeżość!
Grupa treningowa i testowa
Kolejna kwestia to podział danych na dwie grupy: treningową i testową. Problem z traderami jest często taki, że ten sam okres wędruje do kategorii „badania” i „test”. Oznacza to, że testują strategię w okresie, w którym zaobserwowali dany pattern. Taka sytuacja, zawsze kończy się nadmiernym dopasowaniem danych. Jeśli dostrzegłeś pewną prawidłowość w zachowaniu rynku (np. formację analizy technicznej) to machnięcie ręką w geście „to tylko dane historyczne”, również nie jest mądre. Powinieneś to sprawdzić ale nie w tym samym okresie.
Dajmy na to, że widzisz powtarzający się schemat rynkowy, który można wykorzystać, jako sygnał do zajęcia longa, albo shorta, i występuje on np. przez 2 lata. Wówczas powinieneś przetestować strategie w okresie roku, po zakończonym okresie. Jeśli strategia będzie generowała zysk i zachowywała się podobnie co w okresie „badania”, to można powiedzieć, że mamy sprawdzoną strategię, która przeszła prawidłowo test. Dzięki podzieleniu okresu na dwa etapy, eliminujemy nadmierne dopasowanie danych w tradingu.