Alternative Loss Function in Evaluation of Transformer Models

Właściwe projektowanie i architektura testowania modeli uczenia maszynowego ma kluczowe znaczenie, szczególnie w zastosowaniach do problemów finansów ilościowych. Najważniejszym elementem tego procesu jest wybór odpowiedniej funkcji straty do trenowania, walidacji, estymacji i dostrajania hiperparametrów. W niniejszych badaniach, poprzez eksperymenty empiryczne na danych giełdowych i kryptowalutowych, zastosowaliśmy funkcję Mean Absolute Directional Loss (MADL), która lepiej sprawdza się w optymalizacji modeli prognozujących dla algorytmicznych strategii inwestycyjnych. Porównaliśmy wyniki funkcji MADL między modelami Transformer i LSTM, wykazując, że w niemal każdym przypadku modele Transformer osiągają znacząco lepsze rezultaty niż LSTM.

Autorzy: Jakub Michańków

Data publikacji: 22 July 2025

Czasopismo: ArXiv (preprint)

DOI: 10.48550/arXiv.2507.16548

Link: Zobacz publikację

Słowa kluczowe: uczenie głębokie, sieci neuronowe, LSTM, algorytmiczne strategie inwestycyjne