Właściwe projektowanie i architektura testowania modeli uczenia maszynowego ma kluczowe znaczenie, szczególnie w zastosowaniach do problemów finansów ilościowych. Najważniejszym elementem tego procesu jest wybór odpowiedniej funkcji straty do trenowania, walidacji, estymacji i dostrajania hiperparametrów. W niniejszych badaniach, poprzez eksperymenty empiryczne na danych giełdowych i kryptowalutowych, zastosowaliśmy funkcję Mean Absolute Directional Loss (MADL), która lepiej sprawdza się w optymalizacji modeli prognozujących dla algorytmicznych strategii inwestycyjnych. Porównaliśmy wyniki funkcji MADL między modelami Transformer i LSTM, wykazując, że w niemal każdym przypadku modele Transformer osiągają znacząco lepsze rezultaty niż LSTM.