Jel ima netko ideju što sa podzadatkom za outliere? Probao sam svaku značajku provuć kroz Z-score tako da mi prikaže sve one podatke koji imaju Z-score > 3, ali čini mi se da tu postoji par problema:
previše redaka bi bilo izbačeno (1114)
čini mi se da to nije baš ni najbolji pristup jer vjerojatno bi svaka značajka zahtjevala neki osobni pristup, al s druge strane ima ih 230…
Ako netko tko je riješio ima savjete, dobro će doći.