Dootz Radiš split pa feature selection.
Nemoj uopće razmišljati na način da test set postoji. Znači iz perspektive modela, on ni ne bi trebao znati za test set, pa nema smisla da odabir značajki, što je dio modela, daje modelu infomacije o stvarima oko kojih on ne bi trebao znati išta.
I ovo se odnosi na sve tipove radova, ne samo na ovaj. Iako, naravno, ima diskusije i da se radi obrnuto, ali svaki takav argument je pobijen kao bullshit ili zabluda… Kao npr. onaj Kaggler koji je navodno imao super performanse modela, jer je radio selekciju značajki na testu, a onda su mu dali prave neviđene podatke pa mu je model bio lošiji, normalno.