Matt zašto je bolje da model “pamti” slike umjesto da generalizira?
Zato što je takav zadatak, imaš premalo slika da bi generalizirao na samim slikama, nego više pokušavaš upamtiti što više djelića s kojima bi mogao rekonstruirati lokaciju, ali ne i samo značajke (jer kao što sam rekao ako analiziraš training set vidjet ćeš da su značajke generalno loše).
Ako pogledaš dataset vidjet ćeš da ima užasno puno slika po cesti po dalmaciji, neke udaljene stotinu kilometara, a značajke gotovo iste. Asfalt okružen šikarom. Ako pokušaš generalizirati na ovome dobit ćeš jako “strme” granice, tj. model ti treba biti jako osjetljiv na varijacije da bi mogao za gotovo iste značajke izbaciti dosta udaljene koordinate. Zato je bolje dati mu da se donekle overfitta na input, a generalizaciju pokušati riješiti umjetno povećanim brojem uzoraka, znači augmentacijama.
Matt Jel bi tu metodu “pamćenja” koristio da moraš rješavati ovaj problem za slike cijelog svijeta?
Ovisi o modelu i broju slika. Svakako je najčišće rješenje ako imaš sve slike samo ih zapamtiti jer suštinski nemaš garanciju da postoji naučiva funkcija za konačan broj parametara. Ako imaš premalo slika opet ti je bolje dati modelu da se malo overfitta na puno augmentacija. I onda će ti on generalizirati u smislu da si mu dao puno primjera, ne da si ograničio broj značajki koje gleda kao što rade konvolucijske mreže. Iako iskreno možda bi za cijeli svijet i bile bolje konvolucije ako gledamo da nemaš beskonačno veliki model, jer će tad veći problem biti redukcija dimenzionalnosti…
tl;dr treba pogledati training set pa na osnovu toga zaključiti