Pitanja:
Gradijent od wx+b po x-u je: 1, b, w, wT
Izračunati ukupan broj parametara za arh [2,3,4]
Koja metoda optimizacije je najbolja za učenje: biblioteka sa matričnim {množenjem, zbrajanjem}, kod (Python), C petlja
Softmax izlaz je [0.2, 0.3, 0.4, 0.1]. Ispravna klasa je 3 (ova za koju smo predictali 0.4). Koliki je loss?