BigD Niš posebno, obično matrično množenje
Težine su ti oblika (out_channels, in_channels, kernel_size, kernel_size)
Ak misliš kak se dogodi in_channels -> out_channels
transformacija, pa za svaki out_channel
se feature mape in_channel
a sumiraju.
Znači u slučaju gdje ti imaš Conv2D(2 in, 1 out, 3×3), imat ćeš 2 jezgre (tj. imat ćeš 1 grupu koja ima 2 kernela). Svaka ta jezgra ide na zaseban kanal ulaza i daje zasebnu mapu značajki. I onda se te mape značajki sumiraju i dobiješ mapu istih dimenzija samo s 1 kanalom, i to ide na izlaz.
EDIT: Tu ti je to malo slikovitije opisano