[STRUCE1] Gradivo
Bananaking
tomekbeli420 Pokušavam ovaj riješiti, nisam vidio na predavanjima da su riješili baš iteracije k-sredina, ovako sam ga ja shvatio ali očito nisam dobro
EDIT: ups, u centriranju za mi 2 je u nazivniku 2 a ne 3 hahah, sad sve valja, nek ostane post na moju sramotu ali možda nekom pomogne
tomekbeli420
sheriffHorsey e dakle ja sam inicijalno ovako to iskombinirao
dakle hoćemo računati neke uvjetne vjerojatnosti i moramo onda parametre procijeniti
e sad je pitanje kako faktorizaciju napraviti, jer nije moguće kao u onom primjeru u skripti napraviti sve moguće kombinacije vektora \mathbf{x} = (x_1, x_2, x_3, x_4, x_5) jer takvih ima neprebrojivo mnogo zbog x_2 i x_3
E sad sam si razmisljao okej kako napraviti (potpunu) faktorizaciju a da opet mogu prikazati sve to u konačnom broju parametara
Pa mislim si okej ne mogu imati situaciju gdje u uvjetnom dijelu imam neku kontinuiranu varijablu, jer onda opet imam beskonačno kombinacija
Dakle onda moram imati faktor P(x_2, x_3 \mid x_1, x_4, x_5, y) i ovo se da u konačno mnogo parametara prikazati. Za svaku kombinaciju ovih uvjetnih varijabli imat ću jedan 2D Gausijan
Onda konačna faktorizacija bi bila
P(x_1, x_2, x_3, x_4, x_5, y) = P(y) P(x_1, x_4, x_5 \mid y) P(x_2, x_3 \mid x_1, x_4, x_5, y)
Za računati prvi faktor treba 1 parametar
Za drugi treba 22, kao što i kod tvog postupka (3*2*2-1 kombinacija za svaku klasu)
E a za ovaj treći, treba nam dakle 3*2*2*2 = 24 dvodimenzionalnih Gausijana za svaku kombinaciju
Dakle 24 dvodimenzionalnih lokacija + jedna dijeljena kovarijacijska matrica od 3 parametra = 24*2+3 = 51 parametar
1+22+51 = 74
I to je samo za \mathcal{H}_0
Evo ovo je moje mišljenje što bi trebalo biti dobro, ovo njihovo fakat nema smisla…
Dootz
tomekbeli420 Stranica 16
tomekbeli420
Dootz di točno, ja ne vidim da uopće se pojavljuje taj zadatak u tom docu
edit: nvm našao sam sad gledam
ma kakvi nema šanse da je ovo objašnjenje dobro, čini mi se da je i on uključio uvjetne nezavisnosti, da ima vremena popričao bih s njim, uvjeren sam 100% da je sjebao
Cubi
cajaznun Znaci polunaivan bayesov klasifikator je slican kao naivan Bayesov klasifikator. Znaci rastavlja P(x_1, x_2, x_3, y) = P(y) P(x_1 \mid y) P(x_2 \mid y) P(x_3 \mid y) ako su sve varijable uvjetno nezavisne. Ako nisu, onda te zdruzi, npr recimo da su x_2 i x_3 uvjetno zavisne onda bi zajednicka vjerojatnost bila: P(x_1, x_2, x_3, y) = P(y) P(x_1 \mid y) P(x_2, x_3 \mid y)
Problem koji se dogadja je da je tesko odrediti koje su varijable uvjetno zavisne i onda postoje razliciti postupci objasnjeni u skripti da sad ne ulazim u detalje. U zadatku kaze da su varijable uvjetno zavisne ako je I(x_i, x_j) > 0.01 tj. uzajamna informacija veca od 0.01. Sad samo treba izracunati I za svaki par i vidjeti koji su parovi zavisni. Njih cemo zdruziti u faktorizaciji P(x_1, x_2, x_3, y) poslije.
I(X, Y) se računa kao \sum{P(X, Y) ln \frac{P(X, Y)}{P(X)P(Y)}} za svaku vrijednost X i Y.
Primjerice:
I(x_1, x_2) = P(x_1=0, x_2=0) ln \frac{P(x_1=0, x_2=0)}{P(x_1=0)P(x_2=0)} +P(x_1=0, x_2=1) ln \frac{P(x_1=0, x_2=1)}{P(x_1=0)P(x_2=1)} +P(x_1=1, x_2=0) ln \frac{P(x_1=1, x_2=0)}{P(x_1=1)P(x_2=0)}+P(x_1=1, x_2=1) ln \frac{P(x_1=1, x_2=1)}{P(x_1=1)P(x_2=1)}
Ne da mi se sad raspisivat dalje detaljno, al iz tablice se mogu odrediti P(x_1, x_2) za svaki par vrijednosti. Npr za (0, 0) samo zbroji kad su x_1, x_2 = 0 za svaki x_3. Slicno i za P(x_1), samo se zbroje sve vrijednosti za svaki x_2 i x_3
Ako je ovo isti zadatak kao u zadacima za vjezbu, dobije se:
I(x_1, x_2)=0.00513164
I(x_1, x_3)=0.03
I(x_2, x_3)=0.00513
iz cega slijeda da su varijable x_1 i x_3 zavisne i faktorizacija je P(x_1, x_2, x_3, y) = P(y) P(x_2 \mid y) P(x_1, x_3 \mid y)
prx_xD
bodilyfluids
prx_xD jos skrolanja 5 sekundi gore i nasao bi 4. sheriffHorsey
matrica
OVDJE mozete pronaci sve zadatke sa ispita za ZI i neke za ucenje.
Mozda nekome pomogne pri sutrasnjem ponavljanju ili kasnije… 😅
ako nekome treba dio za MI bacite kom
Bananaking
matrica <3
matrica
bodilyfluids
Bananaking
bodilyfluids
Zna netko objasnit ovaj? S prošlogodišnjeg ZI, rješenjima piše da je A točno, ali ako je tema članka već brexit, riječ brexit sama po sebi nebi trebala dodatno utjecati na pojavu riječi UK.
matrica
Dragi prijatelj strojnog učenja obzirom da ocekujes rijec brexit u clancima u brexitu, bas kao i uk - to bi znacilo da te dvije rijeci nisu uvjetno nezavisne u kateogriji clanaka koji pricaju o brexitu, to sto je tema brexit ne utjece. c i d su cini mi se jasni sami po sebi. b nije jer ne ocekujemo da ce se rijec brexit pojavljivati u clancima cija tema nije brexit, a u takvim clancima bi se recimo mogla pojaviti rijec konzum, tj skup tema koje se ne bave brexitom smo dodatno suzili na skup tema koje u sebi imaju i konzum. dakle ako nista, metodom eliminacije dolazis do istog odg
-Ivan-
Dragi prijatelj strojnog učenja Taj zadatak je odbačen prošle godine tj. rekli su da nije imao točno rješenje
bodilyfluids
obzirom da ocekujes rijec brexit u clancima u brexitu, bas kao i uk - to bi znacilo da te dvije rijeci nisu uvjetno nezavisne u kateogriji clanaka koji pricaju o brexitu
sori, nije mi baš jasno i dalje… Ovaj zadatak je riješen na predavanju i ovdje A nije točan odgovor “jer riječ pandemija u temama o covidu ne pridonosi nikakvu informacijsku dobit”.
Kako se ova situacija razlikuje od prethodnog zadatka? Ako je tema o brexitu, pretpostavljam da pojava riječi brexit neće ništa promijeniti u vjerojatnostima?
Sulejman
matrica Zasto je d) jasan po sebi. Da je tema brexita i da se spominje konzum rekao bi da ce se ostatak teksta odnosit na utjecaj brexita na trgovine u hrvatskoj i mozda se uopce ne spomene uk. Sam ja neš krivo skužio ili?
matrica
Dragi prijatelj strojnog učenja okej, kuzim, kontradiktorno je samo po sebi. Jedino bih i dalje ostala pri tom odgovoru zbog drugih ponudenih. Ako ovo dode na ZI, lagani prigovor setacu.
bodilyfluids
Sulejman U zadatku se dosta da filozofirati pa su ga vjerojatno zato maknuli. Pod D) se gleda koja je vjerojatnost da se u clanku koji prica o brexitu spominje rijec “Ujedinjeno Kravljevstvo”. IMO, kad je vec tema brexit to ce imate toliko veliki utjecaj na pojavu rijeci “Ujedinjeno Kraljevstvo” da utjecaj uvjeta “Konzum” postaje zanemariv.
BillIK
Može pomoć s ovim? Ne dobivam ni jedan od ponuđenih rezultata
bodilyfluids
BillIK Mislim da dobiš “točan” odgovor kada pribrojiš onu konstantu s pi. Iz nekog razloga su je uvrstili.