kerovac evo ovo je odgovor za to s teams-a:
Trebali biste brojati pojavljivanje vrijednosti ciljne varijable u primjerima iz podskupa podataka za treniranje, ne koliko je listova s nekom vrijednošću ciljne varijable (pretpostavljam da to radite iz screenshota u dokumentu).
Konkretno za prvi primjer (heldout), za slučaj “1:sex=male 2:cabin_letter=B 3:fare=75_to_100” postoje tri primjera u skupu za treniranje, dva su označena s “yes”, jedan s “no”. Nijedan nema age=adult, pa se primjer iz heldout seta klasificira prema najčešćoj vrijednosti u čvoru “3:fare=75_to_100” (u ovoj grani), a to je yes.