🤡 Ja sam testirao s razno raznim parametrima, i zapisao rezultate. Nasao sam optimalno od tih mojih testiranih (za 2 na 21, dakle 2 milijuna podataka) zadatak mi se izvrsi za 50ak sekundi i pronade 155 613 prostih brojeva. Ako se stavi G=a_np.shape, a L=None onda traje 80ak sekundi. Znaci uspio sam ga malo smanjiti. Moji optimalni parametri su G=(N/local_size)*6, a local_size je local_size = prg.prim.get_work_group_info(cl.kernel_work_group_info.WORK_GROUP_SIZE, device)
MIslim da je poanta samo se poigrat s G i L da vidis kak funkcioniraju, ne trebas sad stvarno nac najoptimalnije i najbrze izvodenje moguce.