dinoo ZalutaliStudent Reznox Bisolvon znaci 4 sata gledam, ako netko naleti na isti problem:
dev_psi = cl.Buffer(ctx, cl.mem_flags.WRITE_ONLY , psi.nbytes)
stvar je da ovdje se psi stavlja kao write_only
i onda se boundary vrijednosti ne inicijaliziraju prilikom izvršavanja petlje odnosno:
A A A A A A je undefined
A B B B A B zapisemo u loop-u
A B B B A
A B B B A
A A A A A
i onda kada citamo taj buffer nazad u psi sa cl.enqueue_copy(queue, psi, dev_psi).wait()
imamo undefined vrijednosti, ugl ovo treba biti:
dev_psi = cl.Buffer(ctx, cl.mem_flags.READ_WRITE | cl.mem_flags.COPY_HOST_PTR, hostbuf=psi)