Most lehet én (aki szó szerint pont most ir FP16 kódot gépi tanulásra..) vagyok lassú felfogású, de hol vannak az alapvető műveletek? (ADD, MUL..)
hozzászólások
Azok már nyilván megvannak, mert összeadni meg szorozni eddig is kellett Most csak kapnak olyan változatot, ami BF16-tal működik, de az nem számít új utasításnak.
Az új műveletekből kettő skaláris szorzatot számol, egy több elem sima szorzatát, az utolsó meg FP32-t konvertál BF16-ra.
Az ARM blogposztja nem ír arról, hogy a jelenlegi utasítások is kapnának BF16 paraméteres verziókat.
Közben én is megtaláltam és abból azért némileg más jött le, mint itt a ph-s cikkből: ahogy elnézem, a BF16-ot tényleg csak ezek az utasítások fogják támogatni, szóval szorzás-osztás 32 biten, aztán mátrixműveletek 16 biten (amiknek az eredménye szintén 32 biten számolódik).