[Re:] A gépi tanulásra optimalizálja új ARMv8-A revízióját az ARM

LordX
(veterán)

Most lehet én (aki szó szerint pont most ir FP16 kódot gépi tanulásra..) vagyok lassú felfogású, de hol vannak az alapvető műveletek? (ADD, MUL..)

(#2) dabadab LordX (#1)

dabadab
(titán)

Blog

Azok már nyilván megvannak, mert összeadni meg szorozni eddig is kellett Most csak kapnak olyan változatot, ami BF16-tal működik, de az nem számít új utasításnak.
Az új műveletekből kettő skaláris szorzatot számol, egy több elem sima szorzatát, az utolsó meg FP32-t konvertál BF16-ra.

(#3) LordX dabadab (#2)

LordX
(veterán)

Blog

Az ARM blogposztja nem ír arról, hogy a jelenlegi utasítások is kapnának BF16 paraméteres verziókat.

(#4) dabadab LordX (#3)

dabadab
(titán)

Blog

Közben én is megtaláltam és abból azért némileg más jött le, mint itt a ph-s cikkből: ahogy elnézem, a BF16-ot tényleg csak ezek az utasítások fogják támogatni, szóval szorzás-osztás 32 biten, aztán mátrixműveletek 16 biten (amiknek az eredménye szintén 32 biten számolódik).

[Re:] A gépi tanulásra optimalizálja új ARMv8-A revízióját az ARM - Processzorok, tuning fórum

üzenetek

hozzászólások

üzenetek