Hirdetés

üzenetek

hozzászólások


Gábor001
(tag)

Részben igaz, tényleg töredéke a training kapacitásigényének a futtatás. A bottleneck LLM-eknél inkább a (V)RAM, ami iPhone-on kicsi, az M2U viszont abban kifejezetten erős. Szerintem ez a fő ok a "kiszervezésre", mivel szerintem is elég erős az NPU az iPhone-okban.

üzenetek