玩酷网

Meta发布了适用于移动设备的量化Llama 3.2 1B和3B模型。图2为不同

Meta发布了适用于移动设备的量化Llama 3.2 1B和3B模型。图2为不同的量化方法在一加12手机上的速度/内存占用对比。 ​​​