李想:理想汽车的VLA模型目前采用INT8与FP8的混合精度推理,英伟达Thor U芯片目前可提供高达700 TOPS的算力;
同时,Thor-U也支持FP4精度推理,未来我们也会将精度逐渐往FP4去优化,从而“压榨”芯片获取更大的算力。