DeepSeek绕过英伟达CUDA:为国产GPU的适配与发展带来了新的曙光

科技清扬不搭界 2025-02-05 20:52:56

在人工智能与高性能计算的激烈竞争的当下,一则重磅消息引发广泛关注:DeepSeek绕过了英伟达的CUDA框架,为国产GPU的适配与发展带来了新的曙光。

长期以来,英伟达凭借CUDA构建的软硬件生态壁垒,在GPU及AI计算领域占据主导地位。CUDA自2006年推出,是包含编译器、函数库、开发工具链的完整生态系统,全球90%以上的深度学习框架默认支持它,使得开发者对英伟达硬件平台形成路径依赖。这让非CUDA生态的GPU,尤其是国产GPU面临“有卡无生态”的困境。

而DeepSeek在使用英伟达H800芯片训练时,采用英伟达底层硬件指令PTX语言,绕过了CUDA。PTX语言能让开发者直接接触硬件底层,实现更细粒度的操作和优化。

DeepSeek此举具意义重大。从技术层面看,打破了CUDA的性能限制,可实现更高效的模型训练。从产业层面讲,为国产GPU的发展提供了强大的软件支持。它已全面适配华为昇腾系列AI处理器,还完成了与天数智芯、摩尔线程等国产GPU的适配工作。

DeepSeek在推动国产GPU适配的道路上也面临诸多挑战,如CUDA成熟的开发者生态与丰富工具链难以复制,重建生态、吸引开发者任重道远。​

0 阅读:0

科技清扬不搭界

简介:感谢大家的关注