华为芯片推动Deepseek成功?

SevenTech 2025-01-29 22:59:33

人工智能竞赛正在升温,中国的DeepSeek正在掀起波澜。该公司声称,其人工智能模型比美国竞争对手更具成本效益。这一优势使其DeepSeek成为51个国家中最受欢迎的应用程序。这一成功背后的一个关键因素是它使用了华为的Ascend 910C芯片。

DeepSeek的大语言模型(LLM) DeepSeek R1使用英伟达的H100 gpu进行训练。然而,对于推理——生成人工智能响应的过程——它依赖于华为的Ascend 910C芯片。此举降低了成本,同时减少了对美国技术的依赖。

DeepSeek相比Open AI具有强大的成本优势,DeepSeek R1的预训练费用仅为557.6万美元,使用2048块英伟达H800 GPU集群运行55天完成。API调用成本低:每百万输入tokens的费用为0.55美元,而OpenAI-o1模型为15美元。本地部署时,DeepSeek R1还可以在消费硬件上运行精简版本,完全避免云费用。

人工智能研究员@Dorialexander指出,Ascend 910C只用于推理,而不是训练。训练人工智能模型需要强大的计算能力,而英伟达GPU在这方面处理得更好。推理需要更少的功率,使华为的芯片成为一个可行的替代方案。这种方法在保持高性能的同时节省了成本。

尽管910C有很多优点,但它也有局限性。它缺乏训练大规模人工智能模型所需的能力。因此,中国的人工智能公司仍然依赖英伟达进行模型开发。为了克服这一挑战,华为正在开发Ascend 920C芯片。这款新处理器旨在与业界顶级人工智能芯片英伟达(Nvidia)的Blackwell B200竞争。如果成功,它将给中国企业提供一个强大的国产选择。

DeepSeek R1的开源性质和低成本使其在发布后迅速获得了广泛关注。其开源代码和训练方法为开发者提供了极大的灵活性,有助于推动AI技术的普及与创新。

DeepSeek的崛起显示出中国在人工智能领域日益增长的雄心。它的成本效益战略和华为在硬件方面的进步可能会重塑整个行业。中美科技巨头之间的较量将决定人工智能的未来。这种竞争将推动未来几年的创新、可负担性和全球影响力。

喜欢点赞收藏!欢迎关注SevenTech!

0 阅读:6

SevenTech

简介:资深科技自媒体,Seven哥说科技.