破局,全球20家科技大厂官宣接入DeepSeek!

半导体喜迎春 2025-02-07 15:50:33

近期,中国人工智能企业深度求索(DeepSeek)的大模型凭借其卓越的技术优势和广泛的应用前景,迅速成为行业焦点。随着多家国内外知名云平台和科技企业相继宣布上线DeepSeek大模型,人工智能市场迎来了新的变革浪潮。

据全球半导体观察不完全统计,目前已包括国外巨头英伟达、AMD、微软、亚马逊云科技、英特尔,国内GPU企业沐曦、天数智芯、摩尔线程、海光信息,云计算大厂华为云、腾讯云、天翼云、阿里云、百度智能云、火山引擎,以及无问芯穹、壁仞科技、硅基流动、PPIO派欧云、云轴科技等总计20家企业均已宣布适配及上架DeepSeek模型服务。

国际巨头积极布局,引领全球AI发展

AMD

在国际市场上,AMD最早在1月25日就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平台发文中,AMD董事长兼CEO苏姿丰称赞DeepSeek展现了“AI世界创新的速度和步伐”、“模型和算法创新有利于AI普及”。

微软

微软也不甘落后,1月30日,微软宣布DeepSeek-R1模型已通过AzureAIFoundry和GitHub提供。微软计划将该模型应用于其AI电脑Copilot+PC,并推出了针对NPU优化的版本,进一步拓展了其AI应用生态。

英伟达

1月31日,英伟达接连官宣上线搭载DeepSeek-R1的软件服务。英伟达官网显示,DeepSeek-R1模型现已作为NVIDIANIM微服务预览版提供,为开发者开启了测试和体验该API的通道。

英特尔

同样在1月31日,英特尔也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。

AWS(亚马逊云科技)

AWS(亚马逊云科技)同样积极布局,1月31日,亚马逊云科技宣布用户可以在AmazonBedrock和AmazonSageMakerAI中部署DeepSeek-R1模型。此外,用户还可以通过AmazonEC2和AmazonSageMakerAI,使用AmazonTrainium和AmazonInferentia部署DeepSeek-R1-Distill模型。

国内企业迅猛跟进

华为云

2月1日,华为云发文称,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。该服务借助自研推理加速引擎,不仅能让部署的DeepSeek模型获得与全球高端GPU部署模型相当的效果,还具备稳定的生产级服务能力。

腾讯云

2月2日,腾讯云宣布在高性能应用服务HAI上支持一键部署DeepSeek-R1模型,开发者仅需3分钟即可完成模型的启动和配置,并且能与其他腾讯云服务无缝集成,极大提高了构建基于DeepSeekR1完整AI应用的效率。

天翼云

2月5日,中国电信天翼云宣布成为国内最早支持DeepSeek-R1模型的云服务商之一。天翼云在其智算产品体系中全面接入DeepSeek-R1模型,涉及的产品和服务涵盖息壤-科研助手、天翼AI云电脑、“息壤”智算平台、GPU云主机/裸金属等。

阿里云

2月3日,阿里云宣布其PAIModelGallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型,用户可以在该平台上零代码实现从训练到部署再到推理的全过程。

百度智能云

2月3日,百度智能云千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案以及限时免费服务。

火山引擎

2月4日,火山引擎宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企业用户可在火山引擎机器学习平台veMLP中部署或通过火山方舟平台直接调用。

沐曦

沐曦联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线了1.5B、7B、14B、32B四个较小规模的模型,均部署在国产沐曦曦云GPU上。DeepSeek-R1模型与沐曦曦云GPU及Gitee AI平台的结合,实现了从芯片到平台、从算力到模型的全国产研发和中国制造,官方称之为“100%国产AI的力量”。

天数智芯

天数智芯于2月4日宣布与Gitee AI合作,仅用时一天就完成了与DeepSeek-R1模型的适配工作,并正式上线多个大模型服务,包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。其表示国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本。

摩尔线程

摩尔线程于2月4日宣布已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。其认为DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。

海光信息

海光信息于2月4日宣布其技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。海光DCU是其推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。用户可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,基于DCU平台快速部署和使用。

无问芯穹

无问芯穹早在1月28日就宣布其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。无问芯穹的Infini-AI异构云平台上线了DeepSeek-R1-Distill等产品,为客户提供基于DeepSeek模型的服务。

PPIO派欧云

PPIO派欧云于2月2日正式官宣其云服务平台对DeepSeek模型的支持。PPIO派欧算力云支持了DeepSeek-V3、DeepSeek-R1以及蒸馏模型DeepSeek-R1-Distill-Llama-70B。

360数字安全

2月2日,360数字安全宣布其安全大模型正式接入DeepSeek。通过强化学习等技术手段,360将推出“DeepSeek版”安全大模型,发挥其安全大数据优势。

云轴科技ZStack

2月2日,云轴科技ZStack宣布其AIInfra平台ZStack智塔全面支持企业私有化部署DeepSeekV3/R1/JanusPro三种模型。该平台可基于多种国内外CPU/GPU适配,满足企业不同AI场景的需求。

DeepSeek崛起:AI基建需求增长,产业迈向高成本效益

TrendForce集邦咨询表示,全球AI Server市场自2023年起快速成长,预期2025年占整体Server出货比例将逾15%,至2028年有望接近20%。近年大型CSP业者顺应AI训练需求积极扩建,自2025年起将重心扩展至边缘AI推理,除了采用NVIDIA Blackwell等新一代GPU平台,AWS等也加大开发自家ASIC力道,以提升成本效益、满足特定AI应用需求。中国CSP和DeepSeek等相关AI业者着重开发更高效的AI芯片或算法,以促进AI需求和应用的多元发展。

AI 行业过去依赖扩大模型、增加数据和提升硬件效能来发展,但成本与效率成为挑战。DeepSeek 采用蒸馏模型(Model Distillation)技术,压缩大型模型以提升推理速度并降低硬件需求,同时充分发挥 NVIDIA Hopper 降规版芯片的效益,最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及 API 开源策略,不仅优化技术与商业应用的平衡,也展现 AI 产业向高效发展的趋势。

DeepSeek大模型的成功上线,为企业提供了低成本、高性能的技术解决方案,还推动了人工智能行业的良性竞争与发展。随着更多应用场景的开发和落地,DeepSeek有望在更多领域发挥重要作用,后续发展值得持续关注。

0 阅读:14

半导体喜迎春

简介:感谢大家的关注