近期,中国人工智能企业深度求索(DeepSeek)的大模型凭借其卓越的技术优势和广泛的应用前景,迅速成为行业焦点。随着多家国内外知名云平台和科技企业相继宣布上线DeepSeek大模型,人工智能市场迎来了新的变革浪潮。
据全球半导体观察不完全统计,目前已包括国外巨头英伟达、AMD、微软、亚马逊云科技、英特尔,国内GPU企业沐曦、天数智芯、摩尔线程、海光信息,云计算大厂华为云、腾讯云、天翼云、阿里云、百度智能云、火山引擎,以及无问芯穹、壁仞科技、硅基流动、PPIO派欧云、云轴科技等总计20家企业均已宣布适配及上架DeepSeek模型服务。
![](http://image.uc.cn/s/wemedia/s/upload/2024/1ec16a7a9c7399ecebe10d1023112597.jpg)
国际巨头积极布局,引领全球AI发展
AMD
在国际市场上,AMD最早在1月25日就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平台发文中,AMD董事长兼CEO苏姿丰称赞DeepSeek展现了“AI世界创新的速度和步伐”、“模型和算法创新有利于AI普及”。
微软
微软也不甘落后,1月30日,微软宣布DeepSeek-R1模型已通过AzureAIFoundry和GitHub提供。微软计划将该模型应用于其AI电脑Copilot+PC,并推出了针对NPU优化的版本,进一步拓展了其AI应用生态。
英伟达
1月31日,英伟达接连官宣上线搭载DeepSeek-R1的软件服务。英伟达官网显示,DeepSeek-R1模型现已作为NVIDIANIM微服务预览版提供,为开发者开启了测试和体验该API的通道。
英特尔
同样在1月31日,英特尔也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。
AWS(亚马逊云科技)
AWS(亚马逊云科技)同样积极布局,1月31日,亚马逊云科技宣布用户可以在AmazonBedrock和AmazonSageMakerAI中部署DeepSeek-R1模型。此外,用户还可以通过AmazonEC2和AmazonSageMakerAI,使用AmazonTrainium和AmazonInferentia部署DeepSeek-R1-Distill模型。
国内企业迅猛跟进
华为云
2月1日,华为云发文称,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。该服务借助自研推理加速引擎,不仅能让部署的DeepSeek模型获得与全球高端GPU部署模型相当的效果,还具备稳定的生产级服务能力。
腾讯云
2月2日,腾讯云宣布在高性能应用服务HAI上支持一键部署DeepSeek-R1模型,开发者仅需3分钟即可完成模型的启动和配置,并且能与其他腾讯云服务无缝集成,极大提高了构建基于DeepSeekR1完整AI应用的效率。
天翼云
2月5日,中国电信天翼云宣布成为国内最早支持DeepSeek-R1模型的云服务商之一。天翼云在其智算产品体系中全面接入DeepSeek-R1模型,涉及的产品和服务涵盖息壤-科研助手、天翼AI云电脑、“息壤”智算平台、GPU云主机/裸金属等。
阿里云
2月3日,阿里云宣布其PAIModelGallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型,用户可以在该平台上零代码实现从训练到部署再到推理的全过程。
百度智能云
2月3日,百度智能云千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案以及限时免费服务。
火山引擎
2月4日,火山引擎宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企业用户可在火山引擎机器学习平台veMLP中部署或通过火山方舟平台直接调用。
沐曦
沐曦联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线了1.5B、7B、14B、32B四个较小规模的模型,均部署在国产沐曦曦云GPU上。DeepSeek-R1模型与沐曦曦云GPU及Gitee AI平台的结合,实现了从芯片到平台、从算力到模型的全国产研发和中国制造,官方称之为“100%国产AI的力量”。
天数智芯
天数智芯于2月4日宣布与Gitee AI合作,仅用时一天就完成了与DeepSeek-R1模型的适配工作,并正式上线多个大模型服务,包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。其表示国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本。
摩尔线程
摩尔线程于2月4日宣布已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。其认为DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。
海光信息
海光信息于2月4日宣布其技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。海光DCU是其推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。用户可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,基于DCU平台快速部署和使用。
无问芯穹
无问芯穹早在1月28日就宣布其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。无问芯穹的Infini-AI异构云平台上线了DeepSeek-R1-Distill等产品,为客户提供基于DeepSeek模型的服务。
PPIO派欧云
PPIO派欧云于2月2日正式官宣其云服务平台对DeepSeek模型的支持。PPIO派欧算力云支持了DeepSeek-V3、DeepSeek-R1以及蒸馏模型DeepSeek-R1-Distill-Llama-70B。
360数字安全
2月2日,360数字安全宣布其安全大模型正式接入DeepSeek。通过强化学习等技术手段,360将推出“DeepSeek版”安全大模型,发挥其安全大数据优势。
云轴科技ZStack
2月2日,云轴科技ZStack宣布其AIInfra平台ZStack智塔全面支持企业私有化部署DeepSeekV3/R1/JanusPro三种模型。该平台可基于多种国内外CPU/GPU适配,满足企业不同AI场景的需求。
DeepSeek崛起:AI基建需求增长,产业迈向高成本效益
TrendForce集邦咨询表示,全球AI Server市场自2023年起快速成长,预期2025年占整体Server出货比例将逾15%,至2028年有望接近20%。近年大型CSP业者顺应AI训练需求积极扩建,自2025年起将重心扩展至边缘AI推理,除了采用NVIDIA Blackwell等新一代GPU平台,AWS等也加大开发自家ASIC力道,以提升成本效益、满足特定AI应用需求。中国CSP和DeepSeek等相关AI业者着重开发更高效的AI芯片或算法,以促进AI需求和应用的多元发展。
AI 行业过去依赖扩大模型、增加数据和提升硬件效能来发展,但成本与效率成为挑战。DeepSeek 采用蒸馏模型(Model Distillation)技术,压缩大型模型以提升推理速度并降低硬件需求,同时充分发挥 NVIDIA Hopper 降规版芯片的效益,最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及 API 开源策略,不仅优化技术与商业应用的平衡,也展现 AI 产业向高效发展的趋势。
DeepSeek大模型的成功上线,为企业提供了低成本、高性能的技术解决方案,还推动了人工智能行业的良性竞争与发展。随着更多应用场景的开发和落地,DeepSeek有望在更多领域发挥重要作用,后续发展值得持续关注。