作者 | 云鹏
编辑 | 漠影
DeepSeek的出现可以说引爆了整个科技产业,在科技赛道的各个领域掀起波澜。
成本更低、性能更高、规模更小,“不可能三角”被彻底打破。这样的表现可以说颠覆了AI大模型行业的传统认知。随之而来的,是各行各业迅速接入DeepSeek,由DeepSeek蒸馏而来的各类小模型也开始在端侧设备中广泛落地。
Meta首席AI科学家杨立昆就提到过,蒸馏技术可以让模型快速应用到产品中,这也是开源的优势所在,每个人都能从技术进步中获益。
模型训练成本不断下降、边缘AI推理变得越来越普遍,单纯以比拼模型规模为核心的竞争已经成为过去式,根据权威市研机构Epoch AI数据,2024年AI大模型中75%以上规模都在千亿参数以下。
▲每年发布的大规模AI模型数量(按参数量分类),来源:Epoch AI,2025年1月
如今行业聚焦的是如何在边缘和端侧高效地落地AI、如何在实际的生产中去部署AI,进而带来实质性的效益提升。高质量的小规模模型愈发受到热捧。
与此同时,端侧AI的加速发展,也带动着相关芯片的规模化扩展,芯片需求显著增长。端侧AI低时延、高实时性、高隐私性、高安全性,可以更好地实现本地个性化AI体验的诸多优势特性都愈发凸显。
在这样的产业背景下,移动芯片巨头高通公司俨然已成为加速端侧AI发展的核心推手,从硬件、软件到生态,高通技术生态版图正加速扩展。
高通是行业内最早一批聚焦端侧AI、强调端侧AI重要性的厂商,其很早就提出了混合AI架构。近期,作为端侧AI核心玩家的高通发布了最新AI白皮书,深入分析了AI大模型的激增和演进如何给AI格局带来改变并释放新的价值。
与此同时,高通在今年的MWC上亮出一系列端侧AI相关产品,与荣耀、小米、OPPO等国内头部手机厂商合作展示了不少亮眼的端侧AI技术和AI智能体新应用。
▲高通MWC展台
可以说,随着高通AI产品技术生态在手机、PC、汽车、工业IoT、网络等终端和边缘加速赋能、广泛落地,高通已成为后DeepSeek时代AI产业的核心变量。
一、“小模型”爆发大能量,智能硬件端侧AI或迎井喷今天,在AI技术快速迭代发展之下,AI产业格局正迎来转变。AI模型的训练方式正在发生颠覆性变革,大规模推理浪潮来势汹汹,新的边缘侧推理计算创新和升级周期已经到来。
基于蒸馏和一系列优化技术而生的更小型、更高效的模型正在快速落地行业,并加速在终端侧的规模化集成。
从手机、PC、智能穿戴、智能家居到汽车,端侧和边缘运行的AI模型在质量、性能和效率方面都有显著提升。
终端侧可以运行越来越多高质量的AI模型、高质量小语言模型和多模态推理模型数量激增,随之而来的是越来越多AI应用和用例的涌现。
与此同时,AI也在重新定义终端的用户界面,AI正在成为终端侧新的UI。诸多手机、PC巨头都已经发布AI OS相关技术,AI深度融入的操作系统成为终端行业的关键技术发展方向之一。
而实现这一切,加速端侧AI落地,离不开底层一系列模型优化相关技术的支撑。
比如蒸馏(Distillation)技术能让大模型“教学”小模型,在保持准确性的同时迁移知识,这也催生了诸多面向垂直行业特定领域调优的专用小模型。
基于这样的技术,DeepSeek作为教师模型,已经帮助不少“学生”模型在性能表现上得到显著提升。
此外,量化、压缩和剪枝等模型优化技术,同样有助于缩小模型规模,尤其是有助于降低运行模型的功耗,算力、功耗的节省对于端侧AI的发展可以说是关键因素之一。
得益于这些技术,小模型的实际表现已经逐渐接近前沿大模型。
比如使用DeepSeek蒸馏后的Qwen-7B模型,已经能够在性能上与去年推出的GPT-4o云端模型持平,而蒸馏后的Llama 700亿模型在推理、编程、数学、数据分析等多方面的表现都已经超越了原始模型。
▲Meta Llama 700亿参数模型和DeepSeek对应蒸馏模型的LiveBench AI基准测试平均结果对比
在一系列技术的加持下,大型基础模型缩减为更小、更高效的版本,具备更快的推理速度、更少的内存占用和更低的功耗,这无疑显著加速了AI模型在智能手机、PC和汽车等智能终端上的部署落地,大幅降低了设备的算力门槛。
二、提前押宝端侧AI领跑行业,从硬件、软件到生态全链路布局在这样的行业趋势下,高通已经走到了端侧AI落地核心推手的位置。从ChatGPT火爆之初,高通就已经开始重点聚焦端侧AI,并在诸多产品和技术发布中强调端侧AI的优势。
近年,高通连续发布AI技术白皮书,其提出的混合AI架构点明了端云结合将是未来行业发展到主流趋势,而端侧AI是高通作为全球移动芯片技术生态巨头所核心专注的领域。
如今DeepSeek的火爆,恰恰验证了高通对AI发展的趋势判断,端侧AI的未来已经十分明确。
从NPU的持续迭代、硬件和算法层面的创新到对大模型的深度优化适配,高通在端侧AI领域有着长期深耕,其产品、技术和解决方案布局涵盖了数十亿台智 能手机、汽车、XR头显和眼镜、PC以及工业物联网终端,这是高通的核心优势所在。
底层芯片方面,高通在CPU、NPU、GPU和低功耗子系统领域已经陆续发布了诸多产品,尤其在系统级芯片(SoC)产品领域有着扎实的基础。
芯片的高性能、高能效、低功耗特性可以说是端侧设备能够高效处理复杂AI任务,同时兼顾续航、能效的根本保障。
打好硬件基础后,高通进一步构建了AI软件栈来赋能开发者,让各类智能终端更高效地得到硬件加速,进而提升端侧AI体验。
简单来说,高通AI软件栈包括库、SDK和优化工具,可简化模型部署并提升性能、缩短AI应用开发的时间。
此外,高通还在与全球AI模型厂商积极合作、提供高通AI Hub等服务,推动终端侧AI应用的开发和规模化扩展。在高通AI Hub上,开发者只需要简单的三步就可以基于大模型开发AI应用并最终完成商业化部署。
最近,高通正式宣布IBM watsonx.governance和Granite LLM大语言模型可以在搭载骁龙8至尊版的终端以及搭载高通跃龙AI的本地设备上运行。同时高通Cloud AI系列推理加速器已通过OpenShift认证,支持IBM的软件应用程序套件在高通Cloud AI平台进行部署。
可以说,从硬件、软件到生态,高通端侧AI优势凸显,高通毫无疑问已经成为后DeepSeek AI推理时代的领跑者之一。
三、从手机、PC、汽车到工业IoT,高通端侧AI生态无处不在基于端侧AI领域过硬的产品性能、完善的软件生态,高通正在多个赛道赋能行业,与厂商一起实现用户体验的革新,进而释放新的商业价值。
比如在PC领域,我们能看到基于骁龙X系列平台的笔记本电脑产品支持了诸多Windows 11 AI+ PC新特性,生成式AI推理真正落地在了端侧,实现了本地运行。
剪映、达芬奇、Zoom等各类流行三方应用都可以基于高通骁龙X平台,本地化实现一些特定的AI功能。
在智能手机领域,三星、华硕、小米、OPPO、vivo和荣耀等头部厂商的最新旗舰智能手机均搭载了最新骁龙旗舰移动芯片平台。
就在最近火爆科技圈的世界移动通信大会(MWC)上,高通亮出了一系列端侧AI新进展,这些产品和技术也令人感受到端侧AI加速发展带来的巨大变革潜力。
现场我们能看到多种先进多模态生成式模型和智能体AI在智能手机上原生运行,AI助手能在不同沟通模式间切换,并生成多模态输出。
▲AI助手多模态交互
与此同时,AI与系统的深度融合,也让手机在通信、图像编辑、个性化和无障碍方面有了进一步提升。比如高通最新发布的X85 5G调制解调器及射频就内置搭载了第四代专用AI处理器,AI在信号增强方面作用显著。
随着AI与系统的融合加深,AI已逐渐成为智能设备新的UI,通过自然语言和基于图像、视频与手势的交互,极大简化了我们与智能设备交互、使用应用、享受服务的方式。
值得一提的是,在当下最为火爆的AI眼镜领域,我们看到搭载高通芯片的智能手机可以与TCL雷鸟的智能眼镜连接,AI眼镜会根据眼前的健身器械来给用户推荐具体的健身方式,AI提供的建议和回复都是个性化的。
▲AI健身建议
此外,在汽车领域,高通骁龙数字底盘已经使用端侧AI来增强汽车安全和驾驶体验,而对于工业物联网和企业应用,高通推出了AI本地设备解决案和AI推理套件,增强隐私性、可控性,提高能效并降低时延。
可以看到,从手机、PC、汽车到工业物联网及网络,终端和边缘侧AI推理正在快速落地、智能体等AI应用快速普应用,AI正加速融入我们生活的方方面面。在后DeepSeek时代,高通端侧AI技术和产品对智能终端行业赋能起着关键作用。
结语:端侧AI激变,高通已跑在前面在端侧AI高速发展的今天,高通的高能效芯片、AI软件栈和各类开发层面的技术支持,都让高通成为端侧AI变革中的领跑者,有其独有优势。从手机、PC、汽车到工业IoT,从CPU、GPU到NPU,从硬件软件到生态,高通正用AI全家桶帮行业武装到牙齿。
展望未来,AI在边缘侧和端侧的爆发仍将继续,各领域与AI的融合必将进一步加深,各类智能终端对芯片层的需求仍将继续提高,高通端侧AI无疑将成为智能终端行业变革的关键技术底座。