轻薄本也能本地部署大模型?AI处理器使其变为可能!

科技每日有梦说 2024-04-01 01:07:41

2023年是大家公认的AI元年,在这一年里,许多的AI应用,大量的AI大模型问世。

“AI人工智能”从一个遥不可及的概念,就这么突然来到了人们身边。

想必大家多多少少,都接触过AI了,就算你没有主动接触,各种在线文档自带的AI写作功能,百度自带的AI搜索功能,各类修图软件的AI修图功能,都能够让你感受到,AI已经融入了互联网中乃至现实生活中。

可如果你仔细分辨,你会发现,你所能接触到的各种AI应用,他们几乎都部署在“云端”。也就是说,这些AI功能其实并不是在你的电脑上运行,而是在软件开发者的服务器上运行的。这会带来许多问题及隐患。

由于在开发者的服务器上运行,软件进行运算时需要的算力也由云服务器贡献,云服务器的算力是昂贵的,这导致这些软件很难免费使用,基本都是包月付费或按次付费的,并且价格昂贵。

此外,云端运行的AI应用,也会有信息泄露的风险,安全性得不到保障。更别说一旦断网,就直接没法用了。

像StableDiffusion、ChatGLM这类可以自己部署部署的AI应用,也不是轻易就能完成部署的,它们都需要很强的算力支持,没一块几千元的独立显卡,很难流畅运行。

AI PC问世

但是在2024年,事情变得有点不一样了!

各类电脑都开始宣传起“AI PC”的概念,就连轻薄笔记本,也说自己可以运行AI应用,这是怎么一回事?

其实“AI PC”之所以能够多了“AI”这一属性,是因为它们的处理器,多了专门用于运行AI应用的模块。

一般的传统处理器,内部包含core核心、缓存和集成显卡核心等单元,除此之外,还会包含专用于某些处理的模块,例如硬件解码模块、数据加密模块。它们再通过内存控制器、PCIe总线等模块,完成与其它硬件的数据传输。

而AI处理器,多了一个很重要的处理单元——NPU

上图是AMD的XDNA架构NPU,与传统处理器核心的对比。能够明显看出,NPU单元与CPU单元的架构,有着明显的不同。

传统处理器核心采用共享连接的方式,数据的传输需要排队进行,这导致即使的多核处理器,对于需要并行高效运行的AI计算,并不是最优解。

此时肯定有人会说:我知道呀,CPU肯定是不适合并行运算的,那还有GPU呀,GPU最适合并行浮点运算啦,AI计算靠NPU不就好啦?

确实,GPU很适合进行AI计算,并且目前的主要AI类计算,也确实都是依靠GPU进行。但文章开头也说了,随便一个AI应用,都需要一个强大的显卡才能运行,想在性能不算高的核显上运行,很难。

但NPU就不一样了,通过不同的架构设计,NPU可以更高效的运行AI应用。下面两张图分别为英伟达RTX4090核心架构图与AMD XDNA核心架构图。

不难看出,RTX4090作为一个旗舰级独立显卡,核心构成复杂且庞大,这为它带来了强劲的性能,同时还有很高的功耗。

核心里最多的框框,是一个叫做“FP32”的框框,这也是显卡里最重要的一个运算单元,FP32运算单元,也称为单精度浮点运算单元。显卡的图形渲染、着色等主要工作,所用到的主要也是FP32运算。

AMD的XDNA架构则不太一样,为了能够集成在处理器中,核心规模肯定是小了很多。

兵器AMD XDNA架构的NPU最适合的几种运算类型,分别为低精度、半精度、单精度整数运算,以及半精度浮点运算。这些运算类型,正是AI应用最常用的。

所以,大家现在能够理解NPU和GPU的区别了吧?

GPU运行AI应用,实际是拿更高的运算精度,来做低精度的事。而NPU来运行AI应用,那便是刚刚好。

因此,NPU才能够用更低的功耗、更小的核心面积,来获得足够的性能。

AMD 锐龙8000系列移动处理器性能详解

AMD在今年年初,发布了锐龙8000系列的移动处理器,被称为AMD的第二代AI PC处理器,对比第一代AI PC处理器锐龙7040系列,其实最大的升级,就是NPU的部分。

锐龙8000系列移动处理器全部采用Zen4架构CPU与4nm制程工艺,配合RDNA3架构的GPU与XDNA架构的NPU。

分为锐龙3、5、7、9四个级别,定位从低到高。

全系搭载Ryzen AI引擎,除最低端两款外,也都搭载了独立NPU。

锐龙 8000系列处理器分为HS与U两种后缀,分别对应标压版本及低压版本。

两者的能效比都很优秀,即使是标压版本,最高TDP也不过是54W,高负载运行也能保持优秀的续航。

最高加速频率,从4.7GHz到5.2GHz不等,低端型号与高端型号的差距并不是很大。核心数量方面,则是从4核8线程到8核16线程。

我比较建议预算充足的朋友,从锐龙7 8840HS这一型号往上选择,在价格并不算高的前提下,能够获得完全满足日常需求的性能了。

锐龙8000系列的NPU单元拥有独立的算力,并且算力水平达到了16TOPS,加上GPU和CPU部分的总算力,可以达到39TOPS的非常高的水平。该数据是FP16(半精度浮点运算)的数值,如果是考虑FP16运算类型,那39TOPS这一水平已经超越了许多独立显卡(因为目前大多数独显更擅长FP32)。

得益于NPU的升级,在AI应用运行、视频编码、文件压缩等需要NPU介入的场景类里,效率有了很大的提升。

其中AI算力的提升最为明显,对比上一代达到了60%。

除了NPU之外,其它方面也保持了领先。

拿主流型号,锐龙7 8845H举例,CPU部分采用了口碑一直很好,拥有很不错的能效比的Zen4架构,4nm的先进制程工艺,最大5.1GHz的加速频率和24MB的高速缓存。性能表现仍然是移动端领先水平,日常使用完全没有压力。

GPU部分的Radeon 780M高能核显,仍然是移动端的最强核显,拥有和AMD独显相同的RDNA3架构,12CU图形核心,显卡频率达到2.7GHz,支持VCN 4.0媒体引擎。

说完AI处理器,就不得不再提一下,AMD配套推出的Ryzen AI引擎。

通过Ryzen AI引擎,开发者能够很好的利用到XDNA架构NPU的性能,也能够快速的通过PyTorch 或 TensorFlow训练机器学习模型,并是用ONNX部署在Ryzen AI处理器上运行。

如果AMD 锐龙8000系列处理器提供了强大的AI算力支持,那Ryzen AI引擎则是提供了AI生态的支持。

总的来说,2024年要选购一台能够运行AI应用的AI笔记本电脑,那首先推荐的就是打在AMD 锐龙8000系列移动处理器的产品。

AMD全系都搭载了Ryzen AI引擎,也覆盖了多个产品线,大家挑选起来也可以放心。

AI笔记本推荐

今年的许多搭载锐龙8000系列处理器的笔记本电脑已经上市,并且很多机型也都是去年销量不错,今年专门升级了处理器的版本,不管是性能还是使用体验方面,都有不错的保障。

下面也为大家推荐几款我比较喜欢的产品,供大家参考。

1、ThinkPad ThinkBook 14+ 2024 锐龙版

ThinkBook系列一直是我很喜欢的一个系列,该系列的笔记本不仅在性能方面表现出色,也有很多专门为办公场景优化的功能。

2024锐龙版有了AI处理器的加持,许多功能的效果更好了。

配置方面,ThinkBook 14+搭载了AMD 锐龙7 8845H标压处理器,拥有8核16线程,以及Radeon 780M集成显卡和Ryzen AI引擎。

不管是生产力还是办公,都可以轻松应对。

在屏幕参数、外观设计、接口配置等方面,也都没有什么短板,给的配置很实在。

在Ryzen AI的加持下,ThinkBook 14+拥有了“联想智会”功能,在会议中支持“虚拟分身”、“人像追踪”、“智能美颜”等功能,这些功能对于日常办公,能够带来切身实际的帮助。

⬇️点击购买⬇️

2、 华硕a豆14 Air

a豆作为一款年轻群体的轻薄商务本,今年主打的就是AI运算能力。配色上a豆的瑰蜜粉金、鼠尾草青都很漂亮,厚度也仅有13.9mm,重量仅有1.29kg,很是轻薄。

处理器选用的也是AMD 锐龙7 8845H,这款处理器注定今年是热门型号了,主流级的笔记本都会搭载。

屏幕方面,采用的是2.8K分辨率、120Hz的OLED屏幕,支持VRR智能可变刷新率、100%P3广色域,表现非常优秀,还支持TUV、SGS双重护眼认证,适合学生党和办公族。

AI应用方面,拥有“豆叮AI助手”功能,随时呼唤,进行聊天陪伴、问题解答等,是你的私人AI助手。

⬇️点击购买⬇️

3、 ROG 幻14 Air

不仅是轻薄本,许多游戏本也用上了AMD 锐龙8000系列的处理器,我比较推荐这款ROG 幻14 Air。

它搭载了旗舰级的锐龙9 8945HS处理器,拥有8核心、16线程,加速频率高达5.2GHz。

独立显卡采用的是英伟达RTX4060,拥有8GB的显存,AI性能和游戏性能更加强劲,最高提供90W的性能释放。

强大的性能并没有让幻14 Air的机身变臃肿,幻14 Air的厚度只有1.59cm,重量也只有1.5kg,轻薄便携,一点都没有高配游戏本的臃肿。

⬇️点击购买⬇️

除了我上面说的几款之外,AMD 锐龙8000系列的处理器其实还有许多选择,都很值得购买。

大家可以去AMD京东小魔方新品日会场选购,有大量新品上市,我前面介绍的几款笔记本电脑,也都有一定的优惠折扣。

活动会场可以领取锐龙8000系列新品以旧换新券,还有晒单返E卡、购机送专属好礼等活动。

部分机型还参与百亿补贴,价格超值!优惠力度一点都不比大促弱,不要错过!

0 阅读:0

科技每日有梦说

简介:感谢大家的关注