苹果 - 国际巨头的端侧 AI布局 深度分析
1.1.1 苹果AI:模型侧:MM1
3月,苹果发布多模态大模型MM1,拥有高达300亿参数。MM1融合密集模型与MoE变体,涵盖300亿、70亿、30亿参数版。MM1预训练指标领先,在多个多模态基准上微调后仍具竞争力。MM1模型凭借多模态预训练,在上下文预测和多图像推理中表现卓越。经指令调优,其少样本学习能力显著提升。在多基准测试中,苹果的MoE模型超越密集模型,预示MoE模型扩展潜力巨大。由于其大规模多模态预训练,MM1可进行上下文预测。这使得MM1能够:
a)计数对象并遵循自定义格式;
b)引用图像的部分并执行OCR;
c)展示关于日常物品的常识和词汇知识;
d)执行基本的数学函数。
MM1模型,遵循指令跨图推理强,VILA示例助其精准答。苹果AI,OpenELM技术,引领智能新潮流。
4月26日,苹果发布开源AI大模型OpenELM,涵盖2.7亿至30亿参数,专为轻量级设备设计,降低运行成本。同时,开源模型权重、推理代码等,助力文本生成。OpenELM采用“分层缩放”策略优化Transformer模型,10亿参数规模下,相较OLMo,准确率提升2.36%,预训练token减少50%。OpenELM BFloat16基准测试,在配备英特尔i9-13900KF CPU、RTX 4090 GPU、24GB DDR5内存的工作站及M2 Max MacBook Pro(64GB内存)上运行。1.2.1 苹果AI:硬件侧:手机AP后劲不容小觑
苹果于2017年率先在SoC中引入NPU计算单元,应用于iPhone 8系列及iPhone X。尽管苹果A17芯片的AI算力为35TOPS,略逊于高通骁龙8Gen2(后者支持10+亿参数的AI模型),但AI性能取决于CPU、GPU、NPU的综合实力,软件适配优化同样关键。苹果M系列芯片采用统一内存架构设计,允许CPU、GPU及其他协处理器共享和访问相同的内存池,使得并行计算更快速高效。M4芯片支持120GB/s的系统内存带宽,M3芯片最高支持128GB内存,M2 Ultra配置高达192GB的统一内存和800GB/s的系统内存带宽,相当于支持了近似容量的显存,甚至可能容纳下LLaMA-65B模型(650 亿参数,显存需求是130GB左右)。在苹果统一内存架构下,CPU、GPU和内存直接通过硅中介层连在一起,数据传输带宽极高。M3/M4系列芯片采用ARM架构设计,台积电3nm工艺制造,在能效比方面优势显著。苹果统一内存架构+ARM架构的能效比优势在端侧AI时代极具想象空间。在《LLM in a flash》论文中,苹果揭示了在内存受限设备上高效运行大型语言模型(LLM)的关键技术,实现内存优化下的高效推理。苹果将模型参数存储在Flash中,按需将其带入DRAM,从而高效地运行超出可用DRAM容量的LLMs。为此,苹果构建了一个推理成本模型,其通过引入两种主要技术,即“窗口化”(通过重用之前激活的神经元战略性地减少数据传输)、以及“行列打包”(针对闪存的顺序数据访问优势,增加了从闪存读取的数据块大小),减少了从闪存传输的数据量、以及以更大更连续的块读取数据。这些方法使得能运行的模型大小达到可用DRAM容量的两倍,与CPU和GPU中的简单加载方法相比,推理速度分别提高了4-5倍和20-25倍。这些方法促成了数据负载的显著减少和内存使用效率的提高,对于端侧部署先进的AI模型尤为关键。闪存容量提升,带宽受限。随机读取吞吐量随块大小及线程数增。苹果优化单token推理,延迟缩减1.3倍。AI时代,苹果重塑Siri,把握流量入口。
纽约时报独家预告:苹果2024年WWDC将大放异彩,全新升级的Siri语音助手将亮相!新Siri将具备更丰富的对话性和多功能性,底层搭载全新生成式AI系统,实现聊天交互,助力处理日常任务,如设置定时器、创建日程和添加购物清单等,成为您的个人智能助手。敬请期待!根据苹果之前在语音领域发表的论文来看新版Siri可能的改进方向,主要有:1)无需唤醒词,就能使用Siri助手,或者更准确地检测唤醒词;
3)生成答案时不再冗长,用户更容易理解等。
结合5月OpenAI和谷歌的发布会来看,在AI语音方面,GPT-4o的拟人化风格,包括能识别人类感情,并根据用户感情做出相应的情绪反应,在语音交互中可随时打断,更贴近真实对话场景等,打破传统的类机器人体验;谷歌DeepMind展示了基于Gemeini开发的智能体Astra的语音交互能力,包括强化的智能体发音、更广泛的语调、更好地理解上下文,并在对话中快速做出响应等。鉴于苹果与OpenAI和谷歌未来可能的合作,预计这些体验未来或将加入到Siri的功能当中。GPT-4o实现拟人化语音交流,Google Astra手机实时推理1.3.2版亮相;苹果AI赋能原生APP,提升服务价值!
苹果APP独领风骚,AI应用工具助手与办公、娱乐类应用井喷。AI Vision Pro,苹果AI终端的未来杀手锏,将重塑生态格局。
XR设备,个人空间的新延伸,承载海量信息,深度内容数据。AI技术如计算机视觉、自然语言交互等,打造沉浸式体验。GPT等AI助力XR产业,提升企业生产力。AI与XR融合,拓展数字体验至制造业、教育等多元领域,引领未来生态革新。苹果Vision Pro引领空间计算新纪元,创新3D交互体验。AI赋能技术革新,打造更强大的元宇宙架构,提升用户体验。XR与智能眼镜实时推理力升级,苹果凭借1.5万亿全球VR/AR市场、充裕现金流及对AI技术的大规模投入,深度布局AI领域。
苹果持续深耕AI与机器学习,研发投入不断攀升。2023财年研发支出近300亿美元,上半年增长2.9%,达156亿美元。资本支出常年超百亿,AI投入预期将扩大规模。2023财年自由现金流高达995.8亿美元,上半年增长4.2%,为新技术布局提供坚实保障。-对此,您有什么看法见解?-
-欢迎在评论区留言探讨和分享。-