21 世纪的第一个十年,移动电话的普及,改变了人类的通讯效率,信息的即时传达让人们随时随地能与全世界保持联系;
21 世纪的第二个十年,智能手机的面世,颠覆了人类的生活方式,它不仅是一部电话,还是一部相机,一部电脑,一部集工作、社交、娱乐于一体的个人终端;
21 世纪的第三个十年,手机的发展进入了一个新的阶段,它仍是一个多功能的 All in One设备,但又不止步于此,它正在变得更加全面,更加智能,成为一个真正意义上的个人智能助理。它会成为人工智能的一个重要载体,也会是人类智慧的一个延伸。
正如主题所说,手机已经整合了相机,游戏机和一部分电脑功能,这些整合进来的功能也成为了当下智能手机的核心体验——性能、影像。
下一个最有可能整合进来的新功能,已经摆在明面上了——大模型。
无论是上游的芯片厂商(高通、联发科)还是 Android 系统的 Google,乃至大部分的手机厂商,这一段时间以来或多或少都在提到大模型。
未来主流的 SoC 都会在 AI 性能上进行针对性加强,高通、联发科的芯片已经连续多年积极推进 AI 算力增强,也推出了本地部署大模型的解决方案,前不久苹果刚发布的 A17 Pro 也加入了巨量的晶体管分配给 NPU,每秒可执行最高达 35 万亿次操作(35 TOPS 算力)。
虽然现阶段能够实现在手机端侧部署的只是特定的大模型,但是随着未来算力的升级,技术的不断成熟,手机端能够部署的模型数量、模态类型甚至部署的形式都会加速发展。
这是一个关于创新与变革的故事,关于如何用 AI 打破常规,开启一个新的发展时代。
为什么手机要整合大模型功能?融入手机系统的大模型可以改变整个智能手机的使用方式,让其他的 App 也能在一定程度上拥有大模型的能力。
这对于智能手机系统的意义,类比人类的进化路线甚至不亚于猿人第一次学会使用工具,虽然距离进化成人类还有一定的距离(距离手机真的成为拥有自主意识的 AI),但是其意义不言自明——所谓的「智能手机」在未来也将拥有真正的「智能」。
这种智能也会带来用户体验的质变提升,从而直接决定用户黏性和品牌的忠诚度,从而影响到存量用户的换机决策,直接决定了未来的市场占比(所以无论是手机厂商还是上游芯片厂商都有动力发展大模型)
手机大模型是不是伪需求?有一个不可忽略的事实是,目前市面上最火的几个大模型,早就已经推出了手机版的 App,乃至还有基于这些大模型的衍生应用。
这些 App 虽然不是在本地部署的,但远程调用云端的大模型这样又不会对手机性能造成额外的负担,又能拥有理论上更高的算力从而实现更强的 AI 性能。
AppStore 的 ChatGPT App
既然如此,那岂不是没有必要费心费力的投入大量资源资金自研这个能部署在手机上的大模型了?手机上这些大模型的 App,以及各种基于大模型能力衍生的其他应用就能让手机也用上大模型的 AI 能力了?
事情没那么简单,这些大模型高昂的算力成本和流量成本其实还没看到能收回来的可能性,现阶段用户每使用一次都在亏钱,未来的收费上涨甚至偷偷阉割能力,这些都是极有可能发生 or 正在发生的事情。
即便是厂商能够接受前期的烧钱投入,但是随着计算需求的增加,大模型的云端算力必然难以承载如此庞大的计算量,从而导致单次计算的时效和成本都急剧增加。
所以分配一定量的计算需求到终端,依靠终端的算力解决这一问题才是未来的趋势。
云端和终端协同工作,根据不同的场景和计算需求分配 AI 计算的工作负载,以更高效地利用算力资源来为用户提供更好的体验。
就像我们平时玩的 FPS 游戏,往往也是这样本地计算和云端服务器的协同工作才得意确保游戏的公平、流畅。
本地客户端负责处理玩家的输入、渲染游戏世界、以及执行本地游戏逻辑,例如玩家的移动、开火等动作。游戏服务器则负责协调游戏世界中所有玩家的状态和事件,以确保游戏的一致性。
包括我们人类自己,也是中枢神经和外周神经来协同的,一些低级反射并不受大脑控制。
除此之外,单纯部署于云端的大模型本身也有一些问题有待解决。
如果你用过 ChatGPT 或者其他的一些大模型,你会发现它们其实有很多局限,比如「失忆」,还有「幻觉」。
而端侧的部署则是突破大模型的「失忆」和「幻觉」最有效的方式之一,因为历史数据只来源于于用户一个人。
云不了解用户,但终端设备了解。
如果大模型能够在终端设备上训练、调整,那它作为个人的专属 AI 将非常强大,因为它只为用户一个人服务,完全了解用户的喜好、需求。相对来说,即便记忆瓶颈存在,也能降低失忆对任务的影响,产生幻觉的矛盾概率也会更低。
而最了解用户的终端是什么?对于大部分人来说,一定是手机。
根据商业智能数据服务商 QuestMobile 之前发布的《中国移动互联网 2023 年上半年大报告》数据显示,截止到 2023 年 6 月,月人均单日使用时长达到7.2小时,月人均单日使用次数达到116.3次……
无论这些年来占据手机最久使用时长的 App 如何风水轮流转,手机厂商永远稳坐钓鱼台。
所以手机厂商做大模型这件事,天经地义,而且相比其他科技公司在 to C 的应用层上更具优势。
部署大模型会给手机体验带来什么变化?最直观最容易预见到的一个场景就是手机的智能系统会变的更「聪明」。
现阶段的语音助手虽然也能执行一些相对不那么「精确」的「模糊指令」,但是「我好像听不明白」这种无法理解用户需求的回答还是会频频出现。它明明是「人工智能」,但是实际用起来却经常听不懂人话,理解不了一些更复杂的需求。
等到手机接入大模型成熟之后,可能各种手机 AI 助手真的能成为我们的一个私人助理,就像钢铁侠的J.A.R.V.I.S. 一样。
比如我想在开周会前输出一个自己的工作总结以便会上分享,我可以直接让 AI 帮我写一篇出来,可能比自己写的还好,毕竟它的总结归纳能力要比我强的多
或者我身体有不适的时候,也可以跟 AI 描述一下自己的感受,让它做一个预诊,帮忙判断是什么情况,需要去哪个科室问诊,顺便帮我找好医院预约一个挂号。
如果我遇到一些报税、发票上的问题,我也能在满头问号的情况下向 AI 咨询一下我所面临的税务问题,履行纳税的公民义务。
有一个想找的文件想不起来在哪存储也不记得文件名时,向 AI 描述它的特征或者内容中的关键词,都能够快速定位其所在的位置。
也许就连定闹钟也变成了一整套早晨场景的布置,直接叫 Jovi 在工作日的早上 8:00 叫你起床,如果想赖床就再过几分钟叫一次,在用户拿起手机之后开始播报天气并提供穿衣建议……
就连不太会用手机的年长的人们也能在 AI 的教学下一步步无障碍地完成手机的各种操作,诈骗电话也能直接帮用户挂断并拉黑报警。
这些都是很容易想到的一些场景,也是大模型接入后轻松能实现的事情。
手机大模型将带来真正的「科技普惠」我一直在想,从功能机到智能机,手机系统变得越来越智能的意义是什么?
我觉得这所有的意义落到我们普通人身上,其实都可以归结为四个字:
——科技普惠
消费级的科技产品一直以来在做的事情都是让更多人享受到科技带来的乐趣,手机端在部署大模型后,我觉得也正式迎来了科技的「银发时代」,对于年纪稍长、学习能力稍弱的老人们来说,等于直接在手机上有了一个永远拥有耐心的老师,且还是近乎全知全能的那种。
比如一个老人经常误操作导致自己的手机变成了静音模式,然后听不到电话铃声,不知道该如何设置,给子女打电话询问的话可能也说不清楚如何操作。但是有了 AI 助手哪怕不会打字也能完成手机铃声模式的切换,直接语音指令控制手机就能做到。
由此我们也看到了手机部署大模型带来的包容性,在科技日新月异的今天,我们有时会忽略那些未能跟上时代步伐的人,他们可能年长,可能因为某些原因而学习能力稍弱,也可能因为身体的障碍而无法像我们一样轻松地使用科技产品。
然而我想说的是,他们同样有权利接触并享受到科技的便利,消费级的科技产品一直以来在做的事就是让更多人能享受到新技术、新科技为生活带来的便利和乐趣。
得益于此,现阶段视障朋友可以通过 AI 读屏软件在网上冲浪,听障朋友可以通过 AI 生成字幕观看电影,肢体障碍朋友可以通过语音识别与智能设备进行简单交互。
在手机端部署大模型后,这一切可能都会变得更加容易。
我觉得这个就是科技的意义,这些产品为弱势群体带来的科技普惠不仅让每一个人都能享受到科技的乐趣,更让那些在生活困境中挣扎的人们找到了新的出路,消除了他们与科技之间的鸿沟,让他们也能参与到这个科技日新月异的时代中来。
手机大模型就像一把钥匙,为这些弱势群体打开了科技的大门,大模型的存在让手机不再只是一个简单的通讯工具,而变成了一个更为强大的万能工具和智能助理,比如不会打字的老者可以通过语音输入来实现自己需求的表达,而深度学习和自然语言处理技术使得 AI 又能够理解和回应用户的需求,甚至完成其中的大多关键步骤。
大模型与系统的融合可能不是手机厂商这么多年以来最具颠覆性的动作,但它一定会是一个历史趋势,至少未来几年,这就是手机最有可能整合的新功能。