大量端侧AI功能,AIvivo蓝心智能与原系统OriginOS5发布

爱搞机 2024-10-10 17:45:17

10月10日,2024 vivo开发者大会在深圳国际会展中心举办,大会主题为“同心·同行”。会上,vivo正式发布全新AI战略——“蓝心智能”,同时带来全面升级的自研蓝心大模型矩阵、原系统5(OriginOS 5)、蓝河操作系统2(BlueOS 2)以及vivo在安全、人文、生态合作等方面的最新成果。

vivo高级副总裁、首席技术官施玉坚首先登台,重点回顾了vivo在过去一段时间内取得的成绩。他提到,在过去三年和今年前三季度,vivo始终稳居国产手机销量第一。不久前,vivo还空降凯度BrandZ最具价值中国品牌百强榜单,因在消费电子赛道的稳健表现,vivo同时荣获凯度BrandZ创新明星品牌奖。

vivo高级副总裁、首席技术官施玉坚现场演讲

去年,vivo推出了自己的技术品牌——“蓝科技”。蓝科技是从应用创新扎根到底层技术创新,从硬件驱动到形成软硬件一体化能力,这是vivo基于用户需求,所构建的技术研发体系。其包含了“蓝图影像”、“蓝海续航系统”、“蓝晶芯片技术栈”以及全新升级的“蓝心大模型”和“蓝河操作系统”。

vivo高级副总裁、首席技术官施玉坚现场演讲

施玉坚表示,AI时代已经到来,vivo将始终保持开放的心态,无论是在手机硬件、AI大模型、操作系统,还是在互联网与IoT领域,vivo都将坚持用户导向的科技创新,不断探索科技的边界,与用户和开发者同心同行,共享合作发展成果,共建互信共赢生态,共创科技美好未来。

vivo发布全新AI战略——蓝心智能

在去年开发者大会上,vivo 发布了自研十亿、百亿、千亿三个参数量级,由5款语言大模型组成的蓝心大模型矩阵。并在行业中率先跑通了1B、7B、13B的端侧大模型,同时基于蓝心大模型推出了蓝心小V和蓝心千询APP。去年11月,蓝心大模型在SuperCLUE、CMMLU、C-EVAL等多个大模型榜单上,综合能力排名第一。vivo对于蓝心大模型的定位是,通过丰富中文数据与知识的供给,把蓝心大模型做成最懂中国人的大模型。截至今天,vivo的AI能力已覆盖全球60多个国家和地区,服务超过5亿手机用户,大模型token输出量超过了3万亿个。

而在此次大会上,vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围正式发布了vivo的全新AI战略——蓝心智能。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

蓝心智能是将大模型技术与手机操作系统深度融合的个人智能。周围解释,以蓝心大模型为技术底座,蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务; 同时,蓝心智能将全方位守护用户的隐私安全; 通过系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验。

为了达成这一点,vivo从三个方面用AI重构了系统体验。首先是重构人与设备的交互体验,让交互更自然更符合直觉。在蓝心大模型的加持下,手机将具备更强大的分析能力,无论是按压屏幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。而依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,让蓝心小V在文本能力外,进一步具备强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟人声甚至理解对话中的情绪。

第二个方面是重构人与数字世界的服务体验,让智能更加个人化,也就是构建简单高效的服务获取能力和主动服务能力,从而让手机成为智能温暖的个人助理。vivo依托蓝心大模型对手机的基础功能进行了全面升级。同时,vivo为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。另外,vivo还构建了个人智能系统框架,通过本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

会上,vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围展示了vivo基于蓝心大模型技术做出的一次全新探索,即“PhoneGPT”也就是手机智能体。在演示中,蓝心小V不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。这是手机自动化的一小步,却是解放用户双手的一大步。随着AI发展,未来PhoneGPT一定会带来更多的应用场景,更好的智能体验,让小V成为更懂你的私人助理。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

第三个方面是重构人与物理世界的连接体验,让沟通更顺畅和温暖。去年,vivo读谱功能的发布,让喜爱音乐的视障人士可以利用手机学习乐谱和乐器。而今,vivo利用多模态大模型,让手机成为视障人士的眼睛,帮助他们可以独自安全的走到更远的陌生的地方。vivo希望通过AI技术跨越沟通的鸿沟,帮助障碍人群去追逐梦想,去探索世界的美好。

全新蓝心大模型矩阵正式发布

为进一步夯实AI能力底座,vivo在今年的开发者大会上发布了全新自研蓝心大模型矩阵。全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。这预示蓝心智能,向着个人化和多元化发展迈出重要的一步。

在语言大模型上,千亿级蓝心云端大模型,重点优化了意图理解与分发和任务规划能力。相比去年,整体能力提升30%,在SuperCLUE和C-EVAL榜单上继续领跑国内第一梯队。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

用户的隐私安全始终是vivo打造蓝心智能的首要原则,继去年带来了三款端侧大模型之后,vivo正式发布全新30亿参数量级的蓝心端侧大模型3B。在对话写作、摘要总结、信息抽取等能力上,蓝心3B可以越级比肩行业7B-9B模型。相比蓝心7B,蓝心 3B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA,内存占用仅1.4GB。在SuperCLUE和Equal Eval的小模型综合能力评测中,蓝心3B均排名第一,同时获得了泰尔实验室端侧大模型综合能力认证以及AIIA安全防范能力认证。

除此之外,vivo还同步带来了可以准确理解自然语义,模拟人声的全新自研蓝心语音大模型、强化中国特色与东方美学的融合生成能力的蓝心图像大模型以及升级视觉感知理解能力的蓝心多模态大模型。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

未来,蓝心智能将以蓝心大模型矩阵为技术底座,继续探索AI与OS的深度融合,持续打造开放共赢的智能体生态。

原系统5(OriginOS 5)正式亮相:自然流畅超有AI

操作系统作为用户与手机接触的首要界面,直接决定了用户的使用体验。本次vivo延续“自然舒适、符合直觉”的设计理念,将自身在AI、续航、通信等领域的技术成果,以及对手机基础体验、设计、人文等层面的思考集中落地,推出新一代操作系统——原系统5(OriginOS 5)。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

在原系统5中,作为AI重构系统体验的基础,蓝心小V与Jovi语音正式合并,带来了更加自然的语音交互体验。新增了长按屏幕底部,呼出“小V搜索”等一些列全新的交互方式。基于蓝心多模态大模型技术,vivo全新推出小V圈搜功能,在既有的文本搜索基础上,通过图像识别与圈选交互的结合,精准搜索对象,为用户带来更加便捷的“一圈即搜”。

vivo OS产品总监黄梓勋现场演讲

原系统5还全新升级了“原子岛”功能,除通知功能外,其拥有蓝心小V强大的意图识别能力,不断分析和判断用户当前的需求,主动为用户提供后项服务。并且以更灵活的设计,一按一复制,或者一按一拖拽,满足用户的多任务需求。

vivo OS产品总监黄梓勋现场演讲

除此之外,原系统5升级了以桌面组件的形式为你全天提供智慧服务的“小V建议”、支持同声传译的“小V帮记”、内置“小V写作”能力的“vivo输入法”、支持一键剪辑以及AI定制词曲的“小V时光剪影”。全新推出了能够记住和用户相处点滴的“小V记忆”功能,同时“小V跨端生态”也首次让用户可以在电脑端以及车机端与小V进行直接交互。vivo在原系统5的电话、相册等数十个模块中通过蓝心智能为用户带来了触手可及的智慧体验。

vivo AI系统中心高级总监熊官敬现场演讲

流畅方面,原系统5构建了包括光影、交互、形态切换以及场景过渡在内的全方流畅体验,进行了超过1000项流畅体验优化,旨在将“自然舒适,符合直觉”的使用感受贯穿于系统的每一个场景。

在系统底层层面,原系统5的不公平调度机制再一次迎来了3.0版本的重大升级,首次引入GPU不公平调度机制,通过智能分配GPU资源,显著提升前台应用的流畅度。在内存层面,原系统5创新性地引入了安卓领域内首创的Ledger内存账本机制,实现了系统级的内存资源精准调度,对内存资源进行统一分配和管理,有效减轻了应用的负担,同时,它还能智能构建内存账本,根据实际应用场景动态优化内存分配,确保手机中的每一份内存都能得到高效的利用。显示层面,原系统5的虚拟显卡升级到了性能更加强劲的2.0版本,作为vivo独家首发的显示增强技术,其集成了极速响应动效架构、合成渲染加速器、图形链路协同引擎三大核心技术,全面优化从触控到反馈界面的全链路体验。

原系统5专注于解决用户痛点并持续优化使用体验。在网络通信方面,原系统5在用户场景驱动下实现了全新技术突破和全面体验升级。基于蓝牙,实现了行业首创的公里级无网通信技术,在无网空旷环境下,支持最远超过1.5公里的点对点语音对讲和文字聊天。针对Wi-Fi穿墙的居家场景、网络拥塞的万人演唱会场景以及弱信号的电梯、高铁、地铁等通勤场景,原系统5同样进行了深入的网络性能调优,确保全场景流畅网络体验。在续航方面,原系统5推出全新升级的蓝海续航系统,包括引入全新的场景能效引擎,带来异构计算空间2.0等技术,实现了电量高效精准管理,全天候续航无忧。

vivo OS产品总监吴佰奇现场演讲

除了“理性工程”, 原系统5亦演绎感性美学,在设计上基于原子设计体系进行了两大维度升级,首先引入了空间化感知理念,借助丰富的光影和材质表达、分类卡片式列表等,让界面内容一目了然,并推出还原人日常感受自然方式的全景天气,带来现实与虚拟世界自然融合的奇妙体验。另一维度,原系统5诠释优雅美学,升级个性锁屏、情境壁纸等功能,屏幕熄灭、点亮之间尽显自然舒适,让数字世界更加温暖。

vivo OS艺术创意总监艾敏现场演讲

在过去的一年,通过实施用户顾问计划,每个月组织团队认真倾听用户建议,邀请用户顾问参与到创新的每个环节。无论是体验的反馈,还是对美学的不懈追求,都为系统团队提供了丰富灵感。这也成就了今天原系统5的升级之旅。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

蓝河内核加持,蓝河操作系统2:全栈自研,为AI而生

继去年11月vivo首次发布自研蓝河操作系统(BlueOS)之后,今年的开发者大会上,能力全新升级的蓝河操作系统2同步亮相,其搭载着基于Rust语言编写的实时操作系统内核——蓝河内核,其具备安全、通用、高性能的特性,能够兼容不同的嵌入式平台,具备完整的系统调度、内存管理、文件系统、网络和设备管理能力。而蓝河操作系统2也将成为行业首个全栈由Rust语言编写的操作系统。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

蓝河操作系统2构建了更加智慧的系统架构,首先最底层是由vivo自研的蓝心大模型,和VCAP推理计算加速平台共同构成的底座。蓝河从设计之初就整合了蓝心大模型矩阵,支持不同参数蓝心大模型的灵活端云部署,并且支持视觉、语音等多种AI算法。另外,VCAP保障了各种AI算法在端侧的高效运行。 在这个底座之上,我们带来了全新的服务引擎,它包含数据服务、意图的感知和决策服务等,为意图框架提供了能力支撑。 意图框架能够基于用户的行为和使用习惯,充分感知用户的使用场景,准确理解用户意图,最后自动规划和执行任务。通过这个系统架构,蓝河操作系统 2 从底层构建 AI 能力,进一步实现天生更智慧。

蓝河操作系统2深度融合了蓝心智能强大的AI 能力,其中蓝心大模型为技术底座,蓝心小V为专属助理,智能体平台提供专业服务。在生态方面,蓝河兼容了开放原子开源基金会孵化的hapjs快应用标准,随着快应用升级到2.0,也将为用户带来更加智慧的服务生态。同时,vivo为开发者带来了全新的蓝河UI框架。基于自适应UI布局,只需要一次开发,就能在不同尺寸的屏幕上带来一致的体验。

在AGI时代,除了更加智慧的操作系统,智能硬件也迎来了新一轮的变革。蓝河操作系统2适配不同大小的设备,也能为不同设备赋予强大的AI能力。vivo愿意与行业开放合作,共同探索蓝河操作系统2以及蓝心大模型,搭载在智能眼镜、机器人乃至更多AI设备上的解决方案,共同打造真正面向未来的智能终端。

以用户为中心 实现开放智联

近年来,vivo围绕智慧出行、智能家居、智慧办公、运动健康、影音娱乐等五大生活场景持续深耕,致力于打破不同品牌之间的壁垒,以用户为中心,实现真正的开放智联。对此,vivo一方面做到生态开放,积极打造自有能力,并赋能给外部生态设备。同时牵头创建联盟、广泛兼容行业标准,让用户突破生态壁垒,自由连接心仪的智能设备。 另一方面vivo希望让连接更智能。vivo将强大的AI能力跨端流转到生态设备,让用户能够通过自然语言与设备高效沟通。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

现阶段,vivo智能车载已实现覆盖规模行业领先,连接超过170个汽车品牌,覆盖超过8500款车型。vivo以开放共赢的态度积极推动行业技术发展。 为实现智能车载、数字车钥匙技术升级,vivo牵头发起ICCOA联盟,推出的协议覆盖了市场上超过350W辆汽车。

在家居智能设备互联的场景中,vivo深度参与matter生态建设,适配可连接的品类在联盟中有超过1200多个SKU。同时,vivo还支持CCSA等权威协会,帮助制定了20余项IoT行业标准。

此外,vivo通过“小V跨端”实现了AIGC能力上车、上电脑,还将推出“家居智能体”和“车载智能体”,让用户能通过自然语言控制智能设备,让连接更便捷。值得一提的是,vivo还成为国内首家能兼容苹果生态的厂商。为了给用户带来更丝滑的跨设备体验,我们通过深度适配苹果M系列芯片,实现了与苹果电脑的跨端协同,用户可以通过vivo办公套件对苹果电脑进行全端搜索、远程操控。

坚守长期主义,为用户安全隐私保驾护航

新兴技术发展带来生活和生产效率的巨大飞跃,但开展技术时必须考虑到安全、人文和产业的协同发展,才能让技术更好地落地应用、造福人类。

vivo首席安全官鲁京辉现场演讲

会上,vivo首席安全官鲁京辉分享了vivo AI在安全领域的最新进展。他表示,在隐私权限守护上,vivo倡导并实践“透明化”的隐私政策,将权限主导权交给用户。在提供AI服务时,vivo采取“端侧优先、端云协同”的技术策略,能在端侧处理的数据绝不上云。在面对复杂的AI任务处理时,在保障用户隐私和数据安全的前提下调用云侧大模型能力,以此实现高效、安全的端云协同,确保AI服务既智能又安全。面对敏感的隐私信息,vivo通过匿名化处理和差分隐私技术,在收集与分析数据前移除或模糊个人身份信息,在保障隐私前提下来提供个性化服务。鲁京辉强调,打造个人化智能,用户隐私安全始终是首要原则,vivo会继续在个性化服务与隐私保护之间寻找最佳平衡。让蓝心智能的“私人定制”便捷贴心,安全可靠。

此外,vivo通过蓝心智能将端侧AI能力赋能“千镜可信引擎”,构建了全链路诈骗防护。同时升级了手机丢失防护体系,推出全新的“查找网络”功能。除离线查找外,利用数以亿计的vivo设备和先进网络定位技术,在安卓阵营率先实现关机定位,提升手机找回概率。若无法找回,可远程物理级安全删除数据,同时还有芯片级刷机激活锁防盗用。三重防线,层层守护你的设备及数据安全。

有AI无碍,以科技照亮美好未来

科技的成果可以普惠于每一个人,包括我国近3000万的听障人群,1730万的视障人群和超过2亿的老年人。vivo持续以AI技术赋能无障碍应用体验。去年,vivo推出了首款集手语识别与合成于一体的软件“手语翻译官”,并在CCL2024手语数字人翻译质量评测中,获得了第一名的成绩。今年,为了协助国家通用手语的普及与推广,我们在“手语翻译官”中升级了“手语学习”功能,希望可以帮到更多的人学习手语。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

同时,基于蓝心语音大模型,“vivo听说”新增了方言自由说功能,目前支持6种方言,以解决各地区间的沟通障碍问题,也让用户可以以自己最熟悉的乡音与手机进行交互。而为了让更多人的乡音能被语音大模型识别,接下来,我们会把越来越多的语种适配进手机的各种功能中,让手机的语言交互更自然,更符合人的直觉,让人与人之间的的沟通更流畅,更温暖。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围现场演讲

除“vivo听说”外,“vivo看见”同样得到了语音大模型加持,新增了实时问答功能,成为行业首款多模态大模型视觉辅助产品。基于多年的技术积累与行业实践,vivo为8月28日正式开馆的国家无障碍环境展示馆制作了行业首款视障用户导览软件。通过vivo手机产品和“vivo看见”的视觉辅助功能,为展馆提供助力。

同时,《vivo无障碍解决方案》入选联合国ITU《人工智能向善案例集》、世界互联网大会《公益行动计划书》,获得了《可及信息无障碍优秀案例》等10余个权威奖项及荣誉。vivo成为中国残联战略合作伙伴,面向10所高校的1000多名残障学子公益捐赠无障碍设备,并招募了100位梦想导师,助力残障青年就业,帮助他们勇敢逐梦。

携手全球开发者及合作伙伴共同绘制开放未来

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围表示,一花不是春,独木不成林。vivo始终秉持“协同发展,互信共赢”的合作理念,不断深化并整合底层核心技术,涵盖提升应用体验的度量系统能力、引领创新的AI和蓝河操作系统技术、开放智联的IoT技术等。

AI作为新一轮科技革命的核心力量,为产业提高运营效率、优化用户体验、增强市场竞争力创造了新契机。vivo希望凝聚全球合作伙伴及开发者持续开展深入合作,加速产品服务创新和产业生态构建,共同开启AI时代的无限可能。

0 阅读:8

爱搞机

简介:据说99%搞机发烧友都关注的头条号