“最人味的机器人”再进化,能分辨环境,还能模仿马斯克讲故事!

科技商谈 2024-03-06 15:29:20

在几天前的2024年世界移动通信大会上,英国机器人公司Engineered Arts推出的第二代Ameca机器人,再次成为全世界媒体的焦点。

为什么要说“再”呢?这要从一段机器人“睁眼看世界”视频说起。

时间拉回到2021年年底,一个被命名为Ameca的机器人,刚刚睁开眼看世界,就因过分逼真的微表情,在科技圈吵翻了天——相当一部分人宁愿相信这段视频是由CG制作,也不相信一个机器人能有这么丰富的表情系统。随着越来越多的细节被证实,Ameca也被媒体冠上了“最有人味的机器人”的头衔。

而这次出现在2024年世界移动通信大会上第二代,比第一代更猛。

接入了GPT-4的第二代Ameca,有了十分接近人类的视觉感知能力和声音克隆能力。它能成功描述房间中的整体布局、还能在描述具体物体时,增添上细节描述。

比如,房间的窗户是开着的,光线太亮,让人睁不开眼睛;再比如,它形容桌子上破旧的机器人玩具,是有“怀旧气息的”……十分有画面感。

更厉害的是,它还能通过改变讲话风格、语气、语调,模仿各种声音讲话。

在官方公布的视频中,它生动地模仿了艾隆·马斯克、摩根·弗里曼、特朗普等明星名人等讲话风格,甚至能克隆他们的声音。还能根据科学家的命令,用海绵宝宝的声音、特朗普讲话的风格,发表“混搭式讲话”。

第二代Ameca与真人无异的视觉感知、声音理解、语义理解等能力,正是来源于AI大模型的赋能。

而官方对Ameca的定位更为直接——从软件层面来看,它就是一个AI开发平台,会随着AI技术的进步,提供更复杂的人机交互新功能。

如果说2023年是AI大模型爆发之年,那么,2024年,将是AI走向硬件的元年。

智能机器人只是其中一个例子,智能戒指、AI Pin、Rabbit R1等新的AI硬件,一直在不断涌现;与此同时,手机、电脑等传统智能设备,也在向AI手机、AI PC演变。

与其他硬件相比,用户使用率更高的手机,向AI硬件方向上转化,不仅是最普通人容易感知的,而且还是转变速度最快的。据OPPO和IDC共同发布的《AI手机白皮书》给出的预测,2024年全球新一代AI手机出货量将达1.7亿部,将占智能手机市场总量的15%。

为在这个新赛道上取得先发优势,各大手机厂商的动作尤为频繁,大举ALL in AI。

三星以“AI功能”作做新旗舰机型的重点宣传;魅族官宣“放弃传统智能手机”,ALL in AI硬件;几天前,苹果被媒体爆料从造车计划中抽身,团队转向AI;OPPO动作更快,用行动证明了他们在AI手机上布局的决心。

作为最早在AI领域布局的手机企业之一,OPPO早在2020年就已推出了首个AI大模型,2023年开始自主训练安第斯大模型;今年年初,又率先将70亿参数的AI大模型应用到Find X7系列手机上。

推出AI硬件后,OPPO又对AI手机进行了更大的布局,龙年春晚当天向1000多万用户解锁超100种AI功能,并宣布正式进入“AI手机时代”;龙年第一个工作日,创始人陈明永在其内部信上中提出“2024年是AI手机元年”,并再次提高AI的战略定位,将集中公司资源向AI研发倾斜。

2月20日,OPPO又召开了“AI战略发布会”,新建成的AI数据中心正式挂牌成立,并发布了上文提到的《AI手机白皮书》,并在对市场充分了解的基础上,推出了由“AI超级智能体”和“AI Pro智能体开发平台”组成的1+N智能体生态战略,表达了推动手机行业加速迈向AI全新阶段的决心。

AI手机时代贡献者和普及者的角色定位,不仅体现在战略布局上,还体现在产品对AI功能的引领上。

OPPO推出的行业首款AI手机Find X7系列,就带来了包括AI通话摘要、AI消除、文章智能摘要、AI超清合影等100多项AI功能,不少AI功能都具有行业引领性。比如,对效率提升明显的“OPPO AI 通话摘要”功能,就是行业首个,也是目前的唯一。

电话是日常工作中最常用的工作对接方式,但记不住或记不准工作电话内容,却让人十分头疼;用纸笔记录或开启通话录音,回顾时又或多或少不方便。

在Find X7系列开启“OPPO AI 通话摘要”,AI助手便能自动总结和提取通话过程中的重要信息,将姓名、手机号码、时间、地点等信息,进行分类归纳,还能会根据需要生成待办事项,能极大提高工作效率和信息管理效率,对于商务人士来说非常友好。

还有Find X7系列上的“OPPO AI 消除”功能,更是受到用户的欢迎。

在拍照过程中,难免会因为不和谐的路人和杂物入镜,影响成片的观感,哪怕借助专业的修图软件,还需要非常复杂的操作,而且效果也不稳定。

而在70亿参数大模型的加持下,Find X7系列能对消除对象进行精准识别,并做到发丝级的分割,完成消除以后,还能根据背景智能填补消除后画面的空缺,实现图像的填充和自然生成,丝毫没有“P图感”。

此外,Find X7系列在70亿参数大模型加持下,语音助手小布,也完成了全新升级。

与以往手机常见的“傻瓜式”问答不同,新小布助手不仅能理解用户更复杂的指令和问题,而且支持文案撰写、AI画师、AI连麦、短视频脚本、PPT大纲等100多种AI功能。

比如,用户可以命令它为朋友圈写个文案,也可以让它规划一个阳春三月的旅游方案,随时满足用户的各种脑洞,智能程度相当于一个无所不知、随时待命的全能助手。

手机、家电、PC、汽车等科技产品探索AI硬件的过程,也是寻找人与硬件之间的更多元、更自然交互的过程。AI硬件则可以通过自然语言处理、图像识别等技术,实现更加自然的交互,在提高用户效率的同时,也能更好地融入用户的生活。

与此同时,随着AI技术的不断进步,应用场景的不断拓展,AI智能终端将为人们的生活带来更多的便利。AI终端的广泛使用,也将推动AI技术的进一步发展和普及。

在AI技术催化下,或许将掀起新一轮的智能终端演化,为产业带来巨大推动;届时,我们的生活和工作方式,也将因这些新一代的AI智能工具而发生改变。

0 阅读:1

科技商谈

简介:分享科技知识,每天更新不同内容