我戴了一周的「大模型耳机」,发现了AI硬件的新答案

爱范儿 2024-10-10 18:55:55

在智能手机之后,下一代的硬件范式应该长什么样,答案仍是众说纷纭,但有一个共识已经越来越清晰——

下一代硬件,应该是 AI 硬件。

全球热销 200 万台的 Meta Ray-Ban 智能眼镜和已经不足 5000 人使用的 Rabbit R1 从正反两面证明了一件事:相比于掏出一个独立设备,无时不刻的陪伴和响应,才是 AI 硬件最核心的竞争力。

AI 硬件应该离人近一点,再近一点。

今天,字节跳动发布了旗下首款智能体耳机 Ola Friend,把大模型应用到了耳机场景。爱范儿也第一时间深度体验了这款产品,我们有了一些有趣的发现。

通晓天文地理的旅游搭子,吃喝玩乐都能解决

拿到 Ola Friend 的时候刚好开启了国庆假期,于是我就戴着它一起去旅游溜达,发现这真的是一个万能的旅游搭子。

前阵子玩《黑神话:悟空》比较上头,对寺庙里的神佛造像兴趣盎然,所以我选了去台州吃美食,去国清寺看罗汉的路线。国清寺的罗汉堂庄严肃穆,有五百多尊罗汉像委身其中,在大饱眼福的同时我也非常好奇,这些造型各异的罗汉都是谁,背后有什么故事?

这时候掏出手机既不方便又不礼貌,但按住 Ola Friend 耳机的触控板,或者直接「豆包豆包」唤醒问一下「这个手里捧着释迦牟尼的罗汉是谁」,豆包马上就会告诉我「这是摩诃迦叶,释迦牟尼的十大弟子之一」——这样的即时反应,确实让我相当惊喜,揣在兜里的手机所做不到的,耳机做到了。

逛完国清寺想找地方吃点东西,还在往外走的时候 Ola Friend 就可以给到很多推荐:

紫阳街那里有各种台州特色小吃,像海苔饼、乌饭麻糍、蛋清羊尾、泡虾等等,你可以一路逛一路吃。最后去人民路海鲜街,尽情享受海鲜盛宴。

Ola Friend 还会给出餐厅的评分、招牌菜、近期评价和人均价格,能省去不少麻烦。Ola Friend 对于语义的理解是相当准确的,会根据上下文内容来判断你问的是哪里的餐厅,推荐离你更近的店面。

有时候,Ola Friend 还会帮你挖掘一些只有本地人才知道的宝藏福地。

前阵子去香港的时候,就给我推荐了湾仔的东方 188 商场,和我之前常去的信和广场相比,能淘到不少绝版的 CD 和漫画,这是过去住在本地的朋友才知道的小众宝地。如果你也想避开人流闹市,不妨试试让 Ola Friend 给你规划一下旅游路线。

戴着 Ola Friend 出去玩这几天,有几个细节让人印象最深刻:

对话声音非常自然!

这主要得益于背后的 Seed–TTS 技术,这是豆包团队研发的一个语音生成基座大模型,能发出各种声音并进行多维度操控,还会模仿人类的说话习惯,保留一些发音瑕疵,系统内置的几个主要音色,生成的语音几乎与真人一致,几乎不会有机器感,音调韵律、情绪起伏都不会让人烦躁,而且响应非常快!

Ola Friend 还专门针对耳机场景开发了实时双向对话功能,唤醒后,你可以边听边说,随时打断,不需要每一次对话都使用唤醒词,就像是在跟人讲电话一样,即便是在人多的室外环境,也不会引起路人奇怪的目光。

最重要的是,这个耳机你真的能戴一整天。

尽管是第一次涉足 AI 硬件领域,但字节 Ola Friend 却在硬件层面有着极高的完成度,其采用 OWS 全开放式设计,是一款耳挂式耳机,不像入耳式耳机那样有耳压,长时间佩戴对耳朵也没有负担,有点像戴眼镜的感觉。

根据官方的数据,Ola Friend 单只耳机仅有 6.6 克,是耳挂式耳机中最轻的,但声音却没有因此打折扣,语音非常清亮,就算在喧嚣的旅途上也能听清。

由于这段时间听歌并不是主要场景,每一次戴着耳机出门五六个小时都不成问题,放回耳机盒里就自动充电,实测下来满电状态使用,单次使用时长超过 6 个小时,配合充电盒使用,确实能达到官方宣称 20 小时左右的续航。

可以说,即便不考虑 AI 能力,Ola Friend 本身就是一款相当成熟的耳机产品,音质、续航和舒适度都相当出众。这让我想到 Meta 和 Ray-Ban 合作的智能眼镜,就算剥离所有的 AI 能力,Ray-Ban 眼镜仍是一款优秀的眼镜产品,这已经足以说服很多用户买单。

运动学习的全能教练,全天候待命的万能老师

旅游回来后,Ola Friend 就成了我的生活搭子。背靠豆包强大的资源和智能体矩阵,Ola Friend 聚合了海量的功能,其中有两个场景非常好用——做运动和练口语。

Ola Friend 一共有四个款式,并且配有小钱包和鹅卵石两种设计的充电盒。我手上这款由类陶瓷触控模块和亲肤橡胶机身组成,既有运动耳机的流线型设计,但又更加小巧好看。当作一个运动耳机来用也完全没有问题。

和其他音乐 app 相比,Ola Friend 运动推荐的一体性非常强,不仅可以帮你制定运动计划、饮食计划,而且能够因地制宜地设置听歌选项——跳绳的时候该听什么歌、跑步的时候适合什么样的节奏、休息的时候播什么音乐……推送的曲目都蛮精准的。每副 Ola Friend 还会送一个月的汽水音乐会员,能够打通你在汽水音乐上的数据,带来更符合口味的推送。

让人意外的是音质,Ola Friend 的声音相当饱满,尽管是开放式耳机,但却有不输入耳式的饱满听感,人声和器乐声有较好的分离,不会显得人声很扁,乐器的声音也相当有层次。值得一提的是,尽管这并非降噪耳机,但由于发声单元离耳道更近,因此声音即便是在嘈杂环境也很清晰,这对一个需要实时响应的 AI 硬件而言相当重要。

练口语是我用得比较多的另一个场景。

由于豆包随时处于待命状态,也就意味着随时随地都可以开启口语练习。这让我想起前阵子看的电影《抓娃娃》里面,有个情节就是小学生马继业,经常在路上遇到假装问路的外教,在不经意的问答间就做了一次口语练习。

练习口语最重要的就是开口多读多练,耳机显然是社交负担最小的使用场景,不需要端坐在屏幕前,甚至也不需要掏出手机,我经常会选择下班后在园区里多溜达半小时,和 Ola Friend 一边聊天一边练口语。

唯一美中不足的是,Ola Friend 暂时还不能根据场景匹配对应的豆包智能体,而是把内容集中在一个对话选项当中,对于持之以恒的学习场景来说,内容多少显得有些冗杂。

虽然说 Ola Friend 要取代英语老师还有一段不小的距离,但有个 24 小时在线的口语陪练,就已经让开口说英文这件事变得方便又自然。

更何况,Ola Friend 还是一个刚刚发布的产品,背靠字节强大的基础模型底座和快速的产品迭代能力,想必还有更多的新功能已经蓄势待发。

好的 AI 硬件,要离人更近一点

耳机,是陪伴我们身边最长时间的硬件之一,我每天有五到八个小时会戴着耳机,无论是工作、通勤还是看剧,和手机相比,耳机离我们更近,能提供的服务也更多。当我一直戴着内置大模型的 Ola Friend 时,这种陪伴就从量变成为了质变——就像《Her》里面的萨曼莎,大语音模型不再是一个虚无缥缈的对话框,而是一位随时倾听话语的朋友。

最近在看装修和家装比较多,对我来说,这是一个完全陌生的领域,选床垫的时候,一眼望去都是不认识的牌子,这时候 Ola Friend 就是我的家装顾问——舒达、金可儿、雅兰这些品牌都是什么来由、选床垫时应该注意哪些指标、主卧应该挑一米五的还是一米八的……在这些我从未涉足的领域,Ola Friend 会耐心解答我的问题,用语音或视频帮我扫盲,起到绝佳的支撑作用。

还有更多问题,是在日常生活中不经意间冒出来的,那些我从来不会想要去了解的事情,现在由于 Ola Friend 的陪伴,获得答案的成本变得相当低,我也会经常提问——

路过一辆公交车,上面贴着八合里牛肉火锅店的广告——作为一个潮汕人,我知道八合里这个品牌在潮汕并不出名,但不知道为什么会火遍全国,于是我唤醒 Ola Friend,于是一段潮汕牛肉火锅的商业发家史就娓娓道来;

读书的时候,突然看到「出马仙」这个词,在过去我可能就得过且过,但现在我会让 Ola Friend 给我讲讲藏在这个词背后的中国旧社会的民俗信仰;

又或者逛超市的时候,我心血来潮想知道山姆、开市客和盒马有什么区别时,我一边推着购物车闲逛,Ola Friend 一边给我讲这几家会员超市的历史与特色……

这让我又找回一些小时候读《十万个为什么》的感觉,我可以对所有的事物好奇,而所有的发问,现在也都能收获答案,生活似乎没有变得不同,但又让人觉得大开眼界,大不一样。

在耳机上进行语音指令交互并不是一件新鲜事,早在十年前 iPhone 4S 上的 Siri 就能通过线控耳机唤醒,但问题是唤醒后还能做什么?

很长一段时间里,我们都对手机内置的语音助理熟视无睹,其中固然有这类产品的能力或设计问题,但更多的是语音助理和用户之间,难以培养一种「信任感」。

在戴着 Ola Friend 的这段时间里,我几乎没有意识到我戴着一副内置大模型的耳机,随时向 Ola Friend 提问这个行为,顺滑自然地融入了我的工作与生活——这是和以往最不一样的地方。

几个月前,在火山引擎的活动上,字节跳动产品与战略副总裁朱骏分享了设计豆包时的三个原则:拟人化、个性化,并且到用户身边去,离用户更近一点。

这也是我用 Ola Friend 这段时间最大的感受,这是个极度拟人化、个性化的产品,真的有人在随时响应你提出来的各种怪问题,这是专属于你的问题,也是专属于你的答案。

更重要的是,不需要打开电脑、不需要掏出手机,仅仅只是提问,就能得到应答——时至今日,AI 硬件的形态如何仍未成定论。

但无论如何,AI 都应该离人近一点,再近一点,这条路总没有错。

0 阅读:5

爱范儿

简介:数字公民的糖