百度AI:理解孩子的声音

北青报深一度 2023-10-27 11:57:54

记者/戴雯

编辑/罗铮

李彦宏在百度世界大会上

移动互联网的普及促使数字社会加速到来,因为种种原因被数字化空间所排斥的群体如乡村、老人、儿童成为“数字弃民”。

但AI技术并非意味着冰冷的数据,也并非是高精尖人才的专属,现在,我们不需要学习复杂的程序,用日常生活中与朋友对话的方式,就能拥有AI这个可靠的工作伙伴和生活助理,它的出现可以重构各行各业、千家万户的工作、生活场景,不仅能呈现给我们成千上万个选择,还能给我们切实可靠的建议。

从“人工智障”向真正的“人工智能”路上迈进的过程中,百度已逾越过很多山峰,并将继续朝着更加智能的路上迈进。可以看见在不久的未来,面前那道数字鸿沟会慢慢弥合,更多的“弱势群体”能被照顾到,AI能回答更多的童言童语,也能做好老人的生活助理,当我们说出最笨拙的需求时,也不用担心会有人责怪,没关系,AI懂你。

小度家庭机器人产品系列

俯下身,理解孩子的声音

在10月17日举行的百度世界大会中,一个身穿彩色条纹Polo衫的小男孩显得和周围穿着黑白制服的大人们格格不入,这个“不速之客”名叫元宝,他只有6岁,是百度世界大会当中年纪最小的一个参与者。

半个月前,元宝的妈妈在网上偶然得知首钢园要开百度世界大会,因为家中就有小度智能屏等家居设备,平时去旅游时,元宝也爱去各地的科技馆逛逛,这一次,她也预约了参会,但由于报名的人太多未能入选。元宝还是很想去,他想看看“小度的妈妈”长什么样子,抱着试试看的心态,元宝妈妈带着他来到了现场,百度市场部的工作人员惊讶居然有年纪这样小的科技爱好者,破例允许元宝进入会场内部。

在候场间隙,小度科技CEO李莹蹲下来,迎接了这个个子还不到她腰间的小小人儿,听他讲希望小度机器人能变得更聪明的畅想。

这样的场景经常发生——“小度小度,我要画一只巨嘴鸟。”“小度小度,我要听三只小猪的故事。”对于这样的简单指令,那台只有巴掌大的黑色边框屏幕的小度智能屏能很好地回答他,陪伴他度过了很多独处时光。但偶尔,元宝也会觉得泄气,因为在一些私人问题上,小度并不能给他答案,“小度,我想做一个科学家该怎么办?”“我要怎么才能成为一个飞行员?”小度只好回答:“哎哟,我还以为我很聪明呢。”“让我的脑子再转一转。”

李莹这次带来了基于文心大模型4.0技术生成的家用智能机器人和AI原生教育产品——小度青禾学习一体机和小度添添家庭机器人,学习机会在与孩子的日常交流和互动中了解到孩子的特点和知识掌握情况,量身定做学习规划,根据实时反馈去调整学习规划,成为最“对症下药”的家庭良师。而小度添添集屏幕、音箱、机器人于一体,更能满足小朋友的情感需求。

元宝在会场惊奇地发现,面前这款白色的小度添添机器人有圆圆的“肩膀”,眨眼的大屏“脑袋”还能随着他的位置而转移,可爱极了。更重要的是,这款新的机器人变得更聪明,能听懂自己在说什么了,和过去冷冰冰的机器人相比,多了一份“人味”。

李莹介绍,小度添添有出色的记忆能力,小朋友如果在应用上看过动画片《汪汪队立大功》后,当他再和小度添添说:“我是一只小狗。”添添就可以立马回答他:“那你是汪汪队的吗?”这是未来的小度添添在家庭使用场景中可能发生的一幕。

李莹说,这款机器人还能在交流时,自然调取出记忆里的小朋友的喜好,并聪明地去转变角色,像朋友一样聊天,很“贴心”,比如,小朋友晚上跟小度说我睡不着,小度会像一个生活管家一样,自动调暗卧室灯光,拉紧窗帘,减少外部环境的干扰,还可以播放舒缓的音乐。

6岁的元宝作为最小的参会者见到了小度科技CEO李莹

重构应用,重构我们的生活

小朋友元宝的困惑也是千万个普通人的困惑——我说的话AI听不懂,怎么办?

在百度世界大会现场,百度创始人、董事长兼首席执行官李彦宏坦诚地说,“人工智能”在一些时候被人称为“人工智障”,经常听不懂人话,久而久之,你也就不敢跟它说太多人话了。但最新的文心大模型4.0不同,它有优秀的理解能力,“今天你说的每一句话,它大概率都能听懂,很多时候比你的朋友同事更懂你在说什么。”

他用了一个非常形象的例子——我问AI,“我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。”文心一言会回答可以用公积金贷款等等一系列流程。

李彦宏解释,其实这句话有好几个小陷阱,先说了买房和办理公积金,最后才说“我在北京工作”,这就对理解能力提出了更高的要求。而“在北京工作”,潜台词是“在北京缴存公积金”,“回承德购房”,暗示了“我”大概率是承德户口。“文心一言提炼出的真正问题其实是——“一名河北承德户籍的用户,能不能用北京的公积金,在承德贷款购房”。“可以看到,文心一言已经可以对前后乱序的表述和模糊的表达意图、话语中的潜台词都有准确的理解。”

文心大模型4.0除了上述的理解能力,还有更多进步,比如,生成能力——输入一张图片,提出要求,便可生成营销海报甚至广告片;理解能力——输入一道数学题,不仅能告诉你怎么做这一道题,还能帮你把相关的知识点串联起来,帮助学生举一反三;记忆能力——创作武侠小说,大模型能够记住你前后语境中的需求,并且根据已经回答的内容进一步生成一部逻辑连贯的小说。

大模型就像是一个聪明的大脑,但没有了应用这个身体,那么大脑再聪明也将会像植物人一样,无场景中的用武之地。理解了大模型的底层逻辑,或许我们就能对应用有了更高的追求,对我们的生活有更多想象。

现在,百度旗下APP已经开始重构,致力于打造繁荣的AI原生应用生态,现在,在搜索、办公、地图、网盘、文库等十余款AI原生应用中,百度都呈现出与过去截然不同的面貌。

当你通过线上搜索问题时,新搜索将不再是给你“一堆链接”,让你在浩如烟海的信息洪流中自己找寻答案,而是通过对内容的理解,生成文字、图片、动态图表的多模态答案,让你更直观、更准确地获取最优答案。网盘中的视频也不再是乱糟糟的,AI不仅能精准定位到视频某一帧,还能在几秒钟内总结完长达1小时的视频内容,并从中提炼出金句和要点。在文库中查询如“光伏行业”的报告,几秒钟就能生成70页文库内容的行业报告,还能快速把文档生成PPT,完成润色美化。

打开地图,AI不仅能做好路线规划,还能实时监控红绿灯如何变化,查询美食时还能依据口碑为你做出介绍和提供建议;大模型接入权威法律数据的“智能法律助手”,还能为用户提供法律咨询的相关建议,而简历助手插件则能帮用户一键生成简历模板......

可以想见的是,在未来,老人学习手机的程序、制表格、订票,不用麻烦年轻人了,AI还可以帮患者和医生对话、生成病历,拿到药品时也可以轻轻一扫,就能询问数字人,药是饭前吃还是饭后吃,喝酒能不能吃。

这样的应用也能遍及各行各业、各种人群,在政务、营销、客服等领域,都有非常广泛的应用前景,也能在制造、能源、电力、化工、交通等实体产业中大展拳脚,包括用智能巡检降低安全隐患、用智能调度缩短交付周期、用智能决策提升企业效率、用智能信控解决交通拥堵。学习、办公、创作、绘画、聊天练口语、进行小说剧本创作......你能想见的大部分生活场景,都能通过AI这个接口实现改变。

“大量AI原生应用将不断涌现,数字技术与实体经济将深度融合,大模型正成为新型工业化的重要推动力。”李彦宏畅想,“基于先进的基础大模型,我们可以构建起一个繁荣的AI生态,共同创造新一轮经济增长。”

李莹在百度世界大会上

服务于人,连接未来

多一分能力便多一分社会责任,科技的进步最终还会反哺到人类身上,做更多更有意义的事。

比如寻根。百度世界大会上,国家图书馆副馆长张志清带来了马来西亚华裔赵佩娟的寻根的故事。赵佩娟祖父13岁来到马来西亚,直到85岁去世,也没回到出生的地方,祖父说,“许多东西都会随着他的离去而消失,但不能忘记自己来自哪里。”赵佩娟依靠记忆中模糊的线索和一张老照片,查阅了很多地方志,走访了很多地方都没有结果。

国家图书馆是中国乃至亚洲最大的图书馆,拥有极其丰富的国家级馆藏资源,其中包括全球最大的古代方志和家谱数据,记载了各地的风土文化。文心大模型能够通过学习这些数据,贯通古今,运用地点、职业、饮食、重要事迹等信息来进行文字识别和理解,迅速帮你定位记忆中的地方,省去在路上奔波、书海翻阅的精力。就这样,赵佩娟顺利找到了祖父记忆中的福建沙堤村。

张志清说,国家图书馆也在积极寻找前沿技术利用好这些数据,帮助海内外寻根华人,将几代人断掉的线重连,现在已收录了福建福州、厦门、泉州、漳州等区域的数据,未来还将持续更新。

AI也帮助了乡村孩子抵达自己想象中的图景,来自江西省赣州市上犹县营前镇石溪小学的乡村教师黄琦不无感慨:“一直以来,AI都是一个高大上的词,它离我们的村子很远。”她带来了乡村学校孩子们使用文心一言APP创作的画作,第一次接触AI技术的孩子们通过图片生成功能,画出了自己和在外务工的妈妈在一起的样子,还画出了未来的自己,有在太空遨游的宇航员、意气风发的士兵,还有拉着手风琴的艺术家......

“AI不会取代人,还会救人。”李彦宏介绍,在与临洮相关部门合作时,通过百度智能监控和AI防溺水模型,百度数字安全堤坝可以成功发布1600多条涉水预警信息,并通过AI发布的预警信息成功救下了4个人的生命。此前,百度与宝贝回家合作,将人工智能的跨年龄人脸识别技术应用于寻找走失儿童中,超过6万条寻亲图片数据接入百度跨年龄人脸识别系统进行对比评测,通过对孩子与父母上传的照片做比对,初步筛选出30例疑似案例。

大会上,百度也正式发布了“千村万户直播计划”——未来5年帮助2000个农村、10万个农民通过数字人进行直播,带货全世界。这项计划依托于百度电商打造的业界首个具备AI全栈式直播间生成能力平台——慧播星,慧播星可以用简单的几步操作,生成超拟真的数字人的主播形象、声音、直播脚本和互动问答,帮助中小商家“零门槛”开播带货。

百度世界2023的主题正是“生成未来”,人类的难题、人类的需求、人类生产的数据,都有助于大模型更好地学习和服务人类,创造更好的未来。

正如李彦宏在百度世界大会的结尾分享的那样,“AI的独特性是它不仅能够模仿人的某些技能,还能够执行我们难以完成的任务,而推动机器学习和大语言模型的每一次进步的背后,其实都是人类。新的世界、新的未来,将在每个企业、每个开发者、每位用户的一次次Prompt中生成,我们即将进入一个AI原生的时代,进入一个人机通过Prompt来交互的时代。”【

版权声明】本作品的著作权等知识产权归北京青年报【北青深一度】所有,未经授权,不得转载。

0 阅读:1

北青报深一度

简介:为认知变革中国提供纵深阅读文本