当前,人工智能(AI)发展步入新阶段,成为推动新质生产力发展的关键力量。每年的科大讯飞全球1024开发者作为新技术、新产品发布的平台,成为行业关注的焦点。本次大会上,讯飞输入法重磅推出14.0版本,通过AI重塑表达,致力于为用户带来“更准确、更高效、更懂你”的输入新体验。
大模型技术进入大众视野已经一年多时间,但生成式AI也带来了新的用户问题。讯飞输入法业务部总经理程坤表示,云端大模型输入服务成本高,用户对生成内容的多样化需求难以被紧凑的键盘界面满足,通用模型难以解决用户垂域沟通场景的体验问题。
纵观“端侧生成式AI新时代”,大模型小型化和端侧化逐渐成为行业趋势,端侧设备的AI算力拥有跨越式提升,各行业App围绕垂域需求打造微调模型和体验。因此,讯飞输入法带来全新的14.0,“云+端”大模型加持,打造“每个人的AI输入”。
“云”指的是云端大模型。讯飞输入法14.0接入讯飞星火语音大模型,即将把方言语音识别种类扩充到202种,覆盖288座城市,同时将方言识别准确率提升30%,使方言语音输入覆盖更广,识别更准。有理由相信,AI增强的方言语音输入不仅是交互体验的必然趋势,更是人类与机器建立更深层连接的桥梁。
“端”值得是的端侧大模型技术。讯飞输入法在现场发布“讯飞星火端侧输入大模型”,通过端侧大模型赋能拼音语音,让AI输入触达更多用户。作为新一代AI技术,讯飞星火端侧输入大模型AI输入增强,能根据上下文离线预测用户输入结果。值得一提的是,讯飞输入法14.0内置AI增强整句联想、AI增强整句预测、AI增强联想,实现从词级输入到句级输入的效果突破;通过大模型的泛化能力,使离线语音识别率基本持平云端效果,让用户随时随地享受高准确率的语音输入体验。
目前,诸多AI能力已在讯飞输入法中初露端倪。为了更好提升AI输入的丰富度,讯飞输入法14.0采用全新AI插件化引擎构架,具有“灵活拓展”、“广泛覆盖”、“智能融合”的特性。这意味着,讯飞输入法能够支持多种结构、多种尺寸的AI模型,体现“即插即用”的理念;同时,做到与不同性能设备的高度匹配,让更多用户用上端侧AI能力;此外,支持多模型融合来优化输入结果,让更多用户享受AI带来的输入效果提升。
一直以来,讯飞输入法不断革新交互逻辑,通过简化入口提供核心服务。“活力视界”是讯飞输入法为解决用户使用生成式AI输入而量身定制的交互。随着大模型技术的迭代,“活力视界”迎来2.0视觉焕新。卡片化设计,触发信息活力,让信息呈现更加灵动便捷;动效加持,进一步激发屏幕的生命力,“活化”整个界面;个性化皮肤,提升体验活力,彰显用户独特的品味与风格。
2023年,讯飞输入法基于通用的大模型赋能AI助手,显著提升助手用户渗透率和助手生成内容点赞率。但这还远远不够,如何更好地释放大模型的潜能,把AI助手的使用场景做得更全、服务人群更广、体验更有趣才是用户所需。
这一次,讯飞输入法全新升级“AI助手小蓝”,从底层到顶层进行了重构,希望打造成为“每个人的AI助手”。这一次,“蜕变”的AI助手与输入服务的融合进一步加深。
以高情商沟通为例,基于通用大模型底座训练出“高情商大模型”,又拆解不同人群,赋予不同风格,使得覆盖更全面的场景,让生成内容更有效,让沟通表达更高效;我们还发现很多用户拥有高频的需求,如恋爱表达。我们沿着这条路径在模型上进行细化调参,面对他们推出了“恋爱军师”,能够分阶段、分性别、分需求定制话术。这样一来,搭载个性化引擎,为不同用户提供更多元、更深入、更个性的服务,让沟通表达更个性;同时,我们开放生态助力玩法创新,通过UGC+PGC共创个性化的助手生态,让沟通表达更有趣味。日前,我们发起了“AI人设创作大赛”,0代码即可打造专属人设。
从讯飞输入法发布14.0可以看出,“云”“端”结合的大模型应用方式将成主流,输入法作为“入口级”服务,其应用范围和场景深入更加清晰,云端服务和本地AI应用双向发展将会有新的变化和提升。不远的将来,讯飞输入法主张的“每个人的AI输入”即将实现!