玩酷网

大部分人都没做成的 C 端 AI 硬件,科大讯飞怎么做成的?

AI给了所有人再做一次硬件的机会,如何抓住机会?

去年被硬件从业者称作“AI硬件元年”,然而时至今年,一批AI硬件公司已面临困境。

2023年,由两位苹果前高管创立的AI硬件公司Humane,目标是推出颠覆智能手机的新产品。其联合创始人曾对媒体表示:“上一个技术周期已经停滞,智能手机已存在16年之久,是时候为新一代硬件让路了。”

一年后,这家以挑战苹果为目标的企业,最终出售给惠普。其明星产品AIPin是一款无屏幕可穿戴设备,通过磁吸固定在衣物上,采用语音指令、手势控制和激光投影交互,但因续航不足、语音识别准确率低而广受差评,几乎售出的所有产品都被退回,大量积压在仓库中。

类似Humane的公司,都期望通过一种新的交互方式或产品逻辑,替代智能手机、平板和PC早已成熟的现有功能,其失败或许早已注定。

根据洛图科技的研究数据,2025年中国AIToC端硬件市场规模达4610亿元,机会很大,但竞争也非常激烈。真正站稳脚跟、取得成绩的产品,反而是那些看似野心不大,但精准定位高价值场景并实现极致体验的创新。用户通常不会单纯为“创新”买单,而是为切实提升的体验付费。哪怕这个产品服务的场景和人群非常小众。

红蓝海并存的C端AI硬件市场,如何精准定位?

2022年底掀起的生成式AI热潮,为硬件领域带来了重新定义产品的机遇。几乎每个季度都有“令人瞩目”的硬件创新涌现。但正如一位Reddit用户所吐槽,许多智能硬件缺乏真实市场需求和明确问题解决能力,更像是VC为了赚快钱催生的产物。

目前,面向C端的AI硬件市场呈现出“红海与蓝海并存”的状态。手机、PC、智能家居、可穿戴设备,都处于红海市场,增长依赖存量换新而非增量市场;而智能眼镜、机器人、车载AI硬件等市场处于蓝海,等待更多创新去精准定位高价值场景。

面向C端的AI硬件创业者失败的原因有很多种,但大部分可总结为三点:市场层面,没有找到明确的需求空白点。要么是在原有产品上堆砌功能,要么做了一个功能模糊不清的新产品。在实际使用中,用户并不需要一个有上百种功能的智能音箱;产品层面,没有跨越技术到市场的鸿沟,设想过于超前,无法实现;战略层面,野心太大,不够聚焦,导致资源浪费,最终消耗至死。

另一方面,芯片、电池、显示屏等重要零部件的尖端技术仍掌握在巨头手中,而苹果、微软等公司积累数十年建成的软件生态短期内也很难颠覆。

对于面向C端的AI硬件创业者来说,在系统、硬件或软件层面实现突破,同时在需求洞察、产品定义和设计上做到极致,才有可能成功。

去年热销的AI卡片式录音笔PlaudNote,核心功能是弥补iPhone无法通话录音的短板。其卡片式设计可完美贴合手机,使其在去年年中登上亚马逊畅销榜首位。

科大讯飞也是为数不多在AI硬件做出成就的公司。一位科大讯飞的产品经理说,他们做硬件的第一天就知道,手机、平板可以替代几乎所有智能硬件,且自己的开发资源很难与苹果等公司竞争,只有在专业的细分场景满足专业的需求,才有机会。

科大讯飞最先瞄准的是“商务办公”场景,早在2015年,科大讯飞就发布了在语音交互技术基础上建设的人工智能时代的人机交互界面——AIUI,以及录音宝、录音笔、讯飞听见网等ToC产品。这也是“AI+办公”产品的初始形态。

2018年,科大讯飞在硬件领域另辟蹊径,推出了业界第一个墨水屏智能办公本,能提供比iPad更好的书写和阅读体验,其内置的智能语音转录软件针对商务办公场景优化,在转录和信息总结方面表现优秀。第一代办公本推出时,讯飞也曾被诸多用户质疑,之后围绕用户反馈,不断迭代,才让智能办公本在硬件领域突出重围。

截至目前,讯飞的智能办公本累计销量突破200万台,是这轮AI硬件热潮中为数不多站稳脚跟的全新品类。

科大讯飞能找到这么精准的场景,从0到1开创新品类,基础在于讯飞对市场和用户的深刻理解。

2018年,人们开始反思手机和平板屏幕对健康的潜在危害。在硅谷,一些父母甚至要求保姆签订合同,承诺在孩子面前不使用手机。那一年,iPhone推出了“屏幕使用时间”功能,期望帮助人们控制对手机的过度依赖。Kindle为代表的墨水屏阅读器是另一种理念的践行者,硬件上模拟纸质的显示效果以保护用户健康,再把功能尽可能做简单,与手机平板保持距离。

科大讯飞的产品经理在当时注意需求的变化,迅速开展了用户调研。结果显示:企业管理者、文字工作者等群体已经快被海量的日常信息淹没。一位用户曾对科大讯飞副总裁、讯飞读写总经理钟锟形容被海量信息淹没的感受:“看起来你很牛,好像能管理这么多人。但有太多信息需要你处理判断,你一停下来,很多链条就转不动了,你会发现自己的信息处理能力才是管理的障碍。”

一个公司绝大多数工作环节,本质都是在交换信息,但在以往纸笔或者手机PC记录时,信息会流失或偏离,降低企业管理和决策效率。讯飞瞄准的企业管理者群体通常是海量信息的交叉点,对效率影响最大。解决重要决策者的信息处理效率难题,是一个没有被察觉的机会。

这是一次精准的产品定位:虽然这个群体并不庞大,开发出来的硬件毫无疑问属于小众产品。但这些人的使用频率会非常稳定,同时更好的表达能力也让产品团队更容易收集到有效的产品需求,用来优化产品。更重要的是,这个小众群体通常有着更强的影响力,更容易将好的产品传播出去,这像是金融风险专家纳西姆·塔勒布(NassimTaleb)提出的“肥尾效应”的一种体现。

其次是讯飞多年的技术积累终于可以追上产品设想。

语音转录是科大讯飞的传统强项,2006年之后,在国际语音技术有关的大赛中击败IBM研究院、微软研究院等对手多次获得第一。科大讯飞还牵头制定了中国中文语音技术标准,建设了最大的中文语音语言数据库。这些积累反映在办公本的转写效果上,2018年,讯飞语音转写准确率高达98%,行业专业术语、方言识别、外语互译等特殊需求也都是强项。

在硬件上,讯飞智能办公本初创团队频繁参加消费电子展,惊喜地发现元太的柔性墨水屏加上日本Wacom电磁笔,足以模拟出类似纸笔的手写体验,远强于平板的手写功能。且讯飞自研的语音识别在当时准确率超过90%,真正达到可用的程度。

最后是战略和执行层面聚焦,少即是多。

在第一代产品诞生前,市面上几乎没有办公本这个品类的清晰定位。可参考的信息很少,讯飞办公本团队一方面需要深刻理解企业管理者和职场人的核心需求,另一方面需要结合讯飞在软件技术领域的深厚积累。从命名开始,从头构建整个产品体系。最终,“智能办公本”这一名称帮助讯飞聚焦于一个区别于手机和平板的细分场景。

产品功能也在摸索过程中逐渐成型:一款面向企业管理者和文字工作者的专业产品,基本能力就是需要将“来自使用者自身的思考”与“来自外部的有效信息”结合展示,化繁为简,帮助使用者更好地做出判断。在这一定义下,产品围绕两大核心功能展开:通过“转写”将外部的信息结构化展示,通过“手写”将使用者自己的思考结构化展示。

新一代办公本X5Pro继续优化了书写功能。

那一年,OpenAI才刚刚发布了模型GPT-1,大模型的能力远没有今天这样成熟。但讯飞办公本的早期产品形态已经在不知不觉间为日后大模型的接入做好了准备:当一款设备可以排除其他干扰,聚焦一个人的工作场景收集并整理各种资料时,这些被结构化的内容本身就是极好的用于AI分析的原料。

精准定位的“小众”产品,如何从1到N影响“大众”?

乔布斯总结苹果公司的产品开发理念时曾转述AlanKay的那句话,“真正在乎软件的人,都应该去制造属于自己的硬件。”

同时做软硬件,将更多产品定义权掌握自己手中,是诸多伟大产品公司的惯常坚持,微软、英伟达、特斯拉也这样。这种模式可以提供更完整且更难被替代的产品服务,也让企业有了更深的护城河,技术发生变革时,他们可以快速跟进变化,迭代产品。

讯飞一直在努力建设像苹果和微软那样强大的软硬件实力作为一款AI硬件,办公本并不是一个一蹴而就的产品,而是从精准的细分需求出发,以技术贴合场景,通过持续迭代站稳脚跟并拓展边界,努力7年以后取得的成果。

钟锟后来复盘讯飞办公本探索历程时说,他们做的最正确的选择就是自身的技术研发极大程度贴合使用场景,为场景服务。那些失败的硬件公司野心太大,有很多对产品的浪漫设想,但忘了解决最具体的问题。

产品定型后,讯飞团队也和其他新硬件厂商一样,面临着“用户接受度”这一终极拷问。讯飞推出办公本时,市面上没有同类竞品,消费者更容易拿办公本和现成的平板电脑相比,这也几乎是所有新硬件产品的宿命。

2019年末,讯飞在北京举办了智能办公本的用户感恩会,邀请了40多位种子用户交流产品。产品经理们列成一排站在台上。当时有一位用户拿着话筒,对产品功能的不足进行灵魂拷问:“你们为什么要设计这种功能?”

感恩会后,讯飞创建了办公本的用户互动平台“莫比俱乐部”。智能办公本后期的诸多改进,都来自俱乐部用户的反馈。比如一部分用户反馈屏幕密码解锁不方便,产品团队就加上了指纹解锁;反馈开会时收音效果不好,就把办公本的麦克风从双阵列升级成八阵列,全向收音。整个产品完整的体验,是他们在与消费者沟通的过程中一点一点优化出来的。

在后续第二代产品中,讯飞接入了自研的星火大模型。在大模型支持下,办公本可以自动生成会议纪要,以及对会议内容进行更深度的分析和整理,使用者不再需要通读全文寻找重点,而是当场查看AI提炼的会议要点。

本周,讯飞发布了新一代X5办公本,这是全球首款支持本地大模型的硬件产品,可以说是第三代办公本。

X5最重要的更新是离线AI能力,大大拓宽了办公本的使用场景。诸多办公本用户都时常有出差需求,处于网络连接不稳定的状态,本地大模型保证办公本能在飞机或者涉密场景也提供智能能力。

讯飞新一代X5Pro智能办公本。

本地大模型对算力要求极高,讯飞团队在移除模型冗余的参数给模型瘦身后,和供应商一起又优化了芯片的算子带宽和内存。尽可能保留了离线模型的转录准确性和翻译等功能。

进一步针对用户需要,讯飞智能办公本X5还增设了全链路隐私安全保护功能。讯飞办公本的用户很多是企业高管、律师等群体,他们要处理更多涉密信息。讯飞团队为此在办公本上增设了一键离线拨片和指纹加密的本地文件保险,把信息是否上云的选择权还给用户。

在硬件上,续航和重量等是智能办公本行业的共性技术难题。科大讯飞也是最前沿的探索者。讯飞智能办公本X5的重量比上一代减少18%,厚度只有4.6毫米,相当一本护照的厚度,这能让用户差旅途中更方便携带。电池采用了比亚迪的4.5V高压电池,电池体积变小的情况下容量还增长了7%。

在X5上,讯飞团队也将主场景功能做到极致。

在最常见的会议记录场景,讯飞智能办公本X5采用八麦克风阵列,360度全向收音,高精度降噪、分角色识别。语音识别大模型加持下,普通话识别准确率高达98%,200+方言可切换识别转写,且支持8种外语互译以及9种外语识别,内置16大行业专业词库让转写更精准,同时还支持下方同步手写,会后回顾时,支持回听回看、即点即读、自动定位到关键点。

会后,它能迅速生成专业版式的会议纪要,2小时会议内容5分钟即可快速提炼关键信息。与此同时,Word、PPT、PDF、Excel等文档审阅、编辑、批注、AI写作、AI文档阅读助手、划词搜索、语篇规整、开放问答等功能一应俱全。

自动日程管理功能也非常丝滑,会议记录、办公本绑定邮箱等都可自动生成日程,还能根据内容自动生成日报/周报。办公本记录、手机查看、电脑编辑,一个App就打通了工作流。内置的百万册图书,也让办公、学习一体化,满足了职场人差旅场景需求。

“不是哪一个具体的技术打动用户,而是让他们发现一款真实的产品,能立刻解决他们办公中的痛点。”钟锟事后复盘认为,是讯飞精准抓住痛点并系统性解决了问题,才让智能办公本取得商业成功。

“从用户中来,到产品中去”的产品思维,帮助讯飞智能办公本完成了从1到N的过程,至今已经积累200多万用户。

再谈“野心”,如何从N到N的次方?

苹果手机重构了人们的生活、工作方式,微信改变了人们的社交方式。这些伟大的是未来的翻译官,将技术进步转化为产品,重构世界的交互方式。

讯飞智能办公本还未颠覆人们的办公方式,但讯飞已经进入正向循环。自2019年,讯飞智能办公本连续蝉联京东天猫双11的品类销量第一,已完成赚钱、继续投入研发改进产品,再赚更多钱做更好产品的正向循环。

这种循环也在带动墨水屏、电磁笔等供应链的技术进步。过去三年,依托科大讯飞等公司在手写体验、AI办公等方面的技术突破,办公本所需的电子纸出货量从年均10%左右的增速涨到接近100%的增速,已经成为最具潜力的电子纸细分市场。

科大讯飞董事长刘庆峰2014年曾设下目标,公司的业务要从语音智能扩展到更大的认知智能,产品要从能听会说到能理解会思考。

今天的X5办公本已非常接近刘庆峰11年前设下的让产品“能理解会思考”的设想。在大语言模型技术飞速进步的当下,钟锟表示,最终希望把办公本做成个人知识库的数字助理,服务更广大群体。每个人使用办公本或者其他产品后,随着使用时长的延长,记录下的信息都变成个人知识资产。本地大模型能在保密前提下学习这些信息,变成一个外接的第二大脑。

如果这个设想能实现,智能办公本就会真正成长为惠及多数人的产品,革新学习、生活、工作方式。

讯飞在智能办公本上的探索,也为硬件行业提供了一个标准的产品创造范本。从一个小的场景、小的需求出发,同时改进软硬件技术,软件为场景服务,硬件为软件功能服务,解决完小问题后,再慢慢改进,提升产品能力,让它渐渐被更多人接受,解决更大的问题。

这可能是有野心的AIC端硬件创业者们可以复制的道路。