亚马逊决定不装了，用户的语音数据要拿走

AI将是未来，如今这已经成为科技行业无可置喙的共识，当成百上千亿的资金被投入AI领域，即使跨国巨头也都没法再稳坐钓鱼台，不得不陆续撕下以往对用户温情脉脉的面纱。

日前根据The Verge的报道显示，亚马逊方面宣称Echo智能音箱会将用户所有的语音记录发送至云端，从3月28日开始，他们将禁用录音保存在本地的隐私设置功能。按照亚马逊给用户发送的邮件中的说法，“随着我们继续利用依赖亚马逊安全云处理能力的生成式人工智能功能来扩展Alexa的能力，我们已经决定不再支持这一功能。”

要知道智能音箱将用户的语音发送到云端，可是一件极为敏感的操作，早在2019年围绕这一行为就曾在海外市场爆发过一次巨大的舆论风波。当时，彭博社、《卫报》等海外媒体陆续曝光了谷歌、亚马逊、苹果、Meta、微软等公司，集体通过智能音箱收集用户语音的行为。

比如，苹果会将上传至服务器的Siri对话录音发送给外包商，用以对Siri的表现进行评价，并分析回答是否准确等。但需要注意的是，这些Siri的对话录音中还包含了与用户隐私关系极为紧密的敏感信息，其中例如医患交流、商务谈判，乃至不可描述行为等。

彼时在舆论的压力下，亚马逊被迫允许Alexa用户可以选择对语音不进行人工审核，并表示，“不管是媒体还是用户都知道，很明显我们在这方面做得不够好”。其实亚马逊当时让步的原因很简单，如果智能音箱成为了窃听器，就会沉重打击消费者对于智能音箱的信心，毕竟对于任何人来说，都不想在自己家中放一台会无时无刻进行窃听的智能音箱。

那么问题就来了，亚马逊为什么没有吃一堑长一智呢？并且在2019年之后，全球网民对于隐私安全不仅没有变得更宽容，反而愈发注重。对于用户这样的变化，作为科技巨头的亚马逊显然不可能不知道，所以他们明知不可为而为之自然是有理由的。这个让亚马逊不惜得罪用户的理由，其实就是生成式人工智能。

没错，亚马逊用Echo智能音箱来收集用户的语音信息，并不是依此向用户推销相应产品，而是为了迭代AI。诚然在过去两年的时间里，Scaling Law一直是AI研究前进的风向标，ChatGPT、Gemini、Claude，乃至DeepSeek都是诞生在它的基础上。

所谓Scaling law，简单来说就是想要训练出更强的大模型，就需要在预训练阶段投入更多的语料。如果要评选过去两年最猖狂的版权破坏者，海盗湾等传统盗版网站其实根本不够资格，OpenAI、Anthropic、谷歌、苹果、英伟达或许才是佼佼者。

硅谷的大佬公开支持AI初创公司窃取数据，OpenAI等AI大厂更是猖狂到视版权保护为无物，甚至逼得400多位好莱坞明星签署联名信反对他们随意使用版权内容来训练AI。这些AI大厂现在更进一步，开始试图争取特殊的法规豁免，以便于直接使用受版权保护的语料训练AI。

更为重要的是，在一众语料数据里，语音其实是一个极为特殊的存在，因为它需要相当强的真实性来让AI跨越恐怖谷效应，进而使得用户认为与AI的对话与真人无异。一个有趣的现实，是如今在顶尖AI厂商推出的多模态大模型中，视频能力往往要远胜于音频能力，就是因为真实的人类语音交流样本数量不足。

这时候，屏幕前的你应该就明白为什么亚马逊非得让Echo智能音箱把用户的语音记录发到云端了。毕竟这些情景各异的人类真实对话片段，最大的特性就是环境噪声以及用户处于自然而非刻意的环境下，有着“贵在真实”的特性。

对于亚马逊而言，用户的厌恶可能不会长久，但如果在这一轮AI竞争中落于下风，才是真正动摇其根基的大事。所以亚马逊的策略就是典型的“该省省、该花花”，能不花的钱就一定不花。

玩酷网

亚马逊决定不装了，用户的语音数据要拿走

三易生活