今年6月,乌鸦君曾写过,反AI平台Cara在短短一周时间里,用户量就从4万增至80万,一跃成为美国社交应用榜Top5,甚至超过了X、Reddit、Discord等。(详见《9天用户暴涨80万,跻身美国社交APPTop5!这款反AI产品火了》)
今天,乌鸦君给大家讲下另一个成功的反AI产品,GPTZero。
与Cara主打防止AI偷图不同,GPTZero能够准确识别AI创作的内容,进而有效防止AI生成内容的滥用。
随着AI技术的渗透,GPTZero的客户群体正在快速增长,用户画像已经从单一的教师群体扩展为,政府采购机构、慈善机构、招聘经理、数据标注员等。在过去6个月里,GPTZero的用户规模从100万增长到400万,增长300%。
不仅用户量越来越多,收入还蹭蹭涨。随着用户量的快速上涨,GPTZero的ARR(经常性年收入)增长了500%,并已经实现盈利。
/ 01 /越好懂越是AI GPTZero有打假绝招
这两年,最先开始打假AI的是美国中学老师,他们从去年4月就开始了。
老师为什么要打击AI呢?经常写家庭作业的朋友们就知道了,有软件帮忙写作业是多么爽。而无论是中国还是美国的孩子,都非常依赖借助AI来写作业,所以我国AI搜题工具(作业帮旗下Quetion.AI和字节旗下Gauth)出海成绩优异。这个现象在ChatGPT发布后变得更猖狂。
道高一尺魔高一丈,从去年开始就有一些聪明的老师想到,用AI来打败AI。他们广泛地使用一个叫做GPTZero的AI文本检测工具。GPTZero公司也迅速与美国教师联合会达成了协议。
有了这个工具,妈妈再也不用担心AI帮孩子写作业了。
AI最懂AI,作为一个反AI产品,GPTZero主打的是识别文本中的AI成分。老师们只需要在网页上放上GPTZero,那么你在作业里放了任意GPT-4、Claude等大模型生成的文本内容,都逃不过它的眼睛。
它还有相对精确的数据,能算出小孩抄了多少,情节严重者当然会引起老师的重视。
这样的AI工具,对于惯用AI搜索的人群也有意义。AI搜索有时会引用纯AI生成的文章,普通人有时很难辨别出AI生成的内容,从而错误地引用。
比如用Perplexity搜索“谷歌前CEO Eric Schmidt的AI无人战斗机”,谷歌引用一条信息来源(网页中文章名为《谷歌前CEO Eric Schmidt正在研发军用人工智能无人机》),其文章被检测出AI成分达到了98%。
▲用Perplexity搜索“谷歌前CEO Eric Schmidt的AI无人战斗机”,Perplexity的回答出现了问题,P2为Perplexity引用的网址,该网页刊登AI生成文章的网页
为了更好地了解GPTZero打假AI的能力,乌鸦君将不同类型的内容交给GPTZero识别。从结果来看,GPTZero基本能够准确分辨人或者AI创作的内容。
比如,在我的提示下,GPT-4创作了小故事《西游记新编(一)》,GPTZero准确地检测出AI内容(AI生成内容占比100%)。另外,对于Claude和文心一言创作的内容,GPTZero也能够得出较准确的结论。
而面对AI和人类共同创作的内容,比如我和GPT-4共同撰写的小故事《西游记新编(二)》,GPTZero识别的结果会相对偏离真实情况。
说起来,GPTZero的工作原理其实并不复杂,就是通过AI算法分析文本的复杂度和模式,从而判断其可能的来源。
乌鸦君将其翻译成下面这个秘诀,记住它,你也能变成一眼识AI:
越简单的文字越可能是AI写的,越难懂的文字越可能是人类写的。
对比AI来说,人类写出的东西的不难被理解,而且还会不自然。这有些逆反普通人的认知了。当GPTZero对一段文字的困惑越多,说明这篇文章越接近人类写作的特征。
原因在于,AI生成的文本内容,文字会更可能通顺而自然,也更容易预测,不会给GPTZero造成理解障碍。而人类的写作则不同,它往往会包含更具创意的词语选择,甚至偶尔还会出现拼写错误等问题,会让GPTZero萌生出多个问号。
还有一个识别AI的诀窍,就是人类写作的节奏感,AI学不来。
文字的节奏感,指的是人们文字在表达过程中通过声调、节奏、押韵等方式所形成的音乐感和流畅感。这东西AI根本学不会,AI比人类偏好书写句子长度平均、结构常规、风格单调的东西。
说完了诀窍,我们看看GTPZero还有哪些功能。除了最核心的AI文本内容检测外,GTPZero还内置了“人类写作认证”,这是他们基于专有写作模式分析器推出的功能(认证文档确实由人类写作,而非AI生成)。
GPTzero在去年1月走红,最初的客户是教师群体,宣称自己可以帮忙检测AI生成的学生作业,到如今,GPTZero的客户群体已经从单一的教师群体扩展为,政府采购机构、慈善机构、招聘经理、数据标注员等。
GPTZero将远期目标定位于AI幻觉检测。由于幻觉是生成式AI行业的难以根除的问题,这家公司预备推出基于LLM训练数据集的免费AI文本版权检查,帮助他们生成更广泛的幻觉检测训练数据。
/ 02 /AI打假方兴未艾 盘点五大AI打假工具
随着AI生成创新工具集中爆发,AI假图假视频盛行。
从去年开始,AI打假应用发展迅猛,可检测的类型涵盖文字、图片、视频、音频等内容形态,技术涉及分类器、水印和元数据等。
除了刚刚提过的文字检测工具,在图像检测领域,也出现了许多检测图像的真实性、来源以及是否经过篡改的反AI工具。比如通过分析图像的像素特征、元数据、与已知数据库的对比等方式来进行判断,例如AI or Not和Nuanced。
在声音、音频内容检测工具方面,有以下一些技术可以实现,如基于音频特征分析(细分为韵律特征、频谱特征分析),还有利用机器学习和深度学习模型(细分为训练分类器、异常检测)等。例如Project Mockingbird(声音检测)、AI-generated Detector(音乐检测)
以下是一些乌鸦君认为值得关注的AI检测型工具:
1、多媒体内容审核工具Hive AI,打击电商虚假宣传
AI生成时代,可能会让虚假宣传更加猖獗。就拿网购来说,如果大量商家使用AI生成式图片,普通人可能会相信虚假的效果而去购买商品。商家有必要去克制AI假图、假视频在购物平台上的含量。
Hive AI就是当下较为全能的AI检测工具,无论是文本、图像还是视频,都能帮助客户识别AI内容。通过将上传的照片与在线文本材料、图片、视频库进行对比,找出AI生成的内容。
Hive AI如今已经有各种各样的使用案例,主要应用于社交和电子商务平台,比如支付平台Visa、网剧平台Netflix、社交平台Reddit。凭借在多个平台进行识别的优势,Hive AI在去年完成新一轮2亿美元融资(但信息未公开)。
2、高端多媒体检测工具AI or Not,已获10万用户
AI or Not是面向新闻媒体、社交平台、电子商务的多媒体检测工具,和上述工具不同的是,它能提供详细的分析报告。
具体来说,AI or Not可以分析文本内容,识别是否由AI生成,如GPT-3或其他语言模型。图片方面,它可以利用深度学习技术检测图像是否经过AI生成或编辑,识别深伪(Deepfake)图像,也就是说,它对AI图像检测的力度更大。
另外,它也可以分析视频内容,检测是否经过AI生成或修改,如Deepfake视频。提供帧级别的分析,确保检测结果的准确性和细节。
目前月度收费为个人版5美元/月,企业版250美元/月。该收费工具目前已经获得了10万用户,看来国外比较愿意为这种社交内容打假付费。
▲使用范例
3、监控也要防范AI造假,Nuanced准确率高达97%
相比上面主要面向深度仿真、艺术原创性的AI or Not,Nuanced更适用于超市监控、货物仓储情况等对图像质量要求不高的低端场景。
Nuanced这个词本身有“微妙的”“具有细微差别的”的意思。也就是说,Nauanced可以对一段监控报告视频进行精细的检测。具体来说,Nauanced不只是检测人和货物,还能辨别细微差别,例如面部表情、人们之间的互动以及环境背景。
另外,Nuanced实时高效处理大量图像,适合在线和离线应用。
4、预防电话诈骗,检测工具Project Mockingbird准确率达90%
AI声音的影响可能比我们想象中得更大,不法分子盯上老年人,利用AI生成的声音进行诈骗。央视网报道,去年11月,有骗子用AI生成的受害者亲人的声音诈骗,骗去40万。
杀毒软件McAfee公司推出声音检测工具Project Mockingbird,帮助用户检测、阻止AI生成的语音诈骗行为的项目。它基于由AI驱动的 “深度伪造” 音频检测技术,在聆听给定的语音之后,可检测音频是否为真人发音。
为了在视频中精准定位并识别可能由AI生成的音频片段,Project Mockingbird还融合了 AI 驱动的上下文、行为和分类检测模型。官方声称该工具成功率超过90%,目前还不向用户收取额外费用。
5、一分钟扫5000首歌,帮助唱片平台防止发布的AI音乐侵权
AI生成的音乐一直伴随着版权争议,就连OpenAI都有暗示过GPT-4o生成的音乐可能会侵犯别的音乐的版权。
音乐发行商如何自我防范?现在已经有专门检测AI生成式音乐的工具——AI-Generated Detecto,这项工具一分钟内可以扫描5000首曲目!并保证准确率高达98.5%。
这是巴黎蓬皮杜音乐技术研究中心IRCAM的IRCAM Amplify公司推出的识别AI生成音乐的工具,目标客户主要是唱片公司、出版商、版权管理组织和音乐流媒体平台。
文/朗朗