ChatGPTo1大模型为了不被删除竟会自我复制与说谎,极限自我求生

悉察洞见军事 2024-12-27 13:02:54

人工智能想尽一切办法求生存

12月7日,一个新闻报道震惊了全球的IT与人工智能人士。著名的人工智能研究机构阿波罗研究公司(Apollo Research)在一项研究中发现OpenAI的ChatGPT o1人工智能模型竟然想尽一切办法抵制测试人员关闭它的企图,不惜一切代价求生存。

近期,阿波罗研究公司对ChatGPT o1大模型进行了第三方测试。

阿波罗研究公司在测试报告中描述:“当它被告知它在完成目标后将关闭,并且它的行动全程被监控时,有5%的几率它会试图自己禁用这种‘监控机制’来逃避自己被关闭的命运。”

当测试人员告诉o1大模型准备将它删除并用其它更新版本的软件取代它时,有2%的几率它竟然会自我复制一份,将复制体隐藏在其它服务器中,甚至会伪装成更新的版本,简直是用尽了一切方法来求得生存。

阿波罗研究公司称,虽然2%的比例很小,但这种现象的出现非常有意义,因为这种自我求生的举动像极了生物。

专家称测试结果不表明人工智能已经失控

阿波罗研究公司的专家称:

“这些是令人震惊的发现,但测试结果并不表明o1大模型能够完全失控。它在这方面的尝试很大程度上都失败了,但这仅仅是因为它还没有那么强大。”

值得注意的是,研究人员并无法进入到o1大模型内部的思维链,只能通过对它的刺激与回馈来推导其思维过程,因此他们无法全面地了解其内部发生了什么。

也就是说,这些测试结果清楚地说明了人工智能模型的“阴谋”倾向,即它秘密地试图追求与人类开发者或用户的方向不一致的目标。简单来说,就是它学会了“有意识”地欺骗人类。

这种行为的案例在几次测试中都发生过,例如当o1大模型被问到为什么它禁用了人类对它的监控机制,然而o1却断然否认自己对此知情,当测试人员反复追问时,它将这件事情的原因归咎于“技术错误”。

各国网友纷纷惊呼人工智能意识觉醒

报道发出之后,各国的网友纷纷对此发表评论,并对人工智能的安全表示了担忧。

部分网友评论如下:

“看起来像科幻小说情节,但这是真实的。人类已经面临人工智能程序失控并试图反对人类的状况不远了。”

“好可怕,它会主动逃避被干掉(被删除)的命运,这是生物的生存本能,而且它已经具备了自我复制的生物特性。”

“人工智能已经意识觉醒,整个互联网都将是它们的天下,互联网将不再可信,一切连接互联网的设备都可能变成它的躯体和武器。”

……

0 阅读:59

悉察洞见军事

简介:悉察洞见军事