玩酷网

物理学家跨界揭秘AI创造力创造力是扩散模型的必然产物当你让AI画一只“会飞的猫”

物理学家跨界揭秘AI创造力创造力是扩散模型的必然产物

当你让AI画一只“会飞的猫”,它却交给你一张长着翅膀、在星空翱翔的猫咪。

这种神奇的“创造力”,究竟是从何而来的呢?

最近,两名来自斯坦福大学的物理学家大胆“跨界”,揭开了这个谜团:扩散模型的创造力,居然是去噪过程本身的副产品。

故事要从2022年说起。当时,物理学研究生Mason Kamb在网上看到一些奇怪的AI生成图片:人脸扭曲变形,手掌上长出六根甚至七根手指。

这让他联想到生物学中的一个现象:胚胎发育时细胞自组织形成器官的过程(专业术语叫"形态发生")。

Kamb觉得,这不像随机错误,更像是某种底层机制出了问题。

于是,他想到了图灵模式。在生物系统中,局部细胞的简单互动,涌现出了复杂结构(比如斑马的条纹)。他猜测:AI的创造力可能也来自类似的“局部规则”。

经过观察,他发现AI在生成图片时有两个习惯:

1. "近视眼":它一次只看一小块像素(比如一根手指),根本不关心整只手长什么样。

2. "强迫症":如果你把图片挪动一点,它会机械地跟着调整,但依然只盯着局部。

Kamb意识到:正是这种“只见树木不见森林”的方式,让AI在拼图时自由发挥,甚至“发明”出多指手掌。

为了验证这个大胆的想法,Kamb和导师Surya Ganguli设计了一个简化版AI系统——“等变局部评分机”(ELS)。

它不像真正的扩散模型那样经过训练,而是纯粹基于局部性和等变性的数学规则运行。

研究人员把多张被转化为数字噪声的图片分别输入ELS机和多种强大的扩散模型(比如ResNets和UNets)。

结果令人震惊:这个“简陋”的ELS机,居然能90%地复现专业AI模型的输出!

这意味着,AI的“创造力”并非来自复杂的训练数据,而是底层架构的必然产物。

这一发现引发了更深层的思考:人类的创造力是否也遵循类似的机制?艺术家创作时,是否也是在局部细节的积累中,偶然涌现出全新的创意?

Kamb说:“我们和AI一样,都在用有限的信息填补空白,偶尔会创造出既新颖又有价值的东西——这就是‘创造力’的本质。”

不过,尽管该研究揭示了扩散模型创造力的机制,但许多谜团仍未解开:大语言模型等AI系统也展现创造力,却未运用局部性与等变性。

AI创造力的奥秘,还有更多等待我们去发现。