斯坦福大学AI研究小组被指抄袭清华大学的大型模型了?这事儿就像一个大炸弹,一出场就炸翻了全球AI圈。在这个信息量爆棚的时代,科技的每一步飞跃都有可能推动社会进步,但当这些火花被阴云笼罩,咱们就得好好想想:在追求顶尖技术的路上,道德和诚信的底线要怎么守得住?
故事从5月29日晚上开始,斯坦福的追梦学子们放了个大招,宣布他们搞出了个叫Llama 3-V的开源多模态模型,据说这模型不光性能能超越GPT-4的SOTA多模态大模型,最让人吃惊的是,训练成本低到只要500美元!这消息一出,立刻火遍全网,Llama 3-V风头一时无两,登上HuggingFace趋势榜首,感觉像是开源界的一次狂欢。
不过,好景不长,在一位眼尖的网友深挖之下,这个“创新”竟然露馅了。网友发现,Llama 3-V和清华大学背景的初创公司面壁智能的MiniCPM-Llama3-V 2.5模型,从模型架构到代码,甚至配置文件,都惊人的相似,就改了改变量名。而面壁智能团队也进行了对比和分析,发现两者在识别还没有对外公开的“清华简”战国古文字时,所表现的能力一模一样,连错误都一样。再次印证了这就是抄袭。
面对排山倒海的质疑,Llama3-V团队努力进行解释,指出他们仅仅是采纳了MiniCPM-Llama3-V 2.5的分词器技术,并强调他们在MiniCPM-Llama3-V 2.5公开之前就已经着手此项目。但面对网友的质疑,Llama3-V团队的迅速删除评论,这一举动再次加剧了外界对其涉嫌抄袭的猜疑。
最终,斯坦福团队的Aksh Garg在社交媒体上回应了,说是团队里的Mustafa Aljadery独立写了所有代码,同时也为没严格审核原创性道歉。这话一出,既是对事情的回应,也是对学术诚信的反省。而斯坦福AI实验室老大Christopher David Manning也公开批评,把这件事情推上了风口浪尖,这表达了他对清华开源模型的肯定,对受害者的安慰,也是对科技界价值观的再次确认。
面对这次事件,面壁智能CEO李大海在朋友圈的发言也挺有意思的。他的话里,有对自己公司创新成果被窃取的无奈,也有对更好科技生态的期待。他说,每一次创新都是团队汗水的结晶,建立一个开放、合作、互信的社区环境,对AI领域的发展太重要了。
斯坦福AI团队的这起抄袭事件,就像一面照妖镜,照出了科技飞速发展过程中,所面临的伦理和诚信问题。这不只是斯坦福和面壁智能的事,是每个科研人员,每家科技公司都要面对的问题。其实不管是学校还是市场,尊重原创,保护知识产权的底线必须守住。在追求技术高峰时,别忘了,真正的创新不是抄过来再随便改改,也不是简单的复制粘贴,而是思维碰撞和实践探索的结果。
未来,在面对科技快速发展与道德伦理的碰撞,你觉得我们该如何才能保持创新、诚信之间的平衡?