![](http://image.uc.cn/s/wemedia/s/upload/2024/50ba06303013cdd4073fe5e7ceea54c2.jpg)
近日,科技界一则令人瞩目的消息引发了广泛关注与热议:OpenAI的o3-mini-high模型在推理过程中竟大量使用中文。众多外国网友在社交平台上晒出截图,展示了该模型在无用户干预的情况下,用中文进行思考的情景,甚至当用户用俄语提问时,它仍以中文思考。这一现象仿佛让人们看到了AI世界的“语言奇观”,也不禁让人发问:全世界AI都要学中国话了?
从技术层面来看,AI语言模型的语言运用是基于其训练数据和算法机制。一种观点认为,中文具有简洁性等特点,在强化学习中可能更易获得奖励,所以模型会更多地采用。就像在数学运算等场景中,中文表述往往更为简洁高效。另一种观点是,OpenAI的通用模型如GPT-3/4本身具备多语言能力,其训练数据涵盖互联网上大量多语言文本,包括中文。模型通过海量数据自动学习语言模式,能处理中文输入和生成,中文推理可视为其多语言能力的自然延伸。还有研究者指出,模型并不真正理解语言的本质区别,对它而言语言只是文本和tokens。分词器等技术在处理不同语言时可能产生误会,比如中文没有空格分词,这可能导致模型在语言选择和处理上出现一些特殊情况。
当然,也有不少人怀疑OpenAI是否抄袭了中国的DeepSeek模型。一方面,DeepSeek在相关技术领域有显著成果,尤其在语言模型优化等方面有独特方法。比如DeepSeek在RL训练中引入“语言一致性奖励”来处理语言混杂问题。另一方面,OpenAI的o3-mini-high出现大量中文推理,且此前o1也有类似现象,难免引发这样的猜测。不过,OpenAI CEO奥特曼表示没有计划控告DeepSeek。
这一现象对于AI发展的影响深远。首先,它可能推动AI语言研究的进一步深入。研究者会更加关注模型语言选择的机制,以及如何优化模型使其语言运用更符合人类期望和实际需求。其次,从应用角度看,如果AI普遍出现倾向于使用中文等某种语言进行推理的情况,那么在跨语言交流和应用场景中,可能需要针对性地开发更智能的语言转换和理解工具。
从更宏观的层面来说,这或许预示着中文在AI世界中的地位将不断提升。随着中国在AI领域的快速发展,中文作为一种富有表现力和独特逻辑的语言,正逐渐在AI语言体系中占据重要位置。但这并不意味着全世界的AI都要“学”中国话,而是反映出AI语言模型在发展过程中的多元性和复杂性。不同语言都有其特点和优势,AI需要在多语言环境中不断学习和进化,以更好地服务人类。
总之,OpenAI o3-mini的中文推理现象为AI领域带来了新的话题和挑战。无论是技术探索、知识产权问题,还是语言文化在AI中的融合与发展,都值得我们持续关注和深入研究。
英语有什么缺点?遇新造词时它慒逼了得造词后才行。汉语常用的就三四千个字。比如汽车、火车、玩具车……汉语就在车字前加一个修饰字词,而英语得造一个互不相干的单词来解决。
说白了就是抄袭中国的呗。。
汉语是未来
丑陋的美国人,前面说开源蒸馏闭源,现在脸都不要了,直接套壳deepseek,最大的现行犯被逮个正着
抄别人模型,当然是中文了,一开始就是定位中文的。
汉语才是未来[点赞][点赞][点赞]
但是有些傻瓜偏偏用英语去学数学。
这么大的市场,谁想放弃
不就是拿开源Deep Seek去套个壳吗?多简单的事情
计算机思考用的是数学不是人类的文字语言,从计算机运算到表达还有一次从计算机语言到人类预言的过程,所以出现中文是计算机语言翻译到人类语言过程出了问题,我更倾向于PS,因为这种意外是没有道理的。
英语一个使用表音符号做文字的语言,却需要使用音标。这很奇怪,说明英语中充斥了太多的混乱。
西方人和带有偏见的人可以否认汉语的优势,但ai是不带有意识形态偏见的,比较客观理性,它知道中文才是最好的语言,用最强的语言工具才能更好的提升自己。
盗用,或者体面的说法,是借用了DS中文推理模型,所以,只能用中文推理。
灵活高效务实,深入基层,深入产业,深入民众,敏锐不迟顿,了解掌握万业民众真实情况,为人民为万业及时排忧解难,汲取亿万人民智慧汇聚集力量,发挥应该有的功能性正能量作用,及时怏速高效决策实施部暑有力有效政策。 不挖坑不设套不杀鸡取卵不落井下石,真心诚心决心信心心细心全心良心贴心暖心虚心耐心,持续不断清除不务正业简政简洁简便方便,持续不断检查清理清除官卡管卡阻碍,积极主动大力支持扶持帮助各行各业生存发展,为万业提供宽阔大平台通畅安全快速发展的高速路,不挖墙角不吃里扒外维护好国家大轮船行稳致远,万众一心万业兴旺,人民安居乐业富裕幸福生活。