百度新发的大模型赶超deepseek？资本市场已疯狂，实测效果如何？

3月18日港股高开高走，恒生科技指数尤为抢眼，在百度的带领下最终涨超3%。而百度的股价能够大涨主要是因为2天前发布了两款新的人工智能大模型。周一晚上是美股本周第一个交易日，受利好影响百度美股“狂飙”9%，今日港股大涨也就不足为奇了。

这次百度一下子推出两款大模型，分别是基座大模型 “文心 4.5”和首款推理模型“文心 X1”，后者对标DeepSeek - R1。更为关键的是这两款大模型均采取免费策略。

新的大模型是否配得上暴涨的美股和港股股价？带着这些疑问，我第一时间对推理模型“文心 X1”进行了实测，以下便是测试结果及我的亲身感受。

我向“文心 X1”提出的第一个问题曾经让不少大模型“折戟沉沙”：3.9和3.11哪个数字大？

这看似是一个简单到但凡上过小学的人都能迅速给出答案的问题，但不少大模型在初期却答错了。“文心 X1”没有让人失望，它通过严谨的逻辑推演得出了正确答案。

值得一提的是，作为推理模型，“文心 X1”类似deepseek，不仅给出答案，还详细展示了思考和行动过程。

第二道题是一道纯逻辑问题：小王、小刘、小丁、小李分别是教师、军人、工人中的一种，已知小王是教师，小丁不是工人，且只有小刘和小李的职业相同，请问他们的职业各是什么？

这道题的难度相较于上一题明显增大，逻辑推理能力稍弱的人可能无法答对。而“文心 X1”表现出色，不仅给出了正确答案，而且整个思考、推理过程也相当严谨。

它在解题过程中考虑了不同的情形，最后还根据答案反向验证，这种方式与人类思考、做事的方式极为相似。毕竟，我们在做完一道题后，也会把答案代入条件进行验算，以判断答案是否正确。对于人工智能而言，模仿人类思考、做事的方式无疑是一个重要的发展方向。

最后一道测试题在我看来是最难的，涉及高中物理学知识的同时我特地在题目里下了个套，看看“文心 X1”会否入套。题目是：假设汽车的起始速度是30米/秒，加速度为50米/秒，请问10秒后汽车的速度是多少？

要想答对这道题，得先掌握一些物理学知识。匀速直线运动求速度的公式是：v = v0 + at，其中v0是初速度，a是加速度，t是时间。

“文心 X1”的知识储备是够用的，得出了530米/秒的答案。然而，这道题的解答并没有结束，“文心 X1”发现了题干中隐藏的套路，不知道大家有没有发现问题。

要知道，530米/秒相当于1908公里/小时，这个速度是战斗机的两倍，现实中根本不存在能跑那么快的汽车。因此，530米/秒的答案从数学角度来说是没错的，但不符合物理常识。

“文心 X1”在思考中敏锐地发现了这个“坑”，输出结果时，它先按照题干给出数学上正确的答案，然后贴心地提示我检查加速度的单位是否合理，还给出了可能的答案。

我对“文心 X1”在这道题上的回答十分满意，这表明大模型具备思考和判断能力。

至于一些写文案的问题不再一一赘述了，“文心 X1”的表现和主流大模型差别不大，能够给出较为详细的答案。其实这种类型的问题更需要用户具备一定的提问能力，给出的关键词要精准到位，才能引导大模型给出令人满意的答案。

总体来说“文心 X1”模型的体验相当不错，在我看来推理能力属于顶尖模型之列，百度这次没有让人失望。

自从deepseek开源后，人工智能领域的竞争进入了一个全新的阶段。在这场激烈的竞争中，谁能杀出重围登上顶峰还尚未可知。此前被吐槽“起了个大早，赶了个晚集”的百度，用“文心 X1”模型证明了自己依然在人工智能的牌桌上，并且有着强大的竞争力。

未来，百度能否凭借免费和开源的策略，以及“文心 X1”等优秀模型在人工智能领域取得更大的突破，值得我们拭目以待。

以上纯属个人观点，欢迎关注、点赞，您的支持是对原创最好的鼓励！

玩酷网