感觉像是在做梦,老外兴奋到扇了自己一巴掌,这不可能是中国?

墨问前程 2024-11-28 15:38:38

“我从来没有这么兴奋过!”

最近发生了一件事,国内讨论很少,但是国产大模型的魅力让海外开发者纷纷直呼“真香”!

前段时间,Qwen2.5 32B发布并开源的消息在海外传开,youtube博主Cole Medin连夜爬起来启动电脑,下载模型,马上测试。

测试完之后,这位海外开发者兴奋得语无伦次,大喊“怀疑自己在做梦,不得不扇自己一巴掌以确保自己是清醒的,因为结果太疯狂了!”

Cole Medin收到消息,觉都不睡了,马上下载了Qwen2.5 32B,用AutoDev(开源AI编程助手)、Arborland Newfork(终极自动化编程工具)以及自己的一些AI代理进行测试,结果太好了!好到Cole Medin都觉得粉丝们可能会认为他夸大其词、不可能是真的,但看过他的演示之后,海外的开发者们不得不服!

Cole Medin用Qwen2.5 32B测试的第一个东西就是AutoDev,它是目前最好的开源AI编程助手之一。为了展示和考验Qwen2.5 32B的能力,Cole Medin决定先从一个非常简单的提示开始,然后逐渐增加难度。

首先,Cole Medin创建了一个使用Tailwind的React聊天界面,可以发送消息并收到回复样本。

接下来,Cole Medin开始添加更多的要求,包括UI要求、一些用户体验、一些功能性的需求。当迭代完成之后,更新后的聊天界面看起来好多了,可能有一些细节可以继续调整,但总体来说,Cole Medin得到了一个不错的加载指示器,收到了样本消息,一切看起来都非常棒。

Cole Medin激动地表示,可以继续改进样式,甚至可以真正连接一个API,将这个应用扩展得很远!

别看这样的功能相对还比较简单,Qwen2.5 32B在运行上表现得如此出色是非常难得的。Cole Medin甚至用了美国Meta的大语言模型Llama 34B来做对比,结果翻车得厉害!面对简单的指令,Llama 34B可以像Qwen2.5 32B一样完成,但当指令变得更加复杂时,Llama 34B就开始出错了。

海外开发者们不得不承认一个技术事实:本地大语言模型在能力上确实不如像大型云模型强大。很多时候,使用这些大型云模型确实很有帮助。

Cole Medin兴奋地感叹:有了Qwen2.5 32B,实际上可以用它构建几乎所有东西!

随后,Cole Medin展示了自己用Lane Chaining和Lang Graph构建的一个代理。他使用不同的工具来与Asana进行任务管理和Google Drive进行文件的上传、下载及搜索。而对于检索,Cole Medin集成了Chroma作为本地的向量数据库,这样基本上可以把来自Google Drive的信息添加到知识库中,供LLM回答问题。

Cole Medin选择了用这个代理来测试Qwen2.5 32B。根据用户的问题,大语言模型可以从很多不同的工具中选择。而海外的大语言模型经常出错。

Qwen2.5 32B的表现如何呢?

Cole Medin打开Asana,可以看到创建任务等操作。他展示了一个前端界面,支持流式输出,同时也打开了终端。粉丝们可以看到AI代理决定调用哪些工具。

Cole Medin输入了第一个问题:“我有哪些项目?”

打开终端,可以看到它调用了getAsanaProjects工具,从Asana API获取JSON结果。然后给出回答,项目包括YouTube、健身业务、个人和编程。这与左侧列表中的项目完全一致。

让人更加惊讶的是,Cole Medin的编程项目中的任务列表是空的。Cole Medin给了第二个指令:“在编程项目中创建一个截止日期为18号的任务。”

它需要考虑几个不同的因素,比如编程项目的ID、截止日期、任务名称等,然后用这些参数调用createAsanaTask。看起来不错,最终,它确定了截止日期和任务名称。

完成后,它告诉Cole Medin,已经在编程项目中创建了任务。再看Cole Medin的编程项目,果然,有一个截止日期为18号的任务,看起来非常棒。

最后,Cole Medin测试了一些与知识库相关的事情,比如从Google Drive下载会议记录并添加到知识库中。

要做到这一点,它需要先从Google Drive搜索并下载文件。看起来它最初没有找到文件,因为Cole Medin给的指令非常具体。所以它说没有找到文件,但Cole Medin让它搜索会议记录,给它一个更通用的指令。终于,它找到了823的会议记录,成功下载并添加到知识库中。

Cole Medin甚至可以回到数据文件夹,看到这个从Google Drive下载的文档文件。这些都让Cole Medin感到不可思议,而如果换了Meta的Llama 3 170B,可能早就失败了。

Cole Medin认为,现在本地和开源AI的世界非常令人兴奋,而Qwen2.5 32B就是最大的原因!

Qwen系列模型自开源后,下载量已经突破 4000万。Qwen的衍生模型数量超7.8万个,已超越Llama成为全球最大的开源生成式模型群。

众多海外开发者亲手测试之后,感觉如在梦中!中国AI大模型的实力实在是太惊人了,海外开发者们怀着复杂的心情,感叹“这简直令人难以置信”!相信随着国产大模型的不断崛起,老外对国产大模型强大实力的“难以置信”会逐渐变成“习以为常”!

0 阅读:13

墨问前程

简介:踏上取经路,比抵达灵山更重要