早上起来,照例喝上两杯咖啡上个茅房。蹲坑拉屎的时候刷刷头条。就看到老詹写的这个:

伴着括约肌的舒畅就简单的回复了一下:

拉完了,那么咱们就展开说说:
对于大语言模型,其实国内的项目都很拉垮。这话说的很绝对,但事实上总结一下就是“在坐的都是垃圾”。别怪W君口冷,但自己看到的事实的确如此。
W君先不否定DeepSeek的“火”,只不过要了解一件事情的发展脉络,首先是不是要先问几个为什么呢?
DeepSeek的爆火,从本心上来说W君还是很高兴的,理由有三个:
第一、这是一款很具有象征意义的产品,在提振我们的士气方面有着榜样性的作用,可以说我们用了中国人特有的智慧打破了西方的封锁垄断,在大模型这条被西方列强设下层层壁垒的领域走出了自己的一条路。这件事是绝对要点赞的事情
第二、DeepSeek爆火这件事本身成为新闻热点对普通国人认识和了解人工智能技术是有积极的促进作用的。之前对人工智能的各种不切实际神乎其神的传说现在就触手可及的摆在了大家面前,虽然W君说DeepSeek还是一碗土豆粉,但这碗土豆粉可以摆在大家的面前,让大家了解到它和粉条还是有区别的,这就是爆火的意义所在,也值得点赞。
第三、DeepSeek是破局的尝试,它启发了专业团队从另一个角度考虑问题,不再拘泥于算力霸权,发挥了中国人多快好省的思路,这是一个大语言模型领域中胜天半子的妙手,让我们从更新的角度来看待大语言模型的训练和使用,也是一件值得称赞的好事。
好了,彩虹屁就到这里,否则就不是W君的风格了,说下为什么DeepSeek就是一碗土豆粉:
W君自己实际上在很早很早之前就把人工智能放在了很多的工作上,毕竟,人嘛“懒”是第一必要性。在2015年的时候,我们就推出了一个简单的人工智能”对话“模型,用在自己的公众号上和粉丝互动聊天,解决一些日常的交流和沟通的问题。

其实实现起来挺简单的,甚至都不需要通过神经网络仅仅利用数据库查询的方式就可以达到目的——提取一句话的关键词向量,在历史对话中找到最贴近的一句话再进行转译,对话的时候根据AI自己发出的内容和用户回复的内容再进行新的一轮学习,以至于到最后这个方式也成功的忽悠了粉丝们很多年。直到17年,有粉丝问一些涉及港台的问题,这个功能就渐渐下线了。
再后来引入了神经网络并结合之前积累的对话数据和文章数据对粉丝的作品进行评价打分,这个AI也就彻底的沦为了一个后台工具不与粉丝直接见面了。
A.I.莉莉娜其实就只是一个例子,在工作生活的各种领域,其实都有很多人工智能的工具替着W君在干很多的具体工作。甚至W君自己的家本身就被装成了一个巨大无比的电脑系统,无时无刻的享受着人工智能带来的便利。
当然了,很多人难以想象连床底下、沙发底下都有小主机

满屋子遍布摄像头

每个月电费过千的智能化生活是什么样子的,但是W君是可以负责的告诉你——真T·M·D爽。
其实大家也不用羡慕或者不屑,这本身就是未来的方向,只不过W君现在来看市场上并没有真正可用的智能生态系统,也就自己在家里搞了一个相当土炮的“土豆粉”方案。至少W君认为大方向还是对的。
大语言模型实际上也和W君的家是一个样子的。目前世界上并不存在一个很好的方案来真正的帮助大家实现真正有价值的正向增益。
实际上就和智能家居一样,在大多数人用起来最终的感觉就是“也就那么回事”,也像一样没有彻底的把大模型玩明白,就下了一个判断“DeepSeek的致命伤——说假话”。W君也是和老詹一样,在很久很久之前就把大语言模型的AI放在了写文章的工具的位置上。
但不一样的是,我们较为深度的发掘了大语言模型的功能。最初军武数据库是有一个编辑部的,三教九流的什么编辑都有,从退役的参谋到刚毕业的大学生在人员配置上还算齐全,在有一段时间里面军武器数据的文章中会出现不止W君这么一个花名,还有很多其他的。当时为了让不同水准的人写出高质量的军事类文章,我们是有一些内部的工具的。例如在确定了一个发文计划的时候就会进入构筑文章内容的过程。这时候我们就利用了AI的架构

定义了一个文章结构的决策树先将编辑们要写的文章的大纲整理出来。其实,现在这套决策树系统也在用,已经和ChatGPT高度整合。

当然了,我们还有一些不能让大家看到的很多数据库的接入系统,只做内部参考使用。但就目前的简单写作功能,实际上ChatGPT就已经比很多的真人编辑要好用多了。

而且,这个系统可以快速的修改风格和理解编辑意图,例如:

这其实才是AI写作的真正用途,不过,在此之前的设定和提示词其实是要特别的微调和设计的。

做个对比,在这一点上DeepSeek实际上还有很远的路要走,甚至是以目前为DeepSeek的架构设计基准是根本做不到的。
不过,现在大多数国人嘛总是习惯接受碎片化的信息,所以知道前面说的DeepSeek爆火的三个让W君高兴的理由也就够了。
而真正动心思去用大语言模型的大多数人往往就觉得大语言模型能给自己偷点懒也就是基本上诉求了。
而至于DeepSeek到底是说真话还是说假话并不在大多数人使用AI模型的需求之列。那么即使是容忍DeepSeek的“说假话”现在这个工具真能用在W君的工作中了吗?
还真别说,尝试过了,依旧是不能!在春节期间W君自己写了一个Chrome插件“头条创作助理”。

干什么用的呢?主要是用来自动化删除不和谐的留言的,现在网友素质良莠不齐,因此有必要做一个AI助手来判断一下大家的留言,哪些显然没有长脑子的话该删除的就删除掉、该拉黑的就拉黑。

当时就考虑了使用DeepSeek的AI模型执行判断,主要是因为DeepSeek相对便宜,这些操作如果扔给ChatGPT来做,每天可就要产生相当可观的费用了。但是经过几天的实际使用,钱的确是没花多少,只不过大部分时间把信息发给这个模型,最终是等不来结果的。

今天我们再去看这个模型的后台界面就发现实际上在1月底的这几天一共就花了三毛八分钱。但上面的橙色提示是几个意思?“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停 API 服务充值。存量充值金额可继续调用,敬请谅解!”这对于真正的大规模付费应用来说就是用完了余额就不能再用的节奏了?这碗土豆粉还是稀罕货了?
所以,从2月1日给火山引擎冲了10块钱,把这个“头条创作助理”的AI部分直接转入了豆包大模型。选了一个简单的小规模模型,一天就一分钱而已

但别小看这一分钱,每天在做自己的“清朗”行动。

真就让哪些狗屁不通的留言玩氮气去了。

其实,这就是AI真的能帮你做的事情之一,但就目前DeepSeek的服务质量来说以及现在不让充值的问题来看,这种事情DeepSeek依然是做不来。不好意思,W君会冷静的用脚投票,只会认为这碗土豆粉里面或许还有食品添加剂的问题了。
昨天还爆出了DeepSeek被ai的顶级域名指向的新闻,各种报道又一轮铺天盖地的“遥遥领先”,其实说句真正用AI的用户的真心话,有那些钱升级下服务器资源不好吗?土豆粉用檀木盒子装不还是土豆粉吗?更严重的是“问题不是它便宜吗,而是它连便宜都做不好!”
再说AI的“虚情假意”的事情,咱们就不说DeepSeek了,毕竟这种条件的DeepSeek根本做不了深入交流。例如这样的事情大家是不是都能看到?

大部分使用经历很难让W君真正的判断DeepSeek的真实功能,毕竟开头一句话可以回答,再说第二句就是“服务器繁忙,请稍后再试”了。而且W君觉得自己所遇到的问题并不是一个“个例”。好歹人家qwen还能有个“三句半”呢,这个DeepSeek更傲娇,只有“一句”,我用你啊!搜索引擎都比这个的用户体验好。
那真正的“虚情假意”的是谁?看前几天发的微头条的一个例子吧:

给大伙看下大图:





W君只能说太政治正确了,而且妥妥的具有AI的求生欲。
另外,大语言模型都定位于自己是一个“智能助理”,但你知道智能助理对你的了解吗?

那大家和deepseek混了很久了,deepseek对大家的评价又是什么呢?


所以……吃土豆粉的人真以为自己吃的是鱼翅吗?