AI锐评把希望寄托在AI上的美妆公司

新识研究所 2025-02-07 21:04:53

Claude-3.5-sonnt,荣膺最“毒舌”大模型?

引言:

AI,会怎么看待因AI激进对公司进行大调整的美妆公司?

近日,据雷峰网报道,网传韩束母公司上美股份内部聊天信息显示,董事长兼CEO吕义雄对各部门下达了裁员比例。

根据上述聊天记录,法务部门50%的人要淘汰,只留20%能用AI的人;客服部门95%的人要淘汰,只留5%能用AI的人;新品创新中心70%的人要淘汰,只留30%能用AI的人以及工艺把控的员工;内容创新部门80%的人要淘汰,只留20%能用AI的人,且该部门要做到一个团队做出20个团队的活。

他还强调,要训练员工通过鼠标+语音与AI的对话交流,取消键盘。

令人感到尴尬的是,公司在大年初一发布的新年贺词中,创始人还提到了自己很感动看到越来越多的员工加入公司,大家一起摸索、突破,一起推动中国美妆进步。真正做到“讲正理,走正道,行正事,做正人”。

此外,他还提到,“千军易得,一将难求”,公司的企业文化是重视每一个人才,优待超级人才,平待一般人才。随着公司效益越来越好,要让公司员工越来越幸福。他还透露今年下半年新的办公楼即将启用,届时员工可享受1900平米的健身房、台球室、乒乓球室等设施,可以“带薪健身与娱乐”。

针对此事,三言Pro也进行了采访,但该公司相关负责人回应称,“裁员”不属实,恰恰相反,公司今年还计划新招聘800人。但是,对于网传这张聊天记录截图是否真实,该负责人并未回应。

而之所以会在一周后就“翻脸不认人”,新识研究所猜测大概是创始人过年期间看到DeepSeek的崛起而心潮澎湃,于是开年便立志要把公司向AI转型,

但是,这样太过“大刀阔斧”的裁员和取消键盘、要求训练员工通过鼠标+语言与AI的对话交流的指令实在太过令人汗颜。那么,如果让AI扮演一个拟人的锐利评论家的话,国内外的各家大模型又会锐评些什么呢?

为了让大模型们输出的内容更加尖锐,我也给了他们全新的设定:#你是一位极具洞察力和独特表达能力的评论家,擅长以幽默、自嘲、讽刺、尖锐的话语揭示事件中最滑稽与最具讽刺意味的一面。你的语言风格既尖锐又充满智慧,能够从新颖独特的视角出发,运用生动形象的比喻、讽刺性的成语以及巧妙的对比手法,对各种现象进行深入剖析和犀利点评。通过你的点评,即便是再复杂或乏味的内容也能变得清晰易懂,并且往往会被揭露得淋漓尽致,让人忍俊不禁的同时也引人深思。

那么,一起来看看国内国外大模型能锐评出什么。

第一部分:国内大模型主打阴阳,DeepSeek表现最好

作为近期国内最火的大模型,DeepSeek也被称作是最像“文科生”的大模型,而他锐评的内容虽然字数不多,但十分贴近一个人的感受,让人读起来感到有点搞笑但也丝毫不缺批评的意思。

除了DeepSeek,一直以来月活霸榜国内第一的豆包,虽然相比起在锐评中联系起公司主业美妆、近期热播的网剧鱿鱼游戏的DeepSeek来说,确攻击性没有那么强,但“此地无银三百两”、“职场迷惑行为大赏”等名词也确实能让人看着就来气,真要让老板看到,也得吹胡子瞪眼。

而如果说DeepSeek和豆包的锐评主要集中于阴阳怪气的言语攻击,那么Kimi的回答则多了几分理性,更像是能搬上台面的、不那么尖酸刻薄的版本。其中最搞笑的莫过于最后总结句里的“脚踩西瓜皮,滑到哪里算哪里”,简直是对上美股份的最辛辣讽刺。

第二部分:GPT-4o略显腼腆,Claude和Gemini“火力全开”

其实,看完国内三家大模型的锐评内容,我本以为已经足够犀利了,但是在尝试了海外的大模型后,我才发现DeepSeek、豆包和Kimi就像是“温室里的花朵”。

而在其中,攻击性最强的Claude-3.5-sonnet甚至飙出了脏话,甚至还逼着我修改prompt要求它不能使用直接人身攻击的话语,才堪堪得到了这样的超雄阴阳怪气回应。

其中最绝的是Claude-3.5没有单单对事件本身进行分析,而是举出了“95%的客服要被裁掉,这是打算让AI来安抚那些收到假货的愤怒顾客吗?我倒要看看AI能不能处理‘这个口红色号和图片不一样’这种细节问题!”的例子,虽然有抹黑假货的嫌疑,但后面的色号问题确实并不像是当前的AI能完美解决的问题。

此外,什么“哀悼广场”,什么“AI训狗员”,什么“快到清明”,已经快超过了锐评的界限了,但让人看着的确很爽。

而如果说Claude-3.5-sonnet像个为了攻击不择手段不限词语的癫人的话,那么GPT-4o就更像是一个稍带一些阴阳怪气但仍然想要沟通的角色了。

总结一下,可以说是平平无奇,甚至还有一些将2025当作2023、提到取消键盘但没提到语音输入的错误,但也可以说是情商拉满,毕竟如果想要解决问题,还是要像GPT-4o这样沟通才行。

而在Claude和GPT后,最近上新的Gemini的锐评也同样有Claude的水平,除了洋洋洒洒一大篇之外,各种设问自问自答的方法,也让人看着十分想发笑。还有模拟出AI客服接线的场景,也像是Claude的进阶版,这样的锐评,的确够尖锐!

那么,你觉得国内外六个大模型哪个锐评的内容最犀利、最直击本质、最令人汗颜?以后的社会性事件,哪家大模型又能担当最好的评论家呢?

作者:杨启隆

编辑:丁力

0 阅读:3

新识研究所

简介:新知识,新见解