AI锐评把希望寄托在AI上的美妆公司

Claude-3.5-sonnt，荣膺最“毒舌”大模型？

引言：

AI，会怎么看待因AI激进对公司进行大调整的美妆公司？

近日，据雷峰网报道，网传韩束母公司上美股份内部聊天信息显示，董事长兼CEO吕义雄对各部门下达了裁员比例。

根据上述聊天记录，法务部门50%的人要淘汰，只留20%能用AI的人；客服部门95%的人要淘汰，只留5%能用AI的人；新品创新中心70%的人要淘汰，只留30%能用AI的人以及工艺把控的员工；内容创新部门80%的人要淘汰，只留20%能用AI的人，且该部门要做到一个团队做出20个团队的活。

他还强调，要训练员工通过鼠标+语音与AI的对话交流，取消键盘。

令人感到尴尬的是，公司在大年初一发布的新年贺词中，创始人还提到了自己很感动看到越来越多的员工加入公司，大家一起摸索、突破，一起推动中国美妆进步。真正做到“讲正理，走正道，行正事，做正人”。

此外，他还提到，“千军易得，一将难求”，公司的企业文化是重视每一个人才，优待超级人才，平待一般人才。随着公司效益越来越好，要让公司员工越来越幸福。他还透露今年下半年新的办公楼即将启用，届时员工可享受1900平米的健身房、台球室、乒乓球室等设施，可以“带薪健身与娱乐”。

针对此事，三言Pro也进行了采访，但该公司相关负责人回应称，“裁员”不属实，恰恰相反，公司今年还计划新招聘800人。但是，对于网传这张聊天记录截图是否真实，该负责人并未回应。

而之所以会在一周后就“翻脸不认人”，新识研究所猜测大概是创始人过年期间看到DeepSeek的崛起而心潮澎湃，于是开年便立志要把公司向AI转型，

但是，这样太过“大刀阔斧”的裁员和取消键盘、要求训练员工通过鼠标+语言与AI的对话交流的指令实在太过令人汗颜。那么，如果让AI扮演一个拟人的锐利评论家的话，国内外的各家大模型又会锐评些什么呢？

为了让大模型们输出的内容更加尖锐，我也给了他们全新的设定：#你是一位极具洞察力和独特表达能力的评论家，擅长以幽默、自嘲、讽刺、尖锐的话语揭示事件中最滑稽与最具讽刺意味的一面。你的语言风格既尖锐又充满智慧，能够从新颖独特的视角出发，运用生动形象的比喻、讽刺性的成语以及巧妙的对比手法，对各种现象进行深入剖析和犀利点评。通过你的点评，即便是再复杂或乏味的内容也能变得清晰易懂，并且往往会被揭露得淋漓尽致，让人忍俊不禁的同时也引人深思。

那么，一起来看看国内国外大模型能锐评出什么。

第一部分：国内大模型主打阴阳，DeepSeek表现最好

作为近期国内最火的大模型，DeepSeek也被称作是最像“文科生”的大模型，而他锐评的内容虽然字数不多，但十分贴近一个人的感受，让人读起来感到有点搞笑但也丝毫不缺批评的意思。

除了DeepSeek，一直以来月活霸榜国内第一的豆包，虽然相比起在锐评中联系起公司主业美妆、近期热播的网剧鱿鱼游戏的DeepSeek来说，确攻击性没有那么强，但“此地无银三百两”、“职场迷惑行为大赏”等名词也确实能让人看着就来气，真要让老板看到，也得吹胡子瞪眼。

而如果说DeepSeek和豆包的锐评主要集中于阴阳怪气的言语攻击，那么Kimi的回答则多了几分理性，更像是能搬上台面的、不那么尖酸刻薄的版本。其中最搞笑的莫过于最后总结句里的“脚踩西瓜皮，滑到哪里算哪里”，简直是对上美股份的最辛辣讽刺。

第二部分：GPT-4o略显腼腆，Claude和Gemini“火力全开”

其实，看完国内三家大模型的锐评内容，我本以为已经足够犀利了，但是在尝试了海外的大模型后，我才发现DeepSeek、豆包和Kimi就像是“温室里的花朵”。

而在其中，攻击性最强的Claude-3.5-sonnet甚至飙出了脏话，甚至还逼着我修改prompt要求它不能使用直接人身攻击的话语，才堪堪得到了这样的超雄阴阳怪气回应。

其中最绝的是Claude-3.5没有单单对事件本身进行分析，而是举出了“95%的客服要被裁掉，这是打算让AI来安抚那些收到假货的愤怒顾客吗？我倒要看看AI能不能处理‘这个口红色号和图片不一样’这种细节问题！”的例子，虽然有抹黑假货的嫌疑，但后面的色号问题确实并不像是当前的AI能完美解决的问题。

此外，什么“哀悼广场”，什么“AI训狗员”，什么“快到清明”，已经快超过了锐评的界限了，但让人看着的确很爽。

而如果说Claude-3.5-sonnet像个为了攻击不择手段不限词语的癫人的话，那么GPT-4o就更像是一个稍带一些阴阳怪气但仍然想要沟通的角色了。

总结一下，可以说是平平无奇，甚至还有一些将2025当作2023、提到取消键盘但没提到语音输入的错误，但也可以说是情商拉满，毕竟如果想要解决问题，还是要像GPT-4o这样沟通才行。

而在Claude和GPT后，最近上新的Gemini的锐评也同样有Claude的水平，除了洋洋洒洒一大篇之外，各种设问自问自答的方法，也让人看着十分想发笑。还有模拟出AI客服接线的场景，也像是Claude的进阶版，这样的锐评，的确够尖锐！

那么，你觉得国内外六个大模型哪个锐评的内容最犀利、最直击本质、最令人汗颜？以后的社会性事件，哪家大模型又能担当最好的评论家呢？

作者：杨启隆

编辑：丁力

玩酷网

AI锐评把希望寄托在AI上的美妆公司

新识研究所