手把手教你用DeepSeek评测:《哪吒2》和《封神2》的分数,谁更高

苑池鳞鱼 2025-02-07 23:16:41

在阅读此文前,恳请您点击一下“关注”,每日为您推送精彩内容,不要错过哦~

心血来潮,我突然想让DeepSeek给《哪吒之魔童脑海》(我们口中的《哪吒2》)和《封神第二部:战火西岐》(我们口中的封神2),进行对比打分!

大家看看这打分合理吗?

当然,如果你不喜欢,可以着重领悟一下,人工智能的使用逻辑,或许能给你在使用人工智能的时候,提供很多参考!

要给电影打分,我们必须先建立一个均衡的评估体系。

以前我们想做这样的评测,需要人用大脑建造,但是建造起来,

很累,很苦,而且很容易出错!

但是,有人工智能之后,建造这样的评估体系,似乎简单了很多。

所以,我的第一个问题如下:

“我们现在重新开始一个测试,我会按照步骤进行提问,请您帮我分析,下面的提问都是关于春节档的两部电影:《哪吒之魔童脑海》简称《哪吒2》、《封神第二部:战火西岐》!

请您尽可能地了解两部电影的情况,包括但不限于影片质量、影片受众、影片好评、影片票房等各种专业或不专业知识,为我提供详细的解答答案!

现在只做准备,不回答问题,等我提问开始!”

(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!)

然后,他很快完成了我的要求!

但是,如果你认真看完上面的内容,应该知道,人工智能也会出错。

他竟然说《封神2》还没上映!

所以,大家使用人工智能的时候,一定要注意这个问题。

千万不要觉得,人工智能是万能的,他不是神,他只是个机器,也会出错。

后面,大家还会看到。

所以,在他出错的时候,我们要尝试提醒它,修正自己的问题!

这是我的修正话术:

“对于问题上述问题,我要纠正一下,《封神第二部:战火西岐》已经上映,可能您了解的还不清

晰。”

(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!下面是人工智能思考的过程,不太重要,大家其实可以忽略不看。)

当一切准备就绪,我们可以进行提问了!

“第一个问题,请您建立一个对电影评估的多维度体系,每个体系都有打分项,从1-10分不等,要求尽可能详细、专业,请将您将其展示出来,尽可能用通俗易懂的语言:”

这里着重说一下,DeepSeek写诗写的非常好,也就是说他的文笔用的很好,甚至时不时会拽一些专业名词或者华丽辞藻!

为了避免它不说人话,我特地加了一些限定词语,如上面提问中的限定语-“通俗易懂”,及时为了避免他出现“非人性化”的答话。

但即便如此,我们还是未必能避免他出现这样的问题,只能遇到问题解决问题!

经过我们上述的测试,他已经给我们建立了一个很完整的评估体系!

如下面截图所示:

(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!下面是人工智能思考的过程,不太重要,大家其实可以忽略不看。)

第一个指标:故事剧本,权重20%,共有3个小指标!

第二个指标:视听效果,权重18%,共有3小个指标!

第三个指标:表演张力,权重15%,共有2个小指标。

第四个指标:市场表现,权重17%,共有2个小指标!

第五个指标,社会共振,权重10%,共有2个小指标!

第六个指标,创新突破,权重8%,共有2个小指标!

第七个指标:观众体验,权重7%,共有2个小指标!

第八个指标:产业价值,权重5%,共有2个小指标

如今指标评估体系已经设置好了,我们就可以开始进行评测了!

所以,该我给它投喂数据了:

“第二个问题,请您为《封神2》打分:”

DeepSeek再次进行思考!

(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!下面是人工智能思考的过程,不太重要,大家其实可以忽略不看。)

然后给出了答案!

《封神2》的综合评分如下!82.6分,被评为春节档S级作品!

大家可以往下看!

第一个指标:故事剧本,《封神2》得分17.5分!

第二个指标:视听效果,《封神2》得分16.8分!

第三个指标(表演张力)和第四个指标(市场表现),分别得分13.2分和14.3分!

第四个指标(市场表现)和第五个指标(社会共振),分别得分14.3分和8.5分!

第六个指标(创新突破)和第七个指标(观众体验),分别得分6.8分和5.1分!

第八个指标:产业价值,得分4.4分!

以上汇总得分,加总,然后就是《封神2》的最终得分82.6分。

那么,《哪吒2》能得多少分呢?

我们给出问题投喂即可!

“请您根据上面评估体系,给《哪吒2》打分:”

“温醒提示:人工智能思考过程,介意分辨率问题,可以不用看!”

《哪吒2》总分如下:85.2分,是春节档超S级作品!

因为《哪吒2》分数高于《封神2》,所以被评为了超S级!

评分细分如下!

第一个指标:故事剧本,得分18.3分!

第二个指标(视听效果)和第三个指标(表演张力),分别得分17.1分和14.5分!

第4个指标(市场表现)和第五个指标(社会共振),分别得分16.2分和9.3分!

第六个指标(创新突破)和第七个指标(观众体验),分别得分为7.5分和6.4分。

第八个指标:产业价值,得分4.9分!

当我用人工智能进行评测之后,还要做一件事,让其自我纠错。

很多人认为,人工智能做的就是对的。

有这种想法,是大错特错的!

人工智能也可能会出错!

至于如何纠错,大家看着下面的内容,自己随意组合即可!

我的想法是让其给两部电影都重新打分!

先给《封神2》重新打分,投喂问题如下:

“接着上面的问题,我希望把《封神第二部:战火西岐》打分进行深化和纠错,要求打分紧跟这部影片情节和剧情,要求打分尽可能中正客观,不带偏见,请重新根据评估体系打分:”

(温馨提示:介意屏幕分辨率,下面两张截图可以不用看)

重新打分之后,《封神2》的评分上升,达到了84.1分,也挤入了春节档超S级作品行列。

但是,仍然低于《哪吒2》的评分85.2分!

具体评分变化如下,大家可以稍微看一下即可,不用深究!

如果我们用同样的逻辑,让他给《哪吒2》打分,《哪吒2》的评分是会下降,还是上升呢?

我们拭目以待!

投喂问题如下:

“接着上面的问题,请按照我们刚才所说的要求,给《哪吒2》重新打分:”

(温馨提示:思考过程,可略过!)

《哪吒2》修正后得分:86.7,分数进一步升高,到达春节档现象级作品的行列!

至于评分变化的细节,大家有喜欢的可以自己看。

其实,正常评估下来,虽然DeepSeek给出的评估系统看上去很可靠,但是最终给出的评分,还是需要修正很大幅度。

恰恰说明,人工智能能搭建评估体系,但是让其替人去打分,有时难免会有失偏颇。

只要咱们投喂问题,可能评分,还会变化。

其实,有一个比较有意思的事,不知道有没有网友有兴趣,把刚才无聊的实验重做一下,先让他评测《哪吒2》,再让其评测《封神2》,看一下《哪吒2》是否还能力压《封神2》。

如果网友得到完全相反的结果,恐怕人工智能,在细节出的评测,还需要人去做,而且是很多人去做,然后加总,才能完成比较靠谱的数据。

有人说,人工智能,早晚会替代人类!

我承认!

但是现在,很多事情,还需要我们人类自己去做,人工智能当做辅助,才能让事情跟谨慎周全。

大家觉得是吗?

0 阅读:9

苑池鳞鱼

简介:社会情感与热点解读,与大家共同见证生活的精彩与奇迹