在阅读此文前,恳请您点击一下“关注”,每日为您推送精彩内容,不要错过哦~
心血来潮,我突然想让DeepSeek给《哪吒之魔童脑海》(我们口中的《哪吒2》)和《封神第二部:战火西岐》(我们口中的封神2),进行对比打分!
大家看看这打分合理吗?
当然,如果你不喜欢,可以着重领悟一下,人工智能的使用逻辑,或许能给你在使用人工智能的时候,提供很多参考!
要给电影打分,我们必须先建立一个均衡的评估体系。
以前我们想做这样的评测,需要人用大脑建造,但是建造起来,
很累,很苦,而且很容易出错!
但是,有人工智能之后,建造这样的评估体系,似乎简单了很多。
所以,我的第一个问题如下:
“我们现在重新开始一个测试,我会按照步骤进行提问,请您帮我分析,下面的提问都是关于春节档的两部电影:《哪吒之魔童脑海》简称《哪吒2》、《封神第二部:战火西岐》!
请您尽可能地了解两部电影的情况,包括但不限于影片质量、影片受众、影片好评、影片票房等各种专业或不专业知识,为我提供详细的解答答案!
现在只做准备,不回答问题,等我提问开始!”
(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!)
然后,他很快完成了我的要求!
但是,如果你认真看完上面的内容,应该知道,人工智能也会出错。
他竟然说《封神2》还没上映!
所以,大家使用人工智能的时候,一定要注意这个问题。
千万不要觉得,人工智能是万能的,他不是神,他只是个机器,也会出错。
后面,大家还会看到。
所以,在他出错的时候,我们要尝试提醒它,修正自己的问题!
这是我的修正话术:
“对于问题上述问题,我要纠正一下,《封神第二部:战火西岐》已经上映,可能您了解的还不清
晰。”
(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!下面是人工智能思考的过程,不太重要,大家其实可以忽略不看。)
当一切准备就绪,我们可以进行提问了!
“第一个问题,请您建立一个对电影评估的多维度体系,每个体系都有打分项,从1-10分不等,要求尽可能详细、专业,请将您将其展示出来,尽可能用通俗易懂的语言:”
这里着重说一下,DeepSeek写诗写的非常好,也就是说他的文笔用的很好,甚至时不时会拽一些专业名词或者华丽辞藻!
为了避免它不说人话,我特地加了一些限定词语,如上面提问中的限定语-“通俗易懂”,及时为了避免他出现“非人性化”的答话。
但即便如此,我们还是未必能避免他出现这样的问题,只能遇到问题解决问题!
经过我们上述的测试,他已经给我们建立了一个很完整的评估体系!
如下面截图所示:
(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!下面是人工智能思考的过程,不太重要,大家其实可以忽略不看。)
第一个指标:故事剧本,权重20%,共有3个小指标!
第二个指标:视听效果,权重18%,共有3小个指标!
第三个指标:表演张力,权重15%,共有2个小指标。
第四个指标:市场表现,权重17%,共有2个小指标!
第五个指标,社会共振,权重10%,共有2个小指标!
第六个指标,创新突破,权重8%,共有2个小指标!
第七个指标:观众体验,权重7%,共有2个小指标!
第八个指标:产业价值,权重5%,共有2个小指标
如今指标评估体系已经设置好了,我们就可以开始进行评测了!
所以,该我给它投喂数据了:
“第二个问题,请您为《封神2》打分:”
DeepSeek再次进行思考!
(温馨提示:已经尽可能截图,但还是因为分辨率的问题,想看清上面的字,仍需需要放大屏幕!下面是人工智能思考的过程,不太重要,大家其实可以忽略不看。)
然后给出了答案!
《封神2》的综合评分如下!82.6分,被评为春节档S级作品!
大家可以往下看!
第一个指标:故事剧本,《封神2》得分17.5分!
第二个指标:视听效果,《封神2》得分16.8分!
第三个指标(表演张力)和第四个指标(市场表现),分别得分13.2分和14.3分!
第四个指标(市场表现)和第五个指标(社会共振),分别得分14.3分和8.5分!
第六个指标(创新突破)和第七个指标(观众体验),分别得分6.8分和5.1分!
第八个指标:产业价值,得分4.4分!
以上汇总得分,加总,然后就是《封神2》的最终得分82.6分。
那么,《哪吒2》能得多少分呢?
我们给出问题投喂即可!
“请您根据上面评估体系,给《哪吒2》打分:”
“温醒提示:人工智能思考过程,介意分辨率问题,可以不用看!”
《哪吒2》总分如下:85.2分,是春节档超S级作品!
因为《哪吒2》分数高于《封神2》,所以被评为了超S级!
评分细分如下!
第一个指标:故事剧本,得分18.3分!
第二个指标(视听效果)和第三个指标(表演张力),分别得分17.1分和14.5分!
第4个指标(市场表现)和第五个指标(社会共振),分别得分16.2分和9.3分!
第六个指标(创新突破)和第七个指标(观众体验),分别得分为7.5分和6.4分。
第八个指标:产业价值,得分4.9分!
当我用人工智能进行评测之后,还要做一件事,让其自我纠错。
很多人认为,人工智能做的就是对的。
有这种想法,是大错特错的!
人工智能也可能会出错!
至于如何纠错,大家看着下面的内容,自己随意组合即可!
我的想法是让其给两部电影都重新打分!
先给《封神2》重新打分,投喂问题如下:
“接着上面的问题,我希望把《封神第二部:战火西岐》打分进行深化和纠错,要求打分紧跟这部影片情节和剧情,要求打分尽可能中正客观,不带偏见,请重新根据评估体系打分:”
(温馨提示:介意屏幕分辨率,下面两张截图可以不用看)
重新打分之后,《封神2》的评分上升,达到了84.1分,也挤入了春节档超S级作品行列。
但是,仍然低于《哪吒2》的评分85.2分!
具体评分变化如下,大家可以稍微看一下即可,不用深究!
如果我们用同样的逻辑,让他给《哪吒2》打分,《哪吒2》的评分是会下降,还是上升呢?
我们拭目以待!
投喂问题如下:
“接着上面的问题,请按照我们刚才所说的要求,给《哪吒2》重新打分:”
(温馨提示:思考过程,可略过!)
《哪吒2》修正后得分:86.7,分数进一步升高,到达春节档现象级作品的行列!
至于评分变化的细节,大家有喜欢的可以自己看。
其实,正常评估下来,虽然DeepSeek给出的评估系统看上去很可靠,但是最终给出的评分,还是需要修正很大幅度。
恰恰说明,人工智能能搭建评估体系,但是让其替人去打分,有时难免会有失偏颇。
只要咱们投喂问题,可能评分,还会变化。
其实,有一个比较有意思的事,不知道有没有网友有兴趣,把刚才无聊的实验重做一下,先让他评测《哪吒2》,再让其评测《封神2》,看一下《哪吒2》是否还能力压《封神2》。
如果网友得到完全相反的结果,恐怕人工智能,在细节出的评测,还需要人去做,而且是很多人去做,然后加总,才能完成比较靠谱的数据。
有人说,人工智能,早晚会替代人类!
我承认!
但是现在,很多事情,还需要我们人类自己去做,人工智能当做辅助,才能让事情跟谨慎周全。
大家觉得是吗?