“从什么时候开始,视频里的字幕不能好好打汉字了?”“死”、“抢”、“病”都要用字母来代替,“最”被写成“蕞”,“酒”成了“8+1”,“钱”也更名为“米”,层出不穷的互联网“黑话”,看起来就像是复活了过去相声行业的“春典”。
看了一些所谓“营销大师”的教程后才知道,原来是说只要这些字眼,直接打在视频字幕中,会被平台方的算法限流,降低传播效果。
然而,事情却完全不是如此。以讹传讹的背后不仅是一种互联网特有的从众性趣味,更是对算法的恶意曲解。
近日,抖音集团副总裁李亮对“钱”、“死”等字眼相关视频限流问题的回应登上热搜,重新引发了大众对于平台算法的认知和思考。
数字化时代,算法如同一张无形却紧密交织的大网,将人们的生活全方位包裹其中。对于这张被诸多网络达人和影视作品大肆渲染过的“网”,算法的背后到底是什么呢,是数据的优化还是平台权力的延伸?
长久以来,算法在大众心中似乎是一个神秘的存在,一方面,有人抱怨算法导致汉语在网络上被异化,另一方面,信息茧房的概念深入人心,人们担忧算法会将自己困于单一的信息框架内,导致视野狭窄观点偏激。
公众希望算法透明化,抖音等互联网平台积极响应,宣布推进算法和平台治理透明化。这一举措为我们重新认识算法、审视算法提供了契机。
要监督、审视算法,首先我们要弄清楚,什么是算法?
算法的前世今生:从解决问题到推荐内容算法,本质上是“以数学方式或者计算机代码表达的意见”,它的历史可以追溯到很久以前。
在古代,人们用简单的数学公式解决实际问题,如计算物品的数量、分配资源等,这其中就蕴含着算法的雏形。随着科技的发展,算法逐渐演变成现代数字化时代的核心技术之一。
简单来说,算法就是一系列解决问题的步骤和规则。你可以把它想象成一个超级详细的菜谱,按照菜谱上的步骤,你就能做出美味的菜肴。
比如说,你要计算从家到学校的最短路线,算法就会像导航一样,根据道路情况、交通流量等信息,为你规划出最佳路径。
再比如,你在网上购物时,平台的算法会根据你之前的购买记录、浏览历史等,找出你可能喜欢的商品推荐给你,就像一个贴心的购物小助手。
这就是现在我们最常接触的推荐算法了。其之所以如此重要,是因为现在物质与数字内容空前丰富,所造成的检索困难。
当检索成本已经大于生产成本,推荐算法的必要性就突显出来了。
你看,每天都有海量的新闻、文章、视频、图片等等各种信息出现在互联网上。据统计,2023年全国数据生产总量达到了32.85ZB(泽字节),这是一个超级庞大的数字,相当于1000多万个中国国家图书馆的数字资源总量。
这么多的信息,我们要从中找到自己真正感兴趣、有价值的内容,简直就像在大海里捞针一样困难,这就是所谓的“信息过载”。同时呢,我们的生活节奏越来越快,大家都在争分夺秒地做事。
这就造成像2024年6月《中国青年报》调查显示的那样,94.8%受访青年感觉自己的生活开启了“倍速键”。
在这么忙碌的生活中,我们根本没有太多时间慢慢地去筛选信息。比如说,你可能只有短短十几分钟的休息时间,想找点有趣或者有用的东西看看,但是面对海量信息却无从下手。
在这样的情况下,推荐算法就应运而生了。
它就像是我们在信息海洋中的导航仪,专门来解决信息过载的问题,帮助我们快速找到自己可能感兴趣的内容。
如果没有推荐算法,我们可能会花费大量的时间在搜索和筛选信息上,而且还不一定能找到满意的。
比如说,你想要找一本好看的小说,没有推荐算法的话,你可能得在无数的书籍网站上一本一本地查看简介和评价,这得花费多少时间?
但有了推荐算法,它可以根据你的阅读喜好,比如你喜欢的小说类型、作者风格等,快速给你推荐合适的小说,大大提升我们获取信息的效率和质量。
那么具体来说,什么是推荐算法呢?
推荐算法其实就是一种超级智能的信息过滤技术。你可以把它想象成一个非常了解你的“私人助理”,不过这个“助理”是由计算机程序和算法规则组成的。
它会时刻关注你的一举一动,比如说你在平台上点赞了哪些视频、评论了哪些文章、收藏了哪些图片,甚至你在平台上搜索了什么关键词,它都会一一记录下来。
然后它就会根据这些行为来分析你的兴趣爱好。如果你经常点赞美食视频,它就会判断你对美食感兴趣,然后从海量的信息中筛选出更多的美食相关内容推荐给你。它的目的就是把那些合适的内容精准地推送给合适的你,让你能更轻松地发现自己感兴趣的东西,提高信息分发的效率和准确性。
优秀的推荐算法成为了我们在信息时代获取个性化内容的得力助手,让我们的网络生活更加丰富多彩。
2021年,TikTok推荐算法被麻省理工科技评论(MIT Technology Review)评为“全球十大突破性技术(10 Break - through Technologies 2021)”,只要内容优质,再普通的人或兴趣都能通过推荐算法找到“知音”。
TikTok的成功,展示了算法在社交媒体领域的强大影响力,它能够精准地捕捉用户兴趣,实现内容的高效分发,让全球用户享受到个性化的内容体验,也进一步证明了算法在当今数字化社会中的重要地位和价值。
某搜索引擎为何总是被人诟病,不就是因为它的搜索结果不够精准,充满了广告吗?
和每一个改变世界的新技术一样,有多大正面的赞赏就有多大负面的意见。现在,针对推荐算法的负面声音正逐渐调高音量。
最大的声音无疑是指责抖音推荐算法是一个“黑箱”,在完全隐蔽的运行状态下完成了尼葛洛庞帝“我的日报”的著名语言,将世界分裂成了彼此隔绝的“茧房”。
可是,事实真的如此么?
推荐算法并无原罪,技术不应被污名化事实上,虽然“信息茧房”这一概念广为流传,但它却是一个假说,并非科学观点,至今无任何科学研究作支撑。
清华大学新闻与传播学院常务副院长陈昌凤教授就曾指出,信息茧房是一个似是而非、缺乏科学证据的概念。
西方学界尚无有力研究证实其存在,一方面,造成“信息茧房”的实验室条件式的纯粹信息环境很难存在,人们总是处于多元复杂的信息环境中;另一方面,若将其作为长期传播效果来研究,证实其存在更是困难重重。
许多情况下,人们对“信息茧房”只是担忧,而非拥有确凿论据。
相反的,绝大部分研究表明,算法对于信息茧房的影响程度,以及互联网信息茧房本身的严重程度,都被过分高估了。
例如,有德国学者研究发现,不同背景和互联网使用经历的用户在相同搜索引擎中搜索同一时间的结果有很多重叠支出,单独出现的结果只占搜索结果的2.5%。
2016年,赛斯佛莱克曼等研究者选择了5万名参与者,要求他们报告自己最近阅读、观看或收听的新闻媒体,同时通过电子手段直接监测和记录他们的实际新闻消费行为。通过两项数据的对比,研究最终发现人们实际的媒体消费比他们自己想象中更具有多样性,也就是说,人们实际并没有陷入“信息茧房”中。
对于平台来说,刻意制造“信息茧房”也不符合自身的利益,因为推荐内容多样性越好,用户长期留存概率越大,拓展丰富性才是算法的原动力。
因此,抖音等平台普遍采用多种手段提高算法推荐结果多样性,包括多样性打散(例如10个推荐中必须有3种不同内容类型)、基于算法的兴趣探索(根据画像类似用户的感兴趣领域进行平行推荐)、引入随机因素(在推荐中随机加入与用户历史行为不完全相关内容)等。
清华大学社科院发布的《破茧还是筑茧?用户使用、算法推荐与信息茧房研究报告》指出,70%的用户对个性化推荐算法持肯定态度,超过90%的短视频APP用户选择开启个性化推荐算法。这充分说明,大多数用户在实际体验中感受到了算法带来的便利和价值。
中国人民大学高瓴人工智能学院的研究也表明,阅读内容的类型数量与使用时长呈正相关,互联网应用有追求算法多样性的内在动力,推荐技术并非单纯“投其所好”,而是在满足用户已知兴趣的基础上,深入激发、满足用户的潜在需求,从而更好地满足人们对信息的多维度诉求。
那么,为什么有那么多人担忧推荐算法会导致“信息茧房”呢?
昆士兰科技大学的研究者阿克塞尔·布伦斯认为,这个说法的流行,不过是技术再一次成为了社会问题的替罪羊。
就像70后家长怪小说、80后家长怪漫画、90后家长怪游戏、00后家长怪短视频一样,大众普遍将目前社会观点撕裂、普遍共识解体的现状归咎于视频平台、新闻门户、社交媒体的推荐算法。
加拿大传播学家文森特·莫斯可曾说过:不必压抑这些争论,因为当新技术彻底融入人们的生活后,这些争论自然会趋缓,人们也终于可以用平和与理性去理解技术。
事实上也确实如此,单纯从技术角度来讲,推荐算法其实并没有那么神秘,与其说它是一个无从破解的黑箱,倒不如说它是一个巨大的乐高拼搭,虽然无法完全掌握内部拼搭细节,但也可以猜到用了那些零件。通过观察推荐给我们的结果,每个人也都可以看懂影响推荐算法的一些因素。
此外,推荐算法也并不能完全自主决定推送结果,在这个过程中,始终是有人工运营为算法导航的,目的包含很多,并不是一切唯流量马首是瞻。
推荐算法的价值:远不止于获取流量与目前市面普遍存在的“算法原罪论”相反,抖音等平台对于算法优化进行了多方位的努力。
在抖音,推荐算法在内容生态的构建中扮演着至关重要的角色,它犹如一双无形却有力的手,巧妙地放大优质内容,同时精准地减少劣质内容,从而为用户营造一个积极、健康且富有价值的信息环境。
具体是怎么实现的呢?
抖音的推荐算法会密切关注用户对内容的多种互动行为。当用户点赞、评论、分享、收藏一条视频时,这些行为都被视为对内容质量和吸引力的积极反馈信号。
例如,一个知识科普类视频被大量用户点赞和分享,这表明该视频具有较高的价值,算法会据此认为这是优质内容,并给予其更高的推荐权重。
除了互动行为,用户观看视频的时长以及完播率也是算法评估内容质量的关键因素。如果用户能够完整地观看一个较长的视频,或者对某个视频的观看时长明显高于平均水平,算法会解读为用户对该内容高度感兴趣且认为其具有吸引力。
在内容进入推荐流程之前,抖音采用了机器审核与人工审核相结合的多重审核机制。机器审核凭借其高效的特点,能够快速识别包含明显违规词汇、色情、暴力、仇恨言论等内容的视频,并将其拦截。
对于一些使用双关语、隐喻或文化特定表达的隐晦不良意图内容,机器审核可能难以准确判断,此时就会交由人工审核团队进行细致审查。通过这种协同审核方式,确保了不良内容在源头就被有效遏制,不会进入推荐系统,从而维护了平台内容的整体质量。
如果将内容比做气球,抖音的推荐算法能够精准给优质内容“打气”,让它非得更高,让更多人看到;“击落”那些劣质气球,减少传播。这不仅为用户提供了更加优质、丰富的内容体验,也为创作者提供了一个公平竞争、鼓励创新的创作环境,推动了平台的持续发展和繁荣。
算法的价值远不止于此。与大众制造“信息茧房”的看法相反,它有助于打破信息桎梏,帮助用户看到更大的世界。实际上,算法正在诸多方面为社会挖掘创造出巨大的价值。
比如在助力城市文旅方面,倘若没有算法推荐,像淄博、天水这样在传统眼光下缺乏足够亮点的地方,其实很难进入大众视野——在火遍抖音之前,有多少人会专程驱车上千公里就为了一顿街边小烧烤?
然而,算法以其独特的视角,发现了这些城市自己都不曾自知的“爆点”,并通过“以点带面”,将小城推向全网、推向世界。
网红城市的变迁史,就是一部算法对城市的再发现史,抖音的助力,让网红城市从单点爆发变为不断涌现热点,让更多不显眼的地方成为流量“显眼包”。
在传统文化传承上,算法同样功不可没。
成都三花民间川剧团曾濒临倒闭,一条短视频让其重获新生,短短三个月,通过网络平台卖出的票几乎是过去两年多的总和,如今演出场场爆满;苏州评弹借助算法推荐机制,突破了地域和方言限制,在网络上聚拢了大批用户,线上直播演出还反哺了线下表演。
此外,小众硬核知识如甲骨文、考古知识、弦理论、星际化学等在抖音持续走红,让更多人爱上小众学科;乡村老师通过抖音学习物理实验并教孩子们发射水火箭,引发乡村教师热潮;科普生活常识、农技知识等内容也在抖音广泛传播,短视频成为乡村振兴的“新农具”,打通了农技推广的“最后一公里”。
在图书推广领域,推荐算法打通了“人找书”和“书找人”的双向链路,实现了图书与读者之间的精准匹配和高效连接。
因读者对《我与地坛》的一段书评,“子弹文学”爆火,网友用1.5亿次短视频播放“品读”史铁生的文笔;老书《画魂》因推荐视频被加印多次;众多经典图书、冷门佳作在短视频平台重新翻红,走进人们视野,取得不错销量,焕发出新的生命力。
当然,算法也需要透明化,接受监督。此次抖音对“钱”“死”等字词限流问题的回应,就是算法透明化的一个良好开端,它让公众了解到算法并非如某些无良商家宣传的那样神秘莫测,而是有章可循。公布更多算法细节,将能够指导创作者更好将注意力集中在创作本身。
并且,这也并不是字节跳动第一次提出算法透明化的倡议,字节跳动早在2018年就通过今日头条进行了算法透明化的科普,开了行业先河。
如今抖音进一步推进算法和平台治理透明化,更是展现了其对公众关切的重视态度。
总之,算法并非洪水猛兽,它是时代发展的产物,具有巨大的潜力和价值。抖音建立安全与信任中心,推进算法和平台治理透明化,是对社会关切的积极回应,也是对算法价值的深度挖掘和正确引导。
通过平台与公众的良性互动,我们有理由相信,算法将在可控可用的轨道上,为社会创造更大的价值,让我们的生活更加丰富多彩,让信息的传播更加高效、精准、有意义。