对算法“黑箱”的治理近年来引起了广泛关注,让算法更加公开透明已成为监管的方向之一,但具体该让算法如何“透明”、“透明”到哪个程度,尚未有清晰的指引规定。
无论是算法备案制度的探索,还是实现算法透明化的设想,均面临着一定的困难和挑战,在不打开算法“黑箱”的前提下,平台推荐算法规制与监管是否有可行之道?清华大学公共管理学院教授、清华大学计算社会科学与国家治理实验室副主任张楠接受南都专访时表示,政府监管部门可通过模拟具有统计学意义的、不同行为习惯的规模用户,测量平台推荐算法运行逻辑,对算法推荐效果进行跟踪记录,并据此对平台企业提出整改意见或作出行政处罚,从而实现“黑箱”下有效的逆向监管,目前其团队已在开展相应研究(相关研究)。
算法黑箱使违规内容推送难以取证
南都:在关于算法治理的讨论中,常常会提到“黑箱”的概念,究竟什么是算法“黑箱”?
张楠:算法“黑箱”的概念主要强调了算法过程逻辑对外部而言的不可知性。以推荐算法为例,在算法逻辑下不同用户看到的信息内容不尽相同,产生“千人千面”的具体现实表现。不同平台推荐算法的差异也逐渐成为平台核心竞争力的重要部分,对外界呈现“盲盒”“黑箱”的状态,无形中也增加监管的难度。当用户浏览到擦边、甚至违规内容时,到底这是算法对用户浏览习惯的精准测算,还是背后有不当的推荐机制和利益交换?算法“黑箱”对监管部门发现问题、界定责任都提出了新的挑战,形成了网络信息内容与网络空间治理的潜在风险。
南都:算法的“黑箱化”特征,为算法监管和治理带来哪些方面的挑战?
张楠:在传统市场监管中,对媒体信息内容的监管,监管部门可以进入实体经营场所,查看实际经营流程;而相较之下,在社交媒体传播时代的平台推荐算法应用过程中,监管部门无法通过一个公开的入口或渠道,对平台分发的信息内容进行监测、调查和取证。
由于推荐算法具有较强的监管隐蔽性和“黑箱化”特征,对采用推荐算法的App,监管部门能看到的也仅仅是“冰山一角”,无法判断和认定平台为全部用户推荐了什么内容、有特定兴趣偏好的用户是否浏览了违规内容,以及违规内容被推送至多少用户等情况。这带来诸多难题,例如,违规信息内容推送行为难以取证、精准推荐与“信息茧房”难以区别、“流量至上”扰乱网络生态等。然而,由于当前对算法以及推荐算法的定义较为模糊、算法伦理规范效力不足、相关立法进程漫长且滞后,加之算法可解释性成本和负担过高,这为打开算法“黑箱”、实现算法透明增加了极大的难度。
借跟踪记录算法推荐效果开展评测监管
南都:在存在算法“黑箱”的前提下,是否有行之有效的技术治理路径?
张楠:无论我国现有的算法治理探索,还是世界主要国家的算法治理经验,目前主要都是围绕算法“透明”展开的。但“透明”不应是算法治理的唯一路径。
一方面,部分算法涉及到平台的核心竞争力和商业机密,绝对意义的“透明”并不现实。另一方面,即便算法“透明”备案,监管部门是否有足够的技术能力审核和监管算法也值得商榷。
必须承认,“黑箱化”是平台算法的现实特征,在打开“黑箱”,实现算法“透明”的路径之外,不打开算法“黑箱”成为可供选择的新模式,同时也为全面提高监管有效性、建立多层次和多元化的监管体系提供了更为丰富的实施路径。政府监管部门可通过模拟具有统计学意义的、不同行为习惯的规模用户,测量平台推荐算法运行逻辑,对算法推荐效果进行跟踪记录,并据此对平台企业提出整改意见或作出行政处罚,从而实现“黑箱”下有效的逆向监管。
南都:在实践层面,国内外有哪些算法治理的案例经验可供借鉴?
张楠:案例还是有很多的,但目前多数案例都是在出了问题、有消费者投诉、形成舆情后,推动监管部门开展的“亡羊补牢”式治理。我们团队曾研究尝试测量了不同平台内容推荐算法的差异。研究发现,差异肯定是存在的,也就是说这些推荐算法或多或少都是有偏的。那后续的问题就是标准怎么制定?红线在哪里?什么程度的推荐算法偏差可能会涉及到不正当竞争和损害用户权益,这还需要在更多实证案例场景结合具体情况去分析。
南都:对于算法治理的必要性,目前社会已经形成共识,但尚未形成针对算法的治理体系。您认为我国的算法治理进展处于哪一阶段?治理成效如何?
张楠:我国算法治理仍处于起步阶段,但面向数字经济时代,算法治理就是市场监管的未来。算法其实并不神秘,也可以理解为运行规则,对算法的监管也是对企业行为规则的监管,是线下传统监管在数智平台的延伸。
如果从延伸的逻辑来思考算法治理评价的话,我们看到优化营商环境改革的核心是从事前审批向事中、事后监管的过渡,而在算法治理中,“透明”逻辑下的算法备案实际上是事前审批模式,不打开“黑箱”情境下的规模数据测试方法则是事中、事后的监管模式,这也是我们强调对此类算法治理模式应有所重视和布局的原因。从长远来看,利用技术工具丰富算法治理手段的能力将是算法治理评价的重点。
采写:南都记者 张雨亭 制图:杨存海 (元宝AI)