从行业场景,看内容审核算法透明度与行业治理的路径

最新文章

算法目前已经成为整个社会运转的重要参与者,因算法自身技术性强、学科交叉度高、决策过程解释性差等原因,造成各界担心算法运行过程中会偏离公正中立,通过反向框定人的行为影响到社会运行,因此要求打破算法黑箱、提升算法透明度日益成为共识。但同时,算法是商业核心竞争力形成的所在,互联网平台也利用算法、数据等天然优势进行了大量的社会治理工作,尤其在打击网络违法行为等方面。如果各类算法完全透明,可能带来目前阻击灰黑产的防线崩塌,网络生态的治理也将面临风险。如何在算法透明度与网络生态治理中探索平衡路径,成为了需要探讨的问题。

一、推进算法透明有其必要性

《互联网信息服务算法推荐管理规定》第四条中提出算法要遵循公开透明原则,同时第十二条要求:“算法推荐服务提供者要优化检索、排序、选择、推送、展示等规则的透明度和可解释性,避免对用户不良影响”,该规定对算法透明度提出了原则性要求。

由于对算法存在一定担忧,公众、商家和监管方对于提升算法透明度都有内在要求。一是从商家和内容生产者的角度,因其担心平台算法设置不合理限制或者不合理条件,妨碍其向用户合法提供服务或正常运行,有要求算法透明的诉求。二是从监管部门的角度,因算法不透明,从外部无法看到算法运行全貌,对算法公平性存在担忧。三是从社会公众利益的角度,算法推荐、分发机制可能带来内容导向不正确、信息茧房等社会问题,如何在算法层面追究责任也是新的难题。

二、算法过度透明与互联网治理间

可能存在的冲突

(一)可能影响内容审核识别规则的有效性

内容审核识别规则,包括内容类平台对内容的审核规则、互联网广告内容审核规则、算法智能拦截垃圾邮件的排除规则等。上述内容审核识别算法的透明度如果过高,可能导致灰黑产从业者利用相关算法,使得拦截、识别违法内容的规则和技术手段失去作用,如通过变体、隐晦表达等方式绕开算法规则,对机器+人工的审核方式形成挑战。

(二)可能降低灰黑产的违法试探成本

目前灰黑产行业会利用真机、模拟器(一台PC模拟多个APP运行)或云手机(即直接远程购买或租用成千上万台手机)等,快速注册账号或者租用账号以及群控软件的方式,不断试探平台风控算法规则,以便于从事违法行为。如果将此类算法规则大幅度公开,将降低灰黑产的试探成本,进而突破平台风控系统。

(三)可能加剧流量作弊行为

1.可能导致商家恶意扰乱搜索、推荐结果。

算法透明度如果过高,将更容易被作弊商家或者内容产出者利用去试探算法规则,并刻意按照算法规则扰乱召回和排序秩序。召回什么、如何排序,决定了商品或内容最终在终端的展示结果,一定程度上也决定了商家或内容产出者的自然流量分配,相关算法的重要性不言而喻,而搜索逻辑和推荐逻辑是召回和排序过程中的核心。如果算法透明要求的颗粒度过细,涉及到召回规则、排序规则,则可能出现商家恶意数据污染、算法反向污染的情况。以下为三种情景下干扰召回、排序算法的例子,从中能窥见,衡量好算法透明的“度”很关键。

在电商场景下,作弊商家可能会通过大量点击热门商品后再点击自家商品的方式来提升自身优势,实现“蹭热点”式的软性流量劫持,从而引导推荐算法更多地展现其商品。

在搜索引擎中,不法商家会通过“万词霸屏”的方式来干扰正常搜索的排序结果,即通过技术手段将其生成的“垃圾网页”植入到第三方网站中生成“虚假网页”,并将虚假网页与搜索关键词相关联,导致用户一旦触发搜索关键词,就会在搜索结果首页中的一条甚至几条显示为该网页,这种行为涉嫌构成不正当竞争行为。

在内容营销中,灰黑产从事者会将大量内容拼接后发布于多个营销号进行群控,以批量加好友、自动点赞、自动回复式互动等方式骗过算法规则来获得流量,为后续的欺骗行为或者引流变现做准备。《互联网信息服务算法推荐管理规定》第十四条规定,不得利用算法非法操纵、交易账号,或者虚假点赞转发等,不得利用算法实施操纵榜单、干预信息呈现等影响舆论或规避监管的行为,便直指了行业问题的症结所在。

2.可能导致广告计费反作弊算法的失效

在互联网广告的计费中通常会设置作弊与反作弊的算法规则,一旦反作弊的算法规则被公开,可能造成不法平台或者广告代理商避开算法规则进行虚拟点击,骗取广告主广告费的情况。

3.可能导致刷单等违法行为增加。

例如商家质量信用评估规则关系到刷单行为,如果识别、对抗、清理、打击刷单行为特征的算法规则被公开,将可能大大提升刷单组织的效率。同理,内容创作者的信用评估关联到流量,个人金融信用评估关联到贷款额度、白条额度等,相关评估算法的公开,可能带来一系列财产风险。

三、进一步推进算法透明的方向和路径探讨

(一)算法透明度应是一定程度上透明

算法透明度本质上让用户预期“透明”,确保用户或公众能够一定程度上了解算法运行的原理,并对涉及其权益的算法决策建立合理的方向性预期。一定程度透明,既要满足消费者、商家、内容产出者等知情权,又要避免灰黑产通过披露的算法低成本穿透平台风控系统,造成平台秩序混乱,侵害正常商家、内容产出者的权益,同时还要能引导算法的掌握者公平、有序参与竞争。所以在算法透明度的讨论上,需要具有多方视角,对各方利益进行充分的权衡考虑,避免对行业健康发展产生负向影响,同时应尽量减少整体秩序治理成本的增加。

(二)对算法“可透明”部分鼓励引导透明度提升,建立团体标准及行业推荐标准

对于算法的共性通用技术、数据要素类别等可标准化的部分,可以尝试以建立团体标准的方式进行推动。

对于算法中有共性通用技术、数据要素类别等可标准化部分,可以尝试以建立团体标准的方式进行推动。如APP启动屏广告涉及的算法,因为技术指标相同或相似,所以行业可以形成标准,此项工作目前也正在推动中。这类具有同样技术类型、应用场景的算法可以通过算法标准化的方式进行透明。

(三)逐步推进算法透明度是必要路径

以内容推荐算法为例,算法决定着资讯内容的排名和曝光度、分发和传播,影响着用户的认知甚至价值观,但是监管部门和公众往往难以知道决定这些内容分发的算法规则,难以提前影响其在舆论中的负向作用。未来可以在算法透明度中逐步引入“正能量要素”,比如对新闻信息和自媒体内容比例中“正能量内容”推荐比例进行约定。对热搜榜类的算法规则则可以要求在监管部门进行备案,避免人为操控和虚假营销等行为。此外,对平台内商家和内容创作者的算法治理规则也需要进一步清晰,在最小必要保障商业秘密的前提下,对于限制流量、降权等方式需要给出相关说明,避免平台恶意滥用算法。