热搜上线第十年,为何算法争议仍不止不休?
热搜再次成为目光焦点。热搜仍
11月24日,上线算法四部门联合开展“清朗·网络平台算法典型问题治理”专项行动,第年重点整治热搜榜单、为何信息茧房、争议止沉迷上瘾、热搜仍大数据杀熟、上线算法算法侵蚀新就业形态劳动者权益五类问题。第年
在热搜问题上,为何专项行动的争议止《算法专项治理清单指引》明确提出了三点要求:第一,算法规则公示。热搜仍平台需要公示榜单排序机制机理,上线算法包括基本原理和排序依据;第二,第年日志留存核验。为何平台应留存榜单相关网络日志,争议止日志内容包括时间、榜单排名、热度值等信息;第三,水军账号识别。平台应健全异常账号监测机制,防范违规操纵榜单、控制热搜等现象。
实际上,国内社交平台上线热搜功能不过十年,已经经历了两次大型整改。微博公布过算法规则,引入了编辑人工审核,可信账号的识别模型每年都在更新,但买榜单、流量造假、娱乐导向过重……纷纷扰扰的争议始终未停。
热搜是如何被算法塑造的,底层问题到底出在哪里?当我们讨论热搜时,还存在哪些误解和盲区?
两次下线,两次升级
微博拥有热搜功能,其实刚到十年。
2014年,热搜在微博手机端正式上线。当时热搜的唯一指标就是“实时搜索次数”,榜单每十分钟更新一次。《微博搜索白皮书》显示,热搜上线的第二年,日均曝光量达到2.5亿。
2018年1月,热搜被网信办启动为期一周的下线整改。因PG One粉丝刷榜的“紫光阁地沟油”热搜,微博相关负责人被北京市网信办约谈,被指“用户发布违法违规信息未尽到审查义务,持续传播炒作导向错误、低俗色情等违法违规有害信息。”
通过这次整改,热搜算法迎来了第一次升级——一个话题要成为热搜,除了单纯的搜索次数,还需考虑传播热度、互动率、话题率。
当时微博副总裁曹增辉还对界面新闻表示,热搜不再是纯粹的算法排序,开始引入编辑人工干预,整治虚假信息和谣言。
2020年6月,热搜再次被启动为期一周的下线整改。据国家网信办对外发布的公告,微博被指在阿里蒋凡舆论事件中,干扰网上传播秩序、传播违法违规信息。当年开始实施的《网络信息内容生态治理规定》将热搜列为网络信息内容的重点展示环节,指出要应当防范和抵制不良信息。
热搜算法因此有了第二次升级,并且进行了公开说明。这一大体规则此后没有更新,其计算公式是:(搜索热度+传播热度 +讨论热度) x互动率。
在官方公式中,互动数是一个很重要的衡量指标,也就是通常所说的转发、点赞、评论。不难看出,比起一次搜索,在热搜页面进行的一次互动能带来的分数更高,话题因此登上热搜的概率也更大。
郑州大学新闻与传播学院副教授王茜长期研究热搜,她的论文《批判算法研究视角下微博“热搜”的把关标准考察》被引用超过六千次。王茜在采访中告诉21记者,2018年算法升级后,“热搜”仍然是原来的排行榜,但对“热门”的定义发生了根本改变,互动性成为更重要的价值因子,而且近年来在平台中的份量越来越重。
“热搜依据用户的真实行为产生,这么说当然没有错。但哪些行为更重要?是一次搜索更能说明用户的关注度,还是一次评论?”王茜说。
决定这一答案的,是算法公式。学者米歇尔·威尔森 (Michele Willson) 用一个更生动的例子说明了算法的权力,他把用户的原始行为、原始数据比喻为食材,把算法比喻为食谱,不同算法能烹饪出不一样的菜肴,直接影响了最终呈现的内容。王茜表示,算法正是以这种不可见的、隐蔽的方式进行价值判断。
算法的设计和偏见
在王茜看来,热搜的“搜索”是一种私下的行为,具有隐蔽性;而转发点赞评论是公开互动,往往有公开表演的成分。公开“转赞评”的内容和私下“搜索”的内容,其实可能有着很大不同。
从心理学的角度来看,人类为了生存,有需要感知威胁、躲避危险的天性,这种“人性弱点”体现在社交平台上,便是暗含危险、愤怒的负性信息更容易获得公开互动。不少社会研究已经证明了这一点,先进网络分析研究小组(GANA)曾对约7000万条微博数据进行情绪分析,结果表明,愤怒是网络上相关性最强、最易传播的情绪,远超过喜悦和低落。
另一方面,强调互动数的热搜算法,也放大了意见领袖(KOL)的影响力。“如果把热搜看成一个话题投票箱,原本大家是一人一票,普通人搜索一次和名人搜索一次贡献是一样的。现在拥有更多粉丝和资源的人,比普通个体的权重更高。”王茜解释。
根据互动数划分不同权重的逻辑,直观体现在热搜的页面里。点进热搜词条,除了热搜主持人置顶的微博,用户首先能看到的便是10~20条左右,互动量高,它们左右着用户对热搜内容的初印象。
有明星后援会的粉丝告诉21记者,这几年算法机制变得越来越复杂,一条评论要在热评区被优先展示,除了需要有高赞数和高评论数,账号本身还需要大概650分的“信用分”,上热门转发则需要690分左右的“信用分”。决定信用分的,是账号发微博的活跃度、社交关系、举报扣分情况等一系列指标。
换句话说,不是所有微博用户都会被纳入热搜考量范围,算法会筛选出“可信用户”。“普通账号的信用比较低的话,怎么评论都上不了热门,微博也上不了热搜广场,甚至可能被屏蔽。所以平时就要多发原创微博,多带话题跟大V互动,提高账号的权重。”前述粉丝说。
这也许能解释为什么能吸引更多回复的,或者来自大V的评论总能被“顶”上前排,获得更多曝光。
王茜说,微博最初发布这一规则时,出发点是识别水军、确保热搜的真实性。“但大数据一定会抹除一些细节。如果要定义哪些是僵尸号水军、哪些是活跃用户,那些只看不常发微博的人就会被判定不可信,筛选出来的就是一批最活跃用户的想法。”
算法抹除的不止用户痕迹。海外社交平台X(前Twitter)同样具有热搜功能,不过显示的是词语,而微博热搜通常是由热搜主持人提前设定好的一句主、谓、宾语完整的句子。王茜指出,虽然这样看起来提供了更多事实,但仍然抹除了细节和语境,属于一种印象式的消息,有时误导性可能更强。
举例来说,2021年的一个热搜#大学教授说娶到大才女李清照是倒八辈子霉#看起来在批评李清照,其实原视频中大学教授是在戏谑对比,但如果不点进视频,或者没有点进完整的热搜页面,很可能就会先留下先入为主的印象。
通过对内容和用户的一系列筛选,热搜能呈现的往往就是一部分活跃用户的、青年群体的、更有争议性的内容。
不应一味追求热搜KPI
如今各大互联网平台都采用流量主导的热搜算法,对商业发展而言是必然选择。
苏州大学传媒学院执行院长陈龙认为,Web2.0技术的普及解决了社交媒体互动性问题。从“转赞评”到“一键三连”,本质都是流量优先的逻辑。通过增加用户粘性,最终将注意力作为商业化的基础,实现自身的发展与扩张。
陈龙告诉21记者,在多个社交平台的竞争下,争夺用户有限的注意力是一场零和博弈。越来越多用户流向短视频平台,原本属于微博的的时间被吞噬。从2018年初开始,新浪股价一路下行,当2021年新浪宣布退出美股时,市值已经萎缩了近五分之一。2023年第三季度最新财报显示,微博营收32.07亿元人民币,同比下滑了3%。如何保用户、保营收是经营者不得不思考的问题。
与此同时,微博是为数不多的公共讨论场地,在社会事件的传播上有着难以替代的影响力。中国政法大学数据法治研究院教授张凌寒提醒,在缺乏监管的情况下,冲突性的内容泛滥是必然结果。而很多冷嘲热讽、煽风点火、阴阳怪气等言论一旦高强度聚集,会对社会事件的当事人造成极大的伤害。
比如,在此前的粉红头发女孩被网暴事件、收件人被快递员造谣出轨事件中,一条评论单看也许只是玩笑话,但海量的负面评论叠加,可能就会形成一场网暴。热搜在网络暴力的生成、传播、聚合中,起着“放大镜”的关键作用。
去年《关于依法惩治网络暴力违法犯罪的指导意见(征求意见稿)》出台,严惩基于蹭炒热度、推广引流等目的,对于网暴信息不履行安全管理义务的行为。2022年《互联网信息服务算法推荐管理规定》要求,要建立完善人工干预和用户自主选择机制,“在首页首屏、热搜、精选、榜单类、弹窗等重点环节积极呈现符合主流价值导向的信息内容。”
尽管有了人工干预,但难题仍然不少。张凌寒指出,治理最大的难题仍是在保障言论自由和维护秩序之间找到平衡。阴阳怪气、冷嘲热讽的互联网信息难以根治,一禁了之既不利于实现有效的公共讨论,长远而言也无益于和谐社会的建设。
张凌寒认为,关键在于通过智能识别等技术对热搜进行及时、全面、准确的分析研判,实现灵活有效的舆论治理。陈龙则建议,语言暴力的边界难以界定,针对具体问题建立人工管理员或投票机制,也是一种方法。
多位受访学者还不约而同地表示,平台热搜的商业性和公共性存在悖论。当下亟需提高算法素养,剥除算法客观性的光环。社会各界也不以热搜当作传播标准,并一味追求上热搜的KPI指标。
“需要认识到的是,尽管热搜在大家心中扮演了民意风向标的角色,但事实上它没法呈现完全的客观性。每种算法都存在一定的缺陷和偏见,要理性看待热搜的性质。”王茜说。
-
文章
446
-
浏览
11
-
获赞
57957
热门推荐
-
执政20年,埃尔多安给土耳其带来了什么?
2023年5月28日,安卡拉,土耳其总统埃尔多安在总统府向支持者示意视觉中国/图)2023年5月28日,土耳其总统选举的第二轮计票结果显示,现任总统埃尔多安以52.14%的得票率,击败反对党候选人克勒卫生巾“偷工减料”惹争议,新国标正起草|周一健
2024年11月22日,浙江省台州市椒江区大润发超市内的卫生巾。视觉中国/图焦点【卫生巾起质量风波,新国标正起草】本周,卫生巾的长度、pH值等话题引发巨大争议。有网友质疑,不少品牌的卫生巾实际长度短于前三季度我国环境空气质量和地表水环境质量总体持续改善
中新网10月27日电 生态环境部近日举行10月例行新闻发布会,生态环境部新闻发言人裴晓菲介绍2024年1-9月全国空气和地表水环境质量状况时称,今年前三季度,我国环境空气质量和地表水环境质量总体持续改卫生巾“偷工减料”惹争议,新国标正起草|周一健
2024年11月22日,浙江省台州市椒江区大润发超市内的卫生巾。视觉中国/图焦点【卫生巾起质量风波,新国标正起草】本周,卫生巾的长度、pH值等话题引发巨大争议。有网友质疑,不少品牌的卫生巾实际长度短于新研究:饮酒增加罹患60余种疾病的风险
国际权威医学期刊《自然·医学》最新发表的一项基于中国成年人群的研究结果显示,饮酒会增加中国男性罹患61种疾病的风险,包括许多此前因缺少证据而未被认为与饮酒有关的疾病。通常认为,大量饮酒会增加罹患肝硬化多地上线运行医保定点药店比价小程序 医保药品价格更加公开透明
中新网10月31日电 据国家医保局微信公众号消息,为更好维护群众购药知情权和选择权,让群众享受到更加便捷优质的医药服务,国家医保局部署各省医保局指导统筹地区加快搭建定点药店医保药品公开比价小程序或模块“神器”能提高燃气灶热效率?专家提醒:选择不当可能造成人身危险
中国消费者报报道杜科记者任震宇)一个小小的铸铁环,就能显著提高家用燃气灶的热效率,火更猛还省燃气?针对市场上销售的各种“聚火罩”“聚能盘”“人民币“避风港”特征凸显!汇率创46个月新高,外贸企业利润承压
摘要:近期地缘政治冲突不断发酵,避险资金配置人民币资产的需求有所增加,人民币兑美元汇率持续稳定维持在6.3-6.4区间。2022年开年以来,人民币延续去年下半年以来的强势,对美元汇率继续攀升。美国陆军的新坦克是坦克吗?丨军事
美军M-10布克Booker)移动防护火力车 资料图片/图)近日,美国陆军签订了一份100辆新坦克的合同,有趣的是,这份合同中的标的不再被称为坦克或轻型坦克,陆军给新装备取了一个新名称:“移动防护火力马德兴:亚足联曾考虑过搞亚国联,强队纷纷反对嫌锻炼价值低
据记者马德兴报道,所谓的“亚国联”其实是一则过时的消息,而且很早就已经遭到亚洲诸多强队的反对而被否掉了。至少在2026年美加墨世界杯赛之前,这项赛事并没有被纳入亚足联的竞赛计划与时间表内。马德兴介绍:对拒收现金说“不”! 全国人大代表郭新明建议这样维护人民币法定地位和金融稳定
摘要:郭新明建议,为维护人民币法定地位和金融稳定,深入推进整治拒收现金工作开展,切实保护消费者现金使用权益,亟需从顶层设计角度出发,尽快完善与整治拒收现金相关的法律法规,为规范、高效整治拒收人民币现金柔宇破产,毋需嘲笑
很多企业的失败退场是静悄悄的,深圳市柔宇科技股份有限公司简称“柔宇科技”)不是。2024年11月18日,深圳市中级人民法院裁定柔宇科技及其两家关联公司破产。放在折叠屏手机大卖的背景之下,这家于2018美国资本入侵,欧洲足球传统正被毁掉
美国是世界第一体育强国,但其国家队在足球界的成绩却相当一般。在半年前刚结束的卡塔尔世界杯上,美国在八分之一决赛中1:3完败于荷兰,止步十六强。纵观历史,美国仅有两届世界杯1930和2002)的成绩更加收到的奶粉盲盒货不对板 海普诺凯被质疑虚假宣传
中国消费者报长春讯记者李洪涛)近日,《中国消费者报》记者接到长春市消费者李先生的投诉,称海普诺凯生物科技有限公司以下简称海普诺凯公司)在其开展的“6罐积分+99元”抽取奶粉盲盒柔宇破产,毋需嘲笑
很多企业的失败退场是静悄悄的,深圳市柔宇科技股份有限公司简称“柔宇科技”)不是。2024年11月18日,深圳市中级人民法院裁定柔宇科技及其两家关联公司破产。放在折叠屏手机大卖的背景之下,这家于2018