微博敏感词检测器(微博敏感词检测器在线)

一、“消失的歌词”

笔者是一名音乐综艺爱好者,每一次有新的音乐综艺推出时笔者都会第一时间前去观看,在欣赏节目的过程中,笔者常常会注意到一些令人啼笑皆非的歌词字幕修改的现象,有时甚至会出现直接删除歌词的情况。荒谬的是,如果不是偶然发现字幕里莫名消失的歌词,很多人可能根本意识不到这首歌歌词的“敏感性”。

如果说对于含有“死亡”等“敏感词”的歌词语句进行直接删除还大致不会影响歌曲的意义表达的话,那么对于歌词字幕进行的修改则会直接改变整首歌原本要传达的情感,让歌词显得不伦不类。最为典型的案例莫过于蔡徐坤的《情人》这首歌。在某次晚会上,这首歌的歌词字幕被大幅度修改,原本用于表达情人之间亲密关系的歌曲在经过“人为加工”后直接变成一首“合家欢”式的励志曲目(见图1),这一修改马上登上了微博热搜,有网友吐槽修改后的歌词“你轻轻一个问,我翻看体会”让人“仿佛来到了开卷考试现场”,歌词的随意修改对于歌曲意境的破坏力可见一斑。

又比如,在《歌手》节目中,徐佳莹在演唱《我还年轻我还年轻》时歌词“给我一支烟”被改为“给我一只眼”,许多观众表示被这诡异的修改吓了一跳,不少人调侃道“看来吸烟比摘取器官更加少儿不宜”。这种吊诡的现象在如今的音乐综艺节目中数不胜数,虽然每次都会引起网友的讨论乃至不满,但网络热潮过后一切仍然如常,对“敏感词”进行审查与“阉割”似乎已经成为平台方与观众之间的默契共识,观众们即使不满也只能用“调侃造梗”的方式来表达自己的抗议。

微博敏感词检测器(微博敏感词检测器在线)

图1 在某晚会上歌曲《情人》的歌词被大幅度修改

事实上,敏感词审查机制不止存在于综艺节目领域,在小说创作、平台评论、影视制作等领域都存在着由机器筛选与人工筛选共同发挥作用的敏感词审查机制。此前,“笑口我了”等网络梗在各大平台迅速蹿红,原因便在于一些网络文学作品中“死”“下体”等疑似含有色情、暴力元素的词汇都被平台“和谐”,在文章中显示为“口”(见图2与图3)。但事实上,许多“被和谐”的句子都是机筛机制作用下的“误杀”,原本并没有相关意涵的语句在“被和谐”之后才被大家发现其中的“问题”,这种“选词填空型”的审查机制让人哭笑不得,广大网民便用这种造梗的方式来侧面表达对这一荒谬机制的不满与抗议。

最初,敏感词审查机制的存在是为了保障公共平台推出的文化产品是人民喜闻乐见的高质量产品,同时起到保护共享网络平台中的未成年人的作用。然而,这一机制在运行的过程中却出现了初衷与结果相背离的、无意识的异化,审查机制下被篡改的文化产品的质量受到了肉眼可见的损害,人们抱怨着荒谬的机制却又无力改变现状,过度的敏感非但没能保护未成年人,反倒激起了许多未成年人“奇怪”的好奇心(比如一些未成年人会去问被屏蔽掉的词语是什么意思),与此同时,表达的危机也在愈发严苛的审核机制下悄然发生。

微博敏感词检测器(微博敏感词检测器在线)

图2 网友在网络文学作品中发现的被“和谐”的事例

微博敏感词检测器(微博敏感词检测器在线)

图3 网友在网络文学作品中发现的被“和谐”的事例

二、“表达之殇”是谁之过?

前一段时间,一篇名为《中文大约的确已经死了》的文章在各路社交媒体上引发了激烈的讨论,文章以“绝绝子”“大白”等流行词汇为例来说明简体中文的低幼化趋向。

首先,我个人并不认同作者在文中提到的“中文已死”的观点,他对于这一现象的归因也略显片面。其次,文中其实涉及到的是两种成因不同的流行语现象,一种是“娱乐至死”氛围下的“低幼化表达”,一种是为了规避敏感词审查而产生的解构式或者扭曲式表达。

对于前一种现象,我认为时间自然会给出答案(正如前些年的许多流行语其实早已湮没在了时代的浪潮之中,但中文却依旧迸发着其独有的活力),而后一种现象我认为才是真正让人担忧的“表达之殇”,当表达失去自由、表达者谨小慎微之时,真正的表达危机、思想危机就在眼前。遗憾的是,作者在那篇文章中将矛头完全对准了前一种现象,而对后者这头“房间里的大象”却视而不见。面对这头“大象”,笔者不禁反思,在这么多的内容主体中,究竟谁应该为上述的种种“表达之殇”负责呢?也许我们应该站在他们各自的角度来思考这一问题。

(一)监管部门:审查边界模糊化的背后

国家相关监管部门是敏感词审查机制的执行主体,也是解答这一疑题的关键主体之一。2021年9月,中共中央办公厅、国务院办公厅印发了《关于加强网络文明建设的意见》,其中提到要深入推进“清朗”、“净网”系列专项行动,深化打击网络违法犯罪,深化公众账号、直播带货、知识问答等领域不文明问题治理,健全网络不文明现象投诉举报机制,动员广大网民积极参与监督,推动网络空间共治共享。同月,国家互联网信息办公室发布《关于进一步压实网站平台信息内容管理主体责任的意见》,意见从完善平台社区规则、加强账号规范管理、健全内容审核机制、提升信息内容质量、规范信息内容传播、加强重点功能管理、坚持依法合规经营、严格未成年人网络保护、加强人员队伍建设等9个方面对网站平台履行主体责任提出具体要求(见图4)。

以上文件进一步明确了平台方的主体责任,但和中国很多自上而下推行的政策一样,它也面临着类似周雪光老师所说的“一统体制和有效治理之间的矛盾”,国家希望通过包括敏感词审核机制在内的一系列制度对网络空间中的文化产品进行统一有效的监管,但显然如果对于网络文化行业这种创造性、自主性极强的行业采用“一刀切”式的强制性行政手段,那么就很容易出现“万马齐喑”的局面,这与相关部门“提供更高质量的文化产品”的初衷是相违背的,因此上级有关部门会有意地模糊化审查边界,将一定的自由裁量权交予相关平台方,为平台方解释相关政策留有余地,并试图以此维系这一机制的各方利益平衡。

但也正如周雪光老师在同一篇论文中所提到的那样,“执行的‘灵活性’和执行过程中的“偏离”常常是同一现象的不同标签,一旦超越了某种临界度,触动权威体制的神经,灵活性就演变成为偏离甚至对抗。”“灵活性”的反面便是“随意性”,敏感词审查机制的“最终解释权”归审查部门所有,最终的审查权也掌握在诸如广电总局等上级部门手中,这时平台方和有关部门之间便会出现力量的不对等,处于弱势地位的平台方此时即使手握自由裁量权,自然也不敢过于“灵活”,甚至会更加谨小慎微,因为平台方稍有不慎就有可能面临被“一刀切”的窘境,由此也就造就了各大平台纷纷进行“自我阉割”的“奇观”。

微博敏感词检测器(微博敏感词检测器在线)

图4 网信办在指导意见中明确要求相关责任主体“健全内容审核机制”

(二)平台方:机器筛查与自我阉割

目前各平台的敏感词审查机制大多采用的是机器筛查与人工审核双措并举的模式,这也直接导向了机制运行过程中出现的两大问题。

机筛机制在工业生产等标准化场景下发挥了巨大的作用,但是当我们把机筛机制移植到具有极强主观性、丰富性的语言表达系统中来时,机制不适配带来的“排异反应”就会引出许多荒谬的现象。由于机器只能筛选语句当中的敏感词要素,而很难识别判断语言表达的语境,许多网络文学作品中便会出现所谓“口口”相接的奇葩景象,原本毫无问题的一句话便会被机器打上“涉嫌色情、暴力等内容”的标签。

而人工审核的模式虽然规避了机筛过程中的种种弊端,但也会导致另一问题的出现——有关工作人员会在审查边界模糊化的作用下有意地进行自我阉割。正如上文所提到的,审查边界模糊化既意味着灵活处理的空间较大,但同时也意味着审查标准的缺乏和审查执行过程的不规范,容易出现“一刀切”的现象(例如由于某些敏感内容的出现而导致整部作品被“毙掉”的情况)。

在进行一番隐形的博弈后,在内容审查过程中缺少维权手段、处于弱势地位的平台方出于利弊比较的考量会自然而然地选择进行自我阉割,以此来防止之前做出的努力、付出的金钱和时间成本付诸东流,他们会站在审查方的角度对自己的作品进行预审查,而这种主观性的预审查显然是没有边界的,因此势必会出现一些由于过于敏感而导致的过度阉割的现象,例如一些歌曲的歌词明明不涉及敏感词汇却被莫名其妙地篡改。

在平台方“一厢情愿”的自我阉割后,审查的边界和范围被不断泛化,文化生态在以肉眼可见的速度迅速恶化,内容创作者看似无拘无束,实际上却不得不谨小慎微地进行表达和创作,以此来避免平台方“重拳出击”带来的“404悲剧”,表达危机由此愈演愈烈。

(三)社会大众:传统思维与举报成风

虽然大家苦敏感词审查机制久矣,但客观来讲,这一机制之所以能在这片土地上生根发芽,也与我国的社会舆论氛围与传统思维模式密切相关。

“一见短袖子,立刻想到白臂膊,立刻想到全裸体,立刻想到生殖器,立刻想到性交,立刻想到杂交,立刻想到私生子。中国人的想像惟在这一层能够如此跃进。”鲁迅先生的一番话一针见血地指出了问题的要害之处,戳中了深埋在许多国民心中的传统思维模式。鲁迅先生最初用这句话来反讽当时的封建卫道士群体,这一群体平日里一副道貌岸然的样子,以道德高尚自居,张口就是仁义道德与妇女贞洁,实际上脑子里都是低俗猥琐的念头,背地里常做一些男盗女娼之事。

这句话既无情批判了封建卫道士的虚伪,也从侧面反映了封建道德对于人性的压抑。中国的封建社会是一个极度压抑人性的社会,在传统观念里,性是肮脏而不可言说的,但实际上,性欲和食欲一样,都是人们与生俱来的向往满足机体需要的一种本能冲动,当人们正常的欲望被社会环境不断压制之后,社会观念和社会氛围只会越来越畸形——人们对性有着出于本能的好奇心,却在畸形的社会环境中装出一副道德卫士的模样,心照不宣地演着戏。同时,既然没有正规渠道,大家就会在好奇心的驱使下通过一些“小众途径”去了解“性知识”,而这些渠道往往传达的是一种有偏差的甚至是错误的性观念,最终受伤的还是心智尚未成熟的孩子们。

在今天,“谈性色变”的状况在不仅没有缓解,反而还有愈演愈烈的趋势,似乎人们今天一谈性,明天就会犯下滔天的罪行。尽管国务院早在2011年就明确提出“把性与生殖健康教育纳入义务教育课程体系”,无数的性教育课本还是在家长们不厌其烦的举报中被停用。(见图5)“窥一斑而知全豹”,从人们对于性教育的态度中便可以窥见许多人心中那仍然解不开的思维束缚,因此我们也不就难理解为什么总是有人为已然异化的敏感词审查机制“摇旗呐喊”了,因为在他们眼中有关死亡、情爱尤其是关于性的内容都是“不宜搬上台面的”,因此要不惜一切代价禁止这类词汇的出现。换个角度想,这种思维模式不也是一种主动的无意识的自我阉割么?

举报机制也是导致表达危机产生的一大重要因素。上文提到,有关部门发布的意见中明确肯定了投诉举报机制在清朗网络空间中的作用。诚然,针对网络中的一些色情暴力的内容,这一机制的确取得了良好的打击效果,但滥用举报机制、影响文化产品正常产出的现象也屡见不鲜。一方面,许多公众受传统思维模式的影响,会下意识地举报一些在他们眼中“少儿不宜”的内容,比如沈石溪著作《狼王梦》就曾经被家长举报,理由是其中有许多有关动物交配的描述;另一方面,部分社会公众会有意利用举报机制进行打击报复,具体体现为从作品中捕风捉影地拼凑出一些“色情”“暴力”的内容,并通过联合一群人进行大量举报的方式迫使作品下架。这种由于对家竞争、个人喜恶等因素而带来的“表达之殇”在近些年屡次出现。

微博敏感词检测器(微博敏感词检测器在线)

图5 一家长对于孩子在学校接受性教育的态度

三、出路在何方?

将视野从国内延伸到国际,我们会发现其实各国普遍存在相关制度设计来规范网络空间中的信息内容,各国也在不断加大对于色情、暴力等违法违规内容的监管力度,对于“少儿不宜”的内容许多国家也采用了分级制度进行分类管理,在网络领域保护未成年人群体显然已经成为国际共识。

但中国由于其特殊的国情,一直没能推行分级制度,由此保护未成年人群体的重任就落到了关键词审查机制等一系列具有中国特色的相关制度安排上来,从实际情况来看,这一机制在一定程度上保护了网络中的未成年人群体,并通过举报机制等配套机制实现了对于相关违法违规内容的社会监督,因此不难推测,在一段时间内这一机制仍然会存续下去。但在这一机制运行的过程中,各方的利益诉求纠集在了一起,多方因素的共同作用酿成了这一场“表达危机”,很难说“表达之殇”是谁之过,因为这是一场系统性的悲剧。

这时不那么悲观的人也许还会多问一句——那还有出路么?如果有的话,出路又在何方呢?坦白讲,笔者学识浅薄,给不出一个清晰明确的答案,但笔者还是想谈谈自己的看法。

首先是社会氛围的问题。笔者认为尽管社会宣传工作步履维艰,但这一工作作为“推动社会思想现代化”的排头兵,仍然是关键词审查机制优化的重要突破口。正如在《十三邀》中锺叔河先生所说的,知识分子应当肩负起“提高全民的常识和情理”的重任。我们要积极参与到性教育、死亡教育等社会宣传工作中来,为社会氛围的改造与国民思维的转变贡献自己的一份力量。在全民的思维模式有了转变、社会思想逐渐走向现代化之后,机制的变革才会有生根发芽的文化土壤。

同时,敏感词审查机制背后所涉及的本质问题是国家和社会的关系问题,换言之是政府监管的边界和方式的问题。当具有强制性的行政机制直接介入到社会管理的各个领域中时,便容易出现治理效能低下的状况,这便是上文所提到的类似于“一统体制与有效治理之间的深刻矛盾”。

周雪光老师也用同样的思路来解释早已实行社会主义市场经济体制的中国为何会出现社会专业化进程举步维艰的情况——“专业化过程具有相对独立性,形成各自领域中的专业权威,难以纳入权威体制的逻辑之中,甚至形成对于权威体制的挑战,由此产生了制度逻辑的不兼容性,在实际过程中我们看到权威体制的种种实践在削弱、阻碍专业化过程的展开。国家的一统观念制度实际上阻碍或者‘否认’了各个专业领域中建立共享观念的独立过程,专业组织和活动常常被看做是对权威体制的威胁,从而受到极大限制。”

同样的逻辑可以解释中国文化行业专业化进程的缓慢。而对于这一问题,周雪光老师认为缩小政府“有效管理”的范围、引入社会机制也许能够成为解题的一种可行思路,在文化领域推行的敏感词审查机制或许也能借鉴这一思路完成机制的重构,当然这已经是另一个问题了。

解决企业获客难题,添加 微信:hvq698  备注:获客

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 792114587@qq.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.yunxkee.com/18109.html