语言过滤 - Repost

网络无疑降低了人们沟通与交流的门槛,但其匿名性也降低了人们对于话语的责任感,致使网络喷子随处可见。很多人为了自己心中廉价的“正义感”而不惮于说出最恶毒的言语,更是有明星在网络霸凌中选择自杀,引起广泛关注,更多的则从未能引起注意的言语伤害。

最近,芬兰的一家科技公司另辟蹊径,开发出了一种装在电脑上的“礼貌字体”。顾名思义,这种字体非常的礼貌,打不出来脏话来:用户启用这种字体后,只要输入了霸凌、色情或者种族歧视一类的文字,程序就会从数据库里调出相对“文明”的表达,来代替这个脏字;过于直白,不好替代的词,则直接换成马赛克。

比如输入国际标准脏话“fxxk”的时候,系统就会显示一团马赛克。输入“shit”(粪便)的时候,虽然这个词也经常被用作脏话,但因为本身还有其它的意思,所以侥幸幸存。如果输入“I hate you”(我恨你)的话,好玩的就来了,前一秒还是“I hate yo”,输入“u”的一瞬间,就变成了“I disagree with you”(我不同意你)。

一些种族歧视的词汇也有了变化,比如“n-word”变成了“person”;对中国人的侮辱性词汇“Ching chong”也变成了“Asian”。“你很丑”,变成了“以传统观念来看,你不太漂亮”(感觉更伤人了???);“你这个蠢B”变成了甚至有些宠溺的“小傻瓜~”

公司的负责人表示,希望能通过这样的方式,让网络上的霸凌者们重新考虑一下他们使用的词语,以及背后的意义。他还表示,目前这个字体有1800个屏蔽的词汇和短语,是由芬兰的一些儿童基金会人员整理出来的。但因为全世界文化的多样性,所以公司也开放了源代码,希望全世界的人都能提供一些恶意词汇和相应的优美翻译。

想象一下,到时候真的开放中文词库了,会变成什么样?国骂三字经肯定是会屏蔽的,但各种地方性的骂人话可就有意思了。京津地区的“二皮脸”→“你这厚颜无耻之人”,上海的“小瘪三”→“小坏蛋”,川渝的“日你仙人板板”→“摩擦您祖先的牌位”,东北的“你瞅啥”→“您看什么呢”(?)想想就有点刺激呢……

客观来讲,这个“礼貌字体”其实也就能起到一个提醒的作用,就像他们自己说的,只希望霸凌者看到系统翻译之后的单词,能够进行自省。这心意肯定是好的,但要知道,人类在这方面的创造力可以说是无穷无尽的,只是简单粗暴地屏蔽掉看着“不和谐”的字眼,对现实中的不和谐,真的能起到什么改善作用嘛……


@jolestar:

“言论自由”最近引起了很大的争议,从计算机的角度理解语言是一个很有意思的事情。
在计算机里,信息和程序的界限还是相对明确的,纯粹的信息不会对计算机产生危害,只有可执行的程序才有风险,并且是否执行受接收方控制。但人类的自然语言同时兼具信息和程序的特征,二者没有非常明确的界限,并且是自动执行的。
比如以三字经这样的骂人的话来说,如果纯粹当成信息来看,一方只是表达了一种想和另外一方的长辈发生性行为的意愿,本质上是无害的,但接收方通过听觉接受到信息后,就会自动通过大脑运行,激起受辱和愤怒的情绪。
然而,如果互相不懂对方的语言,就没有这种效果了,相当于要在一个不兼容的硬件上执行程序。尤其如果双方都错解了对方的意思,一方认为自己在骂人,另外一方听到的实际是夸赞,就会达到最佳的效果,双方都得到了满足。这个场景在《鬼子来了》这个电影里有描绘。
以后人工智能发达了,言论自由和政治正确的问题就好解决了。每个人可以在自己的大脑里嵌入一个设备,相当于计算机上的安全软件。这个设备可以拦截各种信息输入,无论是语音,文字,还是图像,都先由这个设备根据主人政治正确倾向以及心智状态进行评估,如果发现输入信息会伤害主人的感情,可以通过模糊,修改,美化等机制变更,然后再让大脑解释执行。
这样说的人可以肆无忌惮的说,听的人也不会受到伤害,世界终于和平。