刘超转自墙外楼
在哈佛大学的教授等级中,最高级别是“校级教授”(University Professor)。全哈佛大学目前一共只有24名教授享有这一荣誉。而政治学系金加里(Gary King)的“阿尔伯特·韦瑟黑德三世校级教授”(Albert J. Weatherhead III University Professorship)头衔正是在大名鼎鼎的美国政治学者、前哈佛大学政治学系教授亨廷顿(Samuel Huntington)过世后传承而来。金加里以实证研究方法论,特别是量化研究闻名,他的研究不仅仅影响了政治学的发展,而且对公共政策、法学、心理学乃至统计学本身都影响深远。他著有八本书、130多篇论文,并开发了20多个开源软件包。他在1994年与人合著的《设计社会调查》(Designing Social Inquiry: Scientific Inference in Qualitative Research)一书时至今日仍被众多社会学科的学生奉为必读经典。
2013年5月,金加里在美国顶级政治学刊物《美国政治学评论》(American Political Science Review)上发表了一篇 合作文章 ,通过海量数据收集和量化研究,试图解读中国网络审查制度的运行机制和背后逻辑。他的研究团队首先通过阅读以前的文献和咨询相关专家划分出85个话题,并相应设置出一系列关键词,通过计算机技术以六个月为时段,根据这些关键词从1382个中国网站收集了360余万个博客帖子,并从中随机抽样了超过12万条进行分类分析。这一过程随后重复了几次,他们一共收集并分析了1100余万个博客帖子。如此的大样本分析在针对中国互联网的研究中并不多见,且出自名家之手,故文章一出,引起不少讨论。在这篇文章初成但尚未发表之时,金加里在哈佛举办了一次小规模讲座介绍研究成果。尽管他本人并非中国问题专家,但笔者在会场见到了诸多中国研究大腕。
此文的主要结论是,中国的网络审查者严格审查集体性行动(collective action)而非批评性言论。同一研究团队在这篇文章发表之后还进行了一个跟进研究,涵盖了此前并未纳入其中的微博,并且开通一些社交媒体账户发布一些帖子,对中国的网络审查机制进行主动性测试,得出的结论基本未变。文章也对中国的网络审查制度的运作过程做出了一定的解释,并回答了为什么中国的网络审查者们总是能够非常高效、准确地对海量信息进行审查,并快速作出是否删除的决定。尽管近年来关于互联网,特别是社交媒体对于中国社会和政治的发展有诸多讨论,但能通过大数据证实或者证伪一些泛泛之论,这不仅符合美国社会科学一直以来力图“科学化”的大方向,对于中国研究和深入理解中国的变化也是极有意义的尝试。
本采访于9月17日于金加里在哈佛大学政治学系的办公室以英文进行,并于10月8日进行了补充采访。访谈部分在发表前经金加里核对。
中国网络审查更关注集体性行动
问: 你是如何想到要对中国的互联网审查制度作一个大规模量化研究的?
答: 事实上我们一开始是对一个完全不同的东西感兴趣。我们感兴趣的是如何用大数据方法来分析文本。现在有越来越多的数据可供分析,比如说社交媒体和电子邮件等。如果我们能够创建一些方法分析这些数据,那么会非常有价值。我们创建了一些方法,但是我们觉得还需要找一些“困难的案例”来测试这些方法是否适用。所以我们决定转换语言,比如说用中文来测试我们的方法。所以我们使用了我联合创办的公司,Crimson Hexagon,通过其中文社交媒体的数据库来进行分析。这个数据库基本上就是摘取中文社交媒体上帖子的Url(网页地址),并对其进行分析。我们的方法运行良好。后来我和我的同事们决定再次访问这些帖子,因为我们想了解一下这些帖子的上下文。但是我们点击这些Url的时候,发现有一些帖子已经不在了。一开始我们以为是Crimson Hexagon出错了,但是后来我们才发现,原来是我们在中国政府阅读并删除这些帖子之前,就已经把它们搜集到数据库了。这样我们就拥有了很多被中国政府审查删除导致中国网民无法阅读的帖子。所以我们改变了我们的研究题目。
问: 在你们进行这项研究的时候,微博在中国的活跃度甚至超过了博客,但是为什么你们的研究没有涵盖微博?
答: 我们一开始研究博客是因为我们觉得博客可以给中国网民更多的时间去表达他们自己。在我们进行的最新的一项研究中,我们已经将微博纳入我们的研究。我们发现审查机制的运行原则是一样的。
问: 你是如何在研究中定义“集体性行动”?
答: 由非政府发起的任何可能动员人们或者导致聚集的行为。比如说,你决定鼓动人们上街游行示威,这就是集体性行动。如果你邀请很多人参加一次聚会活动,这也是集体性行动。如果你决定邀请很多人聚集在一起庆祝地方政府官员的伟大功绩,这也是集体性行动。
问: 但是在现实中有一些是很难被清晰定义的。比如说你的研究中将“艾未未”这个词条作为“集体性行动”,可是在现实中我们也可以把这个词条归入“对政府进行批评”这个项目中。
答: 在现实的审查中,你无法只阅读一个帖子,然后就决定它是不是集体性行动,因为你几乎可以把所有事情都和政治相关联,比如从对政权的攻击到谈论一部电影。所以如果在这个基础上对个案进行归类的话,肯定是行不通的。在现实中,中国的审查者们好像是首先观察社交媒体上人们的交流,当有围绕某一个话题的讨论一下子变得特别活跃的时候,他们就开始审查这些讨论,如果这些讨论是关于某个具体的集体性行动,或者是某一个曾经在过去组织过集体性行动的人发起的,他们就会将相关的讨论进行删除。他们会删除与这个讨论相关的所有内容,无论这些讨论是赞成政府还是批评政府。
问: 你在论文中还提到所有的帖子按照话题性质被分成了五类:集体性行动、批评审查员、色情、政府政策和其他新闻。但这是否会存在预设立场的问题?比如一些词条性质比较模糊,但相关新闻事件在你进行深入分析的时候已经发生过了,这就可能会导致一个“事后归因”的错误。
答: 我们实际上是通过反向操作的办法来还原中国政府的审查过程,所以这项研究从设计上来说,就是一个事后性质的研究。但是我们找了两个了解中国政治的人来对这些帖子进行归类,他们的工作是各自独立进行的。他们的分类结果高度一致,只有在一个事件的分类上出现了分歧,即方滨兴被投掷鸡蛋和鞋子。这个事件既包含了对审查者的批评,也包含了集体性行动。此外,我们还用一些样本之外的案例对这个分类进行测试,这就并不是回溯性的,而是预测性的。我们得到的结果都是相同的。
多样化且高效的审查机制
问: 中国的网络审查者严格审查集体性行动而非批评性言论,这个结论是否出乎你的意料?
答: 是的,我们非常吃惊。因为此前很多人都认为中国的网络审查者们是审查各种批评性的内容的,当然也是会审查集体性行动的。但是我们现在发现现实并不完全是这样的,一些对政府批评性的帖子是没有被删除的。我们发现很多很多对政府进行激烈批评的帖子,甚至是涉及一些政治领导人个人的都没有被删除,而且这种情况非常普遍。这很令我们吃惊。
但是如果你仔细想想,这也不奇怪。政府允许这些批评性的帖子存在下去,他们能够得到什么?中央政府可以借此对地方政府进行监督,可以对地方领导人的表现进行评估,他们也可以根据这些批评来替换一些地方领导人,如果这些信息都被删了,中央领导人也就看不到了。
问: 但是允许这些批评存在,是否也是对政权的一种风险呢?
答: 有多少风险?如果仅仅是人们对政府的评价很差,这个恐怕并不是特别大的风险。只有当人们开始行动的时候,这才会真正影响到他们对权力的控制。比如我们在阿拉伯之春中看到的,当人们走上街头的时候,一个政权可能真的就会崩溃了。进一步来说,如果你在一个网络被审查的国家里上网,结果发现网上全都是关于这个政府的正面言论,那么你会对这个政府因此有更正面的感受吗?
问: 但是在中国,由于敏感词的存在,很多批评性的帖子根本就发不出来,或者人们自己就不发表这样的意见,这也可能导致你所统计到的实际发表出来的批评性的言论激烈程度很弱,以致于政府没有必要删除它们。有这个可能吗?
答: 我们在第二篇论文里面对这个可能性进行了研究。在第一篇论文中,我们仅仅涵盖了相对较短的一个时段内的帖子,所以你是对的,完全有可能人们在提交了帖子之后,审查者可能根本就不让这个帖子发表出来。如果是这样的话,我们的第一篇论文所使用的研究方法就无法发现这个问题。所以在第二篇论文中,我们自己开通了一些社交媒体账号,并根据已有的社交媒体上的内容发表一些帖子,这样我们就能知道是否这些帖子在发表之前就被审查了。现在我们发现,中国网络审查者确实运用关键词进行事前审查,但是这个事前审查的过程非常低效,那些他们认为不正确的帖子并没有被有效地提前发现。
问: 通过你的研究,我们对于中国的网络审查制度的运作过程有什么了解呢?
答: 通过我们第二篇论文的研究,我们对中国的审查制度运作有了更进一步的了解。我们发现了很大的多样性,在不同的网站,他们适用的技术和审查流程是不一样的。在中国,很多审查都是由网络公司自己完成的,而且看上去政府好像也是允许不同的网站保持各自在审查上的多样性,只要他们能够达到政府要求的结果就行。
中国的网络审查分成两个阶段,第一阶段是核查阶段,这是自动完成的。第二阶段是作出是否删帖的决定,这是由人工完成的。在第一个阶段有很多多样性,有一些网站的核查内容非常多,有一些非常少,但基本上它们最终的审查结果是大致一样的。
而且这种审查是非常高效的,基本上是在当天之内,任何帖子都会被核查,然后有一些会被删除。我觉得他们如此高效是因为他们在监测都有什么话题或者帖子突然变得非常热门,就像我刚才讲的。他们并不需要特别仔细地阅读每一个帖子然后去分析他们的内容到底是正面的还是负面的,只要有特别热门的帖子,他们就会特别关注,然后根据这个话题是否在讨论群体性行动来决定是否删除。如果有一万个人都在谈论一个话题,我觉得对审查者来说不难发现这个讨论。
问: 根据你的理解,中国的网络审查指令是非常具体的?
答: 我们并不知道,我们不知道谁发布审查指令,或是发给谁。我甚至也不敢肯定审查指令就是像我刚才猜测的那样。但是有一点是肯定的,就是要审查和删除批评性的帖子非常麻烦,因为这是无法自动完成的,你必须要阅读每一个帖子,然后才能做出决定。
社交媒体扮演怎样的角色取决于人
问: 你觉得社交媒体在中国是否真的对集体性行动有促进作用?
答: 这是非常有趣的问题。社交媒体当然使得人们的交流更加便利,如果没有被删除,也会使得集体性行动变得更加有可能。我最近在芝加哥,美国歌星Justin Timberlake发了一个Twitter说他会在当地的一个俱乐部,前150个到这个俱乐部来的人会得到免费的门票,结果有一千多人去了。他具备了动员人们的能力,当然对他来说动员人们来听音乐会与政治并不相关,但是其他的人拥有相同动员能力的话,可能就是与政治相关了。政府当然不愿意出现这样的权力拥有者。
问: 你认为政府的这种审查制度是否有效地阻止了中国的集体性行动呢?
答: 当然中国仍然有很多示威游行,但是我觉得这种审查确实有效地阻止了集体性行动。比如说在离你三个街区远的地方有游行,但是你不知道,那你怎么能够参与呢?
问: 从另一个角度来说,我们可以从你的研究中了解到中国网民的什么特点?
答: 中国有着一个鄙视审查制度的网民群体,他们对任何你所能想象得到的话题感兴趣,并且持有极为多样化的观点。自动的审查方式对于中国人来说似乎并不是个问题,他们可以很容易绕过去。比如关键词审查,他们有很多方法来绕过这个东西。所以所谓的自动审查制度只是在浪费时间和金钱。我们发现大多数商业网站并不使用自动审查的方式,而政府网站使用这种方法。
问: 你刚才提到了“阿拉伯之春”,你认为社交媒体也能在中国扮演同样的角色吗?
答: 并不是社交媒体在扮演那样的角色,而是人民。所以问题是中国人民是否愿意扮演这样的角色。这个问题应该由你来回答。
问: 你说的有道理,但是在埃及的解放广场上,人们拿着手机发Twitter或者是Facebook。人们也需要工具。
答: 人们会用各种工具和手段来实现自己的目标。所以我觉得即便是没有Twitter或者Facebook,埃及人也会做同样的事情,他们甚至可能会通过油印小报。这是不同的时代,人们使用不同的科技。当然中国人目前无法使用这种社交科技来实现这样的目的,因为中国政府对社交媒体是管制的。
问: 目前中国政府逮捕了一些网络上的意见领袖,并加紧了对网络的控制,这是否对你的“中国的网络审查者严格审查集体性行动而非批评性言论”的结论提出了挑战?
答: 我并不知道这种逮捕的情况目前有多普遍,目前我们知道有一些网络名人被逮捕,但是中国有数以百万计的网民。也许政府觉得通过逮捕一些意见领袖来对网民提出警告,也许政府希望通过提升不确定性来有效加强自己的权威。一般来说,在一个法治社会,法律可以提供一个清晰的界限。但是当法律界限在一个社会变得特别模糊的时候,是可以对民众起到恐吓作用。也许这就是目前中国政府想达到的,也有可能他们逮捕一些具体的人是出于并不相关的原因。总之我并不是太清楚。