2019-03-04
基于历史的因果识别设计在政治学研究中的应用
社会科学的因果识别革命使得政治学研究越来越偏重基于设计的实验方法。同时学术训练也更着重以计量为导向的因果识别、实验设计等,而轻视了对于历史知识的积累和对研究对象更深层次的了解。本文以政治制度和政治态度的有关研究为例,探讨历史事件在以识别因果关系为导向的研究设计中的独特作用。基于历史的因果识别分析对研究人员在理论、背景知识、数据分析等多个维度上都提出了更高的要求。
文/马 啸
北京大学中国政治学研究中心 助理教授
过去十多年里政治学实证研究经历了因果识别的革命。这种现象的出现,一方面是因为越来越多的经济学家开始尝试政治学议题,潜移默化地将经济学的研究范式引入了政治学,另一方面也是因为政治学的研究成果更为频繁地被作为政策决定的依据,研究人员不再满足于从数据中寻找相关性,而是希望发现因果关系。在此之前,政治学主流的研究方法是基于对观察数据的分析。但是基于观察数据的因果关系分析具有较大的局限性。即使是非常稳健的相关性的结果,也可能会受到包括样本选择偏差、反向因果、遗漏变量等方面的质疑。
为了应对观察数据在因果关系识别上的挑战,政治学研究日益青睐基于设计的实验法。因其研究设计的严谨性,实验法可以为研究者提供非常精准的因果效应的估计,其结果也往往更具有政策参考的价值。但是实验法同样具有局限性。首先并不是所有的研究议题都可以用实验法来检验。而且往往那些无法用实验法检验的话题,恰好具有重要的理论意义。例如,如果想要知道战乱经历对人的政治态度的影响,研究人员就需要让受访者去战场上亲身体验一下战争的残酷,并测量政治态度的变化。但这种可能伤害到受访者的研究设计显然无法在现实中执行。这些局限使得使用实验法的政治学研究者逐渐回避社会科学领域的传统经典理论问题,转而进行一些以政策为导向的微观研究。
本文认为,政治学的一些传统研究方法在以因果识别为研究导向的潮流中可以焕发新的活力。这里说的传统研究方法,特指比较政治学中以国别、区域为研究对象的研究,要求研究者对研究对象的历史进行深度了解和发掘,对所研究对象的社会背景知识(不仅限于自己所研究的特定话题)有广泛积累。本文认为,掌握研究对象的历史与细节知识,本身并不与因果识别相矛盾。相反,掌握丰富的关于研究对象的质性知识,为研究者通过“自然实验”来识别因果关系打开了大门。这种方法将历史事件所造成的长期冲击纳入因果识别相的框架,来分析制度、观念等内生性较强,但同时又颇具理论意义的变量的影响,是一种综合了质性与定量方法、观察数据与实验设计优点的研究路径。
本文首先简单介绍历史自然实验的概念,之后分别结合制度变迁和政治态度两类具体研究,对于基于历史事件的因果识别设计进行阐释,最后对这种方法的局限性做简单的讨论。
历史自然实验与因果识别
使用观察数据并通过相关性分析得出结论的研究面临着两大挑战。第一个挑战是反向因果问题。第二个挑战是遗漏变量的干扰。研究者尝试使用各种方法解决这些问题,包括在分析中使用解释变量的时间滞后项以及在回归中控制尽可能多的干扰因素。但是这种“事后补救”的办法存在各种局限,无法真正解决问题。
为了解决这些问题,计量经济学家提出了工具变量的方法。工具变量需要满足排他性限制,即其只能通过改变解释变量这一个渠道,而非其他途径,来影响被解释变量。为了满足这一条件,研究者采用的工具变量大都基于偶发的事件、自然灾害,或者政策的人为断点等。
历史事件形成的冲击同样可以被用于构建工具变量。重大的历史事件,则可以在更长的时间维度上积淀出更深远持久的影响,因此可以用来检验一些更为复杂且不容易改变的事物的因果效应。下面就以制度和政治态度的研究为例,探讨历史事件作为工具变量在因果识别设计中的运用。
基于历史的因果识别在制度研究中的应用
现代化理论提出后,主流观点认为政治制度的发展是经济发展的结果。随着新制度主义学派的兴起,人们对制度与经济发展间的因果关系又提出了新的问题。制度主义学派认为良好的制度是经济发展的前提而非结果,这与现代化理论的因果关系形成了直接的冲突。由于数据的局限,尽管经济学家和政治学家尝试采用各种高级的计量方法,但还是没有办法取得共识。分析的难点集中在两处:第一,政治制度的决定因素可能是多种多样的,利用观察数据只能控制有限的干扰变量,无法穷尽所有可能影响制度的因素;第二,经济发展与制度变迁这两个核心变量在理论上可以互为因果。
阿西莫格鲁等人将历史遗产用作识别制度变迁的外生冲击。他们发现,曾经被欧洲殖民者统治的国家间存在巨大的经济发展水平差异和制度差异。而这些国家间的制度差异可以用第一批殖民者抵达殖民地时的死亡率来解释。在那些死亡率较低的区域,殖民者会选择长期驻扎,将殖民地当作自己的家园并引入欧洲的法律和产权保护等制度。而在那些早期殖民者死亡率较高的区域,因为环境恶劣不适合长期居住,殖民者将殖民地变成了榨取资源和劳动力的场所。现代国家制度的确立和发展受到了这种早期殖民地差异的路径依赖影响。
阿西莫格鲁等人的结论是建立在历史学家和区域研究专家大量的史料发掘基础之上。原欧洲殖民地国家早期殖民者死亡率的数据,就是基于历史学家菲利普•柯廷(Philip Curtin)关于欧洲殖民史的30多年的研究成果。而早期殖民者的定居模式与后续制度发展之间的关系,也非阿西莫格鲁等人的首创。经济史学家索克罗夫和安格曼(Sokoloff and Engerman)在研究南北美洲巨大的发展差异时,就注意到了两地不同的环境和自然禀赋对欧洲殖民者建立早期殖民地政权的影响。阿西莫格鲁及其合作者的贡献就在于巧妙地将现成的史料与计量方法结合,运用工具变量的研究设计检验了制度对经济发展的因果效应。
对阿西莫格鲁等人研究的众多批评之一是其结论的外部效度。西方国家的殖民历史是一次制度迁移的宏大自然实验,殖民政权的建立对于殖民地的政治制度构成剧烈的外生冲击,很多殖民地在此之前甚至不存在现代意义的国家。而那些没有彻底沦为殖民地的区域(例如东亚和中东地区等),则没有经历类似的外部引入制度的冲击,因此也没有进入阿西莫格鲁等人的分析样本。对于这些历史悠久,而且政权能力足以抵御西方殖民者、不至于彻底沦落为殖民地的国家,如何评价制度与经济发展间的关系值得思考。
梅拉尔多(VictorMenaldo)在研究中东与北非国家时,发现那些在第二次世界大战以后仍然保持了君主制的国家(例如卡塔尔、阿联酋、沙特阿拉伯等)普遍政治稳定、经济发展水平较高。而那些名义上实行了共和制的国家(如伊拉克、叙利亚、利比亚等),则被政治动荡所困,经济发展水平不高。梅拉尔多经过细致的案例研究后发现,君主制国家在权力继承、资源分配、政策制定等重要议题上,具有更为明确的行事规则,而且君主制也通过将传统的神秘化保护这些规则不被轻易修改。那些采用了共和体制的专制国家,在上述重大议题上缺乏规则,即使形成了规则也容易被强人领导所改变。而缺乏明确的规则使得这些国家的统治精英更容易出现分裂,进而影响这些国家的政治稳定与经济发展。
梅拉尔多的分析中面临的一个难题是如何证明君主制与较高经济发展水平间的相关性是因果关系。较高的经济发展水平也有可能是中东君主制国家能够成功抵制要求实行共和制诉求的一个重要先决条件。此外,也可能存在一个尚未被了解的变量,既决定了一个国家的经济发展水平,又影响该国是否能够维持君主制的统治。为了解决这些问题,梅拉尔多尝试寻找能够解释中东国家政体形态的工具变量。他发现在该区域实行君主制的国家,历史上长期的社会形态以游牧部落为主。在那些实行共和制的国家,历史上则长期以城邦为主。在那些降水充沛、土壤肥沃的区域,从很早开始就具有发达的农业,能够承载更多的人口,因此也更早地出现了城市。而在降水稀少、土壤贫瘠的地区,游牧则成为主要的生产生活方式。通过收集中东地区历史降水量的数据,梅拉尔多找到了影响该地区当前政体形态的工具变量,证实了特定的政体形态(君主制)对威权国家的经济发展有重要的影响。
类似历史方法在单个国家内的跨区域分析中同样应用广泛。因为控制了诸如传统、文化、语言等潜在的干扰因素,研究人员能够更好地分离和识别制度变化所带来的影响。例如,杨竹箐关于科举制度的长期影响的研究发现,那些在明代考取进士越多的地区,在现代人均收入也越高、基础设施更完善、对教育的投入也越多。其认为这一相关性的主要因果机制是大量进士产生后形成的地方尊重人力资本投资的传统,而对教育的重视直接导致这些地方在现代发展水平更高。在另一项研究中,章奇和刘明兴发现浙江各地私营经济发展水平与该地在改革开放初期本地干部占比呈现正相关。他们用浙江省各县1949年以前本地游击队的分布数据作为中华人民共和国成立后本地干部比重的工具变量,证实本地干部比例与私营经济发展具有因果效应。受该项研究启发,本文作者尝试解释浙北、苏南两地在改革开放以后经济发展模式差异的历史决定因素。本文作者发现,苏南地区之所以高度依赖外资,与改革开放初期该地国有、集体经济发达,而当时国家法律又要求外商投资必须与本地企业合资有关。国有与集体企业匮乏的浙江不具备吸引大量的外资的条件,地方官员在考核的压力之下最终只能够通过发展本地的私营经济来完成考核目标。本文作者发现两地在改革开放初期国有、集体经济的发达程度与两地的地理位置有关。浙江因地处对台海防前线,在计划经济时代接受的国有投资远远少于江苏。
基于历史的因果识别在政治态度研究中的应用
尽管政治制度与政治态度的研究经常被认为是两个壁垒分明的学术流派,但广义的政治制度也包括了能够引导人们行为的一些非正式制度,包括观念、文化、信任等态度元素。在识别因果机制这一维度上,两者面临着一些共同的挑战。首先两者都属于稳定的均衡。这增加了研究者寻找能影响政治态度的外生冲击的难度。其次,政治态度本身的决定因素也较为多样。这些因素不仅互相之间存在相关性,而且经常和其他的被认为能够决定政治态度的因素相关。这给准确的识别政治态度的决定因素和其对其他行为的影响制造了不少挑战。研究者利用具有重大影响的历史事件来识别政治态度的决定因素。
纳恩(Nunn)和沃彻肯(Wantchekon)在一项研究中发现,欧洲殖民非洲期间受奴隶贸易影响较大的族群个体,普遍表现出对他人较低的信任。为了识别奴隶贸易对政治态度的影响,纳恩和沃彻肯使用非洲各地到海岸线的距离作为殖民时期奴隶贸易强度的工具变量,并发现奴隶贸易的强度对个体的信任态度有显著的负效应。他们同时发现,各地距离海岸线的直线距离仅在非洲与政治信任存在负相关性,而在欧洲和亚洲则不存在类似相关性,说明距离海岸线的距离只有可能通过历史上的奴隶贸易而非其他现当代的渠道影响政治信任,为工具变量满足排他性限制提供了有力证据。
基于历史的因果分析同样可以为反直觉的发现提供有力的佐证。科恩和海恩穆尔勒尔(Kern和Hainmueller)在一项研究中发现,在东德的居民中,有观看西德电视节目经历的居民对东德政权的支持度更高,对生活现状的满意度也更高。这与文献中关于外国媒体对威权国家政治态度的影响的已有研究结论相反。他们利用两德分立时期西德电视信号发射塔的位置及信号覆盖范围作为识别手段,发现分布在信号覆盖范围两侧的居民的政治态度存在显著的差异,为上述发现提供了有力的支持。
中国研究政治态度的学者同样将目光投向了历史。陈济冬等发现,在土地改革时期,家庭成分被定义为“坏阶级”(例如“地主”等)的人士及其后代,当前对政府的信任度普遍较低,尽管这些人在改革开放后取得了较高的社会经济地位。王裕华的研究也发现,20世纪60年代后期武斗中伤亡越严重的区域,居民当前对政府的信任程度越低。王裕华使用了硫矿所在位置作为武斗激烈程度的工具变量。军工厂多靠近硫矿所在地,有解放军驻守并维持秩序,因此出现大规模武斗伤亡的几率较低。
结论与讨论
本文结合若干研究实例,着重介绍了历史事件在社会科学研究因果推断中的作用。基于历史的因果分析要求研究者同时具有对研究对象质性细节的关怀,和对严谨研究设计和定量研究方法的掌握。
任何一种研究方法都存在其局限性,基于历史的因果识别也不例外。首先,将历史事件的外生冲击作为工具变量时,较难证实其排他性限制。因为历史数据的稀缺性,很多时候研究人员只能依赖文字描述(而非数据)来回应对排他性限制的质疑,不能给出非常令人信服的辩护。同时,研究人员经常缺乏能检验同一事件的交叉证据,因而数据中存在的衡量偏误往往无法得到检验和修正。其次,这种研究方法对于学术训练也提出了更高的要求。发现一个好的历史自然实验,除了掌握计量方法外,还需要研究人员在历史、政治、地理、经济领域有广泛而且深厚的积累,而且同时具有将历史实证数据与理论话题互联系的直觉。如何在历史数据和理论议题之间建立起有效的对话,是使用这种方法的研究人员所要面临的一大挑战。
本文原载于《公共管理评论》2018年第2期。为方便阅读,略去全部注释,并有删节和调整。