小吉,香港科技大学经济学博士在读计量经济学 阅读原文 我是计量经济学理论方向的在读博士生,做过本科计量经济学和博士计量经济学的助教,看到这个经典的问题,也来贡献一下看法。 计量经济学和统计学的区别根源之一,在于关心的重点不同。统计学关心的是相关性(correlation),而计量经济学关心的是因果性(causality)。为什么它们关心的重点不同?因为两个学科所服务的研究主题和研究方式不同。 具体而言,统计学通常服务于可实验性更高的学科,例如生物学,医学等。而计量经济学服务于实验性不那么高的学科,例如经济学,金融学,社会学等。实验性高是指什么呢?举个例子,我们想要研究一种药物对改变某个基因表达的影响,我们可以设计一个控制变量实验来研究。“控制变量”就是实验的一个重要特征。如果实验组和对照组相比,改变的变量只有一个,那么二组在结果变量上的区别可以直接归因于这个单一的因变量。实验性高有什么好处呢?大家都知道,回归系数本身只是一个相关关系的大小,而实验性高的好处就在于,通过控制变量,收集实验数据,进行回归分析(regression),我们可以把估计出的回归参数(estimated coefficient )直接看成因果关系的大小,因此统计学在这里不需要刻意区分相关性与因果性。然而,在社会经济类学科中,我们就很难保证实验性了。试想,我们要研究一项经济政策对人们收入的影响,难道我们能把全国人民随机分组,然后一组实行政策,另一组不实行吗?这是几乎不可能做到的。那么这个研究要如何进行下去呢?我们只能试图依赖已经观测到的经济数据来分析。相比完美的实验数据,观测到的数据不再具备“控制变量”这么好的性质(也就是有“内生性”),那怎么办呢?我们只能退而求其次,对简单的回归模型施加更多假设。这就进入了计量经济学的范畴:如何施加不过分(合理)的假设,以得到一个“差不多像做实验一样”的识别条件,从而保证我们依然能够将回归结果中的“相关关系”诠释为“因果关系”。在这个过程中,我们施加的假设,有些是可以用数据做“证据”来说明其合理性的,有些则没有数据说话,而只能依赖经济学逻辑分析。具体情况不同,我们挑选的假设也可以不同,所以计量经济学家开发了适用于不同场景的丰富模型。这些计量模型,与传统的统计学中出现的模型相比,已经走出了一条深远的,不一样的道路。 总结一下:为了服务不同特点的研究内容与研究目的,统计学和计量经济学的区别由此展开。具体的区别包括:模型假设的不同、数据形式和数据假设不同(例如,很多统计学模型更强调数据正态分布的假设,而经济学数据大多是不符合这个假设的)、假设检验的理论依据不同(例如,统计学模型有一部分是有限样本检验,而经济数据通常是大样本,检验时用的是大样本近似理论)等等等等。还有很多因这些基本的不同而衍生出的许许多多区别,这就形成了两门看上去非常相似实际上却各自自成一脉的学科。 当然,学好两门学科中的任意一门都有助于加深对另一门的理解和运用,前提是我们可以清晰地辨别二者的异同,并理解各种缘由。希望我的答案能对各位对这个问题的理解产生一点积极贡献。 btw,对于有限样本(finite sample)和大样本(large sample)理论的区别,以及计量经济学和统计学在运用这两个理论时的区别,还可以多讨论几句。在传统的统计学的 OLS 中,我们会注意到一个经常出现的假设:error term follows a Gaussian distribution,即误差项是正态分布的。与其他假设相结合,我们能得到的结论是,在对 OLS 模型的估计量进行单个假设检验的时候,检验统计量(testing statistics)服从一个 t 分布。这个 t 分布的自由度 n 等于样本量的大小 n,是一个精确的分布。意思是说,对于不同数据集的不同样本大小,这个 t 分布对应的自由度也相应变化。当样本量趋向于无限大时,t 分布趋向于标准正态分布。而在统计学的假设检验中,我们已知具体的样本大小 n,能计算精确的统计量分布,而 t 值,p 值,查表值,置信区间(confidence interval)等,都是基于精确的 t(n)分布的。 那么,在计量经济学中会有什么不同呢?首先,我们丢掉正态分布的假设,因为在绝大多数情况下,它不符合经济数据的特征。没了这个假设,还能推出针对有限样本 n 的统计量分布吗?不能了。那还可以继续做假设检验吗?可以。如何做?我们运用基于大样本理论的假设检验。为什么可以用大样本理论?因为在经济学研究中,数据集一般是很大的,少也有几百,大可以到几万甚至更多,在这样大的样本下,我们可以想象,样本量最终有机会趋向于无穷大。有了脑子里的这个想象,我们可以用统计量近似服从(在 n 无穷大时)的分布来做假设检验。根据大样本理论,我们知道,标准化后的检验统计量近似服从一个标准正态分布。这就是为什么在计量经济学中,0.05 水平假设检验的 t 值,永远是和 1.96 比较的。因为 1.96 是标准正态分布的 97.5%分位数,我们用它,其实是在用大样本近似。希望这几句补充可以给统计学和计量经济学的区别添加一个佐证。 阅读原文