chenqin,数据帝 阅读原文 谢很多很多人邀请,这大概是我上知乎以来被邀请数量最多的一次。 第七次人口普查数据总算公布了,数据很多,一下子出来了八个公报,在发布会上也有不少有趣的数据。说几个我觉得比较有价值的点: 1,第七次人口普查中,0-14 岁人口 25338 万人,占总人口比重 17.95%,比起第六次人口普查增加了 1.35%。 很显然,0-14 岁出生数字与历年统计公报报告的出生人口是不一致的。根据历年统计公报与两次普查的 0 岁人口数(2010 年为 1379 万[1],2020 年为 1200 万[2]),2006 到 2020 年的出生人口和应为 23698 万人。 但本次普查给出的结果 25338 万人,要比上图加总的数字高出 1640 万,足足相当于一整年的出生人口。 为什么统计公报出生人口要低于普查 0-14 岁人口?关键是要搞清楚实际人口、普查人口、统计公报人口这三个不同的口径差异以及变化。 低龄人口因漏报而低于教育统计,这种情况并不罕见,我 6 年前写的文章里就提过这点: chenqin:中国的人口数据 虽然人口普查本身就是一项人口数据的标杆并能为政策的制定提供依据,但他并不是永远正确的。1953、1964、1982 和 1990 年的前四次人口普查可以说是中国统计工作的几块丰碑。在统计技术落后、经费有限的情况下,中国的前四次人口普查获得了极高的准确性。但在第五次人口普查时,问题出现了。“五普”数据显示,2000 年的 1 岁人口为 1150 万人,当年生育率为 1.22。(http://www.stats.gov.cn/tjsj/pcsj/rkpc/5rp/html/t0301.htm) 1150 万这个数字对教育部门来说是一个不错的消息,这说明他们在 2005 年将不会碰到太大的入学困难,毕竟比他们早入学的几个年龄段人口都在 1400 至 1500 万人左右。如此,义务教育覆盖率这一指标的完成似乎是没有困难了。而对于计划生育部门来说,这个数字造成的后果则有一些复杂。幼儿数量下降如此之快,似乎说明计划生育工作完成得特别好,但极低的生育水平也预示着计划生育工作目标和机构职能可能会出现变化——正所谓鸟尽弓藏,兔死狗烹。为了证明自己存在的意义依然重大,防止被藏被烹,计生委始终没有接受人口普查报告的幼儿数量,并且在几乎所有场合都提出了 1.8 这个数字作为当年的真实生育率。 人们在数年后才意识到第五次人口普查的严重错误。2005 年,中国的普通小学招生数达到 1671 万人,比普查数字高出一半(http://www.stats.gov.cn/tjsj/ndsj/2006/html/U2121c.htm)——在计划生育的高压下,大量家庭选择藏匿超生的幼儿。如果教育部真的按照 1150 万人口来安排 2005 年的小学招生资源,那后果可以说是不堪设想。另一方面,这个数字的差别也说明中国的生育率并没有第五次人口普查所报告的 1.22 那么低,对于计生委来说,这个消息不知是让他们失望,还是松了一口气。 本次普查中 0-14 岁人口和历年公报的数字不一致,事实上也可以在近几年的教育统计公报中发现端倪。比如 2013 年统计公报出生人口为 1640 万人[3],到了 2019 年教育统计公报,小学一年级在学人口却有 1869 万人[4],足足多了 229 万。 我们将每年统计公报的出生的人口与 6 年后的教育统计公报放在一起,可以得到下图(2010 年统计公报没有出生数字): 从上表可以算出,2006 到 2013 年出生的人口,根据统计公报计算总和为 11280 万人,但根据教育统计,这个年龄段的总入学人口却高达 12322 万人,后者比前者足足高出 9.2%,且两者差异较为稳定。根据灰色折线——教育入学人口统计与统计公报出生人口之比——可以看到,除了 2008 年之外,其他年份均在 1.1 左右,近年来还有上升趋势。 上面我们已经发现,统计公报的历年出生人口数字要比 6 年后的教育统计小学入学数字更低,那么普查分年龄人口和教育统计数据之间存在什么关系呢? 第七次人口普查的分年龄数据尚未发布,我们用六人普的数据看一看。若是只看 2010 年第六次人口普查分年龄人口与 2010 年教育统计公报,我们可以发现,普查人口同样低于教育部人口,但偏低比例逐渐降低: 上图中的蓝柱来自第六次人口普查分年龄数据,橙柱来自 2010 年教育统计公报的分年级数据[5],橙柱同样高于蓝柱。小学入学人口平均每个年龄段要高出 17%;而在初中阶段,教育部人口只比高出了 8%——随着年龄上升,普查数据越来越接近该年龄教育部人口了。 将上面两张图的结论放在一起,可以发现: 1,历年统计公报都偏低教育统计人口,且每年偏低比例较为稳定。 2,普查分年龄人口也偏低教育人口,且年龄越大,偏低比例越小。 以上两个因素合并在一起,当两者的漏报率相对某一基准(在这里的基准是小学一年级入学人口)的变化达到下图情况时,就会出现 0-14 岁人口高于历年统计公报出生人口的情况了。 低龄人口调查是一件非常困难的事,年龄越低,越有可能漏报,近几次普查都没有解决这个问题。因此,0-14 岁人口的普查登记数之和高于统计公报出生数之和,是在非普查年份抽样手段与普查手段不断变化时出现的特殊情况。但目前这两个数字都还低于教育统计入学人口。等十年后的教育统计数字出来,这批人的总数应当还会继续提高。 2,七人普初步汇总的结果显示,2020 年我国出生人口为 1200 万人。 在数据发布会的最后一个问题中,宁吉喆局长透露了这个数字,「七人普初步汇总的结果显示,2020 年我国出生人口为 1200 万人」。与之前的年份相比,2020 出生人口有较大下降,特别是比 2019 年的 1465 万人下降了 265 万人。是什么导致了这么大的变化? 首先需要注意到一点:通过七人普初步汇总得到的 1200 万,并不是在 2020 年出生的人口。人口普查的标准时间是 2020 年 11 月 1 日,而普查中也没有诸如「是否怀孕、预产期哪天」之类的问题。因此,2020 年 11 月和 12 月的出生人口,是没法通过七人普数据汇总得到的。 实际上,1200 万出生人口,是普查中汇总得到的2019 年 11 月 1 日到 2020 年 10 月 31 日之间出生的人口,与 2010 年第六次人口普查的表格 1-12 口径一致[6] 如果不考虑当年出生后在 1 岁内死亡,那么这个数字口径则与 2010 年第六次人口普查表 3-1 的 1379 万[1]0 岁人口一致。 但我们前面也提到了,人口普查的分年龄人口数字,尤其是低龄人口数字,与公安部户籍登记人口、统计公报出生人口或在院分娩数的的口径都是不一致的。在 2010 年时,第六次人口普查公布的 0 岁人口数字为 1383 万(不考虑出生 12 个月内死亡)或者 1379 万(扣除出生 12 个月内死亡),这个数字低于 2009 与 2011 年的统计公报出生人口(分别是 1615 与 1604 万),低于 2015 年的学龄前在学 5 岁人口(1642 万[7]),也低于 2016 年的小学一年级人口(1753 万[8]),且都有较大差距。 因此,正如六人普的 0 岁人口无法与 2009 和 2011 年的统计公报出生人口对比一样,七人普数据发布会上公布的出生 1200 万,与统计公报公布的出生人口不属同一口径,同样是无法与 2019 年公报简单对比,得出「出生人口减少 265 万」这样的判断的。 3,七人普数据表明,2020 年我国育龄妇女总和生育率为 1.3,已经处于较低水平……根据国家统计局的有关调查,我国育龄妇女的生育意愿子女数为 1.8,只要做好相应的支持措施,实际存在的生育潜力就能发挥出来。 本次发布会上首次透露了总和生育率与意愿生育率,并提到了只要做好支持措施,实际存在的生育潜力就能发挥出来。 真的能通过某些手段发挥出生育潜力吗?我在 7 年前的文章里已经提到过这点: chenqin:单独二胎政策,为什么卫计委算错了? 有朋友可能会问,实际生育远低于意愿生育,是不是当前中国的特有现象?两者之间的差距今后会恢复吗?来看看我们的近邻日本吧。 上图列出了日本最近 8 次生育意愿和行为调查的结果,其中最高的柱是夫妇俩的「理想子女数目」,中间的柱是「打算要生育的子女数目」,而最低的斜纹柱是「现有子女数目」。不难发现,日本也有类似的现象,即「理想子女数」(不考虑政策和经济限制,最理想的家庭规模)大于「打算生育的子女数」(考虑政策和经济限制,希望生育的子女数量),又大于「实际生育数」。从理想到实际,其差距稳定在 30%,这个差距,和江苏省的调查较为接近。 因此,假如我们要预测放松计划生育后的生育情况,一个最简单的方法是询问新婚夫妇的理想子女数量,然后直接乘以 70%。 上图来自 2010 年中国综合社会调查,为全国平均数据。横轴表示结婚了多少年,也从另一方面可以反映被访者的年龄。纵轴在问卷中的对应问题是:如果没有政策限制的话,您希望有几个孩子?这个问题实际上度量的是被访者的「理想子女数」,也就是生育水平的「上限」。从中可以看出,中国年轻家庭的理想子女数量,已经低于 1.7。即使我们把范围限制在农村且户主学历在初中以下家庭,理想的孩子数量也没有发生多大差别。这说明,即使在农村,中国传统的「多子多福」思想也已经被打破了。 上图中可以算出的「理想子女数」是 1.7,而本次发布会上公布的意愿生育率是 1.8。从理想子女数再乘以 70%,可算出实际生育率在这种模式下应该等于 1.26。 而发布会公布了中国目前的实际生育率 1.3。1.3>1.26 这么一对比就能发现,对比意愿生育水平、理想子女个数,中国目前的实际生育率,算是超常发挥了,根本就没有挖潜空间。 除非有超常规措施,否则生育率绝无可能上升。 4,平均每个家庭户的人口为 2.62 人,比 2010 年的 3.10 人减少 0.48 人。家庭户规模继续缩小,主要是受我国人口流动日趋频繁和住房条件改善年轻人婚后独立居住等因素的影响。 2000 年第五次人口普查我国有家庭户 34837 万,平均每户 3.44 人[9]。 2010 年第六次人口普查我国有家庭户 40152 万,平均每户 3.1 人[10]。 2020 年第七次人口普查我国有家庭户 49416 万,平均每户 2.62 人。 可以算出,在本世纪第一个十年增加的家庭户为 5315 万,第二个十年增加了 9264 万。对比结婚对数,本世纪第一个十年结婚累计有 9188 万对,而第二个十年增加了 11892 万对。 不考虑未婚独居户、离婚与家庭消亡,粗略计算,2001-2010 的结婚人口,58%到了新的居所成立了新的家庭,剩下 42%仍然与父母同住。而 2011-2020 的结婚人口有 78%成立了新的家庭,只有 22%与父母同住。 新家庭的出现,逐渐从出芽繁殖变成分裂繁殖,新的核心家庭越来越快速地脱离母体而存在。 出芽生殖 分裂生殖 家庭模式的改变是本次普查的最重要数据之一。他首先与年轻人口的生育相关,这方面已经有不少研究。比如封进等在《退休年龄制度的代际影响——基于子代生育时间选择的研究》中发现: 父代在超过退休年龄之后与之前相比,子代生育概率显著提高大约 6—9 个百分点,说明子代会根据父代退休时间规划生育时间,以缓解生育和工作的矛盾。本文进一步发现父代超过退休年龄之后,提供的隔代照料时间明显增加,而且父代超过退休年龄对子代生育的效应在低教育程度父代群体中、工资收入较高的子代群体中和在社会托幼成本较高的地区中体现得更为明显,效应也更大。 意思是说,退休后的父母可以为子女提供照料,进而促进年轻人生育。 但从七普数据看,同住的比例进一步减少所致以及核心家庭模式的进一步改变,分开了父母与子女,不仅改变了年轻人的生存模式,减弱了退休父母对子女生育的照料,也使老年人口核心家庭成为新的课题——成为独立家庭的老年人应当怎么办? 5,老年人口质量不断提高。60 岁及以上人口中,拥有高中及以上文化程度的有 3669 万人,比 2010 年增加了 2085 万人;高中及以上文化程度的人口比重为 13.90%,比十年前提高了 4.98 个百分点……而且,在我国 60 岁及以上人口中,60-69 岁的低龄老年人口占 55.83%,这些低龄老年人大多具有知识、经验、技能的优势,身体状况还可以,发挥余热和作用的潜力较大。 这段文字是本次普查的最大创新点,但却少有人提到。之前的老年人口数据主要关注老年健康,老年失能,鳏寡独居之类的问题。老年人口质量、低龄老人,都是新词,在之前的各类政府报告中是很少出现的。 尤其是「老年人口质量」一词,老年人在这里不是传统报告中的被照顾的对象,而是需要研究教育、经验、技能的劳动要素,这种提法可以说是第七次人口普查公报的首创。 这意味着什么?用 8 年前我自己的一个回答来给出答案吧。 chenqin:中国社保:除了延迟退休,还能做什么? 说了那么多,就想表达一点:如果说中国社保是一个病歪歪的老头子,那么推迟退休年龄就是一剂触手可得价格便宜药到病除人人都用的方子。与之对比的是,其他的药方要么太贵,要么就是安慰剂,要么要跑上半天人快死了才能买到。 在这种情况下,即使反对声音再强,政策制定者也很难抗拒延迟退休年龄的诱惑。 时间关系,就写这五点。 其实其他的一些数据,比如东北地区的人口流出和广东的流入;出生性别比从 118.06 下降到 111.3 等,都有很多可写之处,会抽时间慢慢再写。 想必大家也能注意到,这个答案里面引用的很多数据和观点,都是我自己的回答,而且是 6、7、8 年前的文字了。该说的话,早已说尽了。 所以这几年每每看到人口相关的数字和很多讨论,脑子里常常就是一句话: Told you! 但转念一想,说过又能怎么样?什么都改变不了啊。于是再无奈地回答自己一句话: So what? 阅读原文