养老金和生育率
精华概括
论文《Pensions and Fertility: Microeconomic Evidence》使用巴西的微观数据集研究了养老金供给和生育率的关系。
结论上: 从经济循环和要素替代的整体来看,养孩子的其中一个传统作用是养老,自然,养老金的提供缓解了这部分担忧,于是生育率下降。
贡献上: 历史经验显示,生育率下降的时间大约是在许多高收入和中等收入国家引入或扩大其社会保障制度的时候1🤯。财政公共政策影响生育方面,机理研究相对较少,同时大部分使用 OLG 的宏观模型分析,本文使用微观分析。
计量设计上: 个人比较喜欢本文的计量设计。文章研究的是养老金改革会影响妇女的生育决策,而不同状态的妇女反应理应不同,从而加入不同妇女群组的事件分析法来加强论证。
理论和现实背景
理论
都说国人论文喜欢造词,这篇 AER 文章的好多理论解释不也自己造词?甚至为了凸显一个造出来的效应把话说得挺绕。但对应的,本文比较有意思的点是——如何分解生育决策,并概括成为可量化的约束条件。
女性年龄
- 生存效应(survival effect):养老金改革前后,同时存在新妇女和老妇女,老妇女已经有两孩子,生育风险较低。
- 信息效应(information effect):老年妇女更熟悉孩子养育的情况从而不会囤积孩子。
- 饱和效应(saturation effect):已经达到孩子期望状态,和处于生育期后期的人母亲群体,将减少生育可能性。
- 养老金财富效应(pension wealth effect):临近退休的母亲群体和年轻的母亲群体从养老金改革中获取的养老金贴现流不同,决策反应也会不同。
- 突出效应(salience effect):养老金改革结果越明显,群众反应越突出2。
考虑一位妇女生孩子的决策,她的决策依据将包含自己的身体适孕情况、之前生育出的孩子的数量和性别结构。年轻母亲将更容易对养老金改革做出反应。而年老的母亲不容易做出反应,通过对比两者都数据,使得文章的分析可信度增加。
子女数量结构
- 改革前的孩子数量越多,越不容易增加生育。
- 改革前家庭男孩子越多3,越不容易增加生育。
现实
二十世纪中叶以来,受到城市化、医疗保障、教育等扩张的影响,巴西的生育率急剧下降。在这一背景下,巴西实施了全面的养老金改革。
20 世纪 70 年代之前,只有具有正式工作的城镇工人才有权享受分散的、针对特定职业的养老金,但是 1988 年 10 月巴西联邦共和国宪法的改革显著扩大了养老金的覆盖范围,使得农村工人在巴西历史上首次获得了养老金福利。
养老金改革自 1991 年 7 月获得合法批准后开始实施。对于城镇工人,养老金规则和福利几乎没有变化。而对于农村工人,无论其是否有正式就业或缴纳任何社会保障款项,女性(男性)从55( 60 )岁起就有资格领取养老金
正是基于这种历史背景,在论文的事件研究法中,1988 年成为了和 1991 年形成对比的事件检验。
数据方法
APC 面板
论文使用的巴西全国抽样家庭调查 (PNAD) 的多个横截面,覆盖了1981-1990、1992-1993、1995-1999、2001-2009、2011-2014等年份。
关于 APC 面板——可以参考个人以前的笔记:《 HLT: 生命周期与工资分解》中的第一节阐述。论文虽然使用 APC 面板,但其实并未分解相关效应,而是通过限制 age 队列,然后通过事件分析法进行对比论证人们对政策反应的不同。
多个体追踪的面板数据总是很难得到,于是人们开始使用长截面,把多个截面数据匹配到一起。这种面板数据在流行病统计和人口统计中常常用到,被叫作 APC 数据(age-period-cohort)。显而易见,APC 面板包含三个数据维度。
- Age:年龄,也就是生理特征影响,例如年龄的生理特征可以划分适孕与否、劳动力质量……
- Period:截面数据收集时的时间,例如每年人口统计时,那段时间的科技水平,基础设施水平……
- Cohort:队列,每个截面的出生年月,一般看作群体共同经历了某种社会环境、历史事件,因此具有相似性。
由于 age+cohort=period
,因此这几个变量常常混淆,同时实操时有会产生共线性的问题。
在计量中,往往是通过某些手段(根据对象特性进行巧妙的差分)率先估计出其中一个效应量,然后回归剩余部分;要么对回归施加额外的线性约束;或者使用高阶差分(类似个体效应估计)的方式单独估计三个要素的效应。
人口统计学常常使用 APC 面板绘制 Lexis 图:
横纵坐标为年份时间(period)和年龄时间 (age),中间线条按照队列(Cohort)进行分组,通过对比线条趋势和区别展开分析和预测。
变量与计量式子
因变量
短期效应:如果妇女在数据收集年份一年内内生育了孩子,则值为 1,否则为 0 (基于家庭花名册和出生数据) 。样本包括 1981 年至 1999 年育龄 (15 岁至 44 岁) 的女性受访者。
长期效应:45岁女性的生育总数(包括存活和死亡的孩子)。样本包括1930年至1969年出生的女性受访者,她们在特定调查年份的年龄在45岁至69岁之间。作者将在调查年(1984-2014)年龄高于45岁的受访者的生育总数回溯到她们45岁时(1975-2014)的生育数。
实验组为城市职工;对照组为农村职工。
计量回归
双重差分
$$ \begin{aligned}y _{igtr}^{SR}&= \alpha^{SR}+\beta\big(RURAL _{g}^{SR}\times POST _{t}^{SR}\big)\\&+ \gamma RURAL _{g}^{SR}+\lambda_{t}^{SR}+\phi _{r}^{SR}+\psi^{\prime}\mathbf{X} _{igtr}^{SR}+\epsilon_{igtr}^{SR} \end{aligned} $$
- 脚标:r 地区 g 农村城市组别 i 个体 t 年份 r 地方州。
- $y_{igtr}^{SR}$: 短期效应。调查年份一年内生了孩子。
- $RURAL_{g}^{SR}$:农村工人女性虚拟变量。
- $POST_{t}^{SR}$:1991 年 7 月农村养老金政策改革虚拟变量。
- $\mathbf{X}_{igtr}^{SR}$:个体特征、工作特征、家庭特征和地区层面的控制变量。
- 效应:时间效应 $\lambda_{t}^{SR}$、个体效应 $\phi_{r}^{SR}$、稳健聚类到联邦州。
养老金改革使得生育率短期下降;
分组回归中,年轻群体(15-29岁)不显著,年长群体(30-44岁)生育率显著下降;孩子数量越多,孩子男性比例越多,生育欲望越低。
工具变量
将 did(养老金改革政策实施差异) 视为养老金($\ln(pensionwealth)_{igtr}$)的工具变量。
一阶段: $$ \begin{aligned}\ln(pensionwealth)_{igtr}&= \sigma^{SR}+\theta\big(RURAL_{g}^{SR}\times POST_{t}^{SR}\big)\\&+\eta RURAL_{g}^{SR}+\delta_{t}^{SR}+\tau_{r}^{SR}+\kappa^{\prime}\mathbf{X}_{igtr}^{SR}+\mu_{igtr}^{SR}\end{aligned} $$ 二阶段: $$ \begin{aligned}y_{igtr}^{SR}&=\alpha^{SR}+\beta\ln\left(\widehat{pensionwealth}\right)_{igrt}\\&+\gamma RURAL_g^{SR}+\lambda_t^{SR}+\phi_r^{SR}+\psi^{\prime}\mathbf{X}_{igtr}^{SR}+\epsilon_{igtr}^{SR}\end{aligned} $$
事件研究法
关于事件研究法可以参考《计量:事件研究法 1》。
简单来说,事件研究法可以看作双重差分法的动态处理效应,式子变化上,就是对政策变量 $POST_{t}^{SR}$ 进行时间切片,进一步展开为 $\sum YEAR_T^{LR}$。
$$ \begin{aligned}y_{igtr}^{LR}&=\alpha^{LR}+\sum_{t=-16}^{23}\beta_t\big(RURAL_g^{LR}\times YEAR_t^{LR}\big)\\&+\gamma RURAL_g^{LR}+\lambda_t^{LR}+\phi_r^{LR}+\psi^{\prime}\mathbf{X}_{iglr}^{LR}+\epsilon_{iglr}^{LR},\end{aligned} $$
- 脚标:r 地区 g 农村城市组别 i 个体 t 年份 r 地方州。
- $y_{igtr}^{LR}$: 长期效应。45 岁时的孩子总数。
- $RURAL_{g}^{LR}$:农村工人女性虚拟变量。
- $YEAR_{t}^{LR}$:政策时间虚拟变量。
- $\mathbf{X}_{igtr}^{SR}$:教育年限、婚姻虚拟变量以及终身劳动力供给的控制变量。
- 效应:队列效应 $\lambda_{t}^{LR}$、个体效应 $\phi_{r}^{LR}$、稳健聚类到联邦州。
双重差分部分 $\lambda_{t}$ 是调查数据年份时间虚拟变量,属于时间效应,代表数据调查时对应的科技水平、医疗水平、基础设施等随着时间变化的要素;
事件研究法部分 $\lambda_{t}$ 是出生年份时间虚拟变量,用来标志特定群体经历过特定的历史社会环境。
对于这个细节,我也邮件询问了两位作者,得到如下回复(非常感谢两位老师的热心回复🥰)。
In the short run (SR), we control for time fixed effects (FE) and age dummies. For the long run (LR), our sample includes women aged 45-69 years. We interpret their number of children as the number of children at age 45, regardless of their current age. Therefore, we control for different fertility patterns depending on the birth year of the women, which is why we include cohort fixed effects in the event study section. In this context, (current) time fixed effects are not relevant because we are looking at retrospective fertility patterns (in the past).
To summarize, in the SR, time FE and age dummies are used, while in the LR, we use cohort FE to account for differences in fertility patterns based on birth year. Time FE do not coexist in the LR analysis because they do not directly apply to the retrospective nature of the data.
在我个人看来,做法是人为假设 age-period-time 中某个效应不重要,于是直接省略。这种做法坦白讲,个人依旧觉得不严谨。但还是可以辩护下,请参见下文:
动态处理效应图现实,改革后城乡差距不断缩小,改革后生育率不断下降4。横坐标展示的是队列,控制了 age 为 45 岁,以出生年份分组展现。由于 age+cohort=period, 但从统计的现实意义上说,period 在图的统计中没有特别含义,因此可以忽略时间效应。
混杂因子
比较农村和城市妇女之间的婚姻率,教育,医疗保健,收入,财富和就业的趋势;讨论了巴西文化变革在宗教和电视剧方面的作用、贸易自由化的作用,以及在儿童数量与对其质量 (即教育) 的投资之间的数量-质量平衡模式。
稳健性
- 更换年龄段分组回归对比:使用新的年龄段分组,对比不同队列的妇女对养老金政策的生育反应。
- 更换计量函数:加入教育水;作为控制变量;线性时间趋势,线性时间-区域;区分是否和领取养老金的人住在一起。
- 样本选择:(1)三种类型的样本抽样:非自我代表性的市政局样本框;自我代表性的地区;大都市地区。(2)根据个人职业信息、家庭住址、家长职业信息严格化实验组和对照组的划分和范围。(3)加入妻子丈夫不同职业领域工作的农村城市样本。(4)排除年龄在 15 岁以下和 44 岁以上的妇女样本。(5)排除超过 45 岁的生育妇女。
- 标准误:除了地方州聚类外,加入集中定居点的聚类。为解决自相关问题,结果分别减去治疗前后的结果均值。
结论
我想重点从升华和细化角度归纳本文的结论。
验证了历史经验——养老金的扩大可能降低生育率。
升华:公共福利的支出可能存在一定的政策代价,社会福利和人口变动存在相关机制。
细节:前文提到过了。本文的亮点特色在于结合了 1981 和 1991 年的巴西改革国情,强化了农村-城市,妇女年龄段的分组对比,因此事件研究法也运用的很好。
个人的一些怀疑。
为啥一般人想不到把养老服务和生育联系在一起呢?因为大家默认领取养老金的人已经丧失了怀孕能力。所以这是一个预期问题,妇女们预期未来将得到养老金收入,所以生育决策改变。这个逻辑过程,文章并未采用过计量数据来证明,主要是通过社会历史背景的分析加以阐述。