週記(九)

2025-03-22

Table of Contents

修課

這週書法課終於開始寫字。

這週沒去上統計學習課。原因見其他

研究與閱讀

這週看了一些俗稱是 reduced-form 的應用個體文章。雖然我有發現一些問題,但多被做走了。不過 YC 似乎比較樂觀,他覺得有想到這些厲害的人做了的題目也不錯,可以用一張試算表把讀過的實證文章和相關的計量文章紀錄起來,再看要往下鑽研或者看看其他實證文章。真感謝他的鼓勵😔。

Londoño-Vélez and Saravia (2025)

這篇文章發表在 QJE,標題是 The Impact of Being Denied a Wanted Abortion on Women and Their Children。作者利用哥倫比亞的行政資料,研究拒絕墮胎對女性和她們的孩子的影響。

哥倫比亞從 2006 年開始,將墮胎部分合法化,除了非自願的懷孕,只要醫師或心理師認為懷孕危及孕婦的物理、心理或社會健康,就可以合法墮胎。問題是,實際獲得合法墮胎服務仍然非常困難:除了各種行政障礙,醫療機構經常以宗教為由拒絕提供墮胎服務。因此,許多符合墮胎條件的女性被迫申請 tutela(一種憲法保護令),要求法院命令醫療系統尊重她們的合法權利。Tutela 依法會被隨機分配給法官,而作者發現雖然男女法官在各種 tutela 案件中的判決沒有顯著差別,但在墮胎案件中,女性法官更傾向支持女性的申請。既然承審法官的性別是 tutela 申請成功的最重要的預測因子,而法官性別又不透過判決結果以外的因素影響那些申請者,作者便利用法官的性別作為工具變數,估計被拒絕墮胎對女性和她們的孩子的影響。

研究發現,被拒絕墮胎的女性更有可能生下孩子,相比未被拒絕的女性,他們生下孩子的機率增加 30.7%(相當於兩倍於未被拒絕的女性最後生下小孩的機率)。而且,由於 80% 尋求墮胎的女性在當時沒有孩子,拒絕墮胎會迫使許多女性過早成為母親。注意到即使被拒絕合法墮胎,許多女性仍然終止懷孕,這顯示非法墮胎盛行。但是,墮胎藥物 misoprostol 對於超過 14 週的懷孕無效,因此這些女性可能不得不訴諸其他更不安全的手段。而且,被拒絕墮胎使女性在 9 個月內死亡的可能性增加 2.5%,比未被拒絕的女性高出 161%。作者發現死亡率增加主要是由於敗血症和感染,這顯示拒絕合法墮胎的女性轉向其他(可能不安全的)墮胎方法,增加了致命感染的風險。作者最後檢視了被拒絕墮胎對孩子的影響,發現這些孩子在出生時體重較低,並且在 5 歲時更有可能死亡。

作者還探討了被拒絕墮胎的長期效果。他們發現,被拒絕墮胎的女性更可能有孩子,且孩子數量更多,被拒絕墮胎除了影響何時生育,還影響是否生育以及生育多少孩子;並且,被拒絕墮胎的女性更可能與親戚同住,這可能是因為她們需要額外的照顧;此外,被拒絕墮胎的女性更可能成為單親母親或經歷離婚與分居。而且,被拒絕墮胎降低了獲得高中文憑的可能性,並顯著減少了女性的勞動力參與。作者並與經典的母職懲罰(motherhood penalty)文獻進行比較,發現「非自願」母職對就業的負面影響比「自願」母職更大。被拒絕墮胎還會使女性的家庭貧困惡化,讓他們更依賴社會福利。這種財務壓力還會對兒童產生連鎖反應。作者分析了 2317 名母親尋求墮胎前已出生的最小子女的資料發現,墮胎被拒絕顯著降低了這些孩子接受教育的比例,並顯著增加了孩子參與勞動市場的可能性,他們可能因為家庭經濟困難而不得不工作,而且雖然被拒絕墮胎的女性更可能成為家庭主婦,但這些孩子卻更常獨自在家。

計量上我覺得沒有什麼很值得挑剔的點。這應該可以說是一個蠻乾淨的自然實驗。

Card, Colella, and Lalive (2024)

這篇文章發表在 RES,標題是 Gender Preferences in Job Vacancies and Workplace Gender Diversity。

2005 年起,奧地利政府通知雇主和報紙,在招募員工時表明性別偏好(stated gender preferences, SGP’s)是違法的(當時已經違法二十年),並且會受到罰款處罰(2004 年新引入的規定)。僅僅一年時間,廣告中表明性別偏好的比例從 40% 降到 5%。作者利用這個規定的改變,研究了性別偏好對工作機會的影響。作者以這件事為自然實驗,串連招聘網站上的職缺資訊與行政資料,研究禁止性別偏好招募對僱用結果的影響。

在 2005 年之前,大多數招募廣告中的性別偏好與目標職缺的工作場所中的主要性別相符。即使偏好與職業或工作場所的主要性別不同,帶有性別偏好的職缺也非常有可能(> 90%)由偏好的性別的候選人填補,這表明 SGP 可以說是公司招聘意圖的強烈信號。作者這裡使用這項通知之前的招募廣告中的性別偏好來預測每一特定公司職缺的對性別的偏好。接著他們利用 2000–2010 年間的招募資料,以實際上究竟一職缺是否由女性填補為結果變數,以預測的性別偏好為處理變數,跑了一些 DiD 和 event-study 的分析。研究發現,2005 年的運動導致被預測為偏好男性的職缺中女性的招聘比例顯著增加,而被預測為女性偏好的職位空缺中男性的招聘比例同樣顯著增加。

此事件似乎導致一些公司「改變了主意」——聘用了那些在運動前會因其明確的性別偏好而被篩選掉的工人。作者進一步根據預測的性別偏好與目標職業的主要性別是否一致來考察了異質性效果。對於大多數預測偏好與主要性別相符的職位空缺(刻板印象的偏好),該運動按預期發揮了作用,提高了非偏好性別的招聘率,並增加了目標職業和招聘工作場所的性別多樣性。對於那些預測偏好與主要性別相反的職位空缺,則降低了性別多樣性。作者發現,運動前最密集使用男性性別偏好的招募的公司在 2005 年後女性員工比例出現了系統性的增長,而最密集使用女性偏好的公司則在男性員工比例方面也同樣增長。最後,作者也發現,在最密集使用性別偏好的公司中,沒有發現對公司生存率、總就業人數或平均工資產生負面影響。

這同樣是一篇非常 reduced-form 的文章,而且沒有什麼高大上的技巧,甚至可以說他的實證策略非常 old-fashioned。不過,我對實證策略的疑惑以下包括主要兩點:

  1. 雖然這裡使用了類似 DiD 和 event-study 的方法,但背後的道理並不太像標準的 DiD 設計。這裡不太一樣。首先,一個職缺到底在沒有實施政策時會不會有 SGP,在政策實施後的時期是看不到的,因為政策使得幾乎所有職位不再提出 SGP。本文的研究對象經歷的是一個非突然的、非強制性的政策影響,且作者無法直接識別出哪些雇主在沒有政策的情況下仍然會使用性別偏好。作者因此需要預測到底一個職缺是否會要求 SGP,再把問題放在 2SLS 的框架之下。問題在於,他估計到的東西真的可以有因果詮釋嗎?作者似乎也沒有考慮 generated regressor 的問題。而雖然預測錯誤率不高,但還是有錯,那如何詮釋有錯誤分類的估計結果呢?

  2. 其次,經典的 DiD 設計中,政策開始之前沒有任何人接觸到政策,而在政策開始之後,實驗組接受政策,而對照組不接受。所以在經典的 DiD 設計中,識別假設是平均而言對照組的趨勢(例如政策實施前後的工資差距)與實驗組沒有接受政策的趨勢相同。這裡的設計不太一樣。在政策開始之前,有一些職缺使用 SGP,而有一些公司不使用。在政策開始之後,所有職缺都不使用 SGP。如果我們把使用 SGP 的職缺當成實驗組,沒有的當成對照組的話,就相當於對照組在政策開始之前就已經接觸到政策了。這違反經典的 DiD 設計。我有找到 Tazhitdinova and Vazquez-Bare (2023) 的 NBER Working Paper,Difference-in-Differences with Unequal Baseline Treatment Status 討論類似的問題,之後可以研究看看。

Kuhn and Shen (2023)

這篇文章發表在 AER,標題是 What Happens When Employers Can No Longer Discriminate in Job Ads?。同 Card, Colella, and Lalive (2024),這篇文章也探討當雇主不再能在招聘廣告中明確提出性別要求時會發生什麼。

作者利用一個中國的線上招聘平臺的內部資料。上發生的意外事件作為自然實驗。在該平台上,雇主明確的性別要求在一夜之間應政府要求被移除。研究人員得以比較在性別要求被移除前後,不同職位的申請者和成功應聘者的性別比例。作者使用 RD in time 與 DiD 兩種方法,發現沒有性別要求的廣告的工作在禁令前後沒有明顯變化;那些原先要求男性的工作,女性申請比例大幅上升,女性獲得回電比例也相應增加,而原先要求女性的工作,男性申請比例顯著提高,男性獲得回電比例也相應增加。作者並發現,禁令對所有職位的總申請數量沒有顯著的負面影響,甚至可能略有增加;申請的配對品質沒有顯著下降;申請獲得回電的可能性沒有顯著下降;而中性廣告數量增加,雇主也沒有明顯地轉向其他招聘平台。作者認為這是因為雇主的性別歧視是基於過時的刻板印象,但當禁令實施後,許多雇主發現他們原先期望以外的申請者也能勝任工作。

我跟 RD in time 的設計不太熟悉,不過這篇文章也用很多 DiD,面對的問題與 Card, Colella, and Lalive (2024) 類似。

Duflo (2001)

這篇文章發表在 AER,標題是 Schooling and Labor Market Consequences of School Construction in Indonesia: Evidence from an Unusual Policy Experiment。這篇文章探討基礎建設投資(在此是興建學校)是否能提高教育程度,以及教育程度的提高是否能帶來更高的收入。

印尼政府在 1973 至 1978 年間,展開有史以來最大規模的學校建設計畫。作者使用印尼的人口普查資料,將 1950 至 1972 年間出生的男性的教育與薪資資料與其出生地區的資料串連起來。作者定義實驗組那些在 1973 年至 1978 年間生長在經歷了更密集的學校建設的地區的人,而控制組則是在那些學校建設較少的地區出生的人。研究發現,計畫確實顯著提高了學生的教育程度,並且對後來的工資產生了正向影響。

我看完 Card et al. (2024) 和 Kuhn and Shen (2023) 之後,想到這篇文章。我沒有看過,但在模糊的印象中,也採用類似的實證策略。具體來說,作者所謂「更密集的學校建設」,是把興建的學校數量對小孩數量跑迴歸以後殘差項為正的地區。通常,我們會期待政府之所以在某個地區興建更多學校,是因為那裡的就學率較低,或者學校太少,而這件事很自然地與教育年數本身和未來的收入有關。如此,這很可能並不滿足平行趨勢假設。這也是為何作者還控制了各種固定效果。

除此之外,Duflo 的設計還有一些地方與經典的 DiD 設計相異:

  1. 作者比較高計畫強度地區和低計畫強度的地區,但是低計畫強度地區並非完全沒有學校建設,而高計畫強度地區的學校建設強度也存在差異。他其實是把原本連續的變數變成了二分變數。

  2. Duflo 還用了 DiD esitmates 的比值來估計教育對收入的影響(學校數量 ➡️ 教育 ➡️ 收入)。這種 Wald estimator 在 Chaisemartin and D’Haultfoeuille (2018) 稱為 Wald-DiD,背後仰賴過強的識別假設。

其他

週三早上到衛褔部,發現被排了兩個半天的座位,不同電腦。我當時才意識到我原來是預約兩個半天。

去衛福部分析資料需要事前預約,每次以半天為單位。當天早上(或者前一天晚上),衛福部的公務員或研究助理會安排座位,並把各案的實體硬碟塞進安排的座位的電腦裡。這樣,研究者就可以在衛福部的環境下分析資料,而不用把資料帶回家。

以往即便是預約兩個半天,公務員也會把兩個半天的座位安排在同一臺電腦上。因為,這也省得他們要把硬碟換來換去。不曉得是哪個菜鳥公務員排的座位。這意味著我必須要上午簽到,並在下午前簽退,然後挪動到另一個座位,再簽到,最後再簽退。很不方便。我不死心,問了一下輪值的行政人員,他說「對,否則算是爽約。」1 我只好乖乖照辦。我下午 13:20 要交統計學習課的作業。我先問了學弟印作業了沒。本想如果他還沒印,那就請他幫我印順便幫我交,但他印了,我就打算還是自己去交作業。

我在 12:10 暫時離開衛福部,步行到昆陽捷運站。這時我想著,好久沒騎 YouBike 了,不如就騎到學校。等我騎上腳踏車才想到,我的電腦檔案的雲端備份出了問題,作業檔案不完整,所以我又騎腳踏車折回衛福部上傳作業到雲端。完成下樓後,我竟然發現原本停在衛福部附近人行道的腳踏車不見了。我找了一圈,也沒有找到。我只好走到捷運站,搭捷運到學校。我因為各種事情耽擱了,交完作業後,直到 13:10 才要離開學校。這時候再走到科技大樓搭捷運來不及在 13:30 簽退,於是叫了 Uber 搭車回到衛福部。我遇到一個健談的司機。他問我什麼學校幾年級,又問我去衛福部做什麼,還分享自己跟藥檢局交手的經驗。我用一隻耳朵和半個腦袋陪他聊天,一邊想到底哪裡做錯了。這才發現,我可能太緊迫了,沒有仔細分析利弊再行動。我應該要在中午離開衛福部時就簽退才對,就不用急著趕回去了。

隔天週四,我又到現場。慶幸的是有在附近找到昨天丟失的 YouBike。不知道是被偷騎走,或者被誰挪動。我把腳踏車騎去昆陽捷運站還,這時候顯示租借費用已經累積至 1510 元。於是我到永春的 YouBike 服務中心說這件事,服務人員說可以幫我打折到 70 元(大概是依據我週三撥給客服告知這件事時的通話記錄決定的停止計費時間)。


  1. 如果爽約,該案號會遭受輕微的懲罰,並且會有通知信寄到計畫主持人,也就是 KM 的信箱,然後我就會被 KM 關切。↩︎