清明節(jié),用數(shù)據(jù)思維案例聊聊平均死亡年齡和期望壽命

7 評論 19440 瀏覽 12 收藏 8 分鐘

本文中,筆者將結(jié)合清明節(jié)聊一聊如何用數(shù)據(jù)思維分析“平均死亡年齡”和“期望壽命”。

前些天,我所在的一個產(chǎn)品經(jīng)理群里面,無意中有人聊到了社保,繼而聊到了關(guān)于中國人平均壽命的問題。問題如下:

中國現(xiàn)在對外公布的平均壽命,如:2018年平均壽命75歲,是一個名叫“期望壽命”的指標(biāo)。

而中國人2018年的平均死亡年齡實際上只有66歲左右,所以群里有人認(rèn)為,期望壽命是國家忽悠人一個指標(biāo),應(yīng)該用平均死亡年齡來作為平均壽命的指標(biāo)。

對此,你有什么看法呢?

中國人到底壽命多長,如果讓你去收集數(shù)據(jù)然后得出結(jié)論,你會怎么做?

要知道平均壽命66歲和75歲,差別可是非常巨大的,會導(dǎo)致完全不同的輿論和國家政策。

群里面不少人隨聲附和,什么毒奶粉地溝油又被提起了,然而一個專業(yè)的產(chǎn)品群居然很少有人對上面的說法提出質(zhì)疑。

看到大家的反應(yīng),我擔(dān)心的倒不是中國人的平均壽命,而是擔(dān)心產(chǎn)品經(jīng)理的整體職業(yè)素質(zhì)。

作為職業(yè)產(chǎn)品經(jīng)理,平時都說自己根據(jù)數(shù)據(jù)分析來改進(jìn)結(jié)果,這么多人對于這么明顯的數(shù)據(jù)坑不能識別,那么得有多少決策是錯誤的?

在很多人看來,產(chǎn)品經(jīng)理可能是一個門檻很低的職業(yè),然而數(shù)據(jù)思維真的是很多人的硬傷。

數(shù)據(jù)思維不就是統(tǒng)計統(tǒng)計平均值,比比大小嗎?

還真沒有這么簡單,有的看似很簡單的問題,卻藏著巨大的坑。

忽略掉基數(shù),是很多時候數(shù)據(jù)分析的一個大坑,對認(rèn)真學(xué)過統(tǒng)計的人,識別這個坑并不難,但是多數(shù)產(chǎn)品人員并不能,只會做簡單點加減乘除求平均。

就像上面那個問題一樣,如果想要計算一個國家人口的平均壽命,就把死亡年齡算個平均數(shù)不就OK了。

你要是不這么計算,他還說你把簡單的事情復(fù)雜化。被“簡單化思維”洗腦的人群其實也蠻可怕的,會變得有點反智。

這個世界上有的東西本質(zhì)上就是不能簡化的,過度簡化就是錯誤。

一、平均死亡年齡

平均死亡年齡是一個很容易理解的指標(biāo),就是把當(dāng)年所以死亡人口的年齡算平均。但這個具有誤導(dǎo)性的統(tǒng)計指標(biāo),代表不了人群的平均壽命。

為了說明問題,我們來簡化一下問題。假設(shè)有兩個群體:

  • 第一個群體:由十個10歲的人和五個70歲的人組成;
  • 第二個群體:由五個10歲的人和十個70歲的人組成。

2018年,第一個群體中,10歲的人死亡2個,70歲的人死亡4個;第二個群體中,10歲的人死亡1個,70歲的人死亡8個。如下圖所示:

算平均死亡年齡,第一個群體:50歲,第二個群體:63.3歲。

于是,有的人可能就想得出結(jié)論:第二個群體的人口比第一個群體人口人均壽命更長。

但是我們仔細(xì)看看:

這兩個群體,10歲的死亡率都是20%,70歲死亡率都是80% 。刨除掉不同年齡階段人口基數(shù)的誤導(dǎo),這兩個群體的兩個年齡階段的死亡率是完全相同的,也就是說,這兩個群體的人壽命應(yīng)該是相同的。

然而,平均死亡年齡這個指標(biāo)卻相差很大,平均死亡年齡將不同基數(shù)混淆在里面了,沒有任何的意義。

一個年輕人非常多的國家,只要年輕人意外死亡很小一部分比例,就能把平均死亡年齡拉的很低,造成大家壽命短的假象。而一個年輕人很少的老齡化的國家,平均死亡年齡就會被拉得很高。

中國當(dāng)前就是中年、青年人口更多,所有平均死亡年齡會比較低。如果你用平均死亡年齡當(dāng)壽命指標(biāo),就會被誤導(dǎo)。

想要真正反映一個國家當(dāng)前人口的健康及壽命的狀況,需要刨除掉不同年齡人口基數(shù)的影響,要用到一個叫做期望壽命的指標(biāo)。

期望壽命雖然叫“期望”,但并不是指的“期待”的意思,這個期望是“數(shù)學(xué)期望”,反應(yīng)的是當(dāng)下人真實壽命的,是刨除掉了基數(shù)影響的平均壽命。

二、期望壽命

為了刨除掉基數(shù)的影響,期望壽命的計算使用死亡率而不是死亡人數(shù)。

假設(shè)一個群體中年齡最大的是n歲,年齡最小的1歲。

假如在2018年,1歲人群的死亡率是A1(死亡率是一個百分?jǐn)?shù)),2歲人群的死亡率是A2 , 3歲人群死亡率A3,以此類推,n歲人群死亡率 An。

那么人均預(yù)期壽命為:

1*A1 + 2*(1-A1)*A2 + 3*(1-A1)*(1-A2)*A3 + 4*(1-A1)*(1-A2)*(1-A3)*A4+….(直到n歲)

這個計算方法,是根據(jù)當(dāng)年各個年齡階段的死亡率來計算平均壽命的,直觀感覺有點類似于有一個虛擬的人在同一年從出生到死去,平均會在多少歲死亡。

還有一種錯誤的理解,在一些網(wǎng)頁新聞中能夠見到。他們認(rèn)為:2018年的期望壽命是2018出生的人預(yù)計能活到多少歲,這也是完全錯誤的。

期望壽命是當(dāng)前人口刨除掉基數(shù)影響后壽命的數(shù)學(xué)期望值,不是對新生人口未來的預(yù)計。

三、總結(jié)

在做產(chǎn)品數(shù)據(jù)分析的時候,也有不少這樣的問題。比如:有的人就直接把不同渠道的轉(zhuǎn)化用戶直接相加,或者把不同地區(qū)的轉(zhuǎn)化用戶相加等。

要知道這些數(shù)據(jù)的基數(shù)都是不一樣的,很有可能會得出誤導(dǎo)性的結(jié)論。

有的人說數(shù)據(jù)是不會騙人的,其實,數(shù)據(jù)是最會騙人的,數(shù)據(jù)思維不過關(guān)的更容易被數(shù)據(jù)欺騙。

數(shù)據(jù)思維也不是想某些文章講的那樣,有意識地去看看數(shù)據(jù)就是有數(shù)據(jù)思維了,那頂多稱得上數(shù)據(jù)意識。

后續(xù)有機(jī)會還會繼續(xù)分享數(shù)據(jù)思維相關(guān)的問題。

 

本文由 @ArvinNing 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 這么極端的例子算出來也就差十來歲。

    來自廣東 回復(fù)
  2. 你這個例子,到第二年第三年,逐漸的這兩國的平均死亡年齡就趨于相等了

    來自廣東 回復(fù)
  3. 同為心理學(xué)碩士,能不能加個微信交流下???

    來自北京 回復(fù)
  4. 事實上產(chǎn)品經(jīng)理就是要學(xué)會思考生活。而且生活中的思路產(chǎn)品的思路是一樣的,這個職業(yè)就是這樣的,不喜歡嫌累可以盡早別干

    回復(fù)
  5. 感覺真的沒必要分析,如果做這方面工作,那無可厚非,但是產(chǎn)品經(jīng)理也是人,如果時時刻刻用工作的思維分析生活中的所有事情,那真的會累死的,至少我這種俗人做不到

    回復(fù)
    1. 我覺得反智說的就是你這樣的人,只是一個例子而已工作中生活中都一樣的道理

      回復(fù)
  6. 大一學(xué)的概率論又撿起來了 ??

    來自四川 回復(fù)