2020年3月16日 星期一

Time lag in base popuplation change, misleading statistics COVID-19

The following is the fatal rate of COVID-19 in China.

Graph A



The above graph (A) shows a convex curve rising from 2% to the current 4%.



The graph (B) below shows a concave curve desending from 14% to 4%.

Graph B



Graph A shows a low inital fatal rate of just 2%.
Graph B says otherwise, a 14% initially.
The hugh difference is the base population of confirmed case.

In graph (A) both the base and the fatal figure starts from Jan 28, 2020.

The fatal figure in graph (B) starts from Feb 7, the base figure starts from Jan 28, 2020.
As the health authority estimated the median of  number days a confirmed case fails is 10 to 14 days, so a 12 days lag  from the fatal data is used in the base figure.

From graph A the fatal rate is not yet flatten out.

However ,graph B shows that the fatal rate starts to flat out at 4% from Feb 27 onwards.
So the spread of virus may not under contain but the treatment or measure taken to cure the infected patients have kept the fatal rate under control.
On the other hand one should take a deeper look into the seemingly tough 4% line., be it due to age, chronic disease or whatever reason.

So graph A is good for show to your voter at the initial outbreak stage
but graph B is more useful in public health decision making and more presentable to voters.

All Rights Reserved© fengshuileung2020

天賦基因測試準確性99%?



天賦基因測試搶算命佬生意

近日虎媽熱門話題中“天賦基因測試”一定有一席位。
這是直接搶算命佬生意。
下走可以斷言任一有料算命佬一算就算到一個八字
有無書緣,
聰不聰明,
要怎去教,
要讀什麼類型學校,要不要留學...等等,
根本不需做什麼測試


測試準確性達99%可以是數字遊戲

更有宣傳稱測試準確性達99%。

這就引出下走要討論
統計學中有所謂的準確率數字遊戲。


統計學的陷阱
搗蛋的陰性大多數性

有修社會科學,醫科或政政的同學不妨細看一下。

以本地中學為例,有1/3學位是band 1,而此等學位又有約1/3是學校自主收生。
可以據此假設真正讀到書的學霸約占10%。

一:
假設有一測試
如對象是某特質之人,
這測試有99%成功測出其此特質。Sensitivity 99%
如對象是此特質之人,
這測試有99%成功測出其此特質,亦即有1%誤認為有此特質。Specificity 99%

以測試一千人為例
有此特質的有100人,
測試顯示出有此特質的有99人。

無此特質之人有900人,
誤測出為有此特質的有9人。

測試認為是有此特質的是 99+9=108人
準確率為99/108
=0.917

二:
再來一個假設
如對象是有此特質之人這測試有99%成功測出其為有此特質。
如對象無此特質之人這測試有98%成功測出其為無此特質,亦即有2%誤認為有此特質。

以測試一千人為例
有此特質的有100人,
測試顯示出有此特質的有99人。

無此特質之人有900人,
誤測出為有此特質的有18人。

測試認為是有此特質的是99+18=117人
準確率為99/117
=0.846

三:
再推算下去

如對象是有此特質之人這測試有99%成功測出其為有此特質。
如對象是無此特質之人這測試有95%成功測出其為無此特質,亦即有5%誤認為有此特質。

以測試一千人為例
有此特質的有100人,
測試顯示出有此特質的有99人。

無此特質之人有900人,
誤測出為有此特質的有45人。

測試認為是有此特質的是99+45=144人
準確率為99/144
=0.688

你是有此特質,個測試可以測出你是有此特質的準確度有多高不重要,
無此特質,而個測試誤測出你是有此特質的機率有幾高才重要。
在統計學,上面第一例的 0.917 準確率很多時已經不可以被認為是嚴謹結論,
更不必論例二、三了。

這種誤解不但出現在社科,更常出現在醫學上的統計,如疾病試劑藥苗效果等。

Disclaimer :
本文純屬學術討論,內容數據並非真實,並無意圖影射或針對任何人或企業或技術,如有雷同實屬巧合。

All Rights Reserved ©2019 fengshuileung