从数学角度观全民核酸检测谈精准防控
对于病毒群体检测而言,区块与群在特定时候是可以交互的。
今天是清明时节,春和景明,我们寄托哀思。为快速彻底阻断疫情发生,提高精准防控的效率,全国各地都在做全民核酸检测。那么从核酸检测中就抽象出一个数学问题-区块测试,每次测多少样本是最佳标准呢?在有近2年来抗疫经历后,获得的实际经验,需全面跟踪确诊者(阳性患者)包括无症状感染者及确诊者的(次)密接者。但是,这跟踪检测精准防疫经验要真正实施,需保证核酸检测率得跟上。美国在前总统的拖延下,错过最佳时机,后来检测跟不上,不得已选择“躺平”。在现有情况下,提高检测效率就成了当务之急。根据群检方法,每次把5个人或10个人的采样先部分混检,如果是阴性,则大家全部阴性;如果混检是阳性,再进行每人单独分测。这个初衷很好,但操作有些许麻烦。采用这种方法要想达到真实高效,重点的前提是必须满足假设很低的阳性率,即当地社会面已几乎全部清零。而若阳性率大于0.2,就几乎不划算了,也会造成社会基层民众的负面感。
当前,我们国家医疗水平已大体解决了采样操作问题,现在我们单纯从效率来考虑问题。假设基于给定一个已知的阳性率0.1,每次检测多少样本(样本容量)才能达到最大效率。疫情初前期,有专家(含国外)建议是每次5个,但是在阳性率是0.1的情况下,5个是最好的选择吗?
在回答这个题目之前,我们先来看经典的找次品问题。
有一批零件里有一些分量不足的次品,次品率是1%,也就是说平均每个零件里有一个次品(分量不足)。现在让你用秤来找出这些次品。怎样秤效率最高?(假设你已经有很多标准零件)。
现比如,假设有个零件。一个一个地秤,需要秤次。每次进行两个地秤,需要先秤50次。如果有些组发现有次品,还需对有次品的那些组每一个再秤一次。如果次品率是1%的话,50组里平均有一组会有次品,也就是说还得再秤两次,总共52次,这样的秤法立马就几乎把效率提高了一倍。当然,两次不是最佳选择,多少次是最佳选择呢?
我们把这个问题一般化,假设次品率是p,每次秤m个,这样平均需要秤几次?用统计学语言来表达,系需要计算检测次数的期望值。
期望值的算法是把每一种可能发生的情况的概率乘以其所对应的数值,然后加起来求和。
现比如:你花3块钱去买彩票。为了增加变数,你买了三张不同种类的彩票。第一张奖额是10块,中奖率是1/20;第二张奖额是块,中奖率是1/;第三张奖额是00块,中奖率是1/。那么,三张彩票你期望得到的钱是/20+1/+001/=1/2+1/3+1/6=1。你花三块钱买了一个1块钱的期望值,另外两块钱交了智商税。一般来说买彩票的人都是买同一种彩票,期望值算法更简单,交智商税的本质是一样的。
把这个期望值算法应用到我们这个题目。一次秤m个零件,全都正常的概率是(1-p)^m,这种情况全过关,只需秤一次。有问题零件的概率是1-(1-p)^m,这种情况,必须每个再秤,多秤m次,总共m+1次。
期望值是:
E(x)=(1-p)^m+(1-(1-p)^m)(m+1)=1+(1-(1-p)^m)m
计算效率,把这个期望值除以m(逐个地秤需要m次)。如果商小于1,说明效率提高了。如果商大于1,说明效率降低了。要求最大效率,就是要求这个商的最小值。
上面的等式除以m得到期望效率为:
1/m+1-(1-p)^m
在微积分学中,导数为0时会出现极值。所以,问题变成求导函数的零点。上面式子对m的导数是:
-1/m^2-(1-p)^mlog(1-p)=0
因为有对数和指数,它的零点(原函数的极值)很难求得。如果用数学软件进行数值逼近。
考虑到通常p值很小,我们可以通过近似方法直接进行运算求解。
根据极限思想,把上面的期望效率展开为p的多项式并近可以省略高阶项,我们得到1/m+mp,对这个式子求导解极值就很容易了。p-1/m^2=0==m=1/sqrt(p)。这个虽然是近似值,但因为结果很漂亮,简单好记,是粗估最佳解的好公式。现比如,当p=1%时,最佳解大概是10。
下图是根据不同的p值算出的最大效率m值。蓝线是精确解,红线是近似解。可以看出,因为省略了高阶项,近似解比精确解略小,但十分接近。把近似解朝上取整就与精确解相近。
横坐标-次品率
回到病毒检测问题,从数学角度来说,与找次品零件是完全相同的问题。不过,实际操作起来,病毒检测的生物操作要复杂的多。而且还要考虑时间成本。有些核酸检测方法需要1天以后看结果,群测需要再测的话就要等2-3天,导致疫情雪上加霜。所以,群测问题还要考虑到随之引起的操作复杂度及高度降低容错率,出错率的增加以及其它问题。
从上分析可知,如果阳性率超过0.2,最佳群测个数已经要小于3了。其提高的效率与增加的复杂性就需要一个权衡。单纯从数字上来说,专家建议的5人一组,需要阳性率在0.5左右才是最优解。最新数据表明全美检测的阳性率接近25%,韩国阳性患者已接近30%。这么高的阳性率,这个群测方法的实际意义就需要考虑了。
好消息是新的更简易、更快的补充检测方法-抗原检测试剂盒已经问世,可以大大提高检测效率并避免交叉感染。
现在从国家层面全民守“沪”,坚持动态清零目标不动摇,大概率是4月中旬全国绝大部分地区回到年初的正常生活水平。