你知道不，临床试验里的盲法可真是个有意思的事，它的演变跟指数计算还挺有渊源呢。

你知道不，临床试验里的盲法可真是个有意思的事，它的演变跟指数计算还挺有渊源呢。1799年，John Haygarth医生用了一根木棒给病人做试验，居然发现安慰剂效应比大家想的还要强大。你猜咋回事？原来当时的金属棒叫做“Perkins tractors”，商贩吹嘘它能治病，结果Haygarth医生搞了个木制的安慰剂，发现大家的反应几乎一样。这事儿告诉我们，受试者自己被蒙住双眼还不够，医生也得跟着瞎猜呢。1911年Bingel和1931年Amerson做的研究就做到了这点。他们把药片弄得和对照组一模一样，连医生都不知道谁吃了什么药。这下子双盲就诞生了，临床试验的伦理保护才算真正到位了。但问题来了，“盲法”不等于“随机序列保密”。有的人以为只要把随机数字藏起来就行，其实这是两码事。分配隐藏只是为了保证病人不知道自己拿的是啥药；而盲法是要让病人、研究者还有评价者全都分不清到底谁是实验组谁是对照组。你看下面这张表格就清楚多了。 CONSORT报告要求披露具体细节还得描述盲法成功与否呢。光说一句“我们做到了三盲”，那可没说服力啊。要知道在评估盲法成功的时候，很多人习惯用卡方检验或者kappa一致性检验来看大家猜得准不准。不过这些老方法有个大bug：它们没法区分是因为破了盲才猜对还是瞎猫碰上死耗子猜对了。1996年James在《Statistics in Medicine》上提出了James index这个概念，就是把“不知道”这个选项也放进计算里去了。你看这个公式，结果在0到1之间浮动，越接近1说明盲法做得越好；要是0.5左右说明瞎猜的概率比较大；如果95% CI上界小于0.5，那就意味着可能已经破了盲了。但是Bang觉得James index有点太依赖“不知道”的那部分人了。他觉得还是得看那些明确做出选择的人更靠谱一些。于是他就搞出了个Bang's index，结果区间在-1到1之间浮动，越往负向走说明盲法越好；如果是正的大于0，那就是多数人都猜中了分组提示失败了。你看这张图就直观多了吧？Arandjelovic等人在NIPS 2015年的论文里提出了一个新指标，把两者的优点结合起来用贝叶斯层次模型来合并数据波动也少了很多这对后续研究挺有帮助的。不过不管怎么说核心思想都没变：再好看的事后检验也挽救不了设计上的漏洞啊一旦盲法失败所有的一切都归零啦！说到底从一根木棒到复杂指数所有的进化都是为了回答一个问题：“如果病人不知道自己吃的是什么研究结果还能被信任吗？” 所以设计阶段要把目的、方法、风险和伦理全都权衡清楚这比任何事后检验都更重要呢毕竟完美的隐藏可比完美的统计关键多了！