盲目地选择试验药物或者方案,很多时候都会导致结果不可靠。在早期的研究中,比如John Haygarth医生用一根木制棒来替代昂贵的金属棒,证明安慰剂效应也能产生相同的效果。这个发现启发了后来的临床试验设计,提出了双盲和三盲的概念。给研究参与者和研究者都无法辨认治疗组和对照组,以减少评估偏倚和提高依从性。但是,大家容易把随机序列保密和盲法混为一谈。随机序列保密只是盲法的一个前置条件,而盲法还要考虑到不同角色的参与。CONSORT指南明确要求报告详细设计细节,不能仅仅通过外观一致来证明盲法成功。为了验证盲法的效果,统计学中提出了James指数,它不仅关注受试者猜对的概率,还纳入了不确定选项。然而,这个指数对信息偏倚比较敏感,所以Ognjen Arandjelovic在NIPS会议上提出了新的评估方法。Bang指数通过贝叶斯层次模型合并数据,提供更稳健的评估框架。从这个角度来看,一次完美的统计结果也无法拯救设计阶段的漏洞。设计阶段需要权衡目的、方法、风险和伦理问题,确保试验结果的可信度。统计学家们还发现,采用95%置信区间来判断结果是否存在破盲情况非常有效。Bang指数的可视化结果显示,它对破盲情况更加敏感。对于一些简单的试验设计,给受试者提供安慰剂效果比提供治疗效果更好。在临床试验中,医生、患者和评价者都需要保持不知情状态才能减少偏见和干扰。有时候,给受试者和研究者提供模糊的信息反而能获得更准确的结果。对于一些复杂的试验设计来说,给不同角色实施盲法有不同作用:受试者可以防止主观影响结果;研究者可以减少主观影响数据;评价者可以保证数据准确性。Blindness在临床试验中的重要性不亚于统计分析本身。如果我们想把临床试验做好,必须从一开始就考虑好这些问题。95%置信区间上界小于0.5提示可能存在破盲情况;James指数越接近1表示盲法越成功;Bang指数负值越大表示盲法越成功。Bang's index把方向盘握在真正做出选择的人手里。Amerson和Bingel分别在1911年和1931年进行了早期临床试验。CONSORT指南要求披露具体盲法设计细节并描述是否成功。James在1996年发表在《Statistics in Medicine》上提出了James index这个新指标来判断盲法效果。Perkins tractors是商贩用来宣称能“抽出”体内病气的一种金属棒装置。Perkins tractors这种装置在1799年横空出世并被疯狂抢购。Perkins tractors这种装置因为价格高昂而供不应求。Perkins tractors这种装置被证明是无效的伪科学产品。John Haygarth医生用木制棒替代昂贵金属棒进行试验并发现效果相似。James index把“不知道”选项纳入计算来评估盲法效果。James index公式为P/g + 1/2(1-g)/1-|P/g-1/2| /1-|P/g-1/2| 其值域在0到1之间接近1表示越成功。James index中P代表正确猜测比例而g代表“不知道”选项比例。Ognjen Arandjelovic等在NIPS 2015会议上提出新指标来综合James和Bang指数优点。Ognjen Arandjelovic等使用贝叶斯层次模型合并数据减少单点估计波动。Ognjen Arandjelovic等的新指标为后续研究提供更稳妥的评估框架。统计学中卡方检验和kappa一致性检验只能看猜测准确率而无法区分破盲与无意猜中情况。统计学中卡方检验和kappa一致性检验只能看猜测准确率而无法区分破盲与无意猜中情况时就会遇到问题。统计学中卡方检验和kappa一致性检验只能看猜测准确率而无法区分破盲与无意猜中情况时就会遇到问题的时候就需要采用其他方法来解决这个问题的时候就需要采用其他方法来解决这个问题的时候就需要采用其他方法来解决这个问题的时候就需要采用其他方法来解决这个问题。