……”
确实,那25次模拟训练的数据,就是袁朗得来,也是相当不容易
有这样的顾虑,也不难理解
听了言语,苏七月就抿嘴一笑
“袁队长,不知道那25次模拟训练里的数据,是如何得来的但是在指挥部的时候粗略地看了一眼,觉得没什么参考价值,大可不必当真……”
袁朗闻言就是一怔
是个聪明人,当然听出了苏七月这话的意思
很显然,这位国科大的高材生,是在暗示自己,自己手中的那些数据并不怎么靠谱
对于这一点,其实袁朗之前也有过怀疑
但是又没有证据,加之这些资料的来之不易,也就没有往深了考虑
此时见苏七月十分肯定地给出这个建议,袁朗当然要仔细问清楚
放下酒杯,用请教地目光看向苏七月:“能不能说得清楚点儿?”
苏七月本来就没打算藏着掖着,听了袁朗的询问,就将自己的判断讲了出来
“其实也没什么特别的理由,只是在指挥部看到那些数据的时候,发现其中很大一部分不符合‘本福特定律’所以判断,这些数据很可能是老美经过篡改之后流传出来的可信度,其实并不怎么高……”
“本福特定律!?”
听了这话,袁朗和何子明顿时有些懵圈
“嗯,一种检查数据是否造假的理论”
苏七月点了点头跟着解释道:“根据这个理论,任何一堆从实际生活得出的随机数据中,以1为首位数字的数的出现概率约为总数的三成,接近直觉得出的期望值1/9的3倍”
“用公式来表述,就是在b进位制中,以数n起头的数出现的概率为logb(n+1)-logb(n)”
“延伸开来说,就是任何一组数据在随机出现的情况下,越大的数,以它为首几位的数出现的概率就越低……”
说到这里,苏七月就微微一哂道:“袁队长之前用投影仪放出的那25组数据中,像躯体化、人际敏感、抑郁、焦虑、偏执、恐怖这些数字,按理说都是随机出现,因此它们理应是符合本福特定律”
“但是粗略看了下,25组数据里的上千名士兵的数据样本,似乎都不怎么符合,所以判断这份数据,可能是经过篡改之后才流传出来的”
“如果按照这些数据来印证的话,可能会有问题……”
听着苏七月的侃侃而谈,何子明就觉得自己的脑子好像不够用
另一边,袁朗虽然同样没有听说过“本福特定律”极其相关理论
但是接受能力,是比自己的老战友强的
这会儿经过苏七月这么仔细一分析,袁朗很快就释然了
“原来数据模拟还可以这样来判断真假……”
苏七月肯定地点了点头,笑着说道:“袁队长,其实要仿效老美这种模
点击读下一页,继续阅读 黄杉公子 作品《从士兵突击开始的人生》第203章 本福特定律