|
发表于 2020-6-2 19:51:43
|
显示全部楼层
看到有人为本福特定律吵起来,我也凑个热闹。先上定义。本福特定律:
在b进位制中,以数n起头的数出现的机率为logb(n + 1) logb(n) 只对数学感兴趣,对撕逼没兴趣的就没必要继续看下去了。
营销号写的那个回答,很显然作者缺乏基本的数学素养。无论你是职业数学家还是幼儿园老师,一个靠谱的数学工作者不应该使用“数字的增加会越来越困难”这种含混不清充满歧义的描述。准确的说,应该是“在进位计数制下,高位上的数字增加比低位上的数字增加更慢”。
反驳哥所批评的正是这里。因为根据本福特定律,如果一个变量随时间成指数增长的话,那么这个变量开头的数字随着时间的变化就应该是如下图:
可见纵坐标的增长确实是越来越快的。要注意这里的变量绝对不能含糊的用“数字”来指代。
年龄分布是否服从本福特定律,这个表述其实有点模糊。看到有人写代码做了统计,我也修改一下之前的回答。年龄这个变量本身是累加的,这个应该是服从本福特定律的,我之前理解有误。
但是营销号在这里犯了一个逻辑错误:先讲了本福特定律具有尺度不变性,又说人口年龄分布需要在变换单位后才服从本福特定律。呃...我觉得你根本就不懂什么叫尺度不变性。至于你说的“美国论文”,能否给个链接?
还有,关于用本福特定律来检验彩票和选举统计的问题,确实存在争论。争论的核心是统计样本本身是否能够合理排除人工干预。这里涉及到很多技术细节,但跟数量级毫无关系。
接下来是诛心之论。
营销号这篇回答,疑似是对果壳网上一篇介绍本福特定律文章的洗稿。我在上面给出的函数图也来源于果壳。链接在此:神秘的本福特定律 | 科学人 | 果壳网 科技有意思
可以看到核心论点是一模一样的,要是做个论文查重的话,怕是通不过啊。营销号文中用的直方图显然也是从果壳上扒下来的。
而营销号自行发挥的内容(比如年龄分布问题),基本都是错的。如果营销公司想在细分领域发展的话,建议还是招点专业的人。也建议大家对所有营销文都提高警惕,因为专业性实在堪忧。 |
|