注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据化管理 你的第三只眼睛

讲述数据背后的故事!数据化管理咨询师!

 
 
 

日志

 
 
关于我

善于发现数据背后的故事,专注数据化管理的咨询及培训业务!14年快速消费品、通讯行业的销售经验!5年的零售企业《数据化管理》的咨询顾问、培训导师

网易考拉推荐
 
 

数据的“忽悠”功能(三)瞒天过海  

2011-03-09 22:59:51|  分类: 数据化评论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

      还是从新浪微博说起,今天读到这样一条微博,这是一条某大报官方微博发出的一条微博:

数据的“忽悠”功能(三)瞒天过海 - chemyhuang - 数据化管理 你的第三只眼睛

       这条微博的结论是:即使5次都受孕成功,在13亿多人口的大国,这5个孩子相遇并相爱的几率微乎其微。我们就从这个机率说起,看看这个记者是如何“忽悠”读者,瞒天过海的。我确实相信这个机率会非常低,但是这个记者的逻辑对吗?根据记者的逻辑这五个孩子相遇的机率是5/13亿,这个机率确实非常小。但是这样算对吗?合理吗?按照这个记者的逻辑我们还可以用地球人的总数50亿来做分母,那机率不会更低!更具有说服力?为什么不呢?

      其实这样是不对的,我们必须考虑到如下的因素:

  1. 捐精行为一般在固定的地区,固定的医院进行,且受孕者一般来讲都会是这个地区或城市的女性。所以相遇机率的分母不应该是13亿,而应是该地区或城市的人口总数(下面假设为A)。这样来看相遇机率就会大大的提高了。某些直辖市人口只有3~4千万人,想想这个机率比5/13亿大了多少!大了30~40倍
  2. 有的脖友提到异地捐精,实际上这个因素不能改变这五个子女的相遇机率。唯一能改变的是捐精者的亲生子女和这“五子”相遇的概率。
  3. 人口的流动性会影响相遇机率,如果是70年代,中国的人基本上是不流动的,那么相遇率就是5/A。因为A是一个恒值。但实际上在目前这个社会A不可能是一个恒值。他应该是固定人口加上流动人口(因为该地区所有人都可能和“五子”相遇),假设这个数是B。所以相遇率就是5/B(B会比A稍大)。流动性的大小也会影响B值,不同的地区的流动性也会不一样。
  4. 1~3都是说的相遇率,而这条微博是说相遇并相爱的机率微乎其微。注意是相爱!那这个机率算法一定不等于5/B。应该是5/C,如何计算C?我们从正常的伦理关系以及恋爱正常的年龄跨度来考虑此问题(即同性恋、双方年龄跨度大于10岁的不考虑)。那么C值就应该是“五子”年龄±10岁的年龄段的人群总量的一半(为何是一半,因为同性恋不在我们考虑范畴内,且我简单的认为男女比例一样),那么C=B/4/2=B/8。第一个4是20岁的年龄范围估计占人口总数的1/4(纯估计,没有数据源),第二个2是异性占一半的比例!此时相爱率就是(1~5)/C。“1~5”意思是“五子”全为同性则取五,有男有女则分别对待。
  5. 是否还要考虑其他因素,暂时还没有想到。我们大致来看看计算结果(假设五子全为男孩,计算某3000万人的直辖市,流动人口1000万)。相遇且相爱率可能是5/500万即百万分之一,而按记者的算法是1/2.6亿。概率差了260倍。

      也许有人会认为我鸡蛋里挑骨头,实际上你注意看这种瞒天过海的伎俩到处都是。比如见过一个出租车副驾后背的一个广告位的招商广告:投广告,你的产品广告受众每天将达到200万人(200万人该城市是每天坐出租车的乘客人数)。你自己算算这个广告欺骗度有多大。你要考虑的因素是:该广告是否可以覆盖所有出租车,坐前排的乘客是看不到广告的,后排靠司机后背的乘客打击率也很小。当然你作一些市场调查后这个值有可能会相对准确的算出来,但是那一定比200万少多了。

      对于一个从事数据分析的人员来说,分析的逻辑性、全面性是非常关键的!

      所以,处处留心皆忽悠。不过,据说这也是一门艺术,归赵本山管!

 

《数据化管理》的相关博客文章:

如何做买赠的促销活动分析(一)平衡点分析

什么是数据化管理

如何发现销售报告中有错误的数据

超级数字天才:用数字思考变聪明的案例

几张非常有用的销售分析图表

 

数据化管理系列:如何发现销售报告中有错误的数据(一) - chemyhuang - chemyhuang的博客友情提醒:本文的版权归我所有。如果用于商业目的,请与我联系chemyhuang@163.com。如果网络转载,请注明出处!谢谢你的支持!更多原创文章尽在:http://chemyhuang.blog.163.com。同时在新浪微博、搜狐、网易,腾讯微博搜索“数据化管理”可以方便的找到我。不过我以新浪微博为主!

  评论这张
 
阅读(2752)| 评论(10)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017