如果你是一名要和组织内的分析师打交道的管理者,要做出更多 数据驱动的商业决策,如何提出 好问题应该是你要优先考虑的事情。很多管理者对提问感到恐惧,生怕在跟数据相关 的问题上露怯。不过,如果你提出了正确的问题,你不仅可以显得博学,而且有可能带 来更好的决策结果。 在我的新书《数字分析不掉队》 (Keeping Up with the Quants)里,从 各个方面给数据分析列出了可能问题清单。不过,重要的不仅仅是那些你能对数据提出 的关键问题,在你提问之后可能发生的对话也同样重要。 1.关于假设的提问 你问:你建立的这个模型背后的假设是 什么? 根据他们的回答,你设想的回应:如果 没有特别的假设,你应该感到担心。因为每个模型背后都应该有假设。除非你假定样本 代表了某个群体,或者之前搜集的数据对于 当前的情况仍然具有代表性。 接下来:有什么理由可以说明这些假设 不再有效了? 你设想的回应:在这里,你确实要得到 一个经过深思熟虑的、切实的回答。唯一辨别假设是否依然有效的可靠办法就是以新采集的数据为基础,重新做一次分析,这可能 得花不少钱。或许某一特定的关联只在某一变量向特定方向发生改变之后,才会有效。 比如抵押风险模型只有在房价上涨的时候才 依然有效。
![英国不装腔指南 pdf 跟分析师打交道装腔指南](http://img.413yy.cn/images/a/06020206/020609582531470469.jpeg)
2.关于数据分布的问题 你问:你搜集的数据是如何分布的? 你设想的回应:如果他无法描述数据分 布,那他就是个糟糕的分析师。优秀的分析师早就应该检视过了——而且还能以视觉化 的方式把你的数据在任何特殊变量上的分布 展示给你看。 如果你有兴趣把一个变量作为另一个变量可能的预测指标,找你的分析师要一 份“散点图”,看看数据是否以任何线状 形式分布,这表示两个数据之间呈现很强 的相关性。 接下来:数据是以正态分布吗? 你设想的回应:如果分析师说数据不是以正态分布(也就是说,呈现一个钟形曲 线),那他就得使用不同类型的统计方式 (称为非参数统计),因为通常使用标准差 和相关分析不起作用。 你可以问分析师,他们如何在数据分布 的基础上调整分析。比如说非参数检验经常 就需要具有形同统计可靠性的大量实例。 再接下来:有没有特别的异常值? 你设想的回应:如果数据是正态分布而 又有一些异常值,你可以问问这说明什么, 分析师打算对此采取什么动作。在某些情况 下,删除异常值是合理的,比如说,如果他 们是代码错误导致的。 看,你已经了解大概的路数了。对话当 中,展现你对此很感兴趣,也具备一定的知 识,而且你的目的是为了更好的决策结果, 这些都很重要。提出这些问题并不是要表现 你懂的比分析师还多,或者分析师对你隐瞒了什么。这跟一个CEO与一个汇报财务数 据的部门管理者之间的对话一样,温和的追问是最好的方式。