对庞大数据的筛选
庞大的数据容易让人发狂,如果手上的数据庞杂,而且对于如何处理这些数据没有把握,这是只要记住分析目标就行:记住目标,目光停留在和目标有关的数据上,无视其他。
数据图像化的根本在于正确比较
为了形成优秀的图形,首先要明确能够实现客户目标的基本比较对象
使用散点图探索原因
散点图是探索性数据分析的奇妙工具,统计学家用这个术语描述在一组数据中寻找一些假设条件进行测试的活动。分析师喜欢用散点图发现因果关系,即一个变量影响另一个变量的关系。通常用散点图的X轴代表自变量(假想为原因的变量),用Y轴代表应变量(假想为结果的变量)。
不必论证自变量是影响应变量的原因,因为我们总归是在探索数据,而原因正是我们探索的目标
最优秀的图形都是多元图形
如果一个图形能对三个以上变量进行比较,这张图形就是多元图形,再加上有效的比较是数据分析的基础,于是尽量让图形多元化最有可能促成最有效的比较。
同时展示多张图形,体现更多变量
有个办法能让图形多元化,即将多张相似的散点图相邻排放,这样就能更有效的进行数据间的比较。
当描述数据图形时,需要论述可相互换用的两种因果模型或图解。