数据模型还有几种常见的技巧、叫做钻取、上卷、切片 。
选取就是将维度继续细分 。比如浙江省细分成杭州市、温州市、宁波市等, 2010 年一季度变成 1 月、 2 月、 3 月 。上卷则是钻取的相反概念,将维度聚合,比如浙江、上海、江苏聚合成浙江沪维度 。切片是选中特定的维度,比如只选上海维度、或者只选 2010 年一季度维度 。因为数据立方体是多维的,但我们观察和比较数据只能在二维、即表格中进行 。
上图的树状结构代表钻取(source 和 time 的细分),然后通过对 Route 的 air 切片获得具体数据 。
聪明的你可能已经想到,我们常用的数据透视表就是一种维度分析,将需要分析的维度放到行列组合进行求和、计数、平均值等计算 。放一张曾经用到的案例图片:用城市维度和工作年限维度,计算平均工资 。
除了 Excel 、BI 、R 、Python 都能用维度分析法 。BI 是相对最简便的 。
谈到维度法,想要强调的是分析的核心思维之一:对比,不同维度的对比,这大概是对新人快速提高的最佳捷径之一 。比如过去和现在的时间趋势对比,比如不同地区维度的对比,比如产品类型的区别对比,比如不同用户的群体对比 。单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值 。
我想要分析公司的利润,利润 = 销售额 – 成本 。那么找出销售额涉及的指标/维度,比如产品类型、地区、用户群体等,通过不断的组合和拆解,找出有问题或者表现良好的原因 。成本也是同理 。
这就是正确的数据分析思维 。总结一下吧:我们通过业务建立和筛选出指标,将指标作为维度,利用维度进行分析 。
很多人会问,指标和维度有什么区别?
维度是说明和观察事物的角度,指标是衡量数据的标准 。维度是一个更大的范围,不只是数据,比如时间维度和城市维度,我们就无法用指标表示,而指标(留存率、跳出率、浏览时间等)却可以成为维度 。通俗理解:维度>指标 。
到这里,大家已经有一个数据分析的思维框架了 。之所以是框架,因为还缺少具体的技巧,比如如何验证某一个维度是影响数据的关键,比如如何用机器学习提高业务,这些涉及到数据和统计学知识,以后再讲解 。
这里我想强调,数据分析并不是一个结果,只是过程 。还记得“如果你不能衡量它,那么你就不能有效增长它”这句话吗?数据分析的最终目的就是增长业务 。如果数据分析需要绩效指标,一定不会是分析的对错,而是最终数据提升的结果 。
数据分析是需要反馈的,当我分析出某项要素左右业务结果,那么就去验证它 。告诉运营和产品人员,看看改进后的数据怎么样,一切以结果为准 。如果结果并没有改善,那么就应该反思分析过程了 。
这也是数据分析的要素,结果作导向 。分析若只是当一份报告呈现上去,后续没有任何跟进、改进的措施,那么数据分析等与零 。
业务指导数据,数据驱动业务 。这才是不二法门 。
作者:秦路
推荐阅读
- 如何让旧衣服恢复鲜色
- win10如何取消安全模式 win10如何取消开机密码
- 星际战甲段位经验表 星际战甲段位经验如何提升
- 95版本剑神辅助装备选什么宝珠 如何挑选95版本剑神辅助装备的宝珠
- 奋斗早安最美一句话
- 麻醉医生收入如何支付 麻醉医生收入
- 三国志幻想大陆如何做任务派遣
- 电机发烫如何处理
- 新鲜的栗子该如何储存
- 新鲜栗子怎样保存最好
