• 保存到桌面加入收藏设为首页
淘宝小号查询

数据分析常用6种分析思路

时间:2020-11-16 18:56:36   作者:文章CMS   来源:   阅读:138   评论:0
内容摘要:  作为数据分析师你是否常因为缺乏分析思路而被以下问题影响到幸福感(甚至怀疑人生)  2. 策划营销活动预算有限要看看选择哪些目标用户群、采用哪种方案带来的销量更高(更能拉动KPI)  一个问题就是从天上随机掉落的食材分......

  作为数据分析师你是否常因为缺乏分析思路而被以下问题影响到幸福感(甚至怀疑人生)

  2. 策划营销活动预算有限要看看选择哪些目标用户群、采用哪种方案带来的销量更高(更能拉动KPI)

  一个问题就是从天上随机掉落的食材分析思维就是将这些奇形怪状的食材加工成“看得懂”的美味佳肴。既然要做菜有哪些值得借鉴的“万金油”菜谱呢 本篇会为你慢慢道来。

  完成一项任务通常需要一系列操作比如做菜得先想好吃啥然后买菜、洗菜、切菜、炒菜。

  行动步骤就是先确定起点、终点(目标)然后将起点和终点的距离拆分成一个个小步骤知道先做什么后做什么。

  效度是指数据的准确性也指选择的数据和分析目标及业务目标是吻合的

  信度是指数据的稳定性要保证样本数据有代表性且在一定周期内不能有过大的波动(否则模型不稳定)

数据分析常用6种分析思路

  要连续完成多个步骤有的人“浅尝辄止”有的人“半途而废”有的人则是“善始善终”。

  产品转化的每个步骤都会有用户流失好比100个人参加有9个关卡的淘汰游戏每个关卡会淘汰10个人整个游戏最终会剩下10个获胜者把这个游戏看作产品那么该产品的全流程转化率就是10%(游戏获胜率)。

  收货地址确认-- 选择优惠 -- 选择支付方式 -- 输入短信验证码--返回支付结果(成功或失败)

  e.g. 在用户运营理念中有这样一个转化公式路人--用户--粉丝--员工先把围观的感兴趣的路人转化为用户轻度用户是产品的使用者中度用户是产品的“追随者”重度用户则会主动参与产品的功能反馈和改进建议在这个转化过程中用户的参与度逐步提高。

  并列分类多个分类(子集)构成一个全集e.g. 用户地域可以按省份划分按年龄可以将用户分为70后、80后、90后、00后等女性用户群体可以分为时尚丽人、都市白领、家庭主妇等

  等级分类e.g. 会员等级——铁牌、铜牌、银牌、金牌、钻石、皇冠城市等级——一线、二线、三线b;

  e.g. 按社会关系模型用户角色可以是父母、配偶、子女、朋友等e.g. 按照群体划分可以分为一般情况和特殊情况、二八原则等

  e.g. 用户画像时可以考虑以下属性1. 社会属性收入水平、学历、职业、婚姻情况等

  “痛苦来自比较之中”(没有比较就没有伤害)其实幸福也来自比较之中痛苦还是幸福取决于选择的参照点是高于还是低于你。

  e.g. 对比不同品牌的女装的销售情况不同销售渠道(地区)的交易情况

  实验对比设置实验组和对比组对比两组或多组之间的差异以确定人为干预(实验、方案)的效应。

  e.g. 比较不同的产品或运营方案的效果差异时常采用AB Test需要确保对比的两组或者多组在数量和结构上要具有可比性(e.g. 用户的来源、等级等需要匹配)

  做组间比较时一定要确保样本的可比性(无论是在数量级还是在群体结构上)e.g. 对比两个时间段的交易情况建议剔除掉大促和节假日(这些交易日的数据波动很大)。

  e.g. 问卷调查中那些愿意填写问卷的用户本身就是对产品有高认可度e.g. 产品漏斗转化流程中处在不同环节的用户一般不能进行对比

  常见的纵向对比有同比和环比对比的周期根据实际情况可以按日、周、月、季、年等。

  对比的时候除了比较相对量也要看绝对量以合理地评估数据差异的大小。

  e.g. 公众号关注人数昨日环比增长20%(看着还不错)实际上才增加4个人截止前天也就20个人。

  看数据指标不要只看一个“点”还要看一条“线”上的前后连接的环节进而从“面”或“体”的角度去看整个大环境中都有哪些因素相互作用。

  寻找关联关系时不仅仅要找出对Y有直接影响的X(一个或者多个)还要找出影响X对Y作用的调节因素M。

  用户结构是否发生变化是否有新的注册渠道新渠道导流进来的用户质量如何

  产品多少用户使用旧版本或者新版本产品某个环节有没有改版产品的策略(商品推荐策略等)是否有变化

  现象的产生可能存在延迟效应要考虑当前现象(环节)的前置的“因”和后置的“果”。

  e.g. 今天上线的营销方案可能在几天甚至几十天后才会有显著的效应今天交易量上出现的波动也可能是因为一段时间前产品或者运营策略上有改动。

  可以理解为“分级钻取”如同金字塔结构一样先从总体看到二级分支然后再看更细的分支。

  e.g. 支付成功率的影响可以对新老客、订单来源、支付方式、银行通道一层一层拆解细化各个分支对整体变化的贡献率

  e.g. 用户的标签分为基础标签和复合标签基础标签就是单个用户属性来定义的(例如性别、婚否等)复合标签则是考虑多个基础标签的组合(例如某个典型的用户群体画像是女性单身白领一线b;e.g. 规划用户标签时先用头脑风暴想出一批指标然后进行归类、筛选、组合

  e.g. 风控业务中累计坏账计提的计算是将不同的逾期资金规定不同的风险计提比例最后再把所有类别的风险计提资金汇总起来作为公司所有贷出款项的风险计提资金从而对公司贷款业务风险进行评估

  举个形象的例子自上而下好比国家财政拨款从中央到省会再到各市县区自下而上则像是国家征税就是从各市县区、各企业层层汇总直到报送国库。

  第一步是保证数据的准确性和稳定性第二步就是优化提高准确性、提高效率和效益。

  优化包含两部分的内容缩小当前和目标的差距直到达成并超越目标在成本或者预算固定的前提下使收益最大化。

  e.g. 机器学习建模时尝试多种方案调试各种参数使模型的精确度逐渐提高

  任何商业模式都是追逐利益的首要目标是收益最大化参考如下公式

  以上总结了常见的6种数据分析思路涉及具体的业务场景还要结合业务特点适当变通。精通方法深入业务勤于实践多加总结最终就能踏上描述--解释--预测--控制步步高升的数据分析师精进之路。

数据分析常用6种分析思路

数据分析常用6种分析思路

  必须用pandas。pandas是在python直接流行的数据处理框架。可以说,如果不会使用pandas,就谈不上会用python做

  报告给领导,报告里面放了很多图表,也摆了很多数据,结果被痛批了一顿,觉得很委屈。其实,这位朋友与很多小伙伴一样,做

  这篇文章是从人大经济论坛转载过来的,留下来以做备用,在此谢谢作者的辛苦整理 一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:

  方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。

  1. 二叉树题目 略 2. 层序遍历算法题 1)由顶向下逐层访问 2)可以用队列存储树,每次打印根节点并将左右节点放进队列 (参考:) 3. 图论中的最大团、连通分量,然后问图划分的算法 略 4. 如何判断社区活跃度(基于图),现在想着可能是根据连通...

  的作用 通过企业或者平台为目标用户群提供产品或服务,而用户在使用产品或服务过程中产生的交互、交易,都可以作为数据采集下来。根据这些数据洞察,通过

  因子,提出有价值的问题,提供清晰的指引方向。 2、数据采集。收集原始数据,数据来源可能是丰富多样的,一般有数据库、互联网、市场调查等。具体办法可以通过加入“埋点”代码,或者使用第三方的数据统计工具。 ...

  支持本地书签、tab页、历史记录搜索; 集成CSDN搜索结果; 他是一个时间转换工具; 他是一个计算器; 他是。。。,更多功能正在添加中

  研究自变量与因变量之间的关系、可以用来预测因变量的值、 线性回归使用最佳的拟合直线(也就是回归线)在因变量(Y)和一个或多个自变量(X)之间建立一种关系。 多元线性回归可表示为Y=a+b1X +b2X2+ e,其中a表示截距,b表示直线的斜率,e是误差项。 ...

数据分析常用6种分析思路

  Python机器学习实践:随机森林算法训练及调参-附代码爱你的小魔仙:数据集按照您给的链接,打开全是数字,能不能再发一次呀,谢谢啦


标签:如何分析数据  
相关评论