基于 flink 的电商用户行为数据分析【9】| 电商常见指标汇总 + 项目总结

本文已收录github:https://github.com/BigDataScholar/TheKingOfBigData,里面有大数据高频考点,Java一线大厂面试题资源,上百本免费电子书籍,作者亲绘大数据生态圈思维导图…持续更新,欢迎star!

        本篇是flink 的「电商用户行为数据分析」的第 9 篇文章,也是该系列的最后一篇,为大家带来电商常见的指标汇总对前8篇文章做一个的阶段性的总结,并融入一些我自己的思考,希望大家能够从中受益,感谢阅读!
在这里插入图片描述


电商指标整理

有关"人"的指标

在这里插入图片描述

  • 客服
指标名词名词解释
询单量下单前来询问客服的客户总数
询单转换率(转化率= 成单数/来访量转化率)影响的因素有:宝贝描述(宝贝图片优化和描述很大程度上决定了转化率的高低。其次是店铺的整体布局和设计。)、销售目标(买家都有从众心理,商铺的定价和定位有待调查和确认,主流的消费群体应该是首选销售目标。)、宝贝的评价(评价对于店铺的存在是致命的,没有信誉便放在之后考虑是很多淘宝买家的心理。)、客服(客服是店铺窗口,好的客服相当于销售成功了一半,对于客服的严格要求是必不可少的。)
平均接待时长平均客服接待客户总的时长
DSR评分DSR就是卖家服务评级系统。就比如我们在淘宝、京东等电商平台卖商品,收到货会要求我们评价评分,DSR评分就是选取连续六个月内的买家给予该项评分的总和除以连续六个月内买家给与该评分的次数。淘宝店铺中DSR评分是淘宝店铺动态评分。淘宝店铺动态评分是指在淘宝网交易成功后,买家可以对本次交易的卖家进行如下三项评分:宝贝与描述相符、卖家的服务态度、物流服务的质量。
  • 用户

– 流量(用户)

指标名词名词解释
免费流量(1)搜索流量;搜索流量涉及的提升维度很多,如全店关键词布局,标题,产品架构等,都是细致功夫。手淘首页手淘首页流量的入口有很多,就是付费流量中提及的生活研究所/爱逛街/必买清单/淘立拍/有好货/有好店/猜你喜欢等,都是(2)手淘首页;流量来源,其中流量最大的可操作性最强的,是猜你喜欢。(3)主动访问;如直接访问、购物车、宝贝收藏、已买到商品等。(4)新品流量;有一个可以利用的规则,在这里说一下,就是大家都知道的淘宝对店铺新品的扶持流量。一件商品在刚上架的时候,淘宝平台会有一定的流量扶持,但是由于一件商品的扶持流量比较小,不会很明显。这时候就可以利用大量的上货,利用淘宝的扶持流量发展自身,想要利用这个规则的话,一次性上架几件宝贝肯定是不行的,最好是一次性上架数百的商品,这样的话,店铺自身就会有比较大的流量。但是一次性上架上百的商品,还是每天都上架数百的商品,完全靠人工的话,几乎不可能完成这个任务。这种情况下只能靠一些软件来采集上传商品,以达到一直不断的获取淘宝的扶持流量的目的。这种大量铺货的模式在店铺前期可以做,等到店铺有比较稳定的流量转化的时候,就可以用精细化运营技术来经营店铺了。
付费流量(1)平台广告;联盟按销售额付佣金,如淘宝客。(2)搜索定向基于平台访客搜索行为,如直通车,同时,直通车也可以人群定向的,下面不再重复提及。(3)人群定向;基于平台访客浏览与购买行为,如钻展,品销宝,淘积木,内容渠道。钻展/品销/淘积木大家应该都比较清楚,这里特别说明一下内容渠道,淘系的内容渠道,如有好货/生活研究所/必买清单/爱逛街…等等,都是基于访客标签个性化展现,这些渠道其实是可以获得大量免费流量的,只要产品足够优质,平台或者达人会主动且免费推,但不能全部指望免费,偶尔联系精准达人付费一下,收获流量与转化率双高,也是不错的。(4)硬广;包断某时段的固定位置,如2012年前淘宝首页首屏焦点图是可以每天16万买到,还送登录页面左侧广告等平台免费资源,这就是传说中的电商红利,当没有了红利,只有土豪才能买硬广了,上次看到的土豪就是科颜氏,买断天猫/淘宝首页第一屏。
UVunique Visitor,指访问某个站点或点击某条新闻的不同IP地址的人数。
PVpage View,即页面浏览量
VV访问次数,访客从进入网站到离开网站的一系列活动记为一次访问,也称会话(session),1次访问(会话)可能包含多个PV。
流量深度(PV/UV)平均每个独立访客产生的PV。人均浏览页数=浏览次数/独立访客。体现网站对访客的吸引程度。PV/UV
停留时长用户在一个商品页面停留的时间
ROI投资回报率;投资回报率(ROI)是指通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报。(投资回报率(ROI)=年利润或年均利润/投资总额×100%)
来源转换率指用户通过什么渠道进入该页面,比如:APP,广告,直通车…
跳失率指统计时间内,访客中没有发生点击行为的人数/访客数,即 1-点击人数/访客数。该值越低表示流量的质量越好。多天的跳失率为各天跳失率的日均值。简单地说,就是访客只访问一个页面就离开了。一个较高的跳失率是不利于店铺转化率提升以及店铺的发展的。

– 成交用户

指标名词名词解释
新用户数第一次购买商品的用户
老用户数不是大于一次购买商品的用户
活跃用户数指那些会时不时地光顾下网站,并为网站带来一些价值的用户数量
沉睡用户数沉睡用户定义,是指有一段时间没有使用、访问的用户数。例如:移动互联网产品常把90天活跃度作为一个评判节点,如果一个用户90天之内没有任何活跃行为,就会被判定为沉睡用户。
复购率再次消费的用户数量/总用户数量x100%比如母婴店有1000个会员,当月有100个会员来店再次消费,则回头率为10%。
客单价一段时间内的销售额/客户数。客单价的本质是:在一定时期内,每位顾客消费的平均价格
连带率销售件数/交易次数反映的是顾客平均单次消费的产品件数
RFMRFM模型,包含三个指标:(1)最近一次消费 (Recency):最近一次消费意指上一次购买的时候——顾客上一次是几时来店里、上一次根据哪本邮购目录购买东西、什么时候买的车,或在你的超市买早餐最近的一次是什么时候。(2)消费频率 (Frequency):消费频率是顾客在限定的期间内所购买的次数。我们可以说最常购买的顾客,也是满意度最高的顾客。如果相信品牌及商店忠诚度的话,最常购买的消费者,忠诚度也就最高。增加顾客购买的次数意味着从竞争对手处偷取市场占有率,由别人的手中赚取营业额。(3)消费金额 (Monetary):指的是一段时间(通常是1年)内的消费金额

有关"货"的指标

在这里插入图片描述

  • 进货
指标名词名词解释
备货SKU数指仓库中实际储存的货物规格、颜色、款式的数量。 SKU,英文全称为 stock keeping unit,定义为保存库存控制的最小可用单位,例如纺织品中一个SKU通常表示:规格、颜色、款式。 STOCK KEEP UNIT.这是客户拿到商品放到仓库后给商品编号,归类的一种方法. 通常是SKU#是多少多少这样子. 还有的译为存货单元\库存单元\库存单位\货物存储单位\存货保存单位\单元化单位\单品\品种,基于业务还有的是最小零售单位\最小销售单位\最小管理单位\库存盘点单位等;专业物流术语解释为“货格”。
备货品类数指仓库中实际储存的货物种类。
平均每款SKU数一般是基于品类或者平台来进行统计。
平均每款备货数量平均每款备货量=总备货量/备货品类数
品类采销比指采购商品种类和销售种类的比例
价格带采销比指采购商品价格和销售价格的比例
尺码采销比指采购尺码和销售尺码的比例
  • 销售
指标名词名词解释
销售结构(品类/价格带/折扣带)价格带(Price Zone )指各个商品品种销售价格的上限与下限之间的范围。在店铺内,为了满足顾客对既丰富又有效的商品构成的需要,有必要减少销售格层,并缩小价格带。如果销售价格的种类很多,则必然导致顾客不需要的商品增加,使顾客选择商品成为困难,并失去了商店的特性。
畅滞销指市场的产品上因为一些原因不受消费者欢迎而导致销售速度极慢。其特征为:购买量为零;售价等于或低于成本;简单再生产难以为继;
动销率动销,即拉动销售,指在营销的渠道终端,通过一系列的营销组合手段,提高单店/单点销售业绩的方式。促销是动销的方式之一,动销的手段和方式远超出促销的范畴。(1)动销率越高不一定越好(2)动销率等于100%也不一定就是正常,动销率小于100%也不一定就是滞销商品惹得祸。(3)实际工作中不能仅仅被百分比所迷惑,只看数据的表面,不透过表面找到问题的实质。 动销率计算公式为(商品动销率=动销品种数 /仓库总品种数×100%)
售罄率指一定时间段某种货品的销售占总进货的比例,是根据一批进货销售多少比例才能收回销售成本和费用的一个考核指标,便于确定货品销售到何种程度可以进行折扣销售清仓处理的一个合理尺度。售罄率反映了产品的销售速度–是否受欢迎,要充分关注新货上市的售罄率,发现问题研究问题,及时采取措施. (售罄率=实际销售货品成本/总进货成本)或者(售罄率=实际销售货品/总进货零售价)
  • 库存
指标名词名词解释
周转率/天数存货周转率(次数)是指一定时期内企业销售成本与存货平均资金占用额的比率,是衡量和评价企业购入存货、投入生产、销售收回等各环节管理效率的综合性指标
库存金额指的是存货按成本计价的金额
库存数量指仓库中实际储存的货物数量
库存结构(年份/品类/价格)指仓库中的货物记录的年份,品类和价格
有效库存比要计算有效库存比首先需要定义有效库存的标准,有效库存定义是能给门店带来价值的商品的库存。从定义来看残次商品、过季商品和没有销售的商品肯定都不属于有效库存商品。不过在实际的分析过程中有效库存的确定会复杂很多,首先无效库存包括残次商品、过季商品、冻销商品、甚至是虚库存,滞销商品。对于滞销商品需要确定一个标准将将有销售的商品分成有效库存和无效库存,这个标准一般以周销售量或月销售量来衡量,并且渠道不同标准是不一样的。例如某款衣服某周销售了2件,2件对于单个专卖店来说这可能就是有效库存,但是对于一个区域或总公司来说销售2件的商品肯定不是有效库存,因为产生的价值不大,需要提高标准。 (有效库存比=有效库存金额/总库存金额×100%)
可销天数指库存里面的总数量可以销售多少天。 有2种核算方式:1.(库存可销天数 = 库存总数量 / 日均销售数量) 2.(库存可销天数 = 库存总成本 / 日均销售成本)
  • 售后
指标名词名词解释
退货率(整体/单款)指产品售出后由于各种原因被退回的数量与同期售出的产品总数量之间的比率。有2种计算方式 1.(退货率=退货批次/出货总批次×100%)2.(退货率=退货总数量/出货总数量×100%)

有关"场"的指标

在这里插入图片描述
        现在的电子商务:

        1、大多买家通过搜索找到所买物品,而非电商网站的内部导航,搜索关键字更为重要;

        2、电商商家通过推荐引擎来预测买家可能需要的商品。推荐引擎以历史上具有类似购买记录的买家数据以及用户自身的购买记录为基础,向用户提供推荐信息;

        3、电商商家时刻优化网站性能,如A/B Test划分来访流量,并区别对待来源不同的访客,进而找到最优的产品、内容和价格;

        4、购买流程早在买家访问网站前,即在社交网络、邮件以及在线社区中便已开始,即长漏斗流程(以一条推文、一段视频或一个链接开始,以购买交易结束)。

        「相关数据指标」:关键词和搜索词推荐接受率邮件列表/短信链接点入率

        

电商8类基本指标

        1)总体运营指标:从流量、订单、总体销售业绩、整体指标进行把控,起码对运营的电商平台有个大致了解,到底运营的怎么样,是亏是赚。
在这里插入图片描述

        2)站流量指标:即对访问你网站的访客进行分析,基于这些数据可以对网页进行改进,以及对访客的行为进行分析等等。
在这里插入图片描述

        3)销售转化指标:分析从下单到支付整个过程的数据,帮助你提升商品转化率。也可以对一些频繁异常的数据展开分析。
在这里插入图片描述
        4)客户价值指标:这里主要就是分析客户的价值,可以建立RFM价值模型,找出那些有价值的客户,精准营销等等。
在这里插入图片描述
        5)商品类指标:主要分析商品的种类,那些商品卖得好,库存情况,以及可以建立关联模型,分析哪些商品同时销售的几率比较高,而进行捆绑销售,有点像啤酒和尿不湿的故事。
在这里插入图片描述
        6 ) 市场营销活动指标,主要监控某次活动给电商网站带来的效果,以及监控广告的投放指标。
在这里插入图片描述
        7)风控类指标:分析卖家评论,以及投诉情况,发现问题,改正问题

在这里插入图片描述
        8)市场竞争指标:主要分析市场份额以及网站排名,进一步进行调整
在这里插入图片描述

以上总共从8个方面来阐述如何对电商平台进行数据分析,当然,具体问题具体分析,每个公司的侧重点也有所差异,所以如何分析还需因地制宜。

项目回顾和总结

        本次基于flink 的电商用户行为数据分析项目组成模块如下:

在这里插入图片描述
        这些指标的具体开发在之前的8篇文章中都有陆续介绍,我们在这里可以对其进行一个分类。其中统计类的开发套路有迹可循,无非就是将数据集进行读取,然后经过map封装成样例类,可能还会有filter过滤,keyBy分组的操作,接着就是开时间窗,做聚合。如果遇到稍复杂一点的情况,例如求每个时间范围内的topN,我们按照每个窗口结束的时间indowEnd进行分组,再做一个process自定义Function即可。

        在后面的模块中,我们开发需要针对业务流程中的一些状态做检测输出警告。跟时间相关的,我们就需要使用processFunction定义定时器。如果是正常的状态逻辑,我们就需要使用到状态编程,自定义一些状态,总体来讲,就是一套这样的处理规则。对于统计类指标的开发,如果我们不想用DataStreamAPI,想用更高级的API,也可以考虑用 tableAPIflinkSQL,将需要计算的指标提取出来,做一个聚合即可。如果是对事件,逻辑,风控进行管理,往往我们可以定义CEP复杂事件处理去做定义。

项目收获

        首先谈谈为什么我会尝试去追B站的视频,来学习这个所谓的基于 flink 的电商用户行为数据分析项目。主要还是因为自己在平时的工作中,flink接触到的内容不多。而近几年flink社区的发展又非常迅猛,前几天才刚推出flink1.12.0,流批一体真正统一运行。所以说,大数据未来几年的发展,flink大势所趋!

        通过这次项目的学习,让我这个大数据萌新对于flink又有了更深的认知。尤其是之前没有在意过flink的CEP编程,但是在一些复杂场景下,使用CEP却是真的能提高我们开发的效率,否则自己写逻辑代码要写到吐…另外,对于一些其他的含义,例如时间窗口,水印,以及各种不同的自定义处理函数,都让我加深了印象。尤其是现在再去看之前写的flink代码,果然是顺眼了很多(让我臭个美,顺便截个图)。

在这里插入图片描述

        我相信一定会有小伙伴看到这里,也想跟这个项目。这里我先投出网页视频链接:https://www.bilibili.com/video/BV1yV411f7ZR,其中项目源码我已经放到github上了,欢迎小伙伴们前来围观。

https://github.com/Alice-czxy/FlinkECUserBehaviorAnalysis/

        有留言之前几期文章内容的小伙伴都应该知道,我写的代码基本每行都有注释,所以不用担心看不懂哈,如果看了注释还不太理解,欢迎加微信交流哈~

之后的计划

        这个项目只是我自学的一个小阶段,接下来,我会去自学一项最近很火的 技术——ClickHouse,到时候学习做的笔记或者好的资料我都会贡献出来。但是暂时的文章我不会去写这个,因为我现在能写的内容太多了,档期完全排不过来,一大堆已经有了思路还未动笔的文章等着我去解除封印! 好了,本篇文章over,很感兴趣坚持看到这里的你们 |ू・ω・` ) 你知道的越多,你不知道的也越多!我是Alice,我们下一期见!

        

文章持续更新,可以微信搜一搜「 猿人菌 」第一时间阅读,思维导图,大数据书籍,大数据高频面试题,海量一线大厂面经…期待您的关注!

大数据梦想家 CSDN认证博客专家 CSDN博客专家 大数据学者 追梦人
专注与研究大数据基础,理论,架构与原型实现。
个人原创公众号「 大数据梦想家 」,每日更新大数据干货,欢迎上车!
一天的生活就是一生的缩影。在最美的年华,做最好的自己!!!
一、课程简介<br /> <br /> 随着技术的飞速发展,经过多年的数据积累,各互联网公司已保存了海量的原始数据和各种业务数据,所以数据仓库技术是各大公司目前都需要着重发展投入的技术领域。数据仓库是面向分析的集成化数据环境,为企业所有决策制定过程,提供系统数据支持的战略集合。通过对数据仓库中数据的分析,可以帮助企业改进业务流程、控制成本、提高产品质量等。<br /> <br /> 二、课程内容<br /> <br /> 本次精心打造的数仓项目的课程,从项目架构的搭建,到数据采集模块的设计、数仓架构的设计、实战需求实现、即席查询的实现,我们针对国内目前广泛使用的Apache原生框架和CDH版本框架进行了分别介绍,Apache原生框架介绍中涉及到的技术框架包括Flume、Kafka、Sqoop、MySql、HDFS、Hive、Tez、Spark、Presto、Druid等,CDH版本框架讲解包括CM的安装部署、Hadoop、Zookeeper、Hive、Flume、Kafka、Oozie、Impala、HUE、Kudu、Spark的安装配置,透彻了解不同版本框架的区别联系,将大数据全生态系统前沿技术一网打尽。在过程中对大数据生态体系进行了系统的讲解,对实际企业数仓项目中可能涉及到的技术点都进行了深入的讲解和探讨。同时穿插了大量数仓基础理论知识,让你在掌握实战经验的同时能够打下坚实的理论基础。<br /> <br /> <br /> 三、课程目标<br /> <br /> 本课程以国内商巨头实际业务应用场景为依托,对商数仓的常见实战指标以及难点实战指标进行了详尽讲解,具体指标包括:每日、周、月活跃设备明细,留存用户比例,沉默用户、回流用户、流失用户统计,最近连续3周活跃用户统计,最近7天内连续3天活跃用户统计,GMV成交总额分析,转化率及漏斗分析,品牌复购率分析、订单表拉链表的设计等,让学生拥有更直观全面的实战经验。通过对本课程的学习,对数仓项目可以建立起清晰明确的概念,系统全面的掌握各项数仓项目技术,轻松应对各种数仓难题。<br /> <br /> 四、课程亮点<br /> 本课程结合国内多家企业实际项目经验,特别加入了项目架构模块,从集群规模的确定到框架版本选型以及服务器选型,手把手教你从零开始搭建大数据集群。并且总结大量项目实战中会遇到的问题,针对各个技术框架,均有调优实战经验,具体包括:常用Linux运维命令、Hadoop集群调优、Flume组件选型及性能优化、Kafka集群规模确认及关键参数调优。通过这部分学习,助学生迅速成长,获取前沿技术经验,从容解决实战问题。<br /> <br /> <br /> <div> <br /> </div>
相关推荐
©️2020 CSDN 皮肤主题: 代码科技 设计师:Amelia_0503 返回首页