如何通过业务过程,对指标管理体系进行设计?

摘要:
例如,“自然月日均UV”,原子指示符为“UV”,修改类型为“统计方法”,修改为“日均”。摘要本文总结了如何基于业务划分业务流程,从而涉及相应的原子指标,并基于与维度的结合创建派生指标,以构建标准化、统一的数据指标体系。

本文重点介绍了如何根据业务过程来定义原子指标,根据原子指标和修饰词的结合来定义相关派生指标,同时做好指标的规范命名。

1. 背景介绍

指标是指将业务单元细分后量化的度量值,它使得业务目标可描述、可度量、可拆解。而指标体系的搭建是最为重要的,将直接影响「产生→处理→存储→计算→应用」的全流程。而在实际的使用过程中出现了以下问题:

  1. 对于同一业务场景,各部门会用不同的指标来衡量;
  2. 对于同一指标的计算,不同的时间点去统计,统计来源和方式会有差异。

具体来说,要做到以下几点:

  1. 规范维度和量度命名,确保唯一性,命名规则要尽量做到明确、通用、易懂;
  2. 对确认维度或量度,统一计算口径,避免歧义;
  3. 涵盖尽可能多的核心维度和量度,以此为基础推动数据建设,确保指标字典里覆盖的维度都可区分,指标都可统计;
  4. 基于指标字典,将核心维度和量度注入元数据中心,接入指标提取工具,后续实现不需要写sql即可完成自助查询及分析需求,搭建数据自助分析的基础。

因此要提供标准化的、共享的、数据服务能力,降低数据互通成本,释放计算、存储、人力等资源,以消除业务和技术之痛。

数据体系架构如下:

  1. 业务板块:如果业务产品比较多,且彼此之间的指标或者重叠性比较少的,可单独分开。
  2. 规范定义:设计出一套数据规范的命名体系。
  3. 模型设计:以维度建模理论为基础,基于维度建模总线架构,构建一致性的维度和事实。

如何通过业务过程,对指标管理体系进行设计?第1张

2. 指标的规范定义

指标的规范定义,以维度建模作为理论基础,构建总线矩阵,划分和定义数据域、业务过程、维度、度量/原子指标、修饰类型、修饰词、时间周期、派生指标等。

如何通过业务过程,对指标管理体系进行设计?第2张

(1)数据域

指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不拆分的行为事件,在业务过程之下,可以定义指标;维度,是度量的环境,如买家下单事件,买家是维度。为了保障整个体系的生命力,数据域是需要抽象提炼,并且长期维护更新的,但不轻易变动。

(2)业务过程

指企业的业务活动事件,如,下单、支付、退款都是业务过程。其中,业务过程不可拆分。

(3)时间周期

用来明确统计的时间范围或者时间点,如最近30天、自然周、截止当日等。

(4)修饰类型

是对修饰词的一种抽象划分。修饰类型从属于某个业务域,如日志域的访问终端类型涵盖无线端、PC端等修饰词。

(5)修饰词

指的是统计维度以外指标的业务场景限定抽象,修饰词属于一种修饰类型,如在日志域的访问终端类型下,有修饰词无线端、PC端等。

(6)度量/原子指标

原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名称,如支付金额。

(7)维度

维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省市等)、时间维度(其中包括年、季、月、周、日等级别内容)。

(8)维度属性

维度属性隶属于一个维度,如地理维度里面的国家名称、国家ID、省份名称等都属于维度属性。

(9)派生指标

派生指标=1个原子指标+多个修饰词(可选)+时间周期。可以理解为原子指标业务统计范围的圈定。如原子指标:支付金额,最近1天海外买家支付金额则为派生指标。

如何通过业务过程,对指标管理体系进行设计?第3张

派生指标又分以下三种类型:

事务型指标:是指对业务活动进行衡量的指标。例如,新增注册会员数、订单支付金额,这类指标需要维护原子指标以及修饰词,在此基础上创建派生指标。

存量型指标:是指对实体对象(如商品、会员)某些状态的统计,例如商品总数、注册会员总数,这类指标需要维护原子指标以及修饰词,在此基础上创建派生指标,对应的时间周期一般为“历史截止当前某个时间”。

复合型指标:是在事务性指标和存量型指标的基础上复合成的。例如,浏览UV-下单买家数转化率。

复合型指标的规则:

  • 比率型:创建原子指标,如CTR、浏览UV-下单买家数转化率、满意率等。例如,“最近1天店铺首页CTR”,原子指标为“CTR”,时间周期为“最近1天”,修饰类型为“页面类型”,修饰词为“店铺首页”。
  • 比例型:创建原子指标,如百分比、占比。例如,“最近1天无线支付金额占比”,原子指标为“支付金额占比”,修饰类型为“终端类型”,修饰词为“无线”。
  • 变化量型:不创建原子指标,增加修饰词,在此基础上创建派生指标。例如,“最近1天订单支付金额上1天变化量”,原子指标为“订单支付金额”, 时间周期为“最近1天”,修饰类型为“统计方法”,修饰词为“上1天变化量”。
  • 变化率型:创建原子指标,例如,“最近7天海外买家支付金额上7天变化率”,原子指标为“支付金额变化率”,修饰类型为“买家地域”,修饰词为“海外买家”。
  • 统计型(均值、分位数等):不创建原子指标,增加修饰词,在此基础上创建派生指标;在修饰类型“统计方法”下增加修饰词,如人均、日均、行业平均等。例如,“自然月日均UV”,原子指标为 “UV”,修饰类型为“统计方法”,修饰词为“日均”。

3. 指标管理的功能实现

为了实现指标管理,需考虑的底层信息:

如何通过业务过程,对指标管理体系进行设计?第4张

如何通过业务过程,对指标管理体系进行设计?第5张

如何通过业务过程,对指标管理体系进行设计?第6张

4. 数据的使用框架

在对指标进行规范定义与管理的基础上,可以此推动底层事实表以及维表的建设,保证数据统计的数据源唯一以及计算口径统一。同时,通过指标和修饰词的结合,便于业务人员进行自助分析与使用数据,降低数据获取的效率,从而产生有价值的结论,辅助决策,充分发挥数据的价值。

如何通过业务过程,对指标管理体系进行设计?第7张

总结

本文总结了如何基于业务来划分业务过程,从而涉及对应的原子指标,在与维度结合的基础上创建派生指标,建设成规范统一的数据指标体系。以此推动数据统计来源的唯一性,并接入指标提取工具,后续业务完成自助查询及分析需求,搭建数据自助分析的基础。

免责声明:文章转载自《如何通过业务过程,对指标管理体系进行设计?》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇OpenCASCADE General TransformationPHP的加密方法汇总下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

TDSQL多集群下的自动化和交付

“两地三中心”部署体系 “两地三中心”架构顾名思义:在一个城市有A、B两个机房,另一个城市有C机房,在第一个城市中TDSQL数据库实例采用同IDC异步、跨IDC强同步的方式,我们需要在第一个城市将四个数据节点部署在二个机房,其中主节点和一个备节点在一个机房,另外两个备节点在另一个机房。并且在第一个城市和第二个城市的数据库实例间,采用的是异步复制,保障金融...

数据产品-数据埋点-02

1.埋点方式 1.1客户端埋点   1.1.1代码埋点 代码埋点主要有app研发手动在程序中写下代码进行统计,通过触发某个动作后程序自动发送数据。 优点:具有很强得灵活性,可以控制发散得时间和发散方式等。 缺点:人力成本和维护成本太高,需要以来app发版生效   1.1.2可视化埋点 可视化埋点以前端可视化的方式记录前端设置页面元素与对其操作的关系然后以后...

手把手带你使用360度评估系统实施绩效反馈全流程(附详细图文)

☞☞360度评估反馈实施全面教程☜☜ 在线免费360度评估反馈系统:www.jianjianrenshi.com        360度评估又称360度全方位评估或多源评估,该项评估是由与被评估者有密切关系的人,分别匿名对被评估者进行评估,同时被评估者也进行自评;然后,由专业人士根据他人的评估结果,对比自评结果,出具评估报告并向被评估者提供反馈,帮助被评估...

YOLO V2论文理解

概述 YOLO(You Only Look Once: Unified, Real-Time Object Detection)从v1版本进化到了v2版本,作者在darknet主页先行一步放出源代码,论文在我们等候之下终于在12月25日发布出来。 新的YOLO版本论文全名叫“YOLO9000: Better, Faster, Stronger”,主要有两个...

tableau学习

一、维度 度量   1. 连接到新数据源时,Tableau 会将该数据源中的每个字段分配给“数据”窗格的“维度”区域或“度量”区域,具体情况视字段包含的数据类型而定。   例如:      2. tableau中的字段有角色和类型:    数据字段由数据源中的列组成。系统会为每个字段自动分配一种数据类型(例如整数、字符串、日期)和一个角色:离散维度或连续度...

维数灾难与梯度爆炸

本文章讨论的话题是“curse of dimension”,即维数灾难,并解释在分类它的重要性,在下面的章节我会对这个概念做一个直观的解释,并清晰的描述一个由维数灾难引起的过度拟合的问题。 下面不如正题,考虑我们有一堆猫和狗的图片,现在要做一个分类器,它可以把猫和狗自动并且正确分类。所以对这个两个类别,首先需要一组描述符,使这两个类别可以被表示为数字,分类...