9. 阿里巴巴数据整合和管理体系
体系
规范
数据域 | 指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概 括为一个个不可拆分的行为事件,在业务过程之下,可以定义指标;维度是指度量 的环境,如买家下单事件,买家是维度。为保障整个体系的生命力,数据域是需要 抽象提炼,并且长期维护和更新的,但不轻易变动。在划分数据域时,既能涵盖当 前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据域中和扩展 新的数据域 |
---|---|
业务过程 | 指企业的业务活动事件,如下单、支付、退款都是业务过程。请注意,业务过程 是一个不可拆分的行为事件,通俗地讲,业务过程就是企业活动中的事件 |
时间周期 | 用来明确数据统计的时间范围或者时闻点,如最近30天、自然周、截至当日等 |
修饰类型 | 是对修饰词的一种抽象划分。修饰类型从属于某个业务域,如日志域的访问终端 类型涵盖无线端、PC端等修饰词 |
修饰词 | 指除了统计维度以外指标的业务场景限定抽象。修饰词隶属于一种修饰类型,如 在日志城的访问终端类型下,有修饰词PC端、无线端等 |
度量/原子指标 | 原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可 再拆分的指标,具有明确业务含义的名词,如支付金额 |
维度 | 维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度, 也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、 省以及城市等级别的内容),时间维度(其中包括年、季、月、周、日等级别的内容) ) |
维度属性 | 维度属性隶属于一个维度,如地理维度里面的国家名称、国家ID、省份名称等 都属于维度属性 |
派生指标 | 派生指标=一个原子指标+多个修饰词(可选)+时间周期。可以理解为对原子指 标业务统计范围的圈定。如原子指标:支付金额,最近1天海外买家支付金额则为 派生指标(最近1天为时间周期,海外为修饰词,买家作为维度,而不作为修饰词) |
派生指标可以分为三类:事务型指标、存量型指标和复合型指标。
- 事务型指标:是指对业务活动进行衡量的指标。例如新发商品数、重发商品数、新增注册会员数、订单支付金额,这类指标需维护原子指标及修饰词,在此基础上创建派生指标。
- 存量型指标:是指对实体对象(如商品、会员)某些状态的统计。例如商品总数、注册会员总数,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期一般为“历史截至当前某个时间”。
- 复合型指标:是在事务型指标和存量型指标的基础上复合而成的。例如浏览 UV-下单买家数转化率,有些需要创建新原子指标,有些则可以在事务型或存量型原子指标的基础上增加修饰词得到派生指标。