什么是数据治理
学术的讲:对数据资产管理行使权力和控制的活动集合。
白话的说:把和数据有关系的人拉一起,合计合计怎么把所谓的数据创造更多的价值。
小声BB:其实就是把关键数据筛选后,经过数据建模的推理、产品上线后的验证、市场的反馈后得到既定或者超预期的商业价值,可谓是富贵数中求,数据界的卷KING。
为什么要数据治理
学术的讲:业务多,增长遇到了瓶颈,希望通过数据维度的分析,发现并创造更多的商业价值。
白话的说:刚开始做业务的时候,数据报表、字段、逻辑、血缘关系瞎鸡儿定,后来业务多了,数据积攒太多,存储处理成本太高。导致业务成本增加,业务利润点就开始增长缓慢。业务爸爸心生一计,羊毛出在羊身上,既然数据让我花了钱,我要数据把钱再捞回来,所以就......有点像???
小声BB::早知今日何必当初,整体的规划真的很重要。
数据治理的目标是什么
一句话概括一下:合理可控的范围内使用数据创造并转化价值。
小声BB:其实就是为了以后可以省钱又可以变着法的赚钱
何为合理
运营合规即合理,不刑就是行。在相关法规、条例如:《网络安全法》、《数据安全法》、《个人信息保护法》的法规框架下,满足组织或业务需求的数据使用就是合理的。
小声BB:老板说了没事就没事,除非老板是SB
如何可控
风险可控,至于风险,就是在数据处理、使用过程中的泄露风险,所以要做的就是对数据处理和使用的人、环节增加权限、审批、脱敏等审核和安全处理。
小声BB:构建一套权限体系、审批流程、和数据处理规则,让处理数据的这帮人乖乖的处理数据,管好自己的脑子,别让自己的手出蛾子,不然就真的太刑了。
至于如何使用数据创造转化价值,这个就在于数据治理的整个过程,包括了范围定义、过程管控等等一系列、接下来会详细而又概括的进行说明。
数据治理的范围
数据治理的范围根本上是对底层元数据的定义,从业务和技术视角出发,主要分为业务元数据、技术元数据。
对于业务元数据、技术元数据更多的是要对元数据的一致性、完整性、正确性、合规性、以及及时性等几个维度进行综合考量来圈定范围。
业务元数据
简单来说,业务元数据的定义范围可以参考以下几个维度
数据表的表明:明确表是存什么数,干嘛用。
表、字段的血缘关系:明确每个表干吗用,数据怎么来,去哪里。
字段的参数说明:数据表每个字段的说明,用来确定每个字段代表的含义。
统计的口径说明:明确字段是按照什么维度进行的取值和确定上下游的交互。
技术元数据
从表现层面这个相对比业务元数据简单,总的来说,两个维度长度类型
如何实施数据治理
咳咳,这个比较关键,涉及到最多的其实就是如何让数据治理这个工作正常、稳步的进行开展和推动。但是有个前提或者说原则,所有的过程均应在环境安全、数据开放、价值明确,结果有效的前提展开。所以,对于实施数据治理,主要从以下3个方面开展。
上传下达明确目标
定义怎么算是数据治理成功:其中就涉及到为什么要做数据治理、数据治理里程碑目标是什么。毕竟,目标明确,方向一致,大家都好做事。
确定组织结构:明确并确定在整个治理过程中,谁是负责人、谁是做事儿的,这样的话,治理过程中涉及到资源协调都可以定点到人。
过程中的规章制度:这点更多的是对过程中的汇报和管理的确定,谁汇报,谁管理、谁审批。
小声BB:其实就是准备干活之前,老板叫着各个业务端的负责人一起开个会,说明一下要做的事情和要达成的目标,明确各角色负责人,同时在会上对负责人和干系人进行授权,明确各角色可调用和分配的资源。要是钱多的话,在搞一下赏罚机制更好,毕竟大家谁会跟钱过不去。
充分分析避免分歧
这个环节比较关键,承上启下的作用。对于数据治理的实施,需要结合既定里程碑目标来对各阶段的内容进行规划和设计,所以综合来说,两个方面:
充分分析前期的调研:基于所在行业的业务属性,结合当前和未来可预知的业务场景对于数据的应用进行分析,确保后续的执行过程中的产出成果效益最大化。
后期的分析:方案落地后基于产生的数据的有效性和价值(复用、流转)进行分析,根据分析结果来考虑和研究后续的一些迭代和优化。
设计合理
本来数据治理就是为了缩减企业内部数据成本,提升数据质量,所以在数据治理前期设计者要充分去理解当前的数据架构和所有的数据逻辑,尽可能的最小成本对数据治理的方案进行设计,其中讲究的一个点:成本最小,改动最小的前提下对数据治理的方案进行设计,这样做的主要目标是对当前在行业务影响不会太大。当然,有钱的话,怎么好做怎么来~
数据治理的结果
数据治理的尽头是实现数据资产的价值最大化。具象一点就是一套相对适用的数据审核流程,用于避免无效数据和重复数据的产生,相关干系方会涉及到、渠道、业务、产品、技术。
统一的数据口径
从业务维度出发,多平台、多系统、统一定义数据表的血缘关系,数据参数的名称、参数的定义。其主要目的是为了让业务能读懂数据。技术从日志、库表、模型、报表、代码有统一的设计和输出规范,满足数据的互通和流转,避免数据孤岛。
消除无用数据,提升数据质量
主要取决于从设计到执行对于业务场景的深入理解,确保不同来源数据可以用相同字段进行表述,其目的是为了消除冗余数据,减少数据存储和后续的处理成本。
数据及时响应支撑数据洞察
这一点其实就是想说,做完数据治理以后,可以快速的支持数据对接,业务端的数据响应。同时通过有效的数据满足过程中或任何时间节点的数据分析,支撑市场、商业、产品的走向和规划。
题外话
数据治理是个任重道远的事情,从整体的规划要尽量的考虑周到一些,虽然不能一蹴而就,但是在整个数据治理过程中,要随时关注行业走向,保持和业务端的及时沟通。对于业务端的数据反馈要及时进行响应和分析,根据分析结果来作证和规划后续的迭代。
另外,如果涉及到新的产品,尤其涉及到多端对接的情况,趁早对产品大的方向和数据进行规划。