维克托·迈尔·舍恩伯格在《大数据时代》中提到:“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题。”数据资源将和土地、人力、资金等生产要素一样,成为企业的资产。业界对于数据资产的定义是企业或组织拥有或控制的,能在未来带来经济利益的数据资源。
数字化资产是指由企业拥有或控制的,任何以数字化形式存在(便于电脑处理,通常是二进制)或由数字化方式生成或转化为数字化形式时能给企业带来经济利益的资源。业界对于数据资产的定义是企业或组织拥有或控制的,能在未来带来经济利益的数据资源。
数字化资产的对象包括数据(以数字化形式存在)和能够通过技术手段转化为数字化形式(数据)的一切资源,比如一篇纸质文章,一张照片,一段录音。
当然,不是所有的数字化形式存在或者可以转化为数字化形式的资源都是数字化资产,只有可控制、可量化、可变现的数字化资源才能称为数字化资产。
为了便于理解,下面对资料、数字化资源和数字化资产三者之间的关系进行了辨析,见图1。企业在生产运营过程中产生的所有凭证都可以称为资料,这里面包括大量的未经数字化的资源,例如纸质合同、纸质产品说明书、员工大脑里的想法等。这些宝贵的资料经过数字化就可以转化成数字化资源,比如可以设法将优秀员工的知识经验挖掘出来,建立企业的知识库。数字化资源经过价值评估以后就变成了可以用货币计量的数字化资产,就具备了流通变现的条件。
图1资料、数字化资源、数字化资产三者之间的关系
企业的数据与企业的业务运营相生相随,这些数据也散落在企业信息化的各个领域和层次,在企业运行过程中发挥了巨大的支撑作用。数据分类方法决定了业务发生过程的应该记录什么的问题,作为数据资产的管理和使用用户,我们应对企业的数据分类有个初步的了解。
数字化资产分类如图2所示:
图2企业数字化资产分类
主数据(master data)是关于业务实体的数据,如人、地点、客户、产品等。
交易数据(transactional data,也叫事务数据、业务数据)描述组织业务运营过程中的事件或交易记录,如销售订单、通话记录等。
参考数据(reference data,也叫标准代码数据)是用于将其他数据进行分类的数据,参考数据的值又称为枚举值,如客户等级分为A、B、C三级。
元数据(meta data)是描述数据的数据,帮助理解数据,分为技术元数据、业务元数据等。
指标数据(指标、analytical data)是对企业业务活动进行统计分析的数据,如客户到达数、数据接入率等。
当然,数字化资产还有其他分类标准,如数据来源(企业内部产生、外部获取)、时效性(实时、准实时、批处理)、结构特性(结构化、半结构化、非结构化)、生命周期阶段(在线、近线、离线、销毁)等。
数字化资产管理应结合企业数据的分类及对其特征的分析,才能有针对性地开展相关工作,做到有的放矢、对症下药。
汤姆·彼得斯(Tom Peters)是全球最著名的管理学大师之一,他曾说过: “一个组织如果没有认识到管理数据和信息如同管理固定资产一样重要,那么它在新经济时代将无法生存。”
所以,如何治理数字化资产,利用现有数字化资产创造价值,是企业面临的重要课题。只有管理好数字化资产,才能让企业在未来立于不败之地。
数字化资产治理框架体系包括数据战略、核心领域、保障机制、技术支撑四个层级,从上至下指导,从下至上推进,是一个多层次、多维度、全方位的数字化资产治理体系框架。其中,数据战略是企业发展战略中的重要组成部分,是保持和提高数据质量、完整性、安全性和存取的总体规划,是指导数据治理的最高原则;数据治理核心领域是指数据治理的目标对象,包括数据标准管理、数据模型管理、元数据管理、主数据管理、数据质量管理、数据安全管理、数据共享管理、非结构化数据和数据生命周期管理九个核心领域;数据治理保障机制是指保障各个核心领域的内容有效落地执行的管理机制,包括数据治理组织、数据治理制度及数据治理流程;数据治理技术支撑指支撑核心领域的工具和平台,例如数据质量检查工具、元数据管理系统等,它们是数据治理能够顺利开展的技术保障。
具体来讲,数字化资产治理包括八个方面的内容:数据标准,数据架构,数据模型,元数据,主数据,数据质量,数据安全,以及数据生命周期。
数据标准。数据标准是数字化资产的标准化定义,企业应建立覆盖全部数字化资产的标准化规划,遵循统一的业务规范和技术标准。通过制定共同遵循的数据标准,企业或组织可以实现理解一致和应用统一。数据标准一般分为基础类数据标准和指标类数据标准。基础类数据标准主要针对业务端产生的原始明细数据、交换流转过程中的数据、数据平台中的基础明细数据进行规范和约束,对应企业数据分类中的基础数据和公共代码等;指标类数据标准主要对在基础数据之上、经过进一步加工处理形成的统计计算类的指标数据进行规范和约束,对应企业数据分类中的衍生数据。
数据标准管理的制度包括应在组织分工的基础上明确数据标准申请流程、数据标准制定流程、数据标准发布流程、标准执行流程、标准复核流程以及数据标准变更流程的管理要求和职责分工。
数据标准管理主要包括三个方面的内容:首先是建立企业级数据标准体系;其次是明确数据标准的描述方式;最后是通过梳理全公司报表、应用系统,已经发布的制度、标准、规范,对其中的数据进行逐个识别、去重、归并,并依据数据元表示规范对其进行定义,形成数据标准,并以此指导数字化资产的管理。
数据标准管理的制度应在组织分工的基础上明确数据标准申请流程、数据标准制定流程、数据标准发布流程、标准执行流程、标准复核流程及数据标准变更流程的管理要求和职责分工。
数据架构。数据架构是从总体看企业的数字化资产,其核心是要明确数据的层次划分、数据在不同层次的分布情况和层次之间数据的流转情况。
数据架构管理工作包括基于现有数据架构和各业务部门及应用系统的需求,建立企业级数据架构过程;根据数据架构的变更需求,对企业或组织数据架构规划进行修改和完善的过程;对信息系统的数据架构进行规范和指导等。
数据架构管理的制度应在组织分工的基础上明确数据架构建立流程、数据架构变更流程和数据架构执行流程的管理要求和职责分工。
数据架构设计应遵循四个原则:
[1]数据共享原则是指数据在企业范围内的各个部门和应用之间共享,避免不必要的数据冗余、数据复制,避免数据的重复采集。制定合理的数据分布策略,减少数据源和数据副本,降低数据整合难度,以实现数据在应用系统间的共享。
[2]数据分布合理化原则是指根据企业应用架构的逻辑分层及应用定位,确定数据在各层、各应用的分布。如果数据存在副本,需要明确确保主副本一致性的手段。
[3]可信数据源原则是指对于关键数据项及共享数据,在不能确定唯一数据源的情况下,都应有一个权威的可信数据源,通过该数据源完成数据使用过程中的单一数据采集,减少因为多数据源带来的对业务的。
[4]数据流转规范化原则是指数据提供方原则上应该是数据的首责应用,应用之间应当建立数据接口或者服务调用接口,实现数据的流转。在架构层间应当建立应用、分层之间的数据流转关系视图。为减少对首责应用的负载,应当建立数据交换平台,相同的数据一次抽取、多次使用。应当建立企业级数据交换接口规范,所有应用间的数据交换遵循该规范。需要充分利用数据集成类系统的功能,避免形成网状的数据流转关系。
数据模型。数据模型应能够如实、完整、准确地反映业务开展的情况,能够清楚地表达企业内部各种关键业务主体、属性间关系,使不同部门的业务用户、技术用户和管理用户获得对业务及数据的统一视图。
数据模型从抽象层次上描述了数据的静态特征、动态行为和约束条件,为数据库系统的信息表示与操作提供了一个抽象的框架。数据模型所描述的内容有三部分:数据结构、数据操作和数据约束。数据模型按不同的应用层次分成概念数据模型、逻辑数据模型、物理数据模型三种。
概念数据模型是一种面向用户、面向客观世界的模型,主要用来描述现实世界的概念化结构,与具体的数据库管理系统无关。逻辑数据模型是用统一的逻辑语言描述系统需求,侧重于信息的表示方法和信息结构化的实现方法,是与业务人员沟通的语言,与具体的数据库管理系统无关。物理数据模型是一种面向计算机物理表示的模型,描述了数据在储存介质上的组织结构,与具体的数据库系统密切相关。物理数据模型表征的业务含义及规则应和逻辑数据模型保持一致,但模型本身不是一一对应。在从逻辑数据模型落地成物理数据模型的过程中,需要考虑物理平台特点、系统性能、降范式处理等,使其能够在充分表达业务规则、满足扩展灵活性的基础上,最大程度地提升性能、降低数据处理和加工的难度与复杂度。
数据模型管理的主要工作内容包括理解企业数据模型管理需求并制定数据模型管理的工作目标;模型设计工作,包括业务调研、系统调研、概念数据模型、逻辑数据模型、物理数据模型的设计;制定数据模型设计、管理维护的规范和流程;对企业数据模型进行统一管控(包括模型设计、审核发布、版本管理)等。
数据模型管理的制度应在组织分工的基础上明确数据模型建立流程、数据模型变更流程和数据模型部署流程的管理要求和职责分工。
元数据。元数据是描述数据的数据,上述提到的数据标准、模型等均应作为元数据进行统一管理。元数据是数字化资产管理的重要基础,是对系统建设过程中产生规范元数据信息而进行的规划、实施与控制行为,必须能够忠实地反映系统建设和业务开展的情况,并能够在某种程度上和数据标准对齐以反映系统和业务的规范化程度。
元数据包括模型的元数据、生产的元数据、实时的元数据、指标的元数据、维度的元数据、标签的元数据、API的元数据和ETL的元数据。元数据框架如图 3 所示。
图3 元数据整体框架图
元数据管理的制度应在组织分工的基础上明确元数据获取流程,元数据变更流程,以及元数据注销流程管理要求和职责分工。通过开展企业级的元数据管理活动,可以使企业的数字化资产管理更加有序、合理和受控,有助于理解数据的真实含义。
主数据。主数据是指系统间共享的数据。与记录业务活动,波动较大的交易数据相比,主数据具有高度共享性、长期稳定性、数据独立性、业务关键性等特点。在正规的关系型数据库中,交易记录可通过关键字段关联到主数据,形成对交易数据分析的主体等维度信息。主数据必须存在并加以正确维护,才能保证系统的参照完整性。主数据是描述企业核心业务实体的数据,具有高业务价值的,在企业范围内跨业务条线重复使用,主数据不是特定应用的专属数据。
不同的主数据应建立专门的管理系统,实现主数据的集中储存、展现和使用。通过系统的建设和管理要求的明确建立主数据单一、权威、准确的数据来源等,保障主数据的数据质量和使用效果。不同的主数据管理系统在系统定位、功能、响应效率、时效性等层面有各自要求。
主数据管理应在组织分工的基础上明确主数据新建流程,主数据变更流程,以及主数据发布流程的管理要求和职责分工。
数据质量。数据质量是数据治理的重要领域之一,通过实施数据质量控制确保数据具备准确性、完整性和一致性。数据质量管理的内容可分为管理制度的制定、组织架构的建设、技术支撑平台的建设。
数据质量管理要确定数据质量衡量维度,这是衡量数据可用程度的尺度,一般来说包括完整性、准确性、唯一性、一致性和规范性等五个指标,每个指标可以包括若干判断约束,例如规范性维度中包括“精度约束、长度约束、格式约束”等,每个数据的质量问题可能涉及一个或多个数据质量衡量维度。
数据质量管理还需要针对每个数据制定数据质量规则,包括数据质量业务规则和技术规则。其中,数据质量业务规则应至少定义每个数据的质量衡量维度、质量要求的业务描述及一个可唯一识别的质量规则编号;技术规则应至少定义数据基础信息,如数据库表、字段信息、参照数据等,以及数据质量评估脚本和代码。
数据质量管理领域的工作应通过信息化的手段落地,利用信息化系统建立、管理规则库,并通过规则引擎执行数据质量规则脚本,发现存在的数据问题。数据质量管理平台要支持对其他业务系统、数据仓库、数据平台的访问等功能。
数据质量管理应在组织分工的基础上明确数据质量规则定义流程,数据质量检查流程,数据质量问题分析流程,数据质量问题整改流程,以及数据质量考核评估流程的管理要求和职责分工。
数据安全。数据安全管理是企业或组织信息安全管理的重要组成部分。建立完备的数据安全管理体系,不仅是为了满足国家法规、行业准则和监管要求,更是为了保证企业生产运行的稳定性和连续性,为了保护企业和客户重要的有形和无形资产。数字化资产是数据安全管理的目标对象,数据安全管理就是要保证这些数据已经实施了充足的控制,已被适当保护,不会被误用。
数据安全管理的目标是建立完善的、体系化的安全策略措施,全方位进行安全管控,通过多种手段确保数字化资产在数据生命周期各阶段的安全可控。数据安全管理的主要任务是对数据设定安全等级,保证其被适当地使用。企业通过数据安全管理,规划、开发和执行安全政策与措施,提供适当的身份以确认、授权、访问与审计等。企业应在组织分工的基础上明确数据安全规则定义流程、数据安全检查流程、数据安全问题根因分析流程、数据安全问题整改流程以及数据安全评估流程的管理要求。
数据生命周期。数据生命周期管理指通过制定策略,对数据生命周期的在线、近线、离线、销毁等不同阶段进行科学、有效的管理,从而在确保数据访问效率的前提下控制数据管理成本。数据生命周期可划分为四个阶段:在线阶段、近线阶段、离线阶段和销毁阶段,其中在线阶段为必选阶段,近线、离线和销毁为可选阶段。
在线阶段的数据访问频率最高,具有较高的保留价值、用户访问频率和安全保护要求,要能支持应用系统正常运转及业务活动正常展开,必须确保本阶段数据的可靠性和可用性。
近线阶段的数据使用相对不频繁,在系统资源受限的情况下,将访问频度较低、访问需求不高的数据从应用中分离出来进行单独存放以提升产生原始数据的应用的性能,并提供与在线阶段数据一样的访问方式。
离线阶段的数据一般是没有用户访问的,在系统资源受限和预防一些特殊事件的情况下,访问需求不高的数据会被从应用中分离出来单独存放在磁带、光盘及低端磁盘(包括移动磁盘)等低价值的介质中,并提供专用或者通用的查询接口和工具。
销毁阶段的数据已过保存期,不再具有利用价值,可以进行销毁,从物理介质上清除数据。但鉴于目前存储介质成本低廉以及监管部门的最低保存年限要求,企业应在对数据进行价值评估及结合现状后再决定是否销毁数据。
在制定数据生命周期管理策略前,首先要针对所有数据明确其各个阶段的期限,然后对于明确期限的生命周期阶段制定包括数据存储方案、数据迁移方案、数据访问策略及数据销毁策略等。
对于数据存储方案,至少应涵盖但不限于明确数据存储期限、数据存储容量、数据存储介质,原则上在线数据应存储在高速存储设备中,近线数据应存储在中高速存储设备中,离线数据应存储在中低速存储设备中。对于数据迁移方案,至少应涵盖但不限于需要迁移的数据、迁移目标位置、迁移频率、迁移时间点、增量还是全量迁移方式,数据的迁移应在确保业务不受影响的情况下进行,设计明确的数据备份方案,迁移后的数据应支持反向迁移至上一阶段,迁移过程中应保证数据的完整性、一致性。对于数据访问策略,至少应涵盖但不限于对在线、近线、离线数据访问的技术实现方式,在在线、近线阶段要为用户提供数据的透明化访问。
数字化资产管理是一项非常专业和系统化的工作,除了要从数字化资产各活动领域开展管理工作,还需要相关保障措施,包括组织架构、人员、工作制度和办法、规范流程等软科学支撑;应将管理、业务和技术结合在一起,并基于企业或组织的现状开展工作,因此需要设计一套有针对性的组织架构、规范制度和流程等,确保数字化资产管理工作有序、顺利。
组织架构。数字化资产管理的组织架构不同于企业的实际物理组织架构,是一套符合企业现状、能有效推动数字化资产管理工作的虚拟组织架构。
组织架构主要由领导决策层、规划推动及执行层、参与配合及执行层构成,如图4所示。
图4 数字化资产管理保障措施组织架构图
数字化资产管理委员会负责领导数字化资产的管理工作,对工作进行集中统一领导,协调相关各业务及职能部门的运作,研究确定全企业数字化资产管理的战略、方针和政策,并对未来工作作出重大决策;审定数字化资产管理方案与实施计划;听取工作办公室的工作汇报并给出指导性意见;不定期审议数字化资产管理重大变更事项;在工作开展过程中出现资源冲突、沟通不畅时负责协调和仲裁;针对工作开展过程中的严重违规及重大问题,在全企业范围内协调整改、处理及处罚。
数字化资产管理办公室及下辖分领域管理团队负责制定数字化资产管理相关的政策、规范制度、管理办法、流程等;规划、制定数字化资产管理方案与实施计划;推动数字化资产管理的具体工作,并协调、监督、评价各参与机构的工作情况;定期总结数字化资产工作的进展、成果和存在的问题,并向领导小组汇报;负责推动数字化资产管理平台的建设工作,包括设计、开发和部署实施等。
各业务部门作为数字化资产管理的参与、配合和执行机构,积极参与数字化资产管理的过程活动;负责数字化资产管理工作在本部门的推动执行,并反馈执行效果。
制度体系。数字化转型需要引入管理制度和规范,覆盖数据产生、流转、加工整合、使用、交易交换等各个环节的规范化管理,给予数字化资产管理各项工作制度上的保障,使其有据可循。
管理制度/办法是用来约束和规范主体行为、特殊活动的一种规章制度,属于规范性文件;管理办法明确了适用范围和主体,澄清了基本概念,约定了主要环节工作内容及组织架构中各人员角色应承担的具体工作,统一了日常办公过程中的相关表格模板等。数字化资产管理办法包括数据标准管理办法、元数据管理办法、数据质量管理办法、数据安全管理办法等。
表1 数字化资产管理制度清单(部分)
管理流程。数字化资产管理流程的目的是为了控制风险、降低成本、提高服务质量和工作效率,最终提高顾客满意度和企业市场竞争力,进而达到利润最大化和提高经营效益。管理流程明确了流程中的主要活动节点、活动节点的参与人及其工作内容、流程节点间的流向等。数字化资产管理流程包括数据标准审核、发布、数据标准落地执行、数据质量问题跟踪处理、数据申请下载等(见图5)。
图5 数据标准制定流程
管理工具。在数字化资产管理实践过程中,需要依托具体的软件工具来进行支撑,主要管理工具如表2所示。
表2 数字化资产管理工具(部分)
数字化资产作为战略资产,治理机制有待完善。我们的调研发现,为了有效使用数据,“业务和数据部门有主动沟通意愿”排名第一,企业“设有跨部门沟通平台”排名第二。但在建立完善的数据治理职能如数据治理委员会、数据主管、数据科学家等结构方面,还需要进一步加强(见图6)。数据标准化是数字资产整合的基础,行业数据标准化有改善空间。如图7所示,在企业内部,“不同来源的数据经过转换实现标准统一”排名第一;“各信息系统对同类数据的名称、定义、计算方法一致”排名第二; “行业内有统一的数据标准,指导企业互联互通”一项得分最低,这一问题需要*相关部门、标准制定机构协同企业共同解决。
图6 被调研企业数字化资产治理情况
图7 被调研企业数字化资产标准化情况
企业需要更严格的事前防范机制来保护数字化资产隐私和安全。我们的调研显示,企业“对数据使用有完备授权、使用和管理机制”排名第一; “发生数据泄露或丢失等风险时,有完善的措施将损失降到最低”排名第二;企业“有完善的数据加密、传输和审核机制”,以及“用户对个人数据有充分控制权”得分相对较低(见图8)。
图8被调研企业对数字化资产隐私和安全的保护情况
数字化资产用于商业决策的预见洞察能力相对最弱。本次调研将数字化资产的管理和使用分为三个类型:资源整合能力、深度分析能力和洞察预测能力。调研结果发现,资源整合能力-帮助企业实时获取企业内外的各种数据,排名第一;深度分析能力-支持企业将整合的数据进行加工分析,支持企业的运营、管理与创新,具体内容包括大数据分析挖掘技术和工具等(如:Hadoop、HPCC、Storm等),排名第二;但是基于数据,对消费者、舆情和竞争对手行为进行洞察预测方面,能力相对最弱。洞察预测不仅仅考验企业大数据利用的程度和水平,更考验数据分析人才的基于数据的预见力和直觉能力,以及丰富的行业经验。
企业数字化资产变现需要更多途径。调研发现,数据转化为服务、产品和提高销售是价值变现的主要途径。被调研企业数字化资产变现的最重要途径中,71.5%的企业将数字化资产变为服务,52.3%的企业通过数字化渠道提高销售,28.5%的企业提供数据分析的产品或工具,仅有6.6%的企业提供数据基础服务的租赁。
作者:京东科技 王苑沣
来源:京东云开发者社区 转载请注明来源