大数据时代的数据管理
大数据时代下,要有效挖掘数据价值、形成知识、具备智慧分析能力,才能够推动大数据商业应用。本专题将分享我们在数据规划、数据管理、数据分析和数据服务领域的经验体会,共同探讨大数据时代下的数据管理。
研究与实践 通常而言,大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的信息。
Gartner的定义:"大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从技术角度来讲,大数据是数据分析的前沿技术,是从各种各样类型的数据中,快速获得有价值信息的能力;从应用领域来讲,大数据可分为大数据技术、大数据工程、大数据科学和大数据应用等领域。目前,大家比较关注的多是大数据技术和大数据应用领域。大数据工程, 指大数据的规划建设、运营和管理的系统工程;大数据科学,则是关注在大数据网络发展和运营过程中,探索发现和验证大数据的规律及其与自然和社会活动之间的关系。
大数据时代的数据管理,已不是通常我们所讲的企业(或政府部门)日常的数据库维护,而是着眼更高层次,站在领域-行业或企业(或政府部门)全局的高度,将数据视为有价值的信息资源、贯穿数据全生命周期的管理,通常包括数据模型、数据标准、信息资源目录、元数据、数据安全、数据质量和数据交换管理等内容。
有实效的数据管理是大数据应用的前提,包括:
- 统一的数据管理、形成统一的数据模型和数据标准化体系,可以有效地、根本性地解决系统集成难题;
- 加强源头数据治理和数据环境重建(优化)、实现"源头唯一、标准一致、结构稳定",有效规避"数出多源"、"标准不一"和"结构不合理"等因素的影响,有序消除各类系统间的"信息孤岛"现象、提升系统集成品质;
- 实现数据资产集中化管理,有效地解决因数据资产分散在多个独立系统、导致系统的数据安全问题和数据质量参差不齐、无法保证的现实,强化和深化信息资源深度开发利用能力。
基于多年数据管理领域核心技术研发、信息资源规划和信息资源整合成功实践的企业核心能力,我们提出由数据规划、数据管理到数据服务的数据综合管理的整体解决方案,将突出解决:
- 衔接业务发展战略、支撑适应组织创新管理需要的企业架构建立与优化;
- 科学评估现有数据环境、客观认知数据异构环境,明确数据治理方向;
- 实施信息资源规划,梳理业务和数据需求、数据流分析,建立统一数据标准和统一信息模型,支撑信息化总体规划和顶层设计、完成信息化重点专项工程总体设计;
- 加强数据标准体系、信息模型和元数据管理,形成信息资源管理能力;
- 重视数据环境重建与优化,构建高档次数据环境;
- 强调数据共享与交换、重视数据质量和数据安全,提升数据管理水平;
- 支持数据审计和数据多维展现分析,构建数据门户、提供数据综合服务。
大数据环境下,数据的价值得以最大限度地挖掘、能够有效地形成各类生产经营管理及服务信息,将有效地促进行业信息积累、知识库建设和综合决策能力的提升,实现智慧管理、提供智慧服务。