新一轮信息技术革命与经济社会活动交汇融合,引发数据爆炸式增长,大数据的概念应运而生。《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》提出:“实施国家大数据战略,推进数据资源开放共享。”不过,目前人们对于大数据和大数据战略还存在一些模糊认识,有必要进行探讨和澄清。
对于什么是大数据,社会各界有不同认识。企业界通常将自己可以利用到的海量数据视为大数据,有的政府机构则认为将各部门数据整合起来就是大数据。其实,学术界对大数据的“4V”表述是:大数据是以体量巨大(Volume)、类型繁多(Variety)、存取速度快(Velocity)、价值密度低(Value)为基本特征的数据集。在这种界定下,大数据应用是类似沙里淘金的过程。就是说,大数据并不直接意味着大价值,而是经过分析发掘后可以释放潜在价值。除了以“4V”标准来界定大数据,我们更应从国家信息化发展战略全局来把握大数据。信息化的核心是数据,数据是与物质、能源同等重要的基础性战略资源;数据的采集和分析涉及每一个行业,是带有全局性和战略性的工作。因此,从国家信息化发展全局来看,可以把“大数据”广义地界定为:我国信息化进程中产生的、可被利用的海量数据集合,是当代信息社会的数据资源总和,是信息时代的全数据,既包括互联网数据,也包括政府数据和行业数据。因此,大数据既是一类呈现数据容量大、增长速度快、数据类别多、价值密度低等特征的数据集,也是一项能够对数量巨大、来源分散、格式多样的数据进行采集、存储和关联性分析的新一代信息系统架构和技术,还代表一种新的思维方式——大数据思维,是一种能够帮助人们从信息社会海量数据中发现新知识、创造新价值、提升新能力、形成新业态的强大的认识世界和改造世界的能力。只有从这个高度认识大数据,才能不断释放数据红利、打造数据优势。
那么,实施大数据战略的关键是什么?从我国现实状况来看,关键是“推进数据资源开放共享”,也就是着力解决“不愿开放共享”“不敢开放共享”“不会开放共享”问题,打破部门分割和行业壁垒,促进互联互通、数据开放、信息共享和业务协同,切实以数据流引领技术流、物资流、资金流、人才流,强化统筹衔接和条块结合,实现跨部门、跨区域、跨层级、跨系统的数据交换与共享,构建全流程、全覆盖、全模式、全响应的信息化管理与服务体系。今年9月国务院发布了《关于促进大数据发展的行动纲要》,其核心就是推动各部门、各地区、各行业、各领域的数据资源开放共享。(国家信息中心信息化研究部副主任 单志广)