业务驱动的政府大数据平台数据治理

       为研究跨系统和跨部门的政府大数据平台如何实现数据治理,文章采用案例研究法,选取宁波市三个政府部门建设的政府大数据平台,对各平台的高层管理者、负责人和技术人员开展了半结构化访谈以收集定性数据。案例分析揭示出跨系统和跨部门的数据治理路径涌现为数据集成、数据一致性、数据处理、数据存储和数据共享五个方面。研究表明:业务驱动是决定政府大数据平台数据治理路径的关键。

展开查看详情

1.情报资料工作 2018年第1期 专题研究 业务驱动的政府大数据平台数据治理* 马广惠 1 安小米 1,2,3 宋 懿 1 (1 中国人民大学信息资源管理学院; 2 数据工程与知识工程教育部重点实验室; 3 中国人民大学智慧城市研究中心 北京 100872) 摘 要 为研究跨系统和跨部门的政府大数据平台如何实现数据治理, 文章采用案例研究法, 选取宁波市三个政 府部门建设的政府大数据平台, 对各平台的高层管理者、 负责人和技术人员开展了半结构化访谈以收集定性数 据。案例分析揭示出跨系统和跨部门的数据治理路径涌现为数据集成、 数据一致性、 数据处理、 数据存储和数据 共享五个方面。研究表明: 业务驱动是决定政府大数据平台数据治理路径的关键。 关键词 数据治理 大数据治理 大数据平台 政府大数据 业务驱动 Business-driven Government Big Data Platform Data Governance Ma Guanghui1 An Xiaomi1,2,3 Song Yi1 [1 School of Information Resource Management, Renmin University of China; 2 Key Laboratory of Data Engineering and Knowledge Engineering (Renmin University of China); 3 Smart City Research Centre (Renmin University of China), Beijing,100872] Abstract This paper aims to investigate how across systems and sectors big data platforms in government agencies im⁃ plement big data governance, three representative departments constructing big data platforms in Ningbo City are se⁃ lected for case studies, in the meanwhile, top management, managers and technicians of every platform were inter⁃ viewed to collect qualitative data. Research findings show that data integration, data consistency, data processing, data storage and data sharing are the key approaches of big data governance in building the big data platforms. Through mul⁃ tiple case analyses, this study concludes that the most effective approach to big data platform data governance is busi⁃ ness-driven. Keywords data governance, big data governance, big data platform, big data in government, business-driven 出通过布局大数据基础设施平台实现数据共享、数据 1 问题提出 交换和数据开放。实践层面,为深化互联网与社会经 为推动经济转型,提升政府治理能力及国家竞争 济领域的融合并推进大数据发展和应用,各省市相继 力,国务院印发《国务院关于积极推进“互联网+”行动 开展政府大数据平台的建设实践。理论层面,政府大 [1] [2] 的指导意见》 及《促进大数据发展行动纲要》 , 文件提 数据平台带来的联接力与创新力促进了政务数据的共 *本文系国家社科重大课题 “国家数字档案资源整合与服务机制研究” 13&ZD184)、 (编号: 国家自然科学基金重点培育项目 “面向政府决策的大 数据共享与治理机制” 子项目: 大数据治理规则体系研究” 91646127)和中国人民大学科研项目 (编号: “基于大数据的智慧城市服务关键技术研 究及典型应用” 子课题 “城市大数据集成技术与信息资源整合方法” 15XNLQ08)的研究成果。 (编号: 21

2.专题研究 情报资料工作 2018年第1期 享、开放和交换,有利于推进简政放权、创新政府治理 波市政府大数据中心、宁波市智慧城市管理中心以及 方式、 优化市场服务并加强市场监管[3]。但信息治理环 宁波市海曙区经济和信息化局三者建设的大数据平台 境下政府信息化建设遗留的信息治理、信息安全等问 均包含完整的数据治理过程, 具有数据融合、 业务融合 题未完全解决[4]。进入大数据时代, 建设政府大数据平 和系统融合特征,且三者之间的治理模式存在近似之 台同样面临大数据 4V(Variety, Volume, Velocity, Val⁃ 处, 符合逐项复制的原则。 ue)[5]特征的挑战,这些因素成为阻碍数据共享、 数据安 在数据收集方面,本研究通过不同数据来源为研 [6] 全、 数据主权、 数据治理实现的障碍 , 大数据治理正是 究结论提供三角互证,主要包括访谈、政策及文献调 为应对这些挑战提出的解决路径。 查。其中主要的数据来源于半结构化访谈,选取每个 目前对大数据治理的研究局限于对大数据治理概 平台的高层管理者、负责人及技术人员共 9 人开展访 念的界定,其中代表性的研究包括:Soares[7-9]将其定义 谈,访谈围绕“大数据治理、大数据标准及大数据质量” 为信息治理的一部分, 是与大数据优化、 隐私、 变现、 多 展开,在每项访谈中,访谈对象围绕组织的整体业务情 功能协作相关的政策制定。在此基础上,梁芷铭[10]提 况、平台的建设情况进行介绍, 并演示了平台的具体功 出, 为应对大数据的挑战, 大数据治理是运用技术工具 能及其数据、业务及系统的融合过程。 进行大数据管理、整合、分析及挖掘的行为,并按照对 本研究主要采取以下方式提高收集数据对结论的 象将其划分为人、物、数据、技术四位一体的框架。此 支持度。首先,对不同级别对象进行访谈以避免个人 外,大数据背景下通用的数据治理体系框架包括数据 偏见,其中高层管理者负责平台的顶层设计, 由负责人 持久化层、数据集成层(主数据)、统一建模层、数据质 进行整体规划,技术人员负责具体的功能及技术细节 量层、 元数据管理层和数据治理人员组织层[11]。 实现。其次, 采用多源数据,并在不同平台的访谈对象 文献调研的结果表明,现有研究主要集中于对大 间寻求规律和差异进行相互印证,以避免可能的偏 数据治理概念框架的探讨,缺乏对其实施细节的研究 见。最后,对访谈对象做匿名化处理, 鼓励访谈对象积 和解释,同时缺乏对大数据治理实现过程的实证支 极参与并提供准确信息。 持。为了填补这一研究空白, 本文提出以下研究问题: 在数据分析方面,通过归纳性分析产生政府大数 跨系统和跨部门的政府大数据平台如何实现数据治 据平台数据治理的主要内容。随后的第一项任务是进 理?鉴于当前政府大数据平台数据治理实践和理论的 行内部案例分析,对各平台的数据治理问题进行研 探索性, 本文采用案例研究方法。 究。第二项任务是在复制逻辑的指导下进行跨案例分 析,采用表格形式提炼不同平台的共性和差异, 初步形 2 研究方法及数据收集 成政府大数据平台数据治理的路径,并通过不同平台 针对跨系统和跨部门的政府大数据平台如何实现 进行相互印证。最为重要的过程是在理论和访谈数据 数据治理的研究问题, 论文采用案例研究方法, 并通过 及文献之间进行循环分析, 形成最终的研究结论。 [12-13] 多案例增强结论的说服力 。遵循理论抽样原理, 论 文选取了宁波市三个政府部门建立的大数据平台数据 3 政府大数据平台数据治理案例特点 治理实践为案例,首要原因是宁波市大数据发展过程 本研究调研的宁波市三个政府部门建立的大数据 中呈现的大数据治理实践为本研究提供了实证支持。 平台,均为政府部门内部为促进数据流转建立的跨系 根据《宁波市人民政府关于推进大数据发展的实施意 统和跨部门的大数据平台。表 1 总结了三个案例的 见》,宁波市以国家城市大数据综合示范应用城市、国 特点。 家级大数据创业中心和城市大数据产业基地为未来发 在建设层级方面,海曙区与宁波市政府大数据平 展目标[14]。宁波市代表了政府大数据平台数据治理的 台的一个关键区别是,区级平台直接面向实际工作和 先进水平, 其在大数据发展和应用中取得的成绩, 包括 业务活动,而市级平台不负责具体业务只负责任务分 国家新型城镇化综合试点城市、 国家创新型试点城市、 配,与市级平台相比,区级平台面向业务的数据共享需 2015 中国十大智慧城市等,尤其是海曙区的政务大数 求更为强烈。 据共享和开放建设获得 2017 大数据产业峰会的 “大数 关于管理模式,政府大数据平台的管理模式沿袭 据应用优秀案例奖” , 提供了典型的政府大数据平台数 了我国条块分割的管理体制。海曙区与宁波市大数据 据治理中国方案和地方经验。更为根本的原因在于宁 平台及其城管系统的数据融合平台,因涉及不同职能 22

3.情报资料工作 2018年第1期 专题研究 表1 政府大数据平台数据治理案例特点 部门 大数据平台 平台定位 层级 管理模式 数据资源 政务信息资源 海曙区的35个职能 中心 a.面向政府部门内部 部门 宁波市海曙区 的数据流转; 横向职能 公安、城管、教育、 经济和信息化 区级 b.为部门应用数据提 管理 卫 生 …… 社 会 单 局 视频监控平台 供服务。 位,还有物业、文保 数据等 6 个区、5 个县及 5 智慧城市管理 纵向专业 发现城市管理中与 个园区的智慧城管 宁波市智慧城 平台 管理 数据 智 慧 城 管 有 关 的 市级 市管理中心 智慧城管数据 问题。 横向职能 交警、公安、工商等 融合平台 交换 数据 a. 数据共享平台,与 市场监管局、国税、 宁波市政府大 宁波市政府大 横向职能 应用无关; 市级 公安、社保、民政等 数据中心 数据平台 管理 b.部门协调。 数据 部门间的数据流转, 因而实行横向职能管理; 但对于城 管系统内部, 则在行业内部实行自上而下的垂直管理, 图1 跨系统和跨部门的政府大数据平台数据治理路径 其中的一个显著不同是专业部门建设的大数据平台与 业务直接相关。 需求的关联性。 就数据来源而言,海曙区建立的大数据平台以职 参考现有研究中对数据集成的定义[20],本文将政 能部门提供的应用数据为主, 与之相似, 市级政府大数 府大数据平台的数据集成定义为: 政府各部门将异构、 据平台同样以职能部门提供的数据为来源,两个平台 分布、相互关联的多源数据集成到统一的政府大数据 本身并不拥有数据资源; 与之相区别的是, 市级智慧城 平台,实现数据资源的有效组织和部门间数据共享。 管平台的数据来源于城管系统的业务活动。 表 2 揭示了数据分析的 通过对文献和访谈资料的整理, 结果及代表性观点,描述了基于业务需求的政府数据 4 政府大数据平台的数据治理路径 集成。 [15] 表2 基于业务需求的政府大数据平台数据集成 鉴于数据资源作为政府核心资产的重要属性 , 本文探讨的数据治理聚焦于政府大数据平台以数据为 数据来源 平台 数据集成起源 数据权属 代表性观点引用 部门 对象开展的治理活动。课题组主要围绕 “大数据治理、 “政府部门内部的数据流转” (高 宁波市海曙 区级职能 业务办理中数据共 区 级 各 职 层管理者) 大数据标准及大数据质量” 展开访谈, 本文仅讨论与数 区政府大数 部门 享的需求 能部门 “部门有数据的需求, (平台)从其 据平台 据治理相关的数据。按照数据治理输入、过程和输出 他部门调数据”(技术人员) “没意义的数据我不要……” (高 三个阶段对案例数据进行分析[16], 跨系统和跨部门的政 宁波市智慧 智慧城管 智慧城管工作中发 智 慧 城 管 层管理者) 城市管理大 系统 现城管问题 中心 “智慧城管主要是发现问题的数 府大数据平台的数据治理问题涌现为数据集成、数据 数据平台 据” (高层管理者) 一致性、数据处理、数据存储和数据共享五项具体内 “业务部门愿意给什么就是什么” (负责人) 容。图1描述了三个政府大数据平台的数据治理路径。 宁波市政府 全市职能 业务办理中数据共 市 级 各 职“(由信息化建设部门)挑数据资 4.1 凭业务需求实现数据集成 大数据平台 部门 享的需求 能部门 源, (决定)哪些能共享”(负责人) “没人要,我主动去拿,我拿了以 根据政府信息化发展历程及数据治理理论,信息 后怎么办呢”(负责人) 化是数据集成的背景和环境。由于信息系统建设造成 实际访谈的结果显示政府大数据平台的数据集成 “信息孤岛”问题,为减少冗余数据、保障数据一致性、 起源于职能部门的业务需求,现有研究同样表明集成 促进信息共享, 数据集成成为政府部门的必然选择, 并 方法的选择依赖于业务应用系统的需求[21]。在政府各 由早期的信息系统集成发展到云计算环境下的数据集 职能部门履行职责的过程中,因业务办理产生对其他 [17] 成 。为实现数据集成, 现有学术研究中对数据集成方 政府部门的数据需求[22]。为实现各部门数据交换和共 法和技术的探索包括:数据仓库、数据交换[18]、模式集 享的需求,政府大数据平台集成了不同部门的数据资 [19] 成、 数据复制及综合型集成 。现有研究表明, 信息化 源。在平台上,职能部门的业务需求直接决定其数据 是数据集成的诱因,数据集成主要依靠技术方法实 集成的内容和范围,对于与各部门业务需求无关的数 现。区别于现有研究,本研究揭示出数据集成与业务 据, 并不属于大数据平台数据集成的对象, 即数据集成 23

4.专题研究 情报资料工作 2018年第1期 取决于业务需求。 表3 基于业务活动保障政府大数据平台数据一致性 值得注意的是,政府大数据平台集成数据资源的 更新 平台 责任方 更新方式 代表性观点引用 周期 来源与数据权属问题。智慧城市管理中心实行纵向专 “默认一年会更新两次……签了维护合同”。 (技术人员) 业管理, 直接面向业务需求,其建设的智慧城管大数据 宁波市海 共享数据 源头采集,默认一 “(保证数据真实性)三个环节,第一个是源头 曙区政府 平台主要实现专业范围内数据资源的集成,说明数据 大数据平 的各业务 随 业 务 变 年更新 采集上是工作环境上应用的数据;第二个,几 部门 更 两次 个部门同时涉及一个数据,会有比对机制;第 集成与业务的关联性。与此相区别,区级和市级政府 台 三个还有一个数据纠错和验证机制,还会在实 际工作中验证”。 (高层管理者) 大数据平台本身并不产生业务数据,其数据资源主要 “工商的数据是实时的……数据交换中心也是 来自于与业务直接相关的各职能部门,平台集成的数 根据部门要求提供的”。 (高层管理者) 自有数 “只要来源是统一的,数据库是同一个数据库, 据资源依然归属于各业务部门,但平台为各部门提供 自有数据 来 源 于 统 据一年 数据库市级是统一管理的”。(高层管理者) 宁波市智 了数据交换和数据共享的渠道。两种类型的大数据平 为智慧城 一 的 业 务 更新两 “我觉得现在入库的数据是没有问题的……这 慧城市管 管 ,交 换 活动,部分 次,交换 里面的数据百分之九十九点九是对的,没发生 理大数据 台均表明数据集成与业务需求的相关性。 平台 数据为业 为 自 动 获 数据随 过任何事情,我都是自动获取的,不是由人为 务部门 取 业务变 去输的”。(高层管理者) 综合以上分析,政府信息化建设及数据集成技术 更 “(数据质量问题)一方面是人为去报……另一 方面是有数据普查,每年做两次更新”。 (负 并非数据集成的决定性因素,政府部门的业务需求是 责人) 数据集成的关键原因和重要依据。虽然数据集成涉及 “应用系统变了直接写我一份……我这里是数 数据碎片、冗余数据、数据一致性等问题,但其并非必 据,不是业务”。 (负责人) 宁波市政 共享数据 数据不 “为什么要一致呢……人的信息在各部门绝对 然导致数据集成。案例数据表明,政府数据集成与业 随应用系 府大数据 的各业务 一致很 不会一样,信息的变更是办业务时才会变更, 统变更 平台 部门 正常 只要没有业务发起,信息永远不会变,数据不 务需求直接相关,尤其是业务需求直接决定数据资源 一致很正常……要求数据一致性是伪命题,不 集成的内容和范围。 可能一致”。 (负责人) 4.2 依业务活动保障数据一致性 云计算为大数据提供了分布式存储和数据处理的 业务活动,即使是同一主体的数据同样会因业务活动 [23] 平台 。现有的大数据平台主要采用云计算服务模式, 的差异存在不一致; 第二, 由于三个政府大数据平台的 由于数据存储于不同节点,同时由于分布式数据处理 建设者和使用者之间不存在直接的领导隶属关系,即 造成数据不一致现象[24], 数据一致性保障正是用于解决 使数据不一致, 平台仅有告知的责任与义务, 并无强制 数据不一致问题。 执行的权力和保障;第三,对于业务部门而言,由于数 政府大数据平台中的数据一致性主要关注不同业 据的采集和使用有责任单位,业务部门不具有使用其 务部门关于同一主体的数据一致性问题。虽然保障政 他业务部门数据的权利。 府数据一致性是现有研究的共识,并通过政策、法律、 综合来看,大数据平台的数据一致性主要由业务 标准实现约束[25,26],但现有研究并未明确其制定依据。 活动决定,但数据一致性问题并未造成实际工作的困 与现有研究相反的是,访谈数据显示政府部门数据不 扰。反之, 由于业务活动的差异, 数据不一致现象客观 一致很正常。表 3 描述了基于业务活动保障政府大数 存在,政府大数据平台的数据治理出现由保障数据一 据平台的数据一致性。 致性到接受数据不一致的趋势。但数据一致性保障及 表3显示, 政府大数据平台保障数据一致性的依据 数据不一致现象均以业务活动为决定因素。 是业务活动。平台数据来源于同一业务活动,且数据 4.3 据业务场景开展数据处理 依业务活动的变更而更新。此外,为保障不同部门关 数据处理是政府大数据平台的核心功能,是实现 于同一主体的数据一致性,大数据平台提供的辅助措 数据利用、数据共享的关键环节。大数据处理是对数 施包括: 不同部门间数据的比对,通过数据普查进行核 积累和分析[27], 据的鉴别、 在此项研究中主要涉及数据 验, 以及在实际工作中进行验证。案例研究显示, 三个 处理的依据、 权限及结果。现有文献调研的结果显示, 部门在多年的工作中并未因数据一致性问题造成困 元数据是实现数据从无序到有序的重要依据[28], 主要在 扰, 即数据一致性并非政府大数据平台的关注焦点。 政府数据统计中发挥作用,但由于标准不一亟待构建 与之相反, 由于各部门业务活动的差异,数据不一 统一的元数据标准[29]; 在政府大数据平台开展科学、 合 致被视作正常。在宁波市大数据中心调研过程中,平 理分类是进行数据处理的共识[30], 中国政府公开信息整 台的负责人明确表示:数据不可能一致。关于数据不 合服务平台曾以内容和行政区进行分类,但其效果并 一致的原因与业务活动密切相关: 第一, 业务部门承担 不理想[31]; 在权限方面, 目前仅限于对政府大数据平台 24

5.情报资料工作 2018年第1期 专题研究 使用权限的探索[32]。综合现有研究成果, 其与访谈结果 理,在保证数据业务属性的基础上实现了面向业务场 最为明显的差异在于数据处理与业务场景的分离性, 景的政府跨部门数据利用。 具体如表4所示。 4.4 以业务应用确保数据存储 表4 基于业务场景的政府大数据平台数据处理 大数据存储是为满足应用需求获取数据的方式, 元数据 平台 规范 权限 数据处理结果 代表性观点引用 与数据存储和数据管理相关, 现有的大数据存储技术 “数据的定义是一样的,元数据定义就 包括: 分布式文件系统、 NoSQL 数据库、 NewSQL 数据库 参照国家 可以看到数据 基础数据、综 一套(核心属性、扩展属性),主要是结 [33] 宁波市海 元数据标 内容,系统采 合数据、主题 构化数据”。 (负责人) 和大数据查询平台 。具体到政府大数据平台的数据 曙区政府 准 ,定 义 用授权体系和 数据、应用数“把数据分成了基础数据、综合数据, 存储,在现有文献中,无论是政府开放数据平台,亦或 大数据平 核心属性 两级安全等级 据,提供基本 还有主题数据、应用数据”。 (负责人) 台 和扩展属 性 保障安全 统计分析功能“有一些简单的统计分析功能”。 (高层 对政府信息资源管理的顶层规划,均包含对数据存储 管理者) “数据规范是自己定义的……有的是 的讨论,但并未明确多源数据具体的存储方式及其相 宁波市智 可查看自建信 慧城市管 参照行业 息,可查看其 按照对象形成 按照行业标准”。 (高层管理者) 关依据。与现有研究提出的大数据均应存储于云平台 标准并自 “目前大数据分析还是就事论事…… 理大数据 主定义 它部门共享信 结构化数据 (应该是)不确定问题,让数据告诉我 相区别, 表 5 揭示出业务应用直接影响大数据平台的数 平台 息 哪里出了问题”。 (高层管理者) 据存储。 “整合的时候……肯定要找国家有没 国家标 有(元数据)标准,国家有的我们就用; 表5 基于业务应用的政府大数据平台数据存储 准-行业 有没有(元数据)行业标准,有的也用; 标准-地 如果都没有,地方有没有标准,地方有 平台 存储方 存储目的 存储时间 代表性观点引用 宁波市政 方 标 准 - 数据项可见,对 象 数 据 整 的,我们也用;如果都没有……想办 平台本身 间接面向 默认政府 “(数据留存)一般默认三个月”。 (技术 府大数据 自 主 定 数据内容不可 合,业务数据 法”。 (负责人) 宁波市海 无存储 应用 机构三个月 人员) 平台 义 ,由 业 见 整合 “部门拿过来的时候要有元数据说 曙区政府 “(数据存储)社会机构一个月,政府机 务部门提 明”。 (高层管理者) 大数据平 业务部门 直接面向 业务部门 构三个月”。 (负责人) 供元数据 “第一个层面是归集(从对象去整合), 台 存储 应用 决定 “共享平台上没有数据的存储,存储还 说明 第二个层面是整合(从业务去整合)”。 是放在各个部门的”。(技术人员) (负责人) 自身采集 直 接 面 向 视频数据 “(规定)视频数据存一个月……如果 数据存储 应用 存一个月 (存储空间)没满的话一年前也在,不会 访谈结果揭示,业务场景决定政府大数据平台数 主动删”。 (高层管理者) 宁波市智 “视频全部在区里面,只是通过连接 据处理的输入和输出。一方面, 区别于现有文献, 就政 慧城市管 ……可以连到他那面去……但数据不 理大数据 交换数据存 直 接 面 向 业务部门 存储在我这里” (高层管理者) “(数据交 府大数据平台的输入而言,实践中大数据平台在数据 平台 储在业务部 换中心)数据还在各个部门里,数据交 应用 决定 门 换中心不懂得业务,不懂得数据质量, 处理之初将数据的业务属性纳入考虑范围,以元数据 自己行业范围内自己治理”。 (高层管 作为数据处理依据,并赋予业务部门提供元数据说明 理者) 的自主权, 以保障业务与平台之间的连接。另一方面, 云平台的 面向数据 —— “云平台……备份有一套机制,和数据 宁波市政 技术存储 共享 没关系……(数据归集)和业务没有任 关于数据处理结果的输出,三个平台数据处理的结果 府大数据 业务部门 直接面向 业务部门 何关系,是拿来共享和供别的部门使用 平台 均提供面向应用的数据利用,支持按照业务场景组合 存储 应用 决定 的关系,是两个层次”。(负责人) 应用数据。 案例数据显示,政府大数据平台的数据依然存储 鉴于业务场景的差异,三个平台同样存在数据处 在各业务部门。由于业务部门直接面向业务应用,同 理的差异。对于与业务并无直接关联的政府大数据平 时大数据平台尤其是横向职能型大数据平台与业务的 台, 其元数据参照标准呈现多样化特点; 但对于专业性 分离性,直接决定业务数据的存储依然在各业务部 更强、 与业务直接关联的智慧城管平台, 则以具有专业 门。由此区分出两种数据存储类型:一类直接面向应 属性的行业标准为主要依据。同时,大数据平台数据 用,由承担具体业务的业务部门存储;另一类面向共 处理的权限与业务场景直接相关,由于市级政府大数 享,为大数据平台的技术存储与备份,平台仅提供共享 据平台与业务无直接关联,平台仅提供数据共享的渠 的渠道,即业务部门提供的数据仅用于共享,技术存储 道,因而业务场景的无关性决定其数据处理过程不具 与业务应用无关。后者在存储时间、存储技术等方面 有数据查看的权限。 具有一定的灵活性,但不同平台技术存储的差异仍有 上述结果表明,业务场景直接决定政府大数据平 待整体规划。 台数据处理的依据、 权限和结果, 其中元数据用于保障 以上分析表明,政府大数据平台的数据存储以业 平台数据输入与原始业务的相关性,业务场景决定数 务应用为决定因素, 由于平台与应用的分离性, 因而数 据处理的权限,平台的数据输出同样提供根据业务场 据存储依然由业务部门负责。大数据平台则主要提供 景组合数据的功能。总之,基于业务场景开展数据处 数据资源的技术存储及备份功能, 对于此类存储,未来 25

6.专题研究 情报资料工作 2018年第1期 仍有待于明确存储时间、 存储技术、 存储管理以实现大 建设的初衷是为了促进数据流通,核心在于调动各方 数据平台的数据治理。 积极性, 而非削弱业务部门的权利。 4.5 由业务部门决定数据共享 上述分析表明,与现有文献研究的主流观点相反, 现有对政府跨部门信息共享的研究表明,信息共 政府跨部门数据共享的影响因素众多,但由于存在业 享影响因素是其中的一项重要研究内容。目前对信息 务需求,各业务部门对数据共享表示支持, 而非各部门 共享影响因素框架体系的代表性研究包括:基于政府 不愿共享数据。同时宁波市三个跨系统跨部门的政府 跨部门信息共享的情境,形成政策、组织、社会和技术 大数据平台数据共享的经验揭示,将数据共享的决策 四类因素[34]; 对于地方政府跨部门信息共享的研究形成 权保留在业务部门,以减少业务部门数据共享的顾虑 资源、 动力、 认识和信任四大因素[35]; 此外还包括技术、 是有效的大数据平台数据共享路径。 [36] 组织管理、 法律政策框架 。这些研究潜在的假设是政 府各部门不愿共享信息,因而为促进政府跨部门信息 5 结语 共享,激励机制、标准规范、推进体系等内容成为学界 通过以上对三个跨系统跨部门的政府大数据平台 研究的重点。事实上,数据分析结果揭示本研究所调 数据治理路径的案例分析,本研究发现:第一,政府信 研的宁波市政府各部门对共享数据是比较积极主动 息化的发展并非必然导致数据集成, 数据集成起源于业 的, 并且平台上数据共享的权限是由业务部门决定, 如 务需求; 第二, 平台上数据的一致性主要依靠业务活动 表6所示。 保障,区别于保障数据的一致性, 更为关键的发现是由 表6 基于业务部门的政府大数据平台数据共享 于业务活动的差异性, 数据不一致被视为正常; 第三,大 平台 决策方 决策内容 代表性观点引用 数据平台通过规定数据处理的依据、 权限和结果实现对 “可以个性化定制,比如共享的周期是怎么样的, 宁波市海曙 基于业务场景数据处理的限定; 第四, 区别于面向数据 业务部门 共享方式、共 包括截止时间、状态,以哪种形式”。 (技术人员) 区政府大数 决策 享时间 “经过同意向第三方提供数据,签保密协议,所有 据平台 权也没有损害”。(高层管理者) 共享的大数据平台本身采取的技术备份, 面向业务应用 自有数据由 “(云平台之前)直接跟交警、公安签了保密、使用 的数据存储仍然保留在业务应用部门; 第五,现有关于 宁波市智慧 自 身 决 策 , 协议……没有模板”。(高层管理者) 共享方式、共 数据共享的研究以部门不愿共享为其假设, 但案例数据 城市管理大 交换数据由 “谁的数据谁管,政府投资的东西不能保密的, 享条件 数据平台 其他业务部 (数据再利用的)许可由原来的单位许可”。 (高层 门决策 管理者) 显示各部门对于数据共享持支持态度, 并且平台上数据 “归集进来,根据国家政务信息资源管理办法,三 共享的权限保留在业务部门。以上五方面表明政府大 类信息资源——无条件、有条件和不予共享…… 宁波市政府 业务部门 共 享 内 容 范 必须要告诉我是属于哪一类的”。 (负责人) 数据平台的数据治理路径以业务为驱动。 大数据平台 决策 围、共享条件 “我们是大数据管理部门,不是数据业务部门,能 政府大数据平台数据治理是为打破条块分割的管 不能共享是业务属性,我们定不了……”。 (负 责人) 理体系,实现跨系统跨部门数据共享而提供的探索性 如前所述,政府大数据平台起源于业务部门对其 解决路径。本研究得出政府大数据平台数据治理的关 他业务部门的数据需求,并以最终实现跨部门信息共 键是业务驱动,其实质是保持平台上数据与业务的关 享为目的, 因而数据共享是业务部门的共识。换言之, 联性, 尊重业务需求实现数据集成, 遵循业务活动规范 政府大数据平台的关注问题不是数据愿不愿共享,而 保障数据一致性, 遵守业务场景开展数据处理, 遵照业 是数据如何有效共享。所调研机构的解决方案是将平 务应用要求确保数据存储,遵从业务部门规章制度要 台上数据共享的决策权保留在业务部门,由业务部门 求决定数据共享。 决定数据共享的内容、 范围、 条件和方式等。具体措施 总体而言,现有关于政府大数据平台数据治理的 是由政府大数据平台与各业务部门签订保密协议试行 研究局限于概念性研究,缺少与业务的关联。本文的 数据流通规范、制定数据管理办法等。案例研究再次 研究贡献在于: 通过提供实证支持,将政府大数据平台 证明政府大数据平台的数据治理与业务的关联性。 的数据治理问题具化为数据集成、 数据一致性、 数据处 关于由业务部门而非大数据平台决定数据共享的 理、 数据存储和数据共享五方面, 发现业务驱动是跨系 原因, 首先是体制问题, 各平台的建设者之于平台的使 统跨部门政府大数据平台数据治理的有效路径。未来 用者并无直接的领导与隶属关系,并不具备决策的权 仍将持续关注业务驱动的政府大数据平台数据治理的 利;其次是能力问题,各业务部门直接与业务活动相 有效路径及其实现方式。 关,而平台的建设者只发挥协调、沟通作用,并无决策 参考文献 的人力和物力支持; 最后是平台定位, 政府大数据平台 [ 1 ] 国务院.国务院关于积极推进“互联网+”行动的指导意见[EB/ 26

7.情报资料工作 2018年第1期 专题研究 OL].(2015-07-01) [2017-05-04].http://www.gov.cn/zhengce/ [21] 郭金兰,龙 怡,盛 宇,等. 电子政务系统的数据集成研究[J]. content/2015-07/04/content_10002.htm. 情报理论与实践, 2007, 30(4):480-482. [ 2 ] 促进大数据发展行动纲要[EB/OL].(2015-09-05)[2017-05- [22] 范灵俊,洪学海,黄 晁,等. 政府大数据治理的挑战及对策[J]. 04].http://www.gov.cn/zhengce/content/2015-09/05/content 大数据,2016(3):27-38. _10137.htm. [23] Hashem I A T, Yaqoob I, Anuar N B, et al. The rise of“big da⁃ [ 3 ] 张述存. 打造大数据施政平台提升政府治理现代化水平[J]. ta”on cloud computing: review and open research issues[J]. 中国行政管理,2015(10):15-18. Information Systems, 2015, 47: 98-115. [ 4 ] 安小米. 现代国家治理的云端思维——信息治理能力与政府 [24] 陈 珉,喻丹丹,涂国庆. 分布式数据库系统中数据一致性维 转型的多重挑战[J].人民论坛·学术前沿,2015(2):36-48. 护方法研究[J].国防科技大学学报, 2002, 24(3):76-80. [ 5 ] Gantz J, Reinsel D. Extracting value from chaos[J]. IDC IVIEW, [25] 赵润娣. 国外开放政府数据政策:一个先导性研究[J]. 情报理 2011, 1142(2011): 1-12. 论与实践, 2016, 39(1):44-48. [ 6 ] 中国信息化百人会. 应对不同风险的大数据治理新思维[J]. [26] 岳丽欣,刘文云.我国政府数据开放平台建设现状及平台框架 信息化建设,2017(1):49-51. 构建研究[J].图书馆, 2017(2):81-85. [ 7 ] SoaresS.BigDataGovernance[EB/OL].(2013-10-17)[2017-12- [27] Tsuchiya S, Sakamoto Y, Tsuchimoto Y, et al. Big data process⁃ 10].http://www.dama-ny.com/images/meeting/101713/Presen ing in cloud environments[J]. Fujitsu Sci. Tech. J, 2012, 48(2): tation_deck/damanyc_bigdatagovernance17_october_2013. 159-168. pdf. 017-12-10of a National Survey. [28] 杨家亮.“大数据时代”的政府统计[J]. 中国统计,2013(11): [ 8 ] Soares S.IBM Infosphere: A Platform for Big Data Governance 58-59. and Process Data Governance[M].MC Press Online, 2013. [29] 丛雅静,蔡 宁. 大数据背景下的政府统计信息化建设[J]. 中 [ 9 ] Morabito V. Big Data Governance[M].Big Data and Analytics. 国统计,2014(6):19-21. Springer International Publishing, 2015: 83-104. [30] 沈亚平,许博雅. “大数据” 时代政府数据开放制度建设路径研 [10] 梁芷铭. 大数据治理:国家治理能力现代化的应有之义[J]. 吉 究[J].四川大学学报(哲学社会科学版),2014(5):111-118. 首大学学报(社会科学版), 2015, 36(2):34-41. [31] 黄新华. 整合与创新:大数据时代的政府治理变革[J]. 中共福 [11] 曾 凯. 大数据治理框架体系研究[J]. 信息系统工程, 2016 (11):130-131. 建省委党校学报,2015(6):4-10. [12] 罗伯特·K. 殷. 案例研究:设计与方法[M]. 周海涛,李永贤,李 [32] 徐晓日,李思聪. 大数据背景下政府信息资源共享问题研究 虔,译.重庆: 重庆大学出版社,2010. [J].长白学刊, 2015(6):57-61. [13] Eisenhardt K M,李平,曹仰锋. 案例研究方法:理论与范例—— [33] Strohbach M, Daubert J, Ravkin H, et al. Big Data Storage[M]. 北京大学出版社, 2012. 凯瑟琳·艾森哈特论文集[M].北京: New Horizons for a Data- Driven Economy. Springer Interna⁃ [14] 宁波市人民政府关于推进大数据发展的实施意见[EB/OL]. tional Publishing, 2016: 119-141. (2016- 10- 18) [2017- 05- 04]. http://gtog.ningbo.gov.cn/art/ [34] Pardo T A, Gil-Garcia J R, Burke G B, et al. Factors Influenc⁃ 2016/10/18/art_1150_548195.html. ing Government Cross-Boundary Information Sharing: Prelimi⁃ [15] The White House Office of Management and Budget (OMB). nary Analysis of a National Survey[R/OL].(2009- 09) [2017- Circular No. A- 130, Managing Information as a Strategic Re⁃ 12-10].https://www.ctg.albany.edu/publications/reports/factors source[EB/OL]. [2017-05-04].https://a130.cio.gov/. _inf_gov_cbi/factors_inf_gov_cbi.pdf. [16] The Data Governance Institude. The DGI Data Governance [35] 胡 平, 甘 露, 罗凌霄. 地方政府部门间信息共享的影响因 Framework[EB/OL].[2017-12-10].http://www.datagovernance. 素内部结构研究[J].情报科学, 2008, 26(6):826-833. com/the-dgi-framework/. [36] 龚立群, 高 琳. 跨部门政府信息资源共享影响因素的实证 [17] 耿玉水,寇纪淞. 云计算下异构数据集成模型的构建[J]. 济南 研究[J].情报资料工作, 2012, 33(4):61-65. 大学学报(自然科学版),2012(4):384-389. [18] 陈 宏,曹 健,梁 旻. 分布异构环境下的数据集成方法及 [作者简介]马广惠, 女,1989 年生, 中国人民大学信息资源管理学院博 应用[J].计算机工程,2005(5):115-116, 180. 士研究生。 [19] 陈跃国,王京春.数据集成综述[J].计算机科学,2004(5):48-51. 安小米, 女,1965 年生, 中国人民大学信息资源管理学院、 中国人 [20] Lenzerini M. Data integration: a theoretical perspective[C].Pro⁃ 民大学数据工程与知识工程教育部重点实验室和中国人民大学智慧 ceedings of the Twenty- first ACM SIGMOD- SIGACT- SI⁃ 城市研究中心教授, 博士生导师。 GART Symposium on Principles of Database Systems. ACM, 宋 懿, 女,1991年生, 中国人民大学信息资源管理学院博士研究生。 2002: 233-246. 2017-07-19 收稿日期: 27