1. 京东城市(北京)数字科技有限公司,北京 100176
2. 京东智能城市研究院,北京 100176
3. 西南交通大学计算机与人工智能学院,四川 成都 611756
[ "郑宇(1979- ),男,博士,京东集团副总裁、京东智能城市研究院院长、京东科技首席数据科学家,IEEE Fellow,美国计算机学会杰出科学家,上海交通大学讲座教授,南京大学、香港科技大学等多所高校客座教授。先后担任人工智能顶尖国际期刊ACM TIST的主编、国家重点研发计划项目首席科学家及总负责人,以及ICDE及CIKM等多个国际会议的程序委员会主席。" ]
[ "易修文(1991- ),男,博士,京东城市数据科学家,入选2021年度北京市科技新星计划,主要研究方向为城市大数据智能。" ]
[ "齐德康(1993- ),男,西南交通大学计算机与人工智能学院博士生,主要研究方向为城市计算。" ]
[ "潘哲逸(1992- ),男,博士,京东智能城市研究院研究员,在国际顶级期刊或会议上发表论文10余篇,主要研究方向为城市计算、时空数据挖掘、深度学习。" ]
网络首发:2024-07,
纸质出版:2024-07-15
移动端阅览
郑宇, 易修文, 齐德康, 等. 基于城市知识体系的公共数据要素构建方法[J]. 大数据, 2024,10(4):130-148. DOI: 10.11959/j.issn.2096-0271.2024042.
ZHENG Yu, YI Xiuwen, QI Dekang, et al. Elementarisation method for public data based on urban knowledge systems. [J]. Big data research, 2024,10(4):130-148. DOI: 10.11959/j.issn.2096-0271.2024042.
郑宇, 易修文, 齐德康, 等. 基于城市知识体系的公共数据要素构建方法[J]. 大数据, 2024,10(4):130-148. DOI: 10.11959/j.issn.2096-0271.2024042. DOI:
ZHENG Yu, YI Xiuwen, QI Dekang, et al. Elementarisation method for public data based on urban knowledge systems. [J]. Big data research, 2024,10(4):130-148. DOI: 10.11959/j.issn.2096-0271.2024042. DOI:
数据要素是数字经济发展的核心动能。城市公共数据的基础良好、普适性强、应用场景丰富,成为政府主导的数据要素的首选。当前数据与应用耦合,不同应用之间共享数据难,人工数据治理过程滞后、繁重低效,仅依靠自动抽取技术无法保证数据要素的精度。为此,基于人机智能协同的总体思路,提出基于城市知识体系的数据要素构建方法。首先,对大量城市业务进行解构和抽象,构建以人、地、事、物、组织5类实体,实体间关系及实体属性为核心的城市知识体系,并以这些实体、关系和属性为数据要素的原子描述,向上组合表达各种城市业务,向下形成可标准化的数据资源体系。其次,研发一套数字化控件,承载基于城市知识体系的数据要素化理论,通过灵活配置的方式开发服务于市民的各类应用,使数据在产生时就与城市知识体系关联,自动形成数据要素。最后,构建智能学习和推荐算法,更好地连接数字化控件和城市知识体系,使应用配置人员无须学习城市知识体系就能顺畅地使用数字化控件,降低了工具的使用门槛。该方法可大大提高公共数据要素产生的效率和扩大公共数据要素的规模,释放公共数据要素的价值。
Data elements are the key momentum for boosting digital economy.The data generated by public services provided by governments (a.k.a.public data) is ready to be transferred into data elements
because it has been well organized in the past decade.Unfortunately
public data is strictly coupled with the systems generating them
making it difficult for different applications to share data.The process of munul data governance is lagging
heavy and inefficient
and relying on automatic extraction method can’t ensure the accuracy of data elements.To tackle these challenges
leveraging the synergy between human and machine intelligence
we propose an elementarisation method for public data based on urban knowledge system.Our method is comprised of an urban knowledge system
a set of digital controls and some machine learning algorithms.The urban knowledge system consists of entities
relationships between entities
and the properties associated with these entities and relationships
which can be used to construct different kinds of public services and form standard data representation that can be shared among different applications.Powered by the urban knowledge system
the digital controls enable governments to create different applications as public services flexibly
through a configurable way without writing any codes.Later
the information input by citizens through digital controls in these applications is transferred into data elements automatically.Finally
the machine learning algorithms assist users to use digital controls smoothly through intelligent recommendations.Our method can produce data elements automatically
efficiently and accurately
unlocking the value of data for digital economy.
朱扬勇 . 依照数据用途界定公共数据 [J ] . 大数据 , 2024 , 10 ( 3 ): 163 - 167 .
ZHU Y Y . On public data [J ] . Big Data Research , 2024 , 10 ( 3 ): 163 - 167 .
郑宇 . 城市知识体系 [J ] . 武汉大学学报(信息科学版) , 2023 , 48 ( 1 ): 1 - 16 .
ZHENG Y . The knowledge system for intelligent cities [J ] . Geomatics and Information Science of Wuhan University , 2023 , 48 ( 1 ): 1 - 16 .
中国信息通信研究院 . 数据要素白皮书 [R ] . 2022 .
China Academy of Information and Communications Technology . White paper on data elements [R ] . 2022 .
梅宏 , 杜小勇 , 金海 , 等 . 大数据技术前瞻 [J ] . 大数据 , 2023 , 9 ( 1 ): 1 - 20 .
MEI H , DU X Y , JIN H , et al . Big data technologies forward-looking [J ] . Big Data Research , 2023 , 9 ( 1 ): 1 - 20 .
郑宇 . 城市治理一网统管 [J ] . 武汉大学学报(信息科学版) , 2022 , 47 ( 1 ): 19 - 25 .
ZHENG Y . Unified urban governance models [J ] . Geomatics and Information Science of Wuhan University , 2022 , 47 ( 1 ): 19 - 25 .
郑宇 . 城市治理一网统管 [M ] . 北京 : 机械工业出版社 , 2022 .
ZHENG Y . Unified management of urban governance network [M ] . Beijing : China Machine Press , 2022 .
郑宇 . 政民互通:构建政府和居民之间的双向信息通道 [J ] . 大数据 , 2024 , 10 ( 1 ): 127 - 140 .
ZHENG Y . Building bidirectional digital channels between governments and citizens [J ] . Big Data Research , 2024 , 10 ( 1 ): 127 - 140 .
郑宇 . 城市计算概述 [J ] . 武汉大学学报(信息科学版) , 2015 , 40 ( 1 ): 1 - 13 .
ZHENG Y . Introduction to urban computing [J ] . Geomatics and Information Science of Wuhan University , 2015 , 40 ( 1 ): 1 - 13 .
杜小勇 . 大数据管理 [M ] . 北京 : 高等教育出版社 , 2019 .
DU X Y . Big data management [M ] . Beijing : Higher Education Press , 2019 .
杜小勇 , 陈跃国 , 范举 , 等 . 数据整理:大数据治理的关键技术 [J ] . 大数据 , 2019 , 5 ( 3 ): 13 - 22 .
DU X Y , CHEN Y G , FAN J , et al . Data wrangling:a key technique of data governance [J ] . Big Data Research , 2019 , 5 ( 3 ): 13 - 22 .
梅宏 . 数据治理之法 [M ] . 北京 : 中国人民大学出版社 , 2022 .
MEI H . Methods of data governance [M ] . Beijing : China Renmin University Press , 2022 .
王建冬 , 于施洋 , 窦悦 . 东数西算:我国数据跨域流通的总体框架和实施路径研究 [J ] . 电子政务 , 2020 ( 3 ): 13 - 21 .
WANG J D , YU S Y , DOU Y . East digital computing and west computing:research on the overall framework and implementation path of cross-domain data circulation in China [J ] . E-Government , 2020 ( 3 ): 13 - 21 .
LIU Y , LIU Y , LIU Z , et al . Federated forest [J ] . IEEE Transactions on Big Data , 2020 , 8 ( 3 ): 843 - 854 .
郑宇 . 智能城市操作系统 [J ] . 中国计算机学会通迅 , 2020 : 39 - 44 .
ZHENG Y . Smart city operating system [J ] . Communications of the CCF . 2020 : 39 - 44 .
ZHENG Y . Urban computing [M ] . Cambridge : MIT Press , 2019 .
魏诚 . 电子政务数据共享交换系统的设计与实现 [D ] . 南京:东南大学 , 2015 .
WEI C . The design and application of e-government data sharing and exchange system [D ] . Nanjing:Southeast University , 2015 .
ABRAHAM R , SCHNEIDER J , VOM BROCKE J . Data governance:a conceptual framework,structured review,and research agenda [J ] . International Journal of Information Management , 2019 , 49 : 424 - 438 .
梅宏 . 数据治理之论 [M ] . 北京 : 中国人民大学出版社 , 2022 .
MEI H . Theory of data governance [M ] . Beijing : Chinese University Press , 2022 .
杨孟辉 , 杜小勇 . 政府大数据治理:政府管理的新形态 [J ] . 大数据 , 2020 , 6 ( 2 ): 3 - 18 .
YANG M H , DU X Y . Big data governance in governments:a new form of the government administration [J ] . Big Data Research , 2020 , 6 ( 2 ): 3 - 18 .
陆志鹏 , 国丽 , 乔亲旺 , 等 . 数据元件的结构要求:T/CIITA 406-2022 [S ] . 2022
LU Z P , GUO L , QIAO Q W , et al . Requirement for structure of data components:T/CIITA 406-2022 [S ] . 2022
陆志鹏 , 国丽 , 乔亲旺 , 等 . 数据元件安全审核要求:T/CIITA 506-2022 [J ] . 2022
LU Z P , GUO L , QIAO Q W , et al . Audit requirement of data component for security:T/CIITA 506-2022 [J ] . 2022
梅宏 , 王亚沙 , 赵俊峰 , 等 . 智慧城市 领域知识模型 核心概念模型:GB/T 363322018 [J ] . 2018
MEI H , WANG Y S , ZHAO J F , et al . Smart city-domain knowledge model-core conceptual model:GB/T 36332-2018 [J ] . 2018
史勇明 , 张海梅 , 张红卫 , 等 . 智慧城市 数据融合 第5部分:市政基础设施数据元素:GB/T 36325-2019 [J ] . 2020
SHI Y M , ZHANG H M , ZHANG H W , et al . Smart city-data fusion-part 5:Data elements of basic municipal facilities:GB/T 36325-2019 [J ] . 2020
万碧玉 , 吴丽丽 , 马蓉 , 等 . 智慧城市 数据融合 第3部分:数据采集规范GB/T 36625.3-2021 [J ] . 2021
WAN B Y , WU L L , MA R , et al . Smart city-data fusion-part 3:Data acquisition specifications:GB/T 36625.3-2021 [J ] . 2021
范举 , 陈跃国 , 杜小勇 . 人在回路的数据准备技术研究进展 [J ] . 大数据 , 2019 , 5 ( 6 ): 1 - 16 .
FAN J , CHEN Y G , DU X Y . Progress on human-in-the-loop data preparation [J ] . Big Data Research , 2019 , 5 ( 6 ): 1 - 16 .
HULSEBOS M , HU K , BAKKER M , et al . Sherlock:a deep learning approach to semantic data type detection [C ] // Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining . New York:ACM , 2019 .
ZHANG D , SUHARA Y , LI J F , et al . Sato:contextual semantic type detection in tables [EB ] . arXiv preprint,2019,arXiv:1911.06311 .
PAPOTTI P . Technical perspective of TURL [J ] . ACM SIGMOD Record , 2022 , 51 ( 1 ): 32 .
高珊 , 袁宛竹 , 卢卫 , 等 . 面向列语义识别的共现属性交互模型构建与优化 [J ] . 软件学报 , 2023 , 34 ( 3 ): 1010 - 1026 .
GAO S , YUAN W Z , LU W , et al . Construction and optimization of Co-occurrence-attribute-interaction model for column semantic recognition [J ] . Journal of Software , 2023 , 34 ( 3 ): 1010 - 1026 .
NASAR Z , JAFFRY S W , MALIK M K . Named entity recognition and relation extraction:state-of-the-art [J ] . ACM Computing Surveys , 2021 , 54 ( 1 ): 20 .
臧根林 , 王亚强 , 吴庆蓉 , 等 . 智慧城市知识图谱模型与本体构建方法 [J ] . 大数据 , 2020 , 6 ( 2 ): 96 - 106 .
ZANG G L , WANG Y Q , WU Q R , et al . Model and construction method of the ontology of knowledge graph of smart city [J ] . Big Data Research , 2020 , 6 ( 2 ): 96 - 106 .
马亚中 , 张聪聪 , 徐大鹏 , 等 . 城市大脑知识图谱构建及应用研究 [J ] . 中文信息学报 , 2022 , 36 ( 4 ): 48 - 56 .
MA Y Z , ZHANG C C , XU D P , et al . Construction and application of city brain knowledge graph [J ] . Journal of Chinese Information Processing , 2022 , 36 ( 4 ): 48 - 56 .
杜小勇 , 李彤 , 卢卫 , 等 . 跨域数据管理 [J ] . 计算机科学 , 2024 , 51 ( 1 ): 4 - 12 .
DU X Y , LI T , LU W , et al . Cross-domain data management [J ] . Computer Science , 2024 , 51 ( 1 ): 4 - 12 .
黄丽华 , 杜万里 , 吴蔽余 . 基于数据要素流通价值链的数据产权结构性分置 [J ] . 大数据 , 2023 , 9 ( 2 ): 5 - 15 .
HUANG L H , DU W L , WU B Y . Structural separation of data property rights based on data factor circulation value chain [J ] . Big Data Research , 2023 , 9 ( 2 ): 5 - 15 .
0
浏览量
101
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621