最新刊期

    2024年第10卷第3期

      专题:政务数据处理

    • 专题:政务数据处理

      安小米
      2024, 10(3): 1-2. DOI: 10.11959/j.issn.2096-0271.2024004-1
        
      60
      |
      68
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548002 false
      更新时间:2024-05-15
    • 政务数据标识技术研究进展及下一代政务数据标识体系

      王昀, 郭毅峰, 苏晓亮, 周武爱, 张皖哲, 许大虎, 周强, 冯建华
      2024, 10(3): 3-15. DOI: 10.11959/j.issn.2096-0271.2024004
      摘要:政务数据标识是建设全国一体化政务大数据体系的一项基础性工作。对数据标识技术的研究进展进行了总结,比较了不同数据标识技术编码规则的异同,并进一步总结了政务数据标识及应用进展。结合政务数据所具有的权责明确、安全性要求高、兼容性需求强等特点,提出了下一代政务数据标识体系Gcode。Gcode由外部码、内部码和安全码3个部分组成。其中,外部码兼容了统一社会信息用代码,内部码建立了“机构部门-系统-数据”的关联关系,安全码通过引入区块链技术实现防伪验真。Gcode具有权责明确、兼容性强、安全性高等特点,能够支持政务数据跨层级、跨地域、跨系统、跨部门、跨业务共享,可有力推动实现政务数据“一数一源”。  
      关键词:政务数据;数据标识;数据治理   
      436
      |
      255
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548005 false
      更新时间:2024-05-15
    • 我国政务数据分类分级实施关键问题与实践研究

      王跃, 苏娜
      2024, 10(3): 16-26. DOI: 10.11959/j.issn.2096-0271.2024035
      摘要:数据分类分级是保障数据安全流通、推动数据价值释放的基础前提。聚焦政务数据分类分级这一政府数字化改革中的关键任务,采用基于理论的案例研究方法,基于各省级地方及部委公开发布的方案,对我国政务数据分类分级实施情况进行系统梳理与量化分析。总结了我国政务数据分类分级实施的四大关键过程与五大特点;从政务数据分类分级的特殊复杂性出发,提出我国政务数据分类分级实施存在整体目标定位不清、分类分级对象各异、分类分级关系割裂、安全分级标准不一4个问题,并提供应对方案;基于国家某部委政务数据分类分级实践,验证应对方案的科学性、有效性,为构建全国统一的政务数据分类分级体系提供参考。  
      关键词:数字政府;政务数据;分类分级实施   
      389
      |
      298
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548008 false
      更新时间:2024-05-15
    • 省级政务大数据平台建设模式研究与启示

      孟凡, 杨群力, 高阳, 李文斌
      2024, 10(3): 27-39. DOI: 10.11959/j.issn.2096-0271.2024022
      摘要:建设高质量政务大数据资源平台是实现跨部门、跨区域、跨层级政务信息集成融合,加快建设数字政府、提升公共服务和社会治理等数字智能化水平的重要基础工程。首先,回顾我国电子政务发展历程,并总结出传统省级政务大数据平台的3种建设模式以及存在的问题,即数据鲜活性低、数据一致性差、业务协同管理难、基础支撑力弱和总体投入高。其次,对江苏信用一体化信息资源管控平台进行案例分析,阐述以江苏案例为例的原因,针对传统建设模式存在的问题,提出对应的解决思路和总体架构设计,并梳理出江苏案例的4个借鉴价值。最后,在总结江苏研究和实践经验的基础上,归纳出5点建议,为各省研究、制定省级政务大数据平台的建设指南等政策性文件提供参考。  
      关键词:政务大数据;信息资源管控;系统建设模式;社会信用体系   
      346
      |
      292
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548010 false
      更新时间:2024-05-15
    • 基于联邦学习的政务大数据平台应用研究

      吴坚平, 陈超超, 金加和, 吴春明
      2024, 10(3): 40-54. DOI: 10.11959/j.issn.2096-0271.2024032
      摘要:当前数字政府建设已进入深水区,政务大数据平台作为数据底座支撑各类政务信息化应用,其隐私数据的安全性和合规性一直被业界广泛关注。联邦学习是一类解决数据孤岛的重要方法,基于联邦学习的政务一体化大数据平台应用具有较高的研究价值。首先,介绍政务大数据平台及联邦学习应用现状;然后,分析政务大数据平台面临的隐私数据的采集、分类分级、共享三大管理挑战;接着,阐述基于联邦学习的推荐算法和隐私集合求交技术的解决方法;最后,对政务大数据平台隐私数据的未来应用进行了总结和展望。  
      关键词:政务大数据;联邦学习;推荐算法;隐私集合求交   
      355
      |
      322
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548012 false
      更新时间:2024-05-15
    • “数据赋能”驱动智能化政府建设的逻辑与路径

      王蕤, 刘震
      2024, 10(3): 55-64. DOI: 10.11959/j.issn.2096-0271.2024036
      摘要:在社会全面数字化的时代,政府的智能化趋势不可阻挡。在技术与数据的协同作用下,我国数字政府建设呈现电子化、网络化和智能化的发展趋势。数据是数字政府建设的核心资源,建设智能化数字政府必然要求充分发挥数据的价值。数据赋能推动数字政府建设的逻辑如下:数据赋能政府的开放性运行;数据赋能政府的整体性运行;数据赋能政府的协同性运行;数据赋能政府的科学性运行。通过数据赋能推动数字政府建设的具体路径要求:以数字政府的整体性运行为基础保障数据的开放共享;以数字政府的协同性运行为基础保障数据的统一与管理;以数字政府的开放性为基础保障数据的统筹协调与再分配;以数字政府的科学性为基础保障数据来源的多元性。  
      关键词:数据赋能;智能化政府;智能化政府运行逻辑;智能化政府建设   
      292
      |
      272
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548088 false
      更新时间:2024-05-15

      研究

    • 面向非平行语料的语音转换技术综述

      李鹏程, 张旭龙, 王健宗, 程宁, 肖京
      2024, 10(3): 65-81. DOI: 10.11959/j.issn.2096-0271.2024011
      摘要:语音转换是语音及人工智能领域的一项研究课题,其目标是在保持源语音内容不变的情况下改变语音的音色,使其听上去像是由另一个目标说话人说出的,同时还需保证语音的质量和自然度。面向非平行语料的语音转换技术是当下的热门研究内容,其使用非平行的多说话人语音数据集进行模型训练,能完成多对多以及任意对任意的语音转换。对近年来面向非平行语料的语音转换进行了全面的总结和分析。首先概述了早期面向平行语料的语音转换及其缺陷,然后对当下面向非平行语料的语音转换的各类实现方法进行介绍和对比分析,最后对语音转换技术进行了总结和展望。  
      关键词:语音转换;人工智能;深度学习   
      154
      |
      199
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548205 false
      更新时间:2024-05-15
    • 知识与句法融合的因果关系抽取网络

      汪诗蕊, 解博涵, 丁玲, 陈建廷, 向阳
      2024, 10(3): 82-92. DOI: 10.11959/j.issn.2096-0271.2024008
      摘要:因果关系抽取作为关系抽取的一个重要任务,近年来得到了广泛关注。现有的因果关系抽取方法大多将句法结构和背景知识割裂开进行研究,早期的因果关系抽取方法偏重于从句法结构层面进行分析,随着深度学习技术的发展,预训练模型结合背景知识的方法成为主流。然而上述两种方法均未完全融合句内信息和外部知识,带来了不同程度的信息缺失。为了解决这一问题,提出了结合句法结构和背景知识的因果关系抽取模型。该模型将句子解析为同时包含句法和知识的知识句法图结构,使用图卷积网络进行信息融合。模型同时考虑了句法和知识两部分信息,从而进一步丰富了实体嵌入,达到了良好的因果关系抽取效果。本模型在EventStoryLine数据集上取得了良好效果,F1值达到0.445,与现有方法相比提高了2.3%。  
      关键词:因果关系抽取;预训练模型;图卷积网络;自然语言处理   
      127
      |
      221
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548239 false
      更新时间:2024-05-15
    • Bootstrap样本大数据模型和分布式集成学习方法

      罗凯靖, 张育铭, 何玉林, 黄哲学
      2024, 10(3): 93-108. DOI: 10.11959/j.issn.2096-0271.2024002
      摘要:传统Bootstrap抽样和Bagging集成学习通常以串行方式实现,计算效率低,且存在样本不可重用、扩展性差等问题,不适合高效的大规模Bagging集成学习。从大数据分布式计算的思维入手,提出新的Bootstrap样本划分(BSP)大数据模型和分布式集成学习方法。BSP数据模型通过分布式生成算法将训练数据表达成分布式Bootstrap样本集的集合,存储成HDFS分布式数据文件,为后续的分布式集成学习提供数据支持。分布式集成学习方法从BSP数据模型中随机选取多个BSP数据块,读入集群各个节点的虚拟机,用串行算法对选取的数据块并行计算统计量或训练建模,再将所有的计算子结果回传至主节点中,生成最终的集成学习结果,此过程中可加入对子结果的质量选择以进一步提高预测效果。BSP数据模型的生成和分布式集成学习采用非Map-Reduce计算范式进行,每个数据块的计算独立完成,减少了计算节点间的数据通信开销。提出的算法在Spark开源系统中以新的算子方式实现,供Spark应用程序调用。实验表明,新方法可以高效地生成训练数据的BSP数据模型,提高数据样本的可重用性,在基于有监督机器学习算法构建的大规模Bagging集成学习实验中,计算效率能提高50%以上,同时预测精度进一步提高约2%。  
      关键词:Bootstrap抽样;Bagging集成学习;分布式集成学习;Spark   
      244
      |
      210
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548254 false
      更新时间:2024-05-15
    • 基于动态动作覆盖的深度强化学习新闻推荐

      董相宏, 安俊秀
      2024, 10(3): 109-118. DOI: 10.11959/j.issn.2096-0271.2023069
      摘要:新闻推荐系统对新媒体新闻传播有着重要作用。提出了一种以深度强化学习为基础的推荐系统,旨在结合神经网络的表征能力和强化学习的策略选择能力来提升新闻推荐效果。使用动态动作掩码加强对用户短期兴趣的判断能力,使用优化缓存机制提升经验缓存的使用效率,通过区域遮蔽性质的奖励设计加快模型训练,从而提高推荐系统在新闻推荐领域的表现。实验表明,所提模型在新闻数据集上的推荐准确率与主流的神经网络推荐方法相当,且在排序性能上优于当前先进的推荐算法。  
      关键词:新闻推荐;强化学习;动态掩码;优势缓存;内在奖励   
      224
      |
      428
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548256 false
      更新时间:2024-05-15
    • 面向自然语言理解的多教师BERT模型蒸馏研究

      石佳来, 郭卫斌
      2024, 10(3): 119-132. DOI: 10.11959/j.issn.2096-0271.2023039
      摘要:知识蒸馏是一种常用于解决BERT等深度预训练模型规模大、推断慢等问题的模型压缩方案。采用“多教师蒸馏”的方法,可以进一步提高学生模型的表现,而传统的对教师模型中间层采用的“一对一”强制指定的策略会导致大部分的中间特征被舍弃。提出了一种“单层对多层”的映射方式,解决了知识蒸馏时中间层无法对齐的问题,帮助学生模型掌握教师模型中间层中的语法、指代等知识。在GLUE中的若干数据集的实验表明,学生模型在保留了教师模型平均推断准确率的93.9%的同时,只占用了教师模型平均参数规模的41.5%。  
      关键词:深度预训练模型;BERT;多教师蒸馏;自然语言理解   
      127
      |
      171
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548257 false
      更新时间:2024-05-15
    • 基于三阶张量的大规模数据谱聚类集成算法

      仵匀政, 杜韬, 周劲, 陈迪, 王心耕
      2024, 10(3): 133-148. DOI: 10.11959/j.issn.2096-0271.2024007
      摘要:为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图分割的方法得到初步聚类结果;最后,提出三阶张量集成方法,将多个聚类结果进行融合,得到最终的聚类结果。在大规模的真实数据集和合成数据集上验证,相较经典的谱聚类算法、聚类集成算法以及近年来对其改进的算法,该算法表现出更优异的性能。  
      关键词:数据聚类;大规模数据;谱聚类;三阶张量;聚类集成   
      117
      |
      184
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548466 false
      更新时间:2024-05-15

      论坛

    • 国防网络安全与数据治理研究

      齐鹏云
      2024, 10(3): 149-162. DOI: 10.11959/j.issn.2096-0271.2023038
      摘要:健全和完善我国国防网络安全和数据治理架构,既是国家网络安全与数据治理的重要一环,也是在《数据安全法》框架下细分领域内的重要实践。运用比较分析和文献分析法,提炼美国2013—2022年《国防授权法》中国防网络安全与数据治理的逻辑特征,吸收美国国防网络安全与数据治理的成功经验,完善我国国防网络安全与数据治理的总体架构。总体国家安全观下的国防网络安全与数据治理需要兼顾传统安全与非传统安全建设的核心要素,完善国防网络与数据安全的专项立法、构建政民预警交互意识和政企合作交互布局的“双重交互”体系,完善我国国防网络安全与数据治理格局。  
      关键词:国防授权法;国防网络安全;国防数据战略;重要数据治理   
      247
      |
      208
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548465 false
      更新时间:2024-05-15

      专家视点

    • 依照数据用途界定公共数据

      朱扬勇
      2024, 10(3): 163-167. DOI: 10.11959/j.issn.2096-0271.2024037
        
      145
      |
      221
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548464 false
      更新时间:2024-05-15

      专栏:地方政府大数据

    • 山东省数据创新应用建设探索与实践

      林庆, 刘心田
      2024, 10(3): 168-174. DOI: 10.11959/j.issn.2096-0271.2023023
        
      211
      |
      204
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59548473 false
      更新时间:2024-05-15
    0