最新刊期

    2025年第11卷第5期

      专题

    • 《大数据》十周年寄语 AI导读

      在人工智能领域,专家建立了深度学习体系,为智能技术发展提供新方向。
      2025, 11(5): 1.
        
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 124907482 false
      更新时间:2025-09-15
    • 教育大模型 AI导读

      在人工智能领域,专家建立了深度学习体系,为解决复杂问题提供解决方案。
      2025, 11(5): 2-3.
        
      0
      |
      0
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 124907480 false
      更新时间:2025-09-15
    • 基于重排序和后检索反思的教育大模型问答增强方法 AI导读

      在计算机教育领域,专家提出了基于重排序和后检索反思的大模型问答增强方法,有效提升了计算机问答的准确性。
      孙浩然, 王志豪, 吴一帆, 高晓影, 向阳
      2025, 11(5): 4-17. DOI: 10.11959/j.issn.2096-0271.2025062
      摘要:计算机教育是现代信息社会教育的重要组成部分,随着大语言模型的发展,将大语言模型应用于计算机教育过程受到越来越多的关注,但大语言模型存在的“幻觉”问题为其应用带来了挑战。为了应对这一挑战,检索增强生成技术通过引入外部知识库,有效提升了大语言模型的回答质量。然而,传统检索增强生成技术缺乏对检索信息的精细筛选机制,导致大量低相关知识被保留,无关信息的干扰使模型幻觉问题并未得到有效解决。收集计算机相关教材和知识文档,根据内容结构将其划分为知识文档块,以构建外置知识数据库;在此基础上,提出基于重排序和后检索反思的教育大模型问答增强方法。该方法利用基于交叉编码器的高性能多语言重排序模型捕捉深层语义信息,过滤信息检索,筛去无关信息以提高检索质量,并将检索增强生成技术应用于模型反思,令模型通过自我检查进一步增强模型回答质量,有效提升了大语言模型在计算机问答时的准确性。对所提方法在多个主流生成模型上进行测试,其在CS-Bench上取得了良好的效果,并在计算机知识问答时使模型回答正确率提升约5%。  
      关键词:大语言模型;检索增强生成;计算机教育   
      18
      |
      16
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 109538360 false
      更新时间:2025-09-15
    • 杉杉:面向高吞吐低延迟服务的计算机公共课问答系统 AI导读

      在智能问答领域,高校学生个性化计算机学习支持系统“杉杉”展现出优越性能,为计算机公共课问答提供解决方案。
      杨贇, 刘天扬, 王硕, 苏斌, 蒲鹏, 陆雪松
      2025, 11(5): 18-33. DOI: 10.11959/j.issn.2096-0271.2025058
      摘要:基于大语言模型的自然语言处理能力在智能问答场景展现出了广泛的应用潜力。为了给高校学生提供个性化的计算机学习支持,构建了一种基于代码大语言模型的计算机公共课问答系统“杉杉”。该系统采用前后端分离的结构设计,通过消息队列向大语言模型发送用户指令并监听模型返回结果;利用大语言模型的语言理解和生成能力,自动解答学生提出的计算机相关问题,并采用连续批处理和检索增强生成技术进行优化。性能评估实验表明,该系统在并发性能、响应时间和多轮对话方面均取得了优于对比方法的表现。  
      关键词:大语言模型;智能问答系统;计算机公共课;批处理;检索增强生成   
      18
      |
      11
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 111999519 false
      更新时间:2025-09-15
    • 基于对比学习的数学应用题求解方法研究 AI导读

      在智慧教育领域,专家提出了通用数学应用题求解模型BSCL,有效推动了教育发展。
      张天成, 王玉杨, 张亦嘉, 于明鹤, 冷芳玲, 于戈
      2025, 11(5): 34-47. DOI: 10.11959/j.issn.2096-0271.2025057
      摘要:MWP自动求解不仅可以为学生提供精准的学习指导,还有助于缓解教师压力,推动智慧教育发展。现有MWP求解方法在挖掘题目深层语义信息、区分MWP类型以及处理相似问题的细微差异方面仍存在挑战。为此,提出了一种通用的数学应用题求解模型BSCL。首先,通过预训练语言模型对自然语言形式的MWP进行编码,同时利用对比学习方法增强编码器对不同题型的理解能力;然后,统一解码多种类型的MWP,并采用监督任务确保题目与表达式之间的数学一致性。在中文和英文数据集上的多项实验结果证明了BSCL求解不同类型MWP的有效性和优越性。  
      关键词:数学应用题;自然语言处理;对比学习   
      7
      |
      2
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 109257513 false
      更新时间:2025-09-15
    • 基于知识增强大语言模型的历史学科试题生成系统 AI导读

      在教育领域,研究者开发了基于知识图谱增强的大语言模型历史学科试题生成系统KG-QGH,显著提升了题目生成的正确性、相关性和多样性。
      纪天昀, 张征, 赵宇泽, 黄振亚, 黄威, 佟威, 刘淇, 陈恩红
      2025, 11(5): 48-66. DOI: 10.11959/j.issn.2096-0271.2025059
      摘要:随着大语言模型的问世,其凭借强大的语言能力和推理能力能够模仿教师的题目设计方法,对出题材料进行分析并生成相应题目,并通过自我检查保证生成题目的质量。受此启发,设计了一个基于知识图谱增强的大语言模型历史学科试题生成系统KG-QGH,旨在生成符合教师需求、内容准确、匹配考纲且丰富多样的题目。该系统以历史学科的简答题为例,将历史知识图谱中的关系信息与课本知识点相结合,自动生成简答题目,并引入反馈机制对生成的题目进行验证和修正。对比实验评估结果表明,KG-QGH系统在题目生成的正确性、相关性和多样性等关键指标上均显著优于单一的大语言模型方法。本研究不仅验证了知识图谱增强方法在题目生成领域的有效性,也为教育领域的智能化应用提供了新的研究思路和实践参考。  
      关键词:大语言模型;知识图谱;题目生成;历史教育;智能教育   
      22
      |
      15
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 111999576 false
      更新时间:2025-09-15
    • 面向教育场景的视觉大模型优化与应用 AI导读

      在教育领域,人工智能技术取得新突破,VELM大模型通过多模态数据处理和模型优化,提升了教育场景回复质量,降低了计算资源消耗。
      许跃蓬, 徐柴迪, 郭晋军, 姜云桥, 王仕嘉, 刘垚
      2025, 11(5): 67-85. DOI: 10.11959/j.issn.2096-0271.2025056
      摘要:随着人工智能技术的迅速发展,大语言模型在许多领域取得了显著成功,但在教育领域的应用仍面临多模态数据处理困难、回答准确性不足以及信息载体单一等问题。为解决这些问题,提出了一种视觉教育大模型VELM。VELM基于多模态公开教育数据集及专用教育数据集进行训练,并结合模型优化技术,不仅提升了模型在教育场景中的回复质量,而且实现了计算资源的优化与降低。同时,使用了RAG技术确保生成内容的准确性和丰富度。在部署与应用方面,VELM通过Dify平台实现了灵活的多端部署,支持微信小程序、Web云端平台以及本地化部署3种形式,满足了不同教育场景中的多样化需求。评测实验表明,VELM在标准评测数据集(如Mathvista、OCRBench和MMMU等)上的准确性显著优于MiniCPM-V、DeepSeek-VL、Yi-VL等开源大模型;在专用教育评测数据集上,VELM的准确性相较于基础模型Qwen2-VL提升了9.78%。  
      关键词:大语言模型;多模态;智慧教育;RAG技术   
      20
      |
      39
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 111999691 false
      更新时间:2025-09-15
    • 在教育领域,专家提出了TIKT模型,提升了知识追踪的可解释性和性能,为教育技术发展提供新方向。
      周涛, 李艳婷, 杨月婷, 任俊霖, 琚生根, 师维
      2025, 11(5): 86-100. DOI: 10.11959/j.issn.2096-0271.2025055
      摘要:知识追踪旨在追踪学习者在学习过程中的知识状态变化,从而提升学习效率。当前,知识追踪因其在教育领域的重要意义而备受关注。然而,基于深度学习的知识追踪模型大多致力于追求学习者成绩预测的高准确性,在可解释方面存在明显不足。如何在确保知识追踪模型可解释能力的同时,尽可能提升模型性能,仍然是一个挑战。基于此,首先基于IRT和Transformer架构提出一个精心设计的高性能可解释知识追踪模型TIKT;然后使用经微调的预训练模型,预测题目文本中隐含的题目难度等级,以提升数据的可解释能力,并将题目难度等级引入对比学习框架中,从而增强知识追踪模型的整体性能。在3个真实世界基准数据集上的实验充分证明,所提出的模型在可解释性与性能方面相较其他模型均有一定提升。  
      关键词:知识追踪;对比学习;预训练模型   
      28
      |
      8
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 109537187 false
      更新时间:2025-09-15
    • 基于图检索增强生成和少样本学习的美术作品鉴赏 AI导读

      在美术教育领域,专家利用多模态大语言模型辅导学生鉴赏美术作品,有效提升鉴赏内容质量。
      刘天扬, 寇思佳, 金旭, 王文静, 陆雪松
      2025, 11(5): 101-116. DOI: 10.11959/j.issn.2096-0271.2025061
      摘要:随着我国素质教育的不断推进,美术教育在学科教育中的影响越来越大。美术作品鉴赏是美术教育的重要内容之一,能够培养学生的美术能力和素养。然而,优秀美术教师的缺乏和各地区美术教育发展水平的不平衡,导致众多学生无法受到高质量的美术作品鉴赏教育。在这种情况下,利用多模态大语言模型辅导学生进行美术作品鉴赏,成为一种潜在的替代方案。利用多模态大语言模型,提出一种基于图检索增强生成和少样本学习的方法,引导模型生成符合高中教学需求的美术作品鉴赏内容。实验结果表明,相较于对比方法,该方法能够有效提升多模态大语言模型生成的鉴赏内容的质量。  
      关键词:图检索增强生成;美术教育;多模态大语言模型   
      17
      |
      16
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 111999100 false
      更新时间:2025-09-15

      地方政府大数据专栏

    • 无锡依托历史经验,创新“1+8+X”模式,建设“中国数码头”,解决数据市场难题,为城市数据要素市场建设提供经验。
      胡逸, 颜春水, 章瑜桢, 蒋子海
      2025, 11(5): 117-129. DOI: 10.11959/j.issn.2096-0271.2025050
      摘要:无锡地处长江三角洲几何中心,依托米码头、布码头、丝码头、钱码头等历史经验,充分发挥资源禀赋和产业特色,创新提出“1+8+X”数据要素市场建设模式,全力建设具有市场化配置高、安全权益高、流通成本低“两高一低”显著优势的“中国数码头”,吸引国内国际数据到无锡存储、加工、流通、交易,解决了当前国内数据市场规则缺乏、数据供给不优、平台互通不畅、产业载体不足等普遍存在的难题,取得了积极进展与成效,为大中型城市建设数据要素市场提供了重要经验借鉴。  
      关键词:数据要素市场;大中型城市;中国数码头;创新实践;模式   
      6
      |
      4
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 109257850 false
      更新时间:2025-09-15

      研究

    • 深度伪造音频生成与鉴伪技术综述 AI导读

      深度学习技术发展迅速,伪造音频生成技术成为数字媒体安全挑战。专家深入分析鉴伪方法,为应对伪造音频威胁提供解决方案。
      曾志平, 张旭龙, 瞿晓阳, 肖春光, 王健宗
      2025, 11(5): 130-151. DOI: 10.11959/j.issn.2096-0271.2025064
      摘要:随着深度学习技术的快速发展,伪造音频生成技术,尤其是深度伪造音频的生成,已成为数字媒体安全领域的一大挑战。这些技术生成的音频与真实语音高度逼真,难以分辨,从而对社会安全和个人隐私保护提出了更高要求。鉴于此,深度伪造音频鉴伪技术的研究显得尤为迫切。尽管该领域已取得一定进展,但随着数据量、算力和新模型的不断涌现,新的挑战也随之而来。首先,概述了伪造音频生成技术从传统音频编辑到基于深度学习生成模型的演进历程。接着,深入分析了基于声学特征的鉴伪方法和基于端到端模型的鉴伪策略,详细讨论了深度声学特征鉴伪、预训练神经网络特征鉴伪,端到端模型优化、泛化提升策略及实时检测的强化。最后,展望了未来工作,强调了需要重点关注的研究方向,以推动深度伪造音频鉴伪技术的发展,更有效地应对日益复杂的伪造音频威胁,保障数字媒体的安全性与可靠性。  
      关键词:深度伪造音频;伪造音频生成检测;深度音频生成模型;鉴伪技术   
      15
      |
      31
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 111999019 false
      更新时间:2025-09-15
    • 基于改进YOLOv8的高分辨率遥感图像目标检测算法 AI导读

      在高分辨率遥感图像目标检测领域,提出了基于改进YOLOv8的算法,有效提升了小目标检测性能。
      张霞, 乔环宇, 曹峰
      2025, 11(5): 152-169. DOI: 10.11959/j.issn.2096-0271.2025065
      摘要:针对高分辨率遥感图像数据中目标受复杂背景干扰、目标较小且密集分布、目标多尺度且方向随机等问题,提出了一种基于改进YOLOv8的高分遥感图像目标检测算法。首先,融入了动态蛇形卷积,使算法更好地检测尺度、方向不一致的目标;其次,为使算法能够捕获复杂背景图像中全局上下文信息,将iRMB与Shift-Wise卷积相结合,引入基于注意力的尺度内特征交互模块,将双向特征金字塔网络和语义细节融合模块相结合作为算法的特征融合网络,并设计一种改进的高效解耦检测头;最后,结合NWD与WIoU损失函数,设计一个新的损失函数NWD-WIoU,以加快算法检测时的收敛速度并提升算法对小目标的检测性能。在3个公开的遥感图像目标检测数据集上的实验结果表明,基于改进YOLOv8的高分辨率遥感图像目标检测算法的性能优于其他主流高分辨率遥感图像目标检测算法。  
      关键词:深度学习;高分辨率遥感图像;目标检测;YOLOv8;轻量化   
      45
      |
      23
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 111998943 false
      更新时间:2025-09-15

      应用

    • 在数字经济时代,数据量激增,提出了“多湖一中台”工业大数据平台架构,以实现数据的高效管理与共享,促进数据价值释放。
      蒋楠
      2025, 11(5): 170-184. DOI: 10.11959/j.issn.2096-0271.2025069
      摘要:数字经济时代数据量爆炸式增长,数据平台在数据存储、处理、计算等方面遇到的挑战越来越大。提出基于湖仓一体技术的“多湖一中台”工业大数据平台架构,旨在构建一个高效、灵活、可扩展的大数据管理平台,以支持跨层级、跨组织、跨区域数据共享应用。通过3级数据湖和中台的统一部署,构建“采、聚、理、用、保”五大核心功能,形成多源异构数据采集、多模数据存储与数据处理、数据治理、数据服务、数据安全防护等能力。通过多湖协同联动和数据统一管控,实现超大集团型企业数据的统筹管理、开放共享,支持各业务领域数据应用场景落地,促进数据要素价值释放。  
      关键词:数据湖;湖仓一体;数据中台;工业大数据;数据治理;数据服务   
      19
      |
      4
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 109257467 false
      更新时间:2025-09-15
    • 融合区块链和联邦学习技术的数据资产流通交易方案研究 AI导读

      在数据资产流通交易领域,专家提出了融合区块链和联邦学习技术的方案,构建了高效、安全、可信的数据资产流通交易体系,为我国数字经济高质量发展提供技术支持。
      莫梓嘉, 赵晨
      2025, 11(5): 185-196. DOI: 10.11959/j.issn.2096-0271.2025068
      摘要:作为重要生产要素,数据资产正逐步演变为推动我国稳增长、促转型的重要引擎。然而,数据资产的流通交易面临多重挑战,包括交易前的数据真实性和隐私性、交易中的安全性与可信性,以及交易后的可靠性与可溯性问题。针对此,提出了一种融合区块链和联邦学习技术的链上链下数据资产流通交易方案,旨在通过研究数据可信交互框架、多源敏感数据确权与隐私保护技术、数据全生命周期可信保障技术及异常交易数据溯源机制,确保数据资产流通交易的高安全性、高隐私性及可追溯性,构建高效、安全、可信的数据资产流通交易体系,推动数据要素市场安全有序、平稳持续发展,为我国数字经济高质量发展提供技术支持。  
      关键词:数据资产;数据交易;区块链;联邦学习   
      14
      |
      1
      |
      0
      <HTML>
      <网络PDF><WORD><XML><Meta-XML>
      <引用本文> <批量引用> 109258024 false
      更新时间:2025-09-15
    0