最新刊期

    2018年第4卷第3期

      专题:生物医疗大数据

    • 宏基因组大数据分析的质量控制流程规范

      郑广勇, 杨桢, 曹瑞芳, 刘婉, 李亦学, 张国庆
      2018, 4(3): 2018025. DOI: 10.11959/j.issn.2096-0271.2018025
      摘要:宏基因组数据具有数据量大、复杂度高的特点,从数据类型来看,其涵盖了元数据和测序数据。为了保证宏基因组数据后续功能分析的有效性和正确性,需要对这些元数据和测序数据进行严格的质量控制检测。详细描述了宏基因组数据的质量控制流程,包括元数据和测序数据的信息检查、低质量片段的过滤等过程,从而为宏基因组数据分析提供了预处理的规范,这将为微生物组大数据分析提供坚实的基础。  
      关键词:微生物组;宏基因组;大数据分析;二代测序;质量控制   
      632
      |
      1448
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59530754 false
      更新时间:2018-05-15
    • 区域卫生数据用于临床疗效分析的可用性研究

      叶琪, 赵亮, 阮彤, 冯东雷, 高炬, 刘珉
      2018, 4(3): 2018026. DOI: 10.11959/j.issn.2096-0271.2018026
      摘要:区域卫生数据来源于不同的医院,经历多轮采集、转换、整合过程,数据可能存在各种质量问题。提出了一套“数据可用性”的评估流程,从临床科研需求出发,设计评估需求模板,采集评估需求,进而获得评估度量。通过面向心力衰竭疗效分析的需求实例,获得了与数据的完整性和一致性相关的10个度量指标,并对某省级区域平台的数据进行了可用性评估。结果发现,与临床科研相关的数据的完整性和一致性都仍有待提高。  
      关键词:区域卫生数据;数据质量;数据可用性;疗效分析   
      353
      |
      776
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59530755 false
      更新时间:2018-05-15
    • 生物效应大数据评估聚类算法的并行优化

      彭绍亮, 杨顺云, 孙哲, 程敏霞, 崔英博, 王晓伟, 李非, 伯晓晨, 廖湘科
      2018, 4(3): 2018027. DOI: 10.11959/j.issn.2096-0271.2018027
      摘要:生物效应评估通过测定和分析生物制剂刺激各种人体细胞后的数字化转录组反应,能够快速确定相关的检测标识物和治疗靶标。基于潜在生物制剂作用下的细胞反应大数据,推测突发生物效应模式。综合考虑了MPI、OpenMP两级并行加速,移植优化了基因探针富集分析(GSEA)比对算法和聚类算法,使用不同的数据量和并行度验证了优化后算法潜在的良好可扩展性和快速处理海量生物信息数据的能力。  
      关键词:GSEA;聚类;MPI;OpenMP   
      558
      |
      725
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59530756 false
      更新时间:2018-05-15
    • 基于ICD-10诊断编码的慢性病并发症聚类算法

      王晓霞, 蒋伏松, 王宇, 熊贇
      2018, 4(3): 2018028. DOI: 10.11959/j.issn.2096-0271.2018028
      摘要:慢性病与其相关并发症关系的研究,对患者以及医学研究都有重要意义。电子病历中记录的患者就诊数据为研究目标慢性病与其并发症的关系提供了数据基础,其中面临的挑战之一在于既需要使用临床医生的领域知识对并发症进行标注,又不希望给医生增加过多负担。设计了一种采用分组策略的基于ICD-10诊断编码的慢性病并发症半监督聚类方法,以实现在较少的医生专家参与下对慢性病并发症归类。真实糖尿病患者电子医疗记录数据集上的实验结果表明提出的算法是实用且有效的。  
      关键词:半监督学习;聚类算法;慢性病并发症;CD-10诊断编码I   
      708
      |
      895
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59530758 false
      更新时间:2018-05-15
    • 多中心临床大数据平台建设及深度应用

      朱立峰, 刘淑君, 陈德华, 乐嘉锦
      2018, 4(3): 2018029. DOI: 10.11959/j.issn.2096-0271.2018029
      摘要:多中心临床研究是多中心、多学科对同一临床问题开展广泛协作临床研究的主要途径。传统多中心临床研究主要存在样本量偏小和临床科研相对封闭、开放程度不高的问题。为此,结合了新近兴起的大数据与云计算等技术,将物理上分散的各医院临床中心融合成逻辑上统一的临床大数据,构建了多中心临床大数据应用平台。介绍了多中心临床大数据平台的总体框架设计,详细阐述了平台各个子系统,分析了临床大数据平台的深度应用。  
      关键词:多中心临床研究;临床大数据分析与挖掘;临床科研随访系统   
      860
      |
      1575
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59530757 false
      更新时间:2018-05-15
    • 基于环境气象因素影响的异常就诊量预测

      于广军, 熊贇, 彭思佳, 阮璐
      2018, 4(3): 2018030. DOI: 10.11959/j.issn.2096-0271.2018030
      摘要:通过分析某儿童医院传染科就医人数异常(突增、突减)情况,建立就医人数与气象特征间的分类模型,实现对传染科就医突变情况的高准确率预测,以便院方合理调配科室、安排医生出诊人数。建立的模型对就医人数突增情况的预测准确率达到92.8%,召回率达到83.5%;对就医人数突减情况的预测准确率达到87.4%,召回率达到92.4%,并与多种分类器进行比较,实验表明该方法在预警传染科就诊人数的突变方面综合表现更佳。  
      关键词:环境气象因素;随机森林;异常预测   
      538
      |
      831
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59531003 false
      更新时间:2018-05-15

      研究

    • 面向大数据应用的混合内存架构特征分析

      李鑫, 陈璇, 黄志球
      2018, 4(3): 2018031. DOI: 10.11959/j.issn.2096-0271.2018031
      摘要:受限于DRAM的扩展性,大数据分析及相关应用性能难以有效提升。新型非易失性存储器凭借其非易失性、高存储密度、低能耗等优点,为大数据应用的性能与效率提升带来了契机。以新型非易失性存储器为基础,阐述PCM/DRAM混合存储架构,通过对该混合存储架构在性能优化、能耗优化、内存管理策略等方面的综述分析,详述了混合存储架构在大数据应用方面的优势及可行性,总结了现有研究工作的缺陷,展望了PCM/DRAM混合内存后续的研究方向。  
      关键词:大数据;非易失性存储器;相变存储器;性能优化   
      495
      |
      841
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59531019 false
      更新时间:2018-05-15

      应用

    • 基于Gephi的航运招聘信息可视化分析

      王扬, 田野, 李铁山, 陈俊龙, 彭东成, 周义华
      2018, 4(3): 2018032. DOI: 10.11959/j.issn.2096-0271.2018032
      摘要:将基于Gephi的社会网络可视化分析方法引入船员招聘数据的关联性分析领域中,通过构造船员招聘数据的属性共现网络,分析了船员招聘信息中各属性之间的关系。通过交互式分析,得到了职位与航线、航线与证书等属性之间的关系,探索了船员数据中各个属性之间的关联程度以及航运招聘信息网络的核心属性,以期为相关部门以及广大船员了解船员市场的变化提供有益的参考。  
      关键词:航运招聘信息;可视化分析;Gephi;关联性   
      715
      |
      1282
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59531032 false
      更新时间:2018-05-15

      专栏:大数据领域国家工程实验室

    • 大数据驱动的安全协同生态建设

      鲍旭华, 曲晓东, 郑新华
      2018, 4(3): 2018033. DOI: 10.11959/j.issn.2096-0271.2018033
      摘要:大数据技术发展给网络安全领域带来了挑战和机遇。新技术和新模式伴随着数据泄露、个人隐私风险、数据跨境流动、数据滥用等一系列安全风险,系统地介绍了大数据安全保障思路以应对这些风险。同时,大数据技术的发展为安全产业能力提升带来了巨大的机会,将会在大数据技术、智能安全模式和安全产业协同层面分别发挥作用。  
      关键词:大数据安全;安全协同;安全产业生态;国家工程实验室   
      580
      |
      670
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59531035 false
      更新时间:2018-05-15

      专栏:2017年度大数据应用实践Top 10

    • 混合异构营销数据平台实践

      卢亿雷
      2018, 4(3): 2018034. DOI: 10.11959/j.issn.2096-0271.2018034
      摘要:简要论述了混合异构营销数据平台在实施过程中解决的业务需求问题、用到的相应技术方案选型思考。从技术的角度描绘了构建整个平台过程中的发明创新、遇到的问题和解决方案以及获取的经验教训。  
      关键词:大数据;精准营销;人工智能;数据可视化   
      408
      |
      638
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59531067 false
      更新时间:2018-05-15

      动态

    • 人工智能赋能金融科技

      王健宗, 黄章成, 肖京
      2018, 4(3): 2018035. DOI: 10.11959/j.issn.2096-0271.2018035
        
      632
      |
      2023
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59531219 false
      更新时间:2018-05-15
    0