最新刊期

    2015年第1卷第1期

      聚焦

    • 对大数据的再认识

      李国杰
      2015, 1(1): 1-9. DOI: 10.11959/j.issn.2096-0271.2015.01.001
      摘要:大数据已成为媒体与大众关注的新技术,大数据的应用也预示着信息时代将进入一个新阶段,但人们对大数据的认识有一个不断加深的过程。首先从“信息时代新阶段”、数据文化和认识论的高度阐述了对大数据的理解;接着通过对驱动效益和大成智慧的解释,探讨了如何正确认识大数据的价值和效益,并从复杂性的角度分析了大数据研究和应用面临的挑战;最后对发展大数据应避免的误区提出几点看法。  
      关键词:大数据;认识论;大成智慧;复杂性   
      665
      |
      860
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523314 false
      更新时间:2015-05-20
    • 从系统角度审视大数据计算

      郑纬民
      2015, 1(1): 10-19. DOI: 10.11959/j.issn.2096-0271.2015.01.002
      摘要:大数据计算是实现大数据“巨大价值”的必要手段,而计算系统是大数据计算的有效载体。试着从系统角度审视大数据计算,透过大数据的体量巨大、速度极快、模态多样、真伪难辨等宏观特征,针对批量计算、流式计算、大图计算等计算形式,分别探讨大数据计算的典型特征,论述了这些特征给大数据计算系统的设计与实现带来的技术挑战,进而梳理了为了应对这些挑战所取得的研究成果,最后从系统角度指出未来大数据计算可能的一些研究方向。  
      关键词:大数据计算;批量计算;流式计算;大图计算;系统实例   
      232
      |
      562
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523323 false
      更新时间:2015-05-20

      专题:大数据关键技术

    • 大数据与高性能计算

      陈文光
      2015, 1(1): 20-25. DOI: 10.11959/j.issn.2096-0271.2015.01.003
      摘要:大数据和高性能计算都是计算机技术发展的产物。高性能计算主要采用模拟方法,被称作科学发现的第三范式;大数据主要从数据中总结规律,即使在对研究对象缺乏深入理解的情况下也可以发现一定的相关性,被称作科学发现的第四范式。从研究范式、主要应用类型以及计算机软硬件系统的角度对大数据与高性能计算的关系展开阐述。  
      关键词:大数据;高性能计算;并行与分布式计算;相关性   
      206
      |
      557
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523324 false
      更新时间:2015-05-06
    • 大数据机器学习系统研究进展

      黄宜华
      2015, 1(1): 26-45. DOI: 10.11959/j.issn.2096-0271.2015.01.004
      摘要:要实现高效的大数据机器学习,需要构建一个能同时支持机器学习算法设计和大规模数据处理的一体化大数据机器学习系统。研究设计高效、可扩展且易于使用的大数据机器学习系统面临诸多技术挑战。近年来,大数据浪潮的兴起,推动了大数据机器学习的迅猛发展,使大数据机器学习系统成为大数据领域的一个热点研究问题。介绍了国内外大数据机器学习系统的基本概念、基本研究问题、技术特征、系统分类以及典型系统;在此基础上,进一步介绍了本实验室研究设计的一个跨平台统一大数据机器学习系统——Octopus(大章鱼)。  
      关键词:大数据;机器学习;分布并行计算;大数据处理平台   
      1283
      |
      1661
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523325 false
      更新时间:2015-05-03
    • 大数据与OLAP系统

      杜小勇, 陈跃国, 覃雄派
      2015, 1(1): 46-58. DOI: 10.11959/j.issn.2096-0271.2015.01.005
      摘要:OLAP(online analytical processing,在线联机分析处理)是关系数据基础上实现商业智能的核心技术。在大数据时代,人们迫切希望在由普通机器组成的大规模集群上能实现高性能的OLAP,然而系统性能的挑战巨大。可喜的是,近年来进展迅速,涌现了很多以Hadoop上的数据进行OLAP的所谓SQL on Hadoop系统,并且系统性能不断提升。在综述OLAP技术发展的基础上,重点对几个有代表性的SQL on Hadoop系统进行了测试分析,并展示了这类系统的性能特点。可以预见,未来在低成本的大数据OLAP市场,这类系统会占有重要位置。  
      关键词:大数据;OLAP;SQL分析;SQLonHadoop   
      300
      |
      730
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523326 false
      更新时间:2015-05-20
    • 大数据与智慧城市

      陈宝权, 程章林
      2015, 1(1): 59-69. DOI: 10.11959/j.issn.2096-0271.2015.01.006
      摘要:城市大数据的关联分析与智能提取是智慧城市建设的关键,通过构建真实城市沉浸式交互分析环境,将复杂的城市大数据以及数据挖掘结果以形象直观的方式展现给用户,让用户以视觉理解的方式获取数据中蕴含的信息并进行交互,实现人类智能和机器智能的有机融合是解决复杂城市问题的有效途径。分析了城市大数据面临的挑战、发展现状、处理流程以及技术要点,最后探讨了智慧城市的发展趋势。  
      关键词:大数据;智慧城市;交互式可视分析;机器智能   
      216
      |
      435
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523399 false
      更新时间:2015-05-20

      研究

    • 大数据是数据、技术,还是应用

      朱扬勇, 熊赟
      2015, 1(1): 70-80. DOI: 10.11959/j.issn.2096-0271.2015.01.007
      摘要:通常认为大数据是一个现有技术难以处理的复杂而庞大的数据集,这将导致一个谬误的出现:大数据都不能被处理,能处理的都不是大数据。显然,如何定义大数据是一个问题。分析了已有的大数据定义和现象,发现数据、技术和应用是大数据的三要素,定义大数据是为决策提供服务的大数据集、大数据技术和大数据应用的总称。其中,大数据集是指一个决策问题所用到的所有可能的数据,而不是一个领域的所有数据。还给出了大数据应用遇到的问题及技术挑战,并指出大数据未来的研究方向。  
      关键词:大数据;智慧城市;交互式可视分析;机器智能   
      774
      |
      1187
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523401 false
      更新时间:2015-05-20
    • 大数据管理系统评测基准的挑战与研究进展

      钱卫宁, 夏帆, 周敏奇, 金澈清, 周傲英
      2015, 1(1): 81-95. DOI: 10.11959/j.issn.2096-0271.2015.01.008
      摘要:数据库评测基准在数据库发展历史中的作用不可替代,而大数据环境中传统评测基准不敷应用。因此,从评测基准3要素,即数据、负载、度量体系入手,研究具有高仿真性、可适配性、可测量性的大数据管理系统评测基准,对大数据管理系统的研发和应用系统选型至关重要。基于此,在简要分析评测基准的基本要素和大数据管理系统发展过程的基础上,重点分析大数据管理系统的基准评测需求与挑战,然后通过社交媒体分析型查询评测基准BSMA,探讨了面向应用的大数据管理系统基准评测的设计和实现问题。  
      关键词:大数据管理系统;评测基准;数据生成;负载生成;性能度量体系   
      228
      |
      516
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523421 false
      更新时间:2015-05-20

      应用

    • 百度大数据应用与实践

      陈尚义
      2015, 1(1): 96-106. DOI: 10.11959/j.issn.2096-0271.2015.01.009
      摘要:产生于互联网的大数据应用,现阶段正在向其他行业领域渗透,成为行业创新和转型的重要驱动力。根据百度多年来在大数据领域的创新与实践,阐述了大数据驱动搜索引擎的发展,介绍了百度大数据引擎和行业应用实践。重点分析了大数据发展的关键因素,并提出了大数据和人工智能是未来信息技术发展的重要方向。  
      关键词:大数据;人工智能;搜索引擎   
      303
      |
      1562
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523435 false
      更新时间:2015-05-20

      论坛

    • 对大数据国家战略的几点考虑

      魏凯
      2015, 1(1): 107-113. DOI: 10.11959/j.issn.2096-0271.2015.01.010
      摘要:大数据是国家发展的重要资源。对大数据资源的掌控与分析能力将成为未来国家竞争力的基础。我国大数据的发展及研究已有了良好开端,但也存在大数据资源活性不足、行业应用有待深化、关键核心技术亟待突破、产业基础薄弱、网络信息安全存在潜在隐患等问题。当前,制定国家大数据战略成为各界人士的共同呼声。国家层面的大数据战略究竟应该坚持什么思路,有哪些要素需要考虑,成为产业界和政府部门热议的话题。基于此,结合国外实践和国内问题,提出一些初步思考。  
      关键词:大数据;国家战略;法律规范   
      161
      |
      494
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523438 false
      更新时间:2015-05-20
    • 数据技术时代的未来

      张茂森
      2015, 1(1): 114-119. DOI: 10.11959/j.issn.2096-0271.2015.01.011
      摘要:数据应用是数据技术时代的价值承载,数据技术时代和已有的信息技术时代的区别在于是否将数据作为生产资料。信息技术时代解决的是“过程”智慧的问题,从而提升效率,而数据技术时代解决的是“感知”和“协同”智慧的问题,使效率大幅提升并能完成业务的创新。归纳了数据应用类产品的分类,给出了一个通用的数据应用实现架构,同时对大数据的数据共享和交换的本质和难点做了简要分析。  
      关键词:大数据应用;数据共享与交换;信息技术;数据技术   
      189
      |
      377
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523475 false
      更新时间:2015-05-20

      动态

    • 大数据导航人力资源管理

      张琳艳, 高见, 洪翔, 周涛
      2015, 1(1): 120-122. DOI: 10.11959/j.issn.2096-0271.2015.01.012
        
      166
      |
      275
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523476 false
      更新时间:2015-05-20
    • 站在大数据的风口上

      连玉明
      2015, 1(1): 123-125. DOI: 10.11959/j.issn.2096-0271.2015.01.013
        
      151
      |
      229
      |
      0
      <HTML>
      <网络PDF><XML><Meta-XML>
      <引用本文> <批量引用> 59523484 false
      更新时间:2015-05-20
    0