1. 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
2. 中国人民大学信息学院,北京 100872
[ "杜小勇(1963-),男,中国人民大学信息学院教授,博士生导师,教育部数据工程与知识工程重点实验室主任,中国计算机学会会士,《大数据》期刊编委会副主任。主要研究方向为智能信息检索、高性能数据库、知识工程。主持和参与多项国家核高基(核心电子器件、高端通用芯片及基础软件产品)、“973”计划、“863”计划、国家自然科学基金项目,近年来在SIGMOD、VLDB、AAAI、IEEE TKDE等国际重要期刊和会议上发表论文百余篇。" ]
[ "陈跃国(1978-),男,中国人民大学信息学院副教授,博士生导师,中国计算机学会数据库专家委员会委员、大数据专家委员会通讯委员。主要研究方向为大数据分析系统和语义搜索。主持国家自然科学基金项目2项,参与多项国家核高基(核心电子器件、高端通用芯片及基础软件产品)、“973”计划、“863”计划项目,近年来在SIGMOD、ICDE、AAAI、WWW、IEEE TKDE等国际重要期刊和会议上发表论文30余篇。" ]
网络首发:2017-03,
纸质出版:2017-03-20
移动端阅览
杜小勇, 陈跃国. 大数据的价值发现方法[J]. 大数据, 2017,3(2):2017015.
Xiaoyong DU, Yueguo CHEN. Approaches for value extraction on big data[J]. Big data research, 2017, 3(2): 2017015.
杜小勇, 陈跃国. 大数据的价值发现方法[J]. 大数据, 2017,3(2):2017015. DOI: 10.11959/j.issn.2096-0271.2017015.
Xiaoyong DU, Yueguo CHEN. Approaches for value extraction on big data[J]. Big data research, 2017, 3(2): 2017015. DOI: 10.11959/j.issn.2096-0271.2017015.
大数据的价值有不同的体现形式和发现价值的途径。总结了从大数据中发现价值的3种基本途径:数据服务、数据分析与数据探索,并对它们的特点进行了分析和对比。数据服务通过提供高性能和高并发的数据访问从微观层面体现数据价值;数据分析侧重利用统计模型的方法在宏观层面上对大数据进行处理,通过产生数据洞察的形式体现数据价值;数据探索侧重通过交互模型在微观和宏观的不断变换,引导用户浏览和发现数据的价值。
The value of big data can be presented in different means,and therefore it has different ways to extract the value out of big data.Three approaches of value extraction on big data:data service,data analytics,and data exploration were summarized.The characteristics of these approaches were analyzed and compared.In summary,data service reflects the value of data from the micro-level by supporting high-performance and high-throughput read and write operations.Data analysis focuses on the usage of statistical models to generalize data distribution at macro-level,and it extracts values by generating insights from data.Data exploration focuses on interactive models in the constant interchange of micro-level and macrolevel to guide the users browse and discover values out of the data.
PAVLO A , ASLETT M . What’s really new with newSQL [J ] . ACM Sigmod Record , 2016 , 45 ( 2 ): 45 - 55 .
STONEBRAKER M . SQL databases [J ] . Communications of the ACM , 2010 , 53 ( 4 ): 10 - 11 .
LIU T Y . Learning to rank for information retrieval [M ] . Berlin : Springer PressPress , 2011 .
GOOFELLOW I , BENGIO Y , COURVILLE A . Deep learning [M ] . Cambridge : MIT PressPress , 2011 .
杜小勇 , 陈峻 , 陈跃国 . 大数据探索式搜索研究 [J ] . 通信学报 , 2015 , 36 ( 12 ): 77 - 88 .
DU X Y , CHEN J , CHEN Y G . Exploratory search on big data [J ] . Journal on Communications , 2015 , 36 ( 12 ): 77 - 88 .
0
浏览量
1170
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621