1. 复旦大学计算机科学技术学院,上海 200433
2. 上海市数据科学重点实验室,上海 200433
[ "朱扬勇(1963-),男,博士,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任。1989年起从事数据领域研究,2008年提出数据资源保护和利用,2009年发表了数据科学论文《Data explosion,data nature and dataology》,并出版专著《数据学》,对数据科学进行了系统探讨和描述。2010年创办了“International Workshop on Dataology and Data Science”,2014年和石勇、张成奇共同创办了“International Conference on Data Science”。担任第462次香山科学会议“数据科学与大数据的理论问题探索”的执行主席、《大数据技术与应用丛书》主编。主要研究方向为数据科学、大数据。" ]
[ "熊贇(1980-),女,博士,复旦大学计算机科学技术学院教授。2004年起从事数据领域方面的研究工作,作为项目负责人主持国家自然科学基金、上海市科委发展基金以及企业合作项目。相关研究成果在本领域国际权威期刊或会议发表论文40余篇,出版著作3本。主要研究方向为数据科学、大数据。" ]
网络首发:2017-03,
纸质出版:2017-03-20
移动端阅览
朱扬勇, 熊贇. 大数据的若干基础研究方向[J]. 大数据, 2017,3(2):2017023.
Yangyong ZHU, Yun XIONG. Foundation issues for big data research[J]. Big data research, 2017, 3(2): 2017023.
朱扬勇, 熊贇. 大数据的若干基础研究方向[J]. 大数据, 2017,3(2):2017023. DOI: 10.11959/j.issn.2096-0271.2017023.
Yangyong ZHU, Yun XIONG. Foundation issues for big data research[J]. Big data research, 2017, 3(2): 2017023. DOI: 10.11959/j.issn.2096-0271.2017023.
大数据问题的关键技术挑战在于:找到隐含在低价值密度数据中的价值;在希望的时间内完成。指出前者需要将领域知识和数据技术结合,这种结合的理论和新型算法构成大数据的分析基础和应用基础;后者需要设计新的计算机、集群体系、计算框架、存储体系和数据管理方法,这些构成大数据的计算基础和数据基础。另外,这两个挑战都涉及数学理论,这是大数据的数学基础。系统地分析了大数据的数学基础、计算基础、数据基础、分析基础和应用基础等基础研究方向。
The key technical challenges for big data lie in how to discover the value of the low-value-density data and how to complete the task in the desired time.The ways to take up these challenges from three aspects were discussed.First is that the former challenge requires the combination of domain knowledge and data technology.This combination of theory and new algorithms forms the basis of application and analysis of big data.Second is that the latter challenge needs to design new types of computer,cluster system,computing framework,storage system and data management method,which forms the basis of computing and data of big data.Thirdly,both challenges relate to mathematical theory,which is the basis of mathematics of big data.In conclusion,several foundation issues for big data research including the basis of mathematics,computing,data,analysis and application of big data were analyzed.
朱扬勇 , 熊贇 . 大数据是数据、技术,还是应用 [J ] . 大数据 ,2015007
ZHU Y Y , XIONG Y . Defining big data [J ] .Big Data Research,2015007. Big Data Research ,2015007.
MOORE G E . The microprocessor:engine of the technology revolution [J ] . Communications of the ACM , 1997 , 40 ( 2 ):112.
HEY T , STEWART T , KRISTIN T . The forth paradigm:data-intensive scientific discovery [M ] . Beijing : Microsoft ResearchPress , 2009 .
CARMI D , FALKOWSKI A , KUFLIK E , et al . Higgs after the discovery:a status report [J ] . Journal of High Energy Physics , 2012 ,arXiv:1207.1718.
BAHMANI B , MOSELEY B , VATTANI A , et al . Scalable k-means++ [J ] . Proceedings of the VLDB Endowment , 2012 , 5 ( 7 ): 622 - 633 .
ARTHUR D , VASSILVITSKII S . K-means++:the advantages of careful seeding [C ] // 18th ACM-SIAM Symposium on Discrete Algorithms,January 7-9,2007,New Orleans,Louisiana,USA , New York : ACM Press , 2007 : 1027 - 1035 .
熊贇 , 朱扬勇 , 陈志渊 . 大数据挖掘 [M ] . 上海 : 上海科学技术出版社 , 2016 .
XIONG Y , ZHU Y Y , CHEN Z Y . Big data mining [M ] . Shanghai : Shanghai Scientific& Technical PublishersPress , 2016 .
熊贇 , 朱扬勇 . 特异群组挖掘:框架与应用 [J ] . 大数据 ,2015020.
XIONG Y , ZHU Y Y . Abnormal group mining:framework and applications [J ] . Big Data Research ,2015020.
XIONG Y , ZHU Y Y , YU P S , et al . Towards cohesive anomaly mining [C ] // 27th AAAI Conference on Artificial Intelligence (AAAI),July 14-18,2013,Bellevue,Washington,USA , San Francisco : AAAI Press , 2013 : 984 - 990 .
XIONG Y , ZHU Y Y . Mining peculiarity groups in day-by-day behavioral datasets [C ] // IEEE International Conference on Data Mining (ICDM),December 6-9,2009,Miami,Florida,USA , New Jersey : IEEE Press , 2009 : 578 - 587 .
HINTON G E , SALAKHUDINOV R R . Reducing the dimensionality of data with neural networks [J ] . Science , 2006 , 313 ( 5786 ): 504 - 507 .
0
浏览量
1236
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621