1. 教育部科技发展中心,北京 100080
2. 清华大学软件学院,北京 100084
3. 北京赛时科技有限公司,北京 100084
4. 北京西普阳光教育科技股份有限公司,北京 100191
[ "万猛(1975-),男,博士,教育部科技发展中心研究员,主要研究方向为信息管理与信息系统、科技评价与管理、教育大数据等。" ]
[ "张永锋(1994-),男,清华大学软件学院硕士生,主要研究方向为云存储、网络信息爬取等。" ]
[ "李振华(1983-),男,博士,清华大学软件学院副教授、博士生导师,主要研究方向为云计算、云存储、移动互联网等。" ]
[ "霍东云(1981-),男,北京赛时科技有限公司联合创始人兼首席技术官,主要研究方向为大数据、云计算、移动互联网等。" ]
[ "赵弋洋(1975-),男,博士,北京西普阳光教育科技股份有限公司首席科学家,主要研究方向为物联网、定位、移动互联网等。" ]
[ "王莲(1984-),女,北京西普阳光教育科技股份有限公司高级经济师,主要研究方向为物联网、大数据、产业经济学等。" ]
网络首发:2019-09,
纸质出版:2019-09-15
移动端阅览
万猛, 张永锋, 李振华, 等. 开放存取知识库及其数据采集规范的研究[J]. 大数据, 2019,5(5):2019041-1.
Meng WAN, Yongfeng ZHANG, Zhenhua LI, et al. Research on open-access repositories and data acquisition specifications[J]. Big Data Research, 2019, 5(5): 2019041-1.
万猛, 张永锋, 李振华, 等. 开放存取知识库及其数据采集规范的研究[J]. 大数据, 2019,5(5):2019041-1. DOI: 10.11959/j.issn.2096-0271.2019041.
Meng WAN, Yongfeng ZHANG, Zhenhua LI, et al. Research on open-access repositories and data acquisition specifications[J]. Big Data Research, 2019, 5(5): 2019041-1. DOI: 10.11959/j.issn.2096-0271.2019041.
在建设学术大数据、促进学术共享的时代背景下,调查了目前开放存取知识库的发展现状,在数据规模、地区分布、系统软件等方面阐述了国内外的研究情况。以建立科研机构知识库为例,梳理了建立过程中的数据采集需求,并从数据属性、元数据标准、语义去重等方向分析了常用的数据采集规范。最后,综合考虑国内外开放存取知识库的发展现状,并结合我国发展开放存取知识库存在的问题和面临的挑战,提出了4点发展建议。
Under the background of building academic big data and promoting academic sharing
the current development status of open-access repositories was investigated and domestic and foreign research were summarized on data scale
regional distribution and system software.Taking the establishment of building academic institutional repositories as an example
the data collection requirements were analyzed and the commonly used data acquisition specifications were summarized from the aspects of data attributes
metadata standards and semantic deduplication.Finally
combined with the problems and challenges faced by China in developing open-access repositories
reasonable suggestions were put forwar.
李月明 . 基于OpenDOAR的开放存取知识库分析与研究 [J ] . 图书馆 , 2017 ( 7 ): 46 - 48 ,98.
LI Y M . Analysis and research on open access repository based open DOAR [J ] . Library , 2017 ( 7 ): 46 - 48 ,98.
BJORK B C . Gold,green,and black open access [J ] . Learned Publishing , 2017 , 30 ( 2 ).
何琳 . OpenDOAR和机构知识库发展现状 [J ] . 图书馆工作与研究 , 2009 ( 2 ): 30 - 33 .
HE L . OpenDOAR and development of institutional repository [J ] . Library Work and Study , 2009 ( 2 ): 30 - 33 .
杨武健 , 王学勤 . DSpace机构知识库系统的分析与研究 [J ] . 现代情报 , 2006 ( 11 ): 22 - 222 ,225.
YANG W J , WANG X Q . Analysis and research of dspace institutional repository system [J ] . Journal of Modern Information , 2006 ( 11 ): 220 - 222 ,225.
祝忠明 , 马建霞 , 卢利农 , 等 . 机构知识库开源软件DSpace的扩展开发与应用 [J ] . 现代图书情报技术 , 2009 ( Z1 ): 11 - 17 .
ZHU Z M , MA J X , LU L N , et al . Developing an institutional repository platform via extending dspace [J ] . New Technology of Library and Information Service , 2009 ( Z1 ): 11 - 17 .
ZHU Z M , ZHANG W Q , LIU W , et al . CSpace–a more practical and customizable repository platform serving local needs [J ] . Polymer-Plastics Technology and Engineering , 2010 , 49 ( 7 ): 662 - 671 .
吴玲芳 . 用于机构知识库的元数据研究 [J ] . 现代情报 , 2009 , 29 ( 8 ): 128 - 130 ,134.
WU L F . Study on metadata used in institutional repository [J ] . Journal of Modern Information , 2009 , 29 ( 8 ): 128 - 130 ,134.
杜小勇 , 陈峻 , 陈跃国 . 大数据探索式搜索研究 [J ] . 通信学报 , 2015 , 36 ( 12 ): 77 - 88 .
DU X Y , CHEN J , CHEN Y G . Exploratory search on big data [J ] . Journal on Communications , 2015 , 36 ( 12 ): 77 - 88 .
李建伟 , 宋文 , 汤怡洁 , 等 . 科研本体知识库数据建设研究 [J ] . 现代图书情报技术 , 2013 ( 11 ): 15 - 21 .
LI J W , SONG W , TANG Y J , et al . Research on data building for knowledge base based on scientific research ontology [J ] . New Technology of Library and Information Service , 2013 ( 11 ): 15 - 21 .
朱立禄 , 宋世俊 , 王琳 . 国内外机构知识库建设现状及建议 [J ] . 现代情报 , 2017 , 37 ( 3 ): 109 - 115 .
ZHU L L , SONG S J , WANG L . The development status of worldwide institutional repositories and some corresponding measures [J ] . Journal of Modern Information , 2017 , 37 ( 3 ): 109 - 115 .
0
浏览量
640
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621