8月28日下午,在2025中国国际大数据产业博览会上,国家数据局发布了首批高质量数据集建设先行先试工作名单。经教育部推荐、国家数据局评审,中国人民大学申报的“哲学社会科学学术文献高质量数据集”成功入选。
该数据集以中国人民大学书报资料中心两大核心资源——“复印报刊资料系列数据库”和“中国哲学社会科学自主知识体系数字创新平台”(简称“学术世界”)为依托开展建设。
“复印报刊资料”是一种精选的二次文献,共148种,年总发行量400万册,系我国最大的哲学社会科学学术期刊集群。复印报刊资料系列数据库精选了3%的优质论文,现已成为全国700多家高校、社科院、党校行政学院图书馆的重要资源,覆盖超过2000万名师生和学者,并曾荣获第二届中国出版政府奖。
“学术世界”是深入贯彻落实习近平总书记在中国人民大学考察调研时提出的“建构中国自主的知识体系”“打造中国特色、世界一流的学术资源信息平台”重要指示精神而构建的一个以学术创新为目标、以学术资源为基础的开放性、数智化的学术服务平台。其业务逻辑是数据驱动的全链条学术服务,核心支撑是高质量的学术文献数据集。
“学术世界”一期推出了国内首个哲学社会科学主文献平台(https://zszwx.cn)、首个哲学社会科学预印本平台(https://zsyyb.cn)。“哲社主文献”是一个高效研读学术精品的指南,通过精选和精加工5‰的最优质论文,支持深度学习和智能挖掘,有效缓解了信息爆炸和信息污染造成的“知识饥饿”和“阅读焦虑”问题。“哲社预印本”是一个快速发布研究成果的园地,为学者提供成果审核、预印发布、开放评阅、荐稿选稿、在线发表、复印转载、全媒体传播、成果转化等全过程服务,有效破解了期刊出版周期长、青年学者发表难的问题。
“哲学社会科学学术文献高质量数据集”有三大特色与创新:一是不同于国内其他主流学术数据库追求的“大而全”,本数据集特别强调“精而专”;二是不同于国内其他主流的学术数据库一般只是对已发表的论文进行资源汇集,本数据集建设的是覆盖“阅读—选题—写作—投稿—发表—评价”全链条的学术创新服务体系,将打破传统“封闭式、小散弱”的学术生产模式,形成“开放式、集约化、数据驱动、智能协同”的学术新生态,催生新的学术数据产业;三是本数据集所收录的都是研究中国问题、贡献中国智慧、体现中国立场,具有“主体性、原创性”的学术文献,是有效支撑自主知识体系建构的数据基石。
接下来,“哲学社会科学学术文献高质量数据集”将根据国家数据局、教育部的要求,加强以数据为中心的学术文献资产管理能力建设,围绕数据“采集—存储—治理—共享”,建立标准化管理流程与集成管理平台;加强以知识为中心的学术文献深度加工与挖掘能力建设,通过知识标引、关联分析与语义挖掘,将原始文献转化为结构化知识资源;加强以智慧为中心的科研赋能与协同创新服务能力建设。以AI技术为驱动,构建全链条智能化学术创新服务体系。
未来,中国人民大学将面向国家重大战略需求,以学术共同体为中心,进一步加强复印报刊资料系列数据库和“学术世界”建设,将“哲学社会科学学术文献高质量数据集”建成中国自主的哲学社会科学基础设施,有力支撑哲学社会科学垂直大模型开发,提升国家文化软实力。
① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。
② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。