四大中文数据库医药卫生期刊的比较分析
作者:李艳超 朱康玲
来源:《河南图书馆学刊》 2013年第6期
李艳超,朱康玲
(安徽医科大学图书馆,安徽合肥230032)
关键词:中文数据库;医学期刊;数据库比较
摘要:文章对中国生物医学文献数据库(简称CBM)、中国知网、维普以及万方数据库的医药卫生资源收录及重复情况进行比较分析,旨在为科技查新及文献检索研究提供参考。
中图分类号:G250文献标识码:A文章编号:1003-1588(2013)06-0096-02
收稿日期:2013-05-06
作者简介:李艳超(1983-),安徽医科大学图书馆馆员;朱康玲(1954-),安徽医科大学图书馆副研究馆员。
目前高校市场上,影响范围最广、利用率最高、占有率达80%以上的中文期刊全文数据库主要有“清华同方中国期刊网(简称CNKI)、万方数据——中国数字化期刊群(简称
万方)和“重庆维普中文科技期刊(简称VIP)”[1]。此外,医药卫生科技查新咨询的必备工具——《中国生物医学文献数据库》(简称CBM)在高校的利用及影响相对较少,该数据库由中国医学科学院医学信息研究所/图书馆开发研制,涵盖资源丰富,收录了1978年以来生物医学期刊以及汇编、会议论文的文献题录530余万篇,能全面快速地反映国内生物医学领域研究的新进展,是国家卫生部门认可的重要检索工具之一[2]。
随着数据库的不断发展,各库的产品和服务渐趋同质化,存在内容重复较大,收录重复率较高等问题,这也引发了广大图书情报工作者的关注和研究。而在所有期刊中论文量及新增量最大的则是医药卫生领域[3],已往有关中文数据库的比较分析,主要是对三大中文全文数据库的对比分析与研究,很少有文章涉及CBM,因此,笔者着重对上述4个中文数据库的医药卫生资源进行统计分析和比较研究。
1四大数据库医药卫生类期刊收录及重复情况比较
1.1四库期刊及核心期刊收录的基本情况
本文数据统计时间为2012年4月,整个研究历时一个半月。选择同一时间节点(2012年5月15日前),确保数据的可比性。采用《中国图书馆分类法》[4]医药卫生类分类标准,以CBM为参考蓝本,将其他三大数据库中存在出入的类目进行适当调整并归入统一类目,使其具有可比性。具体整理方法如下:①刊名变更的期刊进行整理合并计为一种期刊如“国际输血及血液学杂志”(变更前刊名分别为(1980-2005)国外医学输血及血液学分册和(1978-1979)国外医学参考资料输血及血液学分册)。数据库计为3种期刊,而本文统计将其算作为1种。②放置在不同学科下的同一期刊也归为一种期刊。如:CBM将“氨基酸和生物资源”期刊在CBM中分别放在基础医学、生物学及生物化学3个类目下,算做3种,本文将其计为1种。③刊名相近,但刊号相同的也归为一种期刊。
最终,统计结果显示万方收录量相对较少为948种,CNKI与维普分别为1,165种和1,706种,而CBM收录期刊总量最多,共计2,348种,将四库进行整理并去除相同期刊后,四库共计收录期刊总数为2,556种。
剔除同一期刊被各库分放在交叉类目下的数量,由表1可以看出,CBM收录的医药卫生期刊数量与核心期刊数量相对较多。该库收录量较大的期刊主要集中在预防医学、卫生学、中国医学、基础医学、内科学、外科学、综合类医学期刊及大学学报等各类期刊,而临床医学类期刊则是VIP收录量最大。
1.2四库收录期刊的重复情况比较
四库收录期刊虽各有不同,但依然存在较多重复。表2统计结果显示,期刊重复率最高的是CBM与VIP,这两个库重复率为57.4%,期刊重复量多达1,468种;其次是CBM与CNKI重复量为1,022种(重复率为40.0%)。进一步比较发现,三大中文全文库重复量为772种(重复率为34.2%);四库重复率为30.0%。重复率最高的是耳鼻喉科学类期刊,占15.0%;其次为口腔科学类期刊,共计15种,占14.4%。两两比较显示,CBM与CNKI主要在综合类医学期刊、大学学报及中国医学三大类重复期刊数量较多,均大于100种;CBM与万方在大学学报类期刊重复较多为118种;CBM与VIP除肿瘤学重复较少外,在医学类各学科的重复数量均较多。总体来看,在大学学报类四库重复均
较多,这可能与各库对大学学报分类较为明确有关。
2四大数据库各库医药卫生类核心期刊收录状况比较
四大数据库中收录医学核心期刊的数量和收录率的统计是以国内较权威的《中文核心期刊要目总览》(2008年版)[5]认定的核心期刊为参考蓝本,该版共收录医药卫生类核心期刊总数为251种。根据表3统计,各库都没有收录全部的核心期刊,收录情况略有不同。收录量最多的数据库是CBM,期刊数共计243种,其次是万方(241种)和CNKI(236种),收录量最少的是VIP,共计223种。核心期刊重复率则有所不同,两两比较可知,重复率最高的是CBM与万方,重复率高达95.2%;CBM与CNKI、万方重复率分别为93.6%和92.8%,但三大中文全文库在核心期刊收录的重复率上稍低,重复数量为215种(重复率为88.4%);四库重复同上。
3结语
通过对四大中文文献数据库收录医药卫生类期刊的比较分析,可以看出四大数据库之间收录存在着严重的重复问题,但四库之间也相互补充。本次统计主要是基于四大数据库现已归置在医药卫生类下的期刊,由于各数据库对期刊的分类方法不尽相同,致使一部分未归置医药卫生类下的期刊未纳入统计,可能会导致数据存在一定偏差,造成统计并不全面。最终,据笔者统计,四库共收录2,556种期刊,核心期刊为251种,而四库在期刊的收录总量上均未能完全收录。相比较而言,CBM在期刊和核心期刊的收录种类上均较多,分别为2,348种和243种;期刊收录量较少的是万方,为948种;核心期刊收录量最少的是维普,为223种。
由此可见,四大数据库应兼收并蓄、取长补短,尽可能地加强彼此之间的合作,减少重复建设,加大信息资源深层次服务的研究,发挥各自的优势和作用,更好地服务于读者。对于生物医学国内科技查新工作来说,这四大中文文献数据库均需要进行检索,才能较好地保证查全率。CBM以其文献收录量大、回溯时间长、检索功能强,在生物医学文献检索与利用中,占有一定的优势,具有权威性[6]。建议先进行CBM检索,调整并确定最终检索式,再加以三大中文数据库的检索内容,发挥四大数据库各自的数据优势,以提高生物医学文献的查准率和查全率。
参考文献:
[1]谭捷,张李义,饶丽君.中文学术期刊数据库的比较研究[J].图书情报知识,2010(4):6-15.
[2]程艾军.CBM数据库在医药卫生科技项目查新咨询中的应用研究[J].医学信息
学杂志,2011(8):62-64.
[3]杜香莉,梁花侠.CNKI期刊全文数据库O-X类论文分析[J].情报科学,2007(3):390-396.
[4]国家图书馆《中国图书馆分类法》编辑委员会.中国图书馆分类法[M].国家图书馆出版社,2010:379.
[5]《中文核心期刊要目总览》(2008年版).[EB/OL].[2012-05-10].http://210.45.242.3/hxqk2008.htm.
[6]李明生.三种中文期刊数据库收录医学文献的比较研究[J].中华医学图书情报杂志,2005(2):57-59.
(编校:崔萌)
因篇幅问题不能全部显示,请点此查看更多更全内容