· 您现在的位置: 中国图书馆网 >> 专业论文集 >> 图书馆现代技术 >> 论文正文
文章搜索
谈谈自建期刊篇目数据库关键词的标引
作者:张萌 文章来源:http://www.fslib.com.cn/ 点击数: 更新时间:2006-5-5

    【摘要】  对期刊篇目数据库关键词标引容易出现的标引错误、标引深浅不一、漏标及标引不一致等问题进行了举例分析,并就完善该项工作提出了一些建议。
  【关键词】  关键词 标引 期刊篇目数据库
 
1 问题的提出
  ILASⅡ中的目次管理系统及连续出版物检索功能,对建立馆藏期刊篇目数据库具有重要作用。2000年以来,我馆利用ILASⅡ自建期刊篇目数据库,选择过刊保存的5个大类、101种期刊,一边录入新刊,一边回溯建库,目前已编制上万条数据,并在实际工作中受到读者的欢迎。
  在数据录入、检索系统使用过程中,笔者发现关键词标引并非易事,很容易出现标引不稳定、质量不高的现象,主要表现在标引错误、标引深浅不一、漏标及标引不一致等方面,这直接影响到读者的检索速度和效果。本文就经济类期刊标引中遇到的问题,谈一些看法。
2 对关键词标引不当的举例分析
  我馆选定建库的经济类期刊共54种,其中既有纯理论性期刊,又有实践性强的期刊。读者检索的目的,主要是撰写论文或查找某方面的信息。从实践中看,影响读者检索的标引失误主要有以下几种:
  (1)标引错误。标引错误产生的原因主要有两种:一种是工作人员未能正确理解论文的题意,没有仔细研读原文,致使主题分析错误,标引错误。如《民营企业需要再创新》一文,只看标题,关键词就会标引为“民营企业、发展、创新”;而文章中的“创新”一词实际上是“制度创新”,而非技术创新、管理创新或其它创新,因此应标引为“制度创新”。另一种是工作人员对专有名词不在意,把它随意进行切分、组配,造成语义错误。如《美国政府会计规范及其借鉴》一文,不能标引成“美国政府、会计规范、借鉴”,因为该文中的“政府会计”是个专有名词,不能切分开。该文章应标引为“政府会计、会计规范、借鉴、美国”。
  (2)标引深度不当。不足标引和过细标引分别会产生专指度低和网罗度差的问题,从而影响检索质量。所以要掌握好标引深度,既要防止滥标、重标,又要防止漏标、少标。如《论消费率》一文,如果只标引“消费率”就是不足标引,因为文章的大章节讨论了“政府消费率”及“居民消费率”,所以至少要将这两个关键词都标引出来。
  (3)漏标。工作人员由于对主题分析不全面,往往会使隐含主题提炼不足而造成漏标。笔者曾标引文章《金融衍生产品与中国资本市场的发展》,初看标题,关键词易标引为“金融衍生产品、中国资本市场”,其实文中主要论述了“股票指数期货”这种金融衍生产品在中国的发展构想,因此,“股票指数期货”这一隐含主题也应标引出来。
  (4)标引不一致。由于不同标引者或同一标引者在不同时间内,在主题分析、标引深度、标引方法等方面存在差异,往往会导致同类文献的关键词标引不同。如期刊《企业管理》中有“企业管理方法”这一栏目,该栏目中的企业管理方法多为企业或个人独创的,名称并未普及,也未规范化,如四优管理法、目视控制法、成本推进管理等,如果将这些词作为检索点就显得太单薄,易漏检,因此在标引这些词时,要同时标引“企业管理方法”一词。
3 对改进关键词标引工作的建议
  (1)提高工作人员的素质。首先,工作人员要树立以人为本的观念,一切从读者的需要出发,尽量设想读者可能使用的检索词、检索习惯及检索方法等,并以此作为标引的依据之一。其次,工作人员要认真阅读文章全文,进行内容分析,明确主题意思。要注意专业词汇和隐含主题的标引,切不可只看标题就草草标引。在文章标题不足以表达主题时,应从文摘或正文中抽取适当的词来补充或重新组配增补关键词。
  (2)正确使用上位词。如果较多地使用上位词,会使其专指度降低,检准率差。所以要尽量用最切中的词来标引文章,少用“大词”。在我馆期刊篇目数据库建库初期,因系统检索中关键词不能轮排,为了保证检全率,较多地在第一个关键词上使用了上位类词。这导致使用某些关键词检索所得结果的专指度低,读者需要在所得结果中继续一篇一篇地查找,或者重新组织检索点再检索,浪费了时间。比如输入“企业管理”一词,可查得600多篇相关文献,这对读者而言没有多大作用。因此,要严格控制上位词的使用,只有那些没有确切关键词标引的概念,在对其进行转意标引后,才可标引其上位词。另外,如果概念过于专指,为了提高检全率,也可适当标引上位词。
  (3)正确对待原刊的标引。笔者所标引的期刊中有一部分已进行了关键词标引,但各刊的标引方法与规则不同,随意性很大,标引深浅不一。因此,在尊重原刊标引的前提下(特别是要尊重一些专有名词的标引),可进行补充或删除,甚至改写部分关键词,以保证不同期刊的同类文章标引一致。如《再论美国“赌博资本主义”》(《会计研究》2001年第4期),原刊关键词标引为“新经济、赌博、股票”,但文中“赌博资本主义”是个专有名词,应该标引,而“赌博”一词太不专指,文章讲的是“金融赌博”,所以要改写。修改后的标引应为:新经济、赌博资本主义、金融赌博、股票。
  (4)编制常用关键词表。要认真总结实际标引中的经验,累积相关的关键词,并按类或按拼音、笔画编排成表,以供参考,保证标引前后一致。笔者设想编制的关键词表,是以《中国分类主题词表》的编制结构为框架,分类则以《中国图书馆分类法期刊分类表》为依据,具体类目下的关键词按笔画排列,内容逐年积累,并可不断更新。
  (5)编制同义词表。由于关键词的同义词、近义词较多(如资本市场、证券市场、股市证券、股票市场等都是近义词),可能造成同一主题文献的记录分散,容易漏检。为了解决这个问题,可编制同义词表,即把表达某一主题概念的各种关键词(包括同义词、同义词组、近义词、缩略语、缩略词及简称等)进行归并整理,形成一个语义网络。当读者检索某一概念主题时,为保证检全率,可查看同义词表,以验证其检索结果是否包括了这一检索词的同义词及相关词所涉及的文献,从而提高检全率。
  (6)编制标引详细规则。不同的数据库都有其标引特色,反映在操作中就是要有详细的标引规则,以保证不同人员或同一人员在不同时间标引文献尽量一致。其内容包括标引的深度、标引方法及各种标引原则等。
  (7)控制关键词的数量和词类。关键词的数量,原则上以3~5个为宜。如果文章论述的主题较多,关键词可适当多些;如果论述的主题较少,1~2个也无妨。关键词的词类应以名词为主,动词和形容词在成为名词性词组时,也可作为关键词。关键词虽为自然语言,但还是要注意一定程度的规范性,不宜使用过于口语化的词。如文章《外国人怎么卖水果》,“卖水果”就不宜作为关键词,而应改用“水果销售”。此外,关键词还应使用有检索意义的词,一些通用词,如分析、思考等,一般不宜作为关键词。如《企业家寻租行为及特征分析》、《国有股减持的理性思考》两篇文章,“分析”与“思考”就不宜作为关键词。

参考文献
1 沈传尧.学术论文中的关键词及其选取方法刍议.图书馆杂志,2000(8)
2 张玲.中刊库检索效率及其影响因素比较分析.情报理论与实践,2001(2)
3 方习围.医学文献光盘数据库主题标引规律的探讨.情报理论与实践,2001(2)
4 董毅士.环保期刊关键词标引评析.情报杂志,2000(1)


作者简介:张萌,女,1973年生,馆员。

【论文录入:张昊    责任编辑:张昊 】
姓 名: * Oicq:
评 分: 1分 2分 3分 4分 5分
评论内容:
发表后刷新本页可见评论!
评论内容
热门文章

| 设为首页 | 加入收藏 | 联系站长 | 友情链接 | 版权申明 | 网站公告 |

Copyright © 2005-2006 Chnlib.com. All Rights Reserved
中国图书馆网 管理QQ:578004449
湘ICP备06011990号