人人范文网 范文大全

中国文献信息资源与检索利用

发布时间:2020-03-02 15:36:36 来源:范文大全 收藏本文 下载本文 手机版

第一章 概说

重点一:九大类型工具书  字典词典  类书政书  书目索引文摘  年鉴手册  百科全书  图录表谱  名录  丛集会要

重点二:工具书的排检方式(四角号码) 重点三:选择纸板,电子工具书的原则 重点四:电子版工具书优势 重点五:电子版工具书的检索功能: 1 检索词:字段词和任意词

字段词:以数值型数据库,事实性数据库和书目数据库出现的电子版检索工具,检索词是字段词,因为这类数据库史记上是关系数据库,数据库中存贮的大量记录是通过字段来描述和解释其内容特征和形态特征,如题名字段,著者字段,主题字段,摘要字段,时间字段,语种字段等。

任意词:以全文数据库出现的电子版检索工具,检索词可以使源文献中任何具有实际意义的语词,也就是通常所说的

“任意词”——自然语言系统中任意的字词,短语,短句。这是因为全文数据库的数据源是全文的,数据技术采用了类似于印刷版工具书中语词索引的方法,对源文献中所有具有实际意义的语词进行了标引,并利用字符串检索,逻辑检索,截词检索,位置检索等现代检索技术对标引词进行了处理,因此标引的对象是全文。

“循环衍生法”可以对检索词进行遴选:1 定义衍生法 2 语素衍生法 3 语境衍生法 2 二次检索

二次检索又称再次检索,是在已有的检索结果中的进一步检索。利用这种功能,可以有效地淘汰冗杂检索结果,使检索效率最大化。 3 高级检索

高级检索也称复杂检索。现有的中文电子版检索工具一般都设有高级检索功能。较多地使用的检索技术是布尔逻辑检索,截词检索和位置检索,体现出的检索特点是组配检索,模糊检索和限定检索。 1)布尔逻辑检索

从理论上说,它是利用布尔逻辑原理,利用概念组配的方法形成表达式,进行文献信息的选择性检索。具体说,他利用布尔逻辑检索符(逻辑“与and”,逻辑“或or”,逻辑“非not”)连接检索词,形成逻辑表达式,计算机按照表达式的

指令进行逻辑运算,见所处数据库中与表达式要求相符的文献信息。

3个布尔逻辑运算符的含义是:

逻辑“与”and符号表示为“*”。以逻辑“与”连接的检索词是“同时包含”关系

逻辑“或”or符号表示为“+”。以逻辑“或”连接的检索词是“分别包含”关系

逻辑“非”not符号表示为“-”。以逻辑“非”连接的检索词是“排除其他:关系

布尔逻辑检索的突出特点是可以进行不同检索条件的组配检索,从而有效地扩展或缩小检索范围,优化检索结果。这种检索技术比较符合人们建立在思维习惯基础上的文献信息现实需求,因此它在计算机检索系统中得到了广泛应用,也是体现计算机检索优势重要方面之一。不过,也应该明确,布尔逻辑检索实际上是建立在概念组配基础上的,而概念与文献信息的内容往往有距离,同时,概念之间不仅有区别,也往往有联系,所以布尔逻辑检索中的“与”“或”“非”界定,有时也与文献信息的实际状况有距离。 2)截词检索

截词检索是利用检索词的词干或不完整词形进行检索的方法。在现有的中文电子版检索工具中,截词的形式主要有两种:

A 任意截断 在词的任意位置截断。其中“前截断”的检索结果是“后方一致”,“后截断”的检索结果是“前方一致”,“前后截断”的检索结果是“任意一致”

B 嵌入截断 在检索词中嵌入截断符号。符号所代表的汉字的数量是规定的,但表达的意义是随意的。

截词检索的最大有点是使模糊检索成为可能。当对检索对象的了解不是很确切的时候,它能帮助我们有效地集中相关文献信息。同时它还可以减少检索词的输入量,简化检索步骤,扩大检索范围,从而提高查全率。 C 位置检索

位置检索主要运用于全文数据库。它是一种对多个检索词在源文献中相对文职进行限定性查找的方式。

位置检索的有点是为查找相关概念在局部环境中的同现情况提供方便,而相关概念的同现,往往意味着文献信息内容的相关,所以,位置检索同样是提高查全率和查准率的有效方法之一。

第二章 辞书资源与汉语字词的查考 重点一:辞书的基本了解 辞书是字典和词典的统称

字典是主要用来解释汉字形,音,义的工具书;词典是主要用来解释词语的意义,概念,用法的工具书。 重点二:中国古代代表性的字书

 中国最早的字典是周宣王是的史官曾编撰的《史籀篇》 

西汉元帝时,黄门令史游作《急就篇》,是我国现存最早的用于教授学童识字的字书

 《尔雅》是中国最早的以训释词义为主要内容的训诂书,被称为中国最早的词典

西汉杨雄编撰的《方言》(全称《輶轩使者绝代语释别国方言》),是我国历史上第一部具有方言词典性质的汉语比较方言词汇集。

东汉中期许慎《说文解字》是我国历史上第一部系统地分析字形,解释字义的字书,代表了当时字书编撰的最高水平。首创的按照部首归并集中汉字的字书编撰方法对中国字典,词典编撰所产生的深远影响。

 三国时期,我国历史上最早的韵书——李登编撰的《声类》  明代《字汇》和《正字通》为古代字书编撰法的定型奠定了基础。

 《康熙字典》是中国历史上第一部明确以“字典”命名的字书,中国传统学术文化总结时期出现的最具代表性的古代字书。

重点三:中国辞书的结构体例与编撰传统 ★ 字典,词典的书证和例证

引自书面文献的例证,一般称为“书证”;影子当代口头通行证的例证,直接称为“例证”或者“例句”

首先,大型历史性语文字典词典的举证,不采用例证,只采用书证。描写性字典,词典可以采用例证

其次,引用书证必须详注出处。出处一般包括作者,书名,篇目或卷次

第三,统一义项引用多条书证,以时代先后排列顺序。 第四,书证引自“始见书”。 ★ 字典中的注音方式

大型历史性语文字典,词典的注音,不仅标注汉字的现代读音,还标注古代读音。古代读音有上古音和中古音之分。 上古音指以《诗经》音为代表的先秦两汉时期的汉语语音系统,中古音是指以《切韵》为代表的隋唐时期的汉语语音系统。

标注古音的项目,较为齐全的包括反切,声调,韵部,声纽;也有的简化标注反切和韵部。

反切是中国古代给汉字注音的一种方法。它用两个汉字拼合另外一个汉字的读音。拼合的原理是:反切上字与被切字的声母相同,反切下字与切字的韵母和声调相同。拼合时,取反切上字的声母,取反切下字的韵母和声调,把它们拼合起来,便是反切字的读音。

声调也称字调,是整个音节额音高。古代的声调分为平,上,去,入四种

韵部是古代韵书中对同韵汉字的归并。凡同韵的汉字归并为

一类,称为一个韵部。每一个韵部都用一个汉字来代表,这个代表字称为韵目。

声纽是声母的别名,简称“声”,“纽”,又称“音纽”。古人认为一个字的读音,声母处于关键,枢纽的地位,故名。声母的代表字称为字母。声母有时也称为声类。 重点四 代表性中国辞书 新华字典 现代汉语词典 古汉语常用字字典 辞典 辞源 汉语大字典 康熙字典 说文解字

第三章 古籍资源与基本古籍的查考 重点一:正史查找线索

重点二:基本古籍资源

 “十三经”:中国古代集中代表儒家思想的十三部经典著作

 “二十六史”:中国古代最为著名的纪传体史书,古代历史著作的典型代表

 《诸子集成》汇集诸子著作的大型丛书  古籍丛书,类书,证书,方志 重点三:查找古籍的代表性目录

汉书·艺文志 是汉书中记载当时国家图书典藏情况的专门篇章。它是根据刘向父子《七略》编成的

隋书·经籍志 是《隋书》中记载当时国家图书典藏情况的专门篇章。《经籍志》部分由著名学者魏徵编撰,在唐太宗贞观三年至十年(公元629年——636年)成书。

四库全书总目 是清代乾隆年间编修《四库全书》的连带产品,基本上包括了清乾隆以前我国重要的古籍,特别是元代以前的书籍更完备。领衔者是乾隆皇帝的六子永王容,实际主持编撰工作的是纪昀。

续修四库全书总目提要 1931-1945年间以日本人主持的“东方文化事业委员会”设立的“北平人文科学研究所”名义编撰的,提要稿全部由中国学者编写,内容上包括了对《四库全书总目》的“续”和“补”。续,是续编清代乾隆年间以后到20世纪30年代新出的图书;补,是补充乾隆年间以前《四库全书总目》失收或虽然收录但篡改删削严重,版本不佳者。

贩书偶记 部主要收录清代著作的目录兼收少量明代小说和辛亥革命至抗战前有关中国古代文化的著作。孙殿起编,原则:

1、凡见于《四库全书总目》者概不收录,录

者必卷数不同的;

2、非单刻本不录,间有在丛书者,必系初刻的单行本或抽印本

贩书偶记续录 雷梦水著,1980年出版,共收录6000余种清代图书,是《贩书偶记》是补充

古籍整理图书目录 录1949年10月-1991年12月国内出版的文、史、哲、书画艺术、医农、科技等方面的古籍图书,还包括一部分翻译成汉文的少数民族古籍。 重点四:电子版古籍查找(基本古籍检索系统,四库全书) ★基本古籍检索系统 “十三经”

我们台湾地区“中央研究院”开发的“汉籍电子文献翰典全文检索系统”加载的“十三经”,是有代表性的网络版“十三经”全文检索系统之一 “二十五史”

“二十五史”是《新元史》和“二十四史”的合称 南开大学组合数学研究中心和天津永川软件技术有限公司开发的“二十五史全文阅读检索系统”是具有代表性的“二十五史”全文检索系统。它所指的“二十五史”是指“二十四史”加《清史稿》。两个功能:1 全文阅读 2 全文检索 我们台湾地区“中央研究院”开发的“汉籍电子文献翰典全文检索系统”加载的“二十五史” 《四库全书》

上海人民出版社和香港迪志文化出版公司联合推出的文渊阁《四库全书》电子版 ★《四库全书》电子版

《四库全书》是中国古代规模最大的丛书。

上海人民出版社和香港迪志文化出版公司联合推出的文渊阁《四库全书》电子版

该电子版分为“原文及标题检索版”(简称“标题版”)和“原文及全文检索版”(简称“全文版”)两种版本。全文版的主体是《四库全书》全文文本数据库和原文图像数据。它所具有的功能主要是:

1)基本检索 包括全文检索,分类检索,书名检索,著者检索四种方式。其中,分类检索按照《四库全书》的分类体系逐级递进,递进层次为:部→类→属→书→卷(或篇目)→原文;书名检索和著者检索均支持模糊检索,即命中对象是包含了检索词的任意一致;全文检索以原文或者注释中的任意字词,字符串作为检索词。

2) 高级检索 这是两个检索条件的逻辑组配检索,逻辑关系包括“与”,“或”,“非”。不论是全文检索还是高级检索,检索词的输入都设计了“辅助输入”功能和“汉字关联”功能。

3)全文文本与全文图像的切换。古籍的“保真”和“整理”存在着矛盾。保真拒绝整理,整理难以保真。但保真的古籍

和整理的古籍各有适用的对象。因此,理想的状态应是“保真原则”和“整理原则”相结合。

文渊阁《四库全书》电子版在这方面作了有益的尝试。它采用了扫描技术输入原文,通过OCR技术自动进行原文图像的编码字符转换,从而使它既保留了完全保真的图像数据,又形成了可以实现检索的文本数据。两个文本可以进行切换,以便于比勘对照。

提供原文图像,满足了古籍研究中版本鉴定,文物鉴赏,书史研究,文字校勘,原件对照等特殊需要。更重要的意义在于,文本版与图像版的结合,凸显了数字化古籍可以兼顾“文物存贮”和“资料应用”两种功能的优势,时古籍整理“保真”和“整理”相结合的原则在电子版阶段真正变成了现实。 4)辅助工具和研究支持功能 文渊阁《四库全书》电子版加载了一些对研究工作 具有支持功能的辅助工具。包括:资料管理员,单字字义查询,写字板,古今纪年换算,干支/公元年换算,八卦·六十四卦表,实时标点断句,实时字义查考,实时添加笔记。

重点五:古籍丛书的查找《中国丛书综录》。 1)结构

上海图书馆编,中华书局1959-1962年出版,上海古籍出版社1982年新一版。共分三册。

第一册 《总目》,分“汇编”、“类编”两部分。“汇编”分杂篡、辑佚、郡邑、氏族、独撰五类,主要是四部各类兼容的丛书,具有综合性质。“类编”收经、史、子、集四类。书后有

1、“全国主要图书馆收藏情况表”,反映了国内41所图书馆收藏古籍丛书的情况,

2、“丛书书名索引”

3、字头笔画检字。本册可按类及丛书名两种途径检索某部丛书包含哪些古籍及其收藏情况

第二册是“子目”,即以丛书所汇集的单种古籍为著录对象的子目分类目录。

第三册是“索引”,即第二册“子目”的索引,包括“子目书名索引”和“子目著者索引”两部分。 2)使用方法

重点六:中国古代代表性类书

艺文类聚:唐·欧阳询等编 成书于唐高祖武德七年(公元624年),是现存最早的类书

初学记 唐·徐坚等编。该书转为皇子临文作诗时查考事类典故、词藻对语而编,故名。

太平御览 宋·李昉等编,成书于宋太平兴国八年(公元984年)初名《太平编类》。综合性类书中,最具代表性。 事物纪原 宋代出现的一部专门用来考订事物起源和流变的小型类书

永乐大典 明代编撰的,我国历史上规模最大的一部类书。明永乐元年(公元1403年)开始编撰,主持其事者有解缙,胡广,胡俨,杨士奇等

三才图会 明代颇具特色的类书。该书由王土斤,王思义父子编撰。图文并茂“图谱之学”

古今图书集成 清康熙四十年(公元1701年)在陈梦龙主持下开始编撰,五年后初稿完成,初名为《汇编》是现存中国古代累书中规模最大,汇集资料最丰富的一部。 古今图书集成索引 林仲湘编

佩文韵府 清·张廷玉等编,清康熙五十年(公元1711年)成书

骈字类编 清·张廷玉等编

第四章近代以来的图书资源与查考 重点一:古代图书装订形式 重点二:书目检索工具 1)图书馆联机书目检索系统

多字段或多条件组配检索,模糊检索,检索范围或条件的限定,再次检索等功能,在联机书目检索系统中都可以实现 国家图书馆的“联机公共目录查询系统”:简单检索,多字段检索,多库检索,高级检索。 2)中国高等教育文献保证系统

简称CALIS,是我国高等教育“211工程”的子项目之一,

目标是建设以中国高等教育数字图书馆为核心的教育文献联合保障系统,实现文献信息资源的共建、共知、共享。 重点二:总结性书目

民时期总书目由北京图书馆编,书目文献出版社1986年-1997年陆续出版。它以北京图书馆、上海图书馆、重庆图书馆的馆藏为基础编撰,收录了1911年至1949年9月间中国出版的中文图书124000余种,基本反映了民国时期出版的图书全貌。(国家图书馆开发民国时期中文图书书目数据库)

中国国家书目由北京图书馆《中国国家书目》编委会主编,《中国国家书目》编辑组编辑。该书目不但收录我国大陆出版的文献,而且还收录台湾、香港、澳门出版的文献和中国与其它国家共同出版的文献。其具体收录的文献类型和范围包括图书、连续出版物、地图、技术标准、博士论文、书刊索引、少数民族语言文献、盲文文献等。因此,它是目前我国收录文献最全的书目,是图书馆必备的一种采选文献的参考工具。(中国国家书名数据库) 重点三:电子图书系统 1)方正Apabi数字图书馆

所容纳的资源,采用与出版社合作的方式,提供获得著作者直接授权的电子新书 2)超新数字图书馆

国内开发较早,目前拥有电子图书资源数量最多的数字图书馆系统。优势:在资源的规模上。依托国内大中型图书馆提供纸质图书进行数字化加工制作,同时征集作者授权。不仅容纳了电子图书,还有一个规模较大的论文资源数据库。

书生之家数字图书馆 电子新书涉及的学科范围比较广泛,但在内容上,目前以人文科学图书为多。

中国数字图书馆 首先依托国家图书馆的文献资源进行数字转化,内容覆盖齐全,覆盖经济,文学,计算机技术,历史,医药卫生等22个门类。据称已拥有20万册电子图书,是目前我国规模较大的中文电子图书系统之一。其次,是基于国家图书馆丰富的馆藏资源,经过整合,形成一系列有特色的专题资源库,如,WTO专题,法律法规,百年敦煌等。 主要检索功能:

1) 分类检索 分类浏览,选择系统中包含的电子图书 2) 字段词检索 以基本书目信息作为字段词进行检索,如书名,作者,出版社等

3) 高级检索 目前中文电子图书系统中的高级检索,都是多个书目字段的逻辑组配检索,有的还可以附加出版时间的限制

4) 目次检索 指在系统中检索图书时,给定检索词

后,命中对象不仅仅在书名层次而且深入到目次层次

5) 全文检索 中文电子图书检索系统在书目检索层面上真正具有全文检索功能的不多,具有代表性的是书生之家

重点四: 中国大百科全书 百科全书特点

简单地概括就是概述知识条目化,条目编排词典化。 条目化:

百科全书的内容是对知识体系中的知识点进行总结性概述

概述知识的基本单元是条目。(条目应是独立的概念或者完整的知识主题;条目必须具有检索意义) 编排词典化:

条目按标题的子目顺序排列 有完备的参见系统 有完备的检索系统

第五章 报刊资源与论文资料的查考 代表性检索系统特点

中国期刊全文数据库(CJFD) 中文科技期刊全文数据库

CGRS全文检索数据库 万方数据资源系统

中国学术会议论文全文数据库(PACC) 全国报刊索引数据库

第六章 时事信息资源与事实、数据、法规的查考 重点一:时事资源信息的检索途径

手册,年鉴,统计集,资料汇编,法律汇编 政府网站,统计网站,经济网站 重点二 国内比较有影响的经济网站 国务院发展研究院(国研网) 中国宏观经济信息网(中宏网) 中国经济信息网(中经网) 数据中华

重点三 叙述我国年鉴资源的类型及特点 特点

整体构成容纳了多种类型的工具书要素,内容体系多元互补,集知识,信息,数据,资料于一身 逐年编辑,连续出版

以栏目作为容纳内容的基本单元,以条目作为表现 内容的主要手段 使用角度分类:

政府年鉴,行业年鉴,学科年鉴,统计年鉴,百科全书年

重点四 当代法律资源的分布情况

大众传播媒介,年鉴、手册等专门工具书,法规汇编,网络检索系统,光盘数据库 重点五 主要法律网络检索系统

中国法律检索系统、中国法律法规信息系统、中国法律资源网·法律数据库检索、国信中国法律网、中华法规网、人民网·法律在线、法律图书馆·新法规在线、CGRS全文检索系统·法律资源数据库、中国资讯行·中国法律法规库

文献信息资源的检索与利用心得体会

文献信息资源的检索与利用课程心得体会

《信息资源检索与利用》作业

《网络信息资源检索与利用》复习资料

信息资源检索与利用电子教案

一次作业——信息资源检索与利用

观看文献信息资源检索与利用流媒体的心得体会[版]

文献信息检索与利用

网络信息资源的检索与利用实验报告

第六章 文献信息检索与利用

中国文献信息资源与检索利用
《中国文献信息资源与检索利用.doc》
将本文的Word文档下载到电脑,方便编辑。
推荐度:
点击下载文档
点击下载本文文档