文献检索复习资料准确
2023年10月26日发(作者:闲情记趣原文及翻译)
各地高考作文题目出炉-
1.信息、知识、情报
1.1信息。
信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。信息就是事物发出的信息,是事物运动的状态与方式的反映。
1.2情报。
情报是知识或信息经传递并起作用的部分,即运用一定的形式,传递给特定用户,并产生效用的知识或信息。
情报具有三个要素:知识性、传递性、效用(益)性。
1.3知识。
是人类对信息、对客观事物规律的认识,它是人们在社会实践中积累起来的经验。人们对事物由表及里、由现象到本质、由感性到理性的认识深化,便形成了知识。
从信息的观念看,知识来源于信息,是信息内容的组成部分。
简而言之,知识是理性化、优化和系统化了的信息。
特点:传递性、加工性、存储性、时效性。
2.文献
2.1定义。
文献是指用文字、图像、符号、声频、视频等技术手段记录在一切载体材料上的人类知识。我国国家标准《文献著录总则》将文献定义为:记录有知识的一切载体。从这个定义可以看出,知识、载体和1 / 14 记录是构成文献的三个要素。
现代科技文献的特征主要反映在三个方面:
◆数量巨大 ◆分布离散 ◆更新加快
2.2类型。
文献的类型是多样的。
◆按文献的信息内容特征划分有:事实型信息和分析信息;客观信息和主观信息。
◆按文献的媒体形式划分有:书本型资料,也称印刷型:非书资料,包括缩微型、声像型和机读型。
◆按对文献信息内容加工的深浅不同,可将文献划分成四个结构层次:一次文献、二次文献、三次文献和零次文献。
◆按文献的出版形式划分,科技文献方面可以分为:科技图书、科技期刊和特种文献
◆按文献的媒体形式分有:印刷型,缩微型,声像型,机读型
3.三者之间的关系(重点)
世界是物质的,物质运动产生信息;各种信息经过人们系统化的加工处理,便转化成为知识;信息知识经过专门化
的加工处理转化成为情报。信息、知识与情报应用于实践,解决实践中存在的问题,创造出物质财富或精神财富。这时,信息、知识与情报便转化为生产力,同时产生新的信息,新的信息又不断产生新的知识与情报,形成一个无限循环的转化过程。这便说明,信息、知识、情报三者不仅是包含关系,而且可以相互转化。
2 / 14 信息、知识、情报三者既有区别,又有联系,因而我们不仅要看到它们之间的相互区别,更要注意它们之间的相互联系和相互转化。由于信息、知识、情报可以记录、编码、存贮、传递,以致最终形成文献。
信息是事物本质属性的反映 ;即事物发生发出信息;
知识来源于信息,是理性化、优化、系统化了的信息;即信息经人脑加工变为知识;
情报是解决特定问题所需要的特定的知识;
文献是信息、知识、情报的载体。知识被记录在载体上形成文献;文献经过传递、应用于理论与实践产生新的信息。
信息包含知识,知识是信息的一部分,情报包含信息和知识的特征,是活化的知识,能为人们所利用。
逻辑关系:信息>知识>情报,而信息、知识、情报是文献的实质性内容。
4.科技信息及文献检索
4.1概念。
科技信息检索就是应用现代信息检索理论并借助各种检索工具和技术,从浩如烟海的科技信息源中获取所需信息的过程。科技信息检索就是应用现代信息检索理论并借助各种检索工具和技术,从浩如烟海的科技信息源中获取所需信息的过程。
文献信息检索就是查文献信息即以科学的方法利用专门的工具,从大量的文献资料中迅速、准确、完整地查文献资料的过程。
3 / 14 核心:是用户信息需求与文献信息集合的比较和选择,是两者匹配的过程.(通过检索语言匹配)
从广义上讲,信息检索全称应包括信息存贮与检索两方面的含义。
4.2类型
4.2.1按载体形式分
纸张文献。便于阅读和流传。
缩微文献。特点是存贮密度大、体积小,便于保存和传递,但必须借助专门的设备才能阅读。
电子文献。特点是信息存储量大,出版周期短、易更新,传递信息迅速,存取速度快,可以融文本、图像、声音等多媒体信息于一体,信息共享性好、易复制,但必须利用计算机才能阅读。
音像文献。特点是形象、直观。但其制作、阅读需要利用专门设备。
4.2.2按加工层次划分
零次文献。
一次文献。全文。作者以生产与科研工作成果为依据,而创作、撰写形成的文献。如期刊论文、图书等。
二次文献。非全文。是指对一次文献信息进行加工、提炼、浓缩,而形成的工具性文献。检索工具、目录、题录、文摘。如图书馆书目检索系统、搜索引擎、中文社会科学引文索引。
三次文献。工具性。是指对一次文献和二次文献的内容进行综合分析、系统整理、高度浓缩、评述等深加工,而形成的文献。如综述、4 / 14 进展报告、百科全书、年鉴、手册、辞典等。
4.3图书
4.3.1 特点:内容比较系统、全面、成熟、可靠,但传统印刷业图书的出版周期较长,传递信息速度慢,电子图书的出版发行可弥补这一缺陷。
图书识别依据:书名、著者、出版地、出版社、出版时间、总页数、国际标准书号(ISBN)等。
ISBN-国际标准图书编号(International Standard Book Number)
10位数,分四段。
地区或语种号+出版商代号+书名号+校验号。
如:7-158-03423-1;
7——地区或语种号,中国大陆。
158——出版商代号,国防工业出版社。
03423——书名号,流水号。
1——校验码,可辨真伪。
一本书的每一版或其他的变化能够申请到一个新的国际标准书号。一般来说,号码长度为是13码或者10码(在2007年1月1日之前)数字,由4或者5个部分组成:
1.如果13位数字的国际标准书号,一个GS1前导数字:
通常为978或者979。( 2008年国际ISBN中心启用前缀979)
2.出版国家或者语言代码。
3.出版商代码。
5 / 14 4.书所分配到的号码。
5.检查码。
国际标准书号号码由13位数字组成,并以四个连接号或四个空格加以分割,每组数字都有固定的含义。
第一组:978或979( 2008年国际ISBN中心启用前缀979 )
第二组:国家、语言或区位代码(由国际书号中心负责分配)
第三组:出版社代码 由各国家或地区的国际标准书号分配中心,分给各个出版社。
第四组:书序码 该出版物代码,由出版社具体给出。
第五组:校验码 只有一位,从0到9。
4.3.2校验码的计算方法
10位
假设某国际标准书号号码前9位是:7-309-04547;
计算加权和S:由前九位数字依次以10-2加权之和
计算 的余数M:;
计算11 − M 的差N:N = 11 − 6 = 5
如果N = 10,校验码是字母“X”;
如果N = 11,校验码是数字“0”;
如果N为其他数字,校验码是数字N。
所以,本书的校验码是5,故该国际标准书号为 ISBN 7-309-04547-5。
6 / 14 13位
假设某国际标准书号号码前12位是:978-986-181-728;
计算加权和S:用1分别乘ISBN的前12位中的奇数位,用3乘以偶数位
S=(9×1)+(7×3)+(8×1)+(9×3)+(8×1)+(6×3)+(1×1)+(8×3)+(1×1)+(7×3)+(2×1)+(8×3)=164
计算S/10的余数M:M=4=164(mod10)
计算10-M的差N:N=10-4=6
如果N=10,校验码是数字“0”;
如果为其他数字,校验码是数字。;
所以,本书的校验码是6。完整的国际标准书号号码为 ISBN 978-986-181-728-6;
4.3.3书号申请
出版社获得国际标准书号的途径在各地有所不同,或经申请、或经核发。通常由该国的法定图书收藏机构(全国各出版社需在图书出版前缴一份到该机构以编目)申请或发配国际标准书号,例如: 台湾出版的著作须向国家图书馆申请国际标准书号,日本则向国立国会图书馆申请。
中国大陆地区详细出版社名单见中国出版社的国际标准书号代码表
中国出版社的ISBN前缀号,均以ISBN 978-7开头。
4.3.4CIP号
CIP全称是:图书在版编目数据。是由中国版本图书馆数据中心统一7 / 14 发放的数据,规定了图书在版编目数据的内容和选取规则及印刷格式,包括书名、作者、出版社、版本、印张等。即图书在版编目数据(CIP),是我国国家新闻出版总署制定的凡正规出版图书必须申报登记的数据记录。
4.4期刊
我国正式出版的期刊都有国内统一刊号.
地区号+报刊登记号+《中图法》分类号.
地区号依《行政区划编码表GB2260-82》取前两位。
如CN11-2257/G3
11—北京
2257—报刊登记号
G3—中图法分类号
4.5专利文献
发明专利,新型专利, 外观设计专利
复习题。
1.简述你对信息、知识、情报以及文献的理解,它们之间的范畴关系如何。
2.何谓信息素质和信息意识,信息意识有哪些表现形式。
答。信息素养是个人、社会和国家通过鉴别、查、评价、组织和有效利用信息来查询结果或解决手头问题的能力。
它的本质是全球信息化需要人们具备的一种基本能力,涉及到信息的8 / 14 意识、信息的能力和信息的应用。
信息意识是人脑对信息知识价值的认识,是自觉地获取有关信息知识,并加以及时分析与利用的内在动力。信息意识表现为对新知识的敏感力、观察力、判断力与吸收能力,表现为对开发利用信息知识的主动性。
3.什么是科技信息检索?如何理解?
答。信息检索是指信息按一定的方式组织起来,并根据信息用户的需要出有关的信息的过程和技术。文献检索的出现和不断发展,使科学交流从非正式的、无组织的状态逐渐变为正式的、有组织的状态。它使原来的信息流程大大简单化了,通道的容量也大扩充了,科学交流也显得更加便利和完善了。科学交流方式的这种演变是社会发展进步的一种表现。
4.学习科技信息检索的重要意义有那些?
答。从狭义上讲,在茫茫信息海洋中快速获取对自己有价值的信息主要取决于两个因素,一是了解掌握现有的信息源,即到什么地方去自己需要的信息;二是用什么方法,即如何获得信息。从广义上讲,信息获取的速度,获取知识的全面性和准确性,还取决于对本专业知识的了解和掌握情况,取决于对信息的表述语言(常常是某一种外语,如英语、日语)的掌握情况。①促进信息资源的开发和利用;②协助管理者做出正确的决策;③便于继承和借鉴前人成果,避免重复研究走弯路; ④节省查文献的时间;⑤促进专业学习。
5.科技信息都有哪些类型?分别按载体形式、加工层次和出版形式划9 / 14 分。 (见上)
6.你对信息资源的含义是如何理解的?其特点如何?
答。人类经济社会活动中积累起来的以信息为核心的各类信息活动要素(信息生产者、信息技术等)的集合。特点:可再生性:指它不同于一次性消耗资源,它可以反复利用而不失去其价值,对它的开发利用愈深入,它不仅不会枯竭,反而还会更加的丰富和充实。可共享性:指它能为全人类所分享而不失去其信息量。
7.何谓一次文献?二次文献?三次文献?它们之间有何区别?
答。一次文献:全文。作者以生产与科研工作成果为依据,而创作、撰写形成的文献。如期刊论文、图书等。
二次文献:非全文。是指对一次文献信息进行加工、提炼、浓缩,而形成的工具性文献。检索工具、目录、题录、文摘。如图书馆书目检索系统、搜索引擎、中文社会科学引文索引。
三次文献:工具性。是指对一次文献和二次文献的内容进行综合分析、系统整理、高度浓缩、评述等深加工,而形成的文献。如综述、进展报告、百科全书、年鉴、手册、辞典等。
区别:一次文献也称原始文献,是指人们根据自己的科学实验、生产实践的成果而撰写的文献,一般指期刊论文、科技报告、会议论文、学位论文、专利等.二次文献也称检索工具,是指对一次信息加工、整理后形成的各种检索工具,如目录、题录、文摘等,它不对一次信息提供评论,仅仅提供一次文献的检索线索.三次文献是指在利用大量一次文献的基础上,对其内容进行综合、分析、研究和述评而撰写出来10 / 14 的文献.分为综述研究类和参考工具类两种类型.一次文献、二次文献、三次文献之间的关系:从一次文献到二次文献、三次文献就是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走向有序、由一种有序结构演变为另一种完善的有序结构的过程.
8.简述信息检索的原理。
答。指通过一定的方法和手段使其存贮与检索两个过程所采用的特征标识达到一致,以便有效地获得和利用文献。
也就是将特定的信息需求与检索体系中的信息线索进行有无、异同及大小的比较与匹配,选取两者相符或部分相符的信息予以输出。无论手工检索还是计算机检索其基本原理都是一样的。
9.构成计算机检索提问式的基本要素是什么?
答。检索词、逻辑算符、位置算符、优先算符及截词符
10.了解布尔逻辑检索 (Boolean Logical)、截词检索 (Truncation)、位置检索 (Proximate)和限制检索(Range)在计算机检索中的作用以及用法。
答。布尔逻辑检索(Boolean Logical)是用布尔逻辑运算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。逻辑算符主要有:And/与、Or/或、Not/非;截词检索(Truncation)是指用给定的词干做检索词,查含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。它可以起11 / 14 到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。对于外文来讲,检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。位置检索为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。全文检索的运算方式,不同的检索系统有不同的规定,主要差别有两点:规定的位置算符不同,位置算符的职能和使用范围不同。限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等
11.了解信息检索的检索策略。
答。①检索课题分析,即主题分析,以明确课题所包含的概念成份及其相互关系;②选择检索手段:一般来说利用光盘检索系统,结合检索相应的网络数据库能满足多数检索要求;没有机检条件时则选用手工检索。如果光盘检索能满足要求,则不必选用其它检索手段;③选择检索系统:选择合适的检索系统主要是选择检索工具/数据库,要根据检索课题的内容范围和要求来决定。要了解检索工具/数据库的学科专业范围及各种性能参数;④确定检索途径和检索词:检索途径主要根据分析课题时确定的已知条件,以及所选定的检索工具能够提供的检索途径来决定。检索词也称检索点是检索的出发点,以前常用"检索途径"这一术语。与检索途径相对应,是检索途径的具体化;⑤构造检索式:检索式是机检中用来表达检索提问的一种逻辑运算式,又称检索表达式或检索提问式。它由检索词和检索系统允许使用的各12 / 14 种运算符组合而成,是检索策略的具体体现。
12.信息检索的效果如何评价?影响查全率和查准率的因素有哪些?
答。有6项评价检索效果的指标,它们由克兰弗登在分析用户基本要求的基础上提出的,包括:收录范围、查全率、查准率、响应时间、用户负担及输出形式。其中两个主要的衡量指标是查全率(Recall
ratio)和查准率(precision ratio),分别用R 和P大写字母表示。判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。
质量标准主要通过查全率与查准率进行评价。 查全率和查准率是判定检索效果的主要标准 。查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。影响查全率的因素从文献存储来看,主要有:①文献库收录文献不全;②索引词汇缺乏控制和专指性;③词表结构不完整;④词间关系模糊或不正确;⑤标引不详;⑥标引前后不一致;⑦标引人员遗漏了原文的重要概念或用词不当等。另外,从情报检索来看,主要有:①检索策略过于简单;②选词和进行逻辑组配不当;③检索途径和方法太少;④检索人员业务不熟练和缺乏耐心;⑤检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。影响查准率的因素主要有:①索引词不能准确描述文献主题和检索要求;
组配规则不严密;②选词及词间关系不正确;③标引过于详尽;④组配错误。
13.什么是查全率?查准率?它们之间的关系如何?
13 / 14 查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。查全率 = [ 检出相关文献量 / 文献库内相关文献总量 ] × 100%
查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。查准率 = [ 检出相关文献量 / 检出文献总量 ] ×
100%
14.计算ISBN为 978-7-5474-1447的校验码为多少?
答。假设某国际标准书号号码前12位是:978-986-181-728;
计算加权和S:用1分别乘ISBN的前12位中的奇数位,用3乘以偶数位 S=(9×1)+(7×3)+(8×1)+(9×3)+(8×1)+(6×3)+(1×1)+(8×3)+(1×1)+(7×3)+(2×1)+(8×3)=164
计算S/10的余数M:M=4=164(mod10)
计算10-M的差N:N=10-4=6
如果N=10,校验码是数字“0”;
如果为其他数字,校验码是数字。;
所以,本书的校验码是6。完整的国际标准书号号码为 ISBN 978-986-181-728-6;
15.查全率、查准率的计算要会。
14 / 14