文献检索Information Retrieval
彭志勤材料与纺织学院 材料工程系
第三讲 数据和事实信息检索第一节 第二节 第三节 第四节 第五节 概述 数据和事实检索信息源 参考工具书 数据和事实型数据库 数据与事实免费网络检索
一、概述1、数据和事实信息的内容
字、词或代码的含义
例:某一英文缩写或代码的含义 (Corp. 、HLB、FTIR…)
各类数值信息 科学技术数据、社会资源数据、商业经济统 计数据
例:我国丝绸产品的生产消费及进出口情况 2009年杭州市总人口数等
计量单位的换算、运算公式、图谱、表格等百科知识、人物、地理、机构信息等
例:钱学森的主要论著
商情信息、科技、法规信息等
例:上海、深圳股票市场每日变化情况
2、数据和事实信息检索的特点
涉及的学科范围、应用领域广泛 检索方式没有统一模式 直接面向问题回答咨询 对数据可靠性、客观性要求高 是确定性检索,不是文献线索的检索 检索范围主要包括各种数值、公式、事实
如:科技成果、市场动态、统计数据、人物传记、 机构名录
二、 数据和事实信息源
参考工具书 数据和事实型数据库 网络信息资源 视频信息资源 报纸、专业性期刊和检索类刊物
参考工具书
定义
是指把某一范围的知识或资料加以分析、综合或浓缩, 并按一定的方式编排,以备查阅、参考,用以解决事实 和数据方面疑难问题的图书字、词(辞)典、百科全书、年鉴、手册、机构名录和人 名录、指南、图谱和统计资料汇编等
类型
特点
知识面广、汇编性强 信息密集、浓缩性强 便于检索、查考
数据和事实型数据库
数值型数据库
以数值为主要内容,存储 各类数值:如科学技术数据、社会资源数据、 商业经济、地理环境数据 运算公式、图谱、表格:如金融、证券系统数 据库中的货币兑换、化学物质结构数据库、生 物蛋白质序列数据库 直接提供可用的事实,存储 既有数字又有文字的统计资料 纯文字的知识资料或信息:如人物传记数据库、 百科知识数据库、自然及社会资源统计数据库、 公共信息数据库
事实型数据库
网络信息资源
有数据和事实型数据库及以提供数据和事实信息 为主要内容的网站
包含字典、辞典、人名录、地理信息、年表、政府出 版品、工商机构、名录、统计资源、法规资源等信息 --便利实用
以搜索引擎,在网上进行数据与事实信息的检索 某些网站或搜索引擎分析与评估网上资源,对此 类信息资源设置相应的指南
如Yahoo、Sohu网站
视频信息资源
录像带或激光视盘:新产品资料或公司、 企业的介绍宣传 用途:广告、和用户沟通 特点:
声、文、图并茂 动感和立体感强 新型的事实数据型信息源 增长速度快
报纸、专业性期刊和检索类刊物
报纸
对信息的传递时效快 内容新、涉及面广、量大 过于分散、可靠性差 信息源相对较为集中 传递较报纸晚 例:《纺织信息周刊》、《丝绸商情》 信息量大,但时差较长 例:《市场与技术预测综览》(PROMT)-美国
专业性期刊
检索类刊物
三、 参考工具书1、结构及排检方式
结构
序:介绍作者生平介绍或书的内容变更情况。 便于读者了解本书的使用价值 凡例说明:说明收录范围、使用方法。 指导读者如何使用本书 正文:主体部分 索引:引导读者查阅正文 附录:提供与本工具有关或无关的参考资料
排检方式(编排特点和使用方法)
分类方式:按内容性质或学科体系进行分类编排 (手册、百科全书) 字序方式:按音序、形序或号码方式排列 (字、 词典;百科全书) 时空方式:按事情发生发展的时间顺序(时序法) 或地点顺序(地序法)编排正文内容 (大事年表;机构名录;地方志)注:许多参考工具书都有两种或两种以上的排检方法,如先 按学科或专业分类,再按字序或其他方法排列
2、参考工具书举要
词(辞)典(Dictionary) 百科全书(Encyclopedia) 年鉴(Yearbook) 手册(Handbook) 名录(List)
1字、词(辞)典(Dictionary)
定义: 专门解释文字的读音、意义、形体结构及用法的工具书叫字典;专门解释词汇的概念、意义及用法的 工具书叫词(辞典)
分类
按语种分 单语词典 《现代汉语词典》《汉语大词典》 多语词典 《英汉词典》 缩略语词典 按内容分 专业类词典 《英汉纺织工业词汇》 综合类词典 《辞海》《中国百科大辞典》
编排: 按字(音)顺序排列正文内容
外语词典的选用
语言类词典--普通学外语用,例:《新英汉词典》 英汉技术词典(汇)--专业用语、基本结构用语(如某词 后可跟什么词) 专业词典--某词经翻译后觉得不通顺,或用多个含义而无 法确定 疑难词---《Webster’s Third New International Dictionary》、 《The Oxford English Dictionary》
例: Screen “屏幕”,在染色中应为“筛网”; Jacket “上衣”,在电气中为“(电解电容的)外壳”; Fat and Thin Fiber “胖瘦纤维” ,在纺织中应为“粗细纤维” 等
2 百科全书(Encyclopedia)
定义:汇集人类一
切门类知识或某一门类知识的概述性著述。 集工具书之大成,囊括工具书的功能--“工具书之王” “下定义”+“解释”(what, when, where, how, why )
特点:
汇编性、概括性、系统性、检索性、可读性 内容注重“全”“精”“新” 按收录范围分: 综合性 、专业性 按部头大小分:大百科全书(>20卷) 小百科全书( <10卷 )、百科词典 按地域观点分:世界性百科全书、 地域性百科全书、宗教和民族性百科全书
类型:
常用百科全书介绍《中国大百科全书》 《不列颠百科全书》 (Encyclopedia Britannica 简称EB)
《美国百科全书》 (The Encyclopedia Americana 简称EA)《科利尔百科全书》 (Collier’s Encyclopedia 简称EC)
1《中国大百科全书》
我国第一部大型综合性百科全书 1980~1993年出版,按学科分卷,包括66个学科和知识门 类,共74卷,收录了77859个条目,总字数逾1.25亿字,插 图约6万幅 各学科分卷一般由前言、凡例、学科概观性文章、分类目 录、条目正文、索引(条目汉字笔画索引、条目外文索引 (Index of Articles)和内容索引)和附表(大事年表、繁体字 和简化字对照表、外国人名译名对照表)构成 在反映中国特色方面有明显的特征,论述的有关中国的内 容具有充分的权威性;自然科学和工程技术方面的内容所 占的比例达到50%以上,各学科条目的知识深度也较高, 接近于专业性百科全书
使用方法
分类检索:从“条目分类目录”按学科体系, 分类查找 字顺检索:每一卷内容是按条目名称的汉语 拼音顺序排列的,可按汉语拼音字顺,直接 查找正文条目 主题检索:可利用“内容索引”可查找某一 条目、隐含于某一条目中比较重要的内容, 或利用《总索引》查找
2 《不列颠百科全书》 Encyclopedia Britannica
当今世界上声誉最高、最具权威 性的大型综合性百科全书之一, 著名的英文三大百科全书ABC 之B。第一版首创于英国,在我 国习惯称为《大英百科全书》 全书共30卷,33141页,有 106421个条目,24709张插图。 其传统内容侧重人文学科,科技 方面占了全书40%的篇幅
/