A. 数据库的数据检索和 搜索引擎的信息检索的不同点是什么需要解决的核心问题和核心技术有何不同
信息检索不等于搜索引擎。
互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为网民提供了很好的快速信息获取和网络信息导航工具,但是将信息检索等同于使用搜索引擎就陷入了误区。搜索引擎技术中也普遍采用了全文信息检索技术,但互联网信息搜索和企业信息搜索是不同的。
一是数据量。传统信息检索系统一般索引库规模多在GB级,但互联网网页搜索需要处理几千万上亿的网页,搜索引擎的基本策略都是采用检索服务器群集,对大多数企业应用是不合适和不必要的,并不适用于企业应用。
二是内容相关性。信息太多,查准和排序就特别重要,Google等搜索引擎发展了网页链接分析技术,根据互联网上网页被连接次数作为重要性评判的依据。但企业网站内部的网页链接由网站内容采编发布系统决定,其链接次数存在偶然因素,不能作为判别重要性的依据。真正的企业应用的检索要求基于内容的相关性排序,就是说,和检索要求最相关的信息排在检索结果的前面,链接分析技术此种排序基本不起作用。
三是实时性。搜索引擎的索引生成和检索服务是分开的,周期性更新和同步数据,大的搜索引擎的更新周期需要以周乃至月度量;而企业信息检索需要实时反映内外信息变化,搜索引擎系统机制并不能适应企业中动态性数据增长和修改的要求。
四是安全性。互联网搜索引擎都基于文件系统,但企业应用中内容一般均会安全和集中地存放在数据仓库中以保证数据安全和管理的要求。
五是个性化和智能化。由于搜索引擎数据和客户规模的限制,相关反馈、知识检索、知识挖掘等计算密集的智能技术很难应用,而专门针对企业的信息检索应用能在智能化和个性走得更远。
(InformationRetrieval),通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。
目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。
信息检索技术的热点
◆智能检索或知识检索
传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。
◆知识挖掘
目前主要指文本挖掘技术的发展,目的是帮助人们更好的发现、组织、表示信息,提取知识,满足信息检索的高层次需要。知识挖掘包括摘要、分类(聚类)和相似性检索等方面。
自动摘要就是利用计算机自动地从原始文献中提取文摘。在信息检索中,自动摘要有助于用户快速评价检索结果的相关程度,在信息服务中,自动摘要有助于多种形式的内容分发,如发往PDA、手机等。相似性检索技术基于文档内容特征检索与其相似或相关的文档,是实现用户个性化相关反馈的基础,也可用于去重分析。自动分类可基于统计或规则,经过机器学习形成预定义分类树,再根据文档的内容特征将其归类;自动聚类则是根据文档内容的相关程度进行分组归并。自动分类(聚类)在信息组织、导航方面非常有用。
◆异构信息整合检索和全息检索
在信息检索分布化和网络化的趋势下,信息检索系统的开放性和集成性要求越来越高,需要能够检索和整合不同来源和结构的信息,这是异构信息检索技术发展的基点,包括支持各种格式化文件,如TEXT、HTML、XML、RTF、MSOffice、PDF、PS2/PS、MARC、ISO2709等处理和检索;支持多语种信息的检索;支持结构化数据、半结构化数据及非结构化数据的统一处理;和关系数据库检索的无缝集成以及其他开放检索接口的集成等。所谓“全息检索”的概念就是支持一切格式和方式的检索,从目前实践来讲,发展到异构信息整合检索的层面,基于自然语言理解的人机交互以及多媒体信息检索整合等方面尚有待取得进一步突破。
另外,从工程实践角度,综合采用内存和外部存储的多级缓存、分布式群集和负载均衡技术也是信息检索技术发展的重要方面。
随着互联网的普及和电子商务的发展,企业和个人可获取、需处理的信息量呈爆发式增长,而且其中绝大部分都是非结构化和半结构化数据。内容管理的重要性日益凸现,而信息检索作为内容管理的核心支撑技术,随着内容管理的发展和普及,亦将应用到各个领域,成为人们日常工作生活的密切伙伴。
信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。
随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。
搜索引擎工作流程
互联网是一个宝库,搜索引擎是打开宝库的一把钥匙。然而,绝大多数网民在搜索引擎的相关知识及使用技巧上能力不足。国外的一次调查结果显示,约有71%的人对搜索的结果感到不同程度的失望。作为互联网的第二大服务,这种状况应该改变。
互联网的迅速发展,导致了网上信息的爆炸性增长。全球目前的网页超过20亿,每天新增加730万网页。要在如此浩瀚的信息海洋里寻找信息,就像“大海捞针”一样困难。搜索引擎正是为了解决这个“迷航”问题而出现的技术。
搜索引擎的工作包括如下三个过程:
1.在互联中发现、搜集网页信息;
2.对信息进行提取和组织建立索引库;
3.再由检索器根据用户输入的查询关字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
发现、搜集网页信息
需要有高性能的“网络蜘蛛”程序(Spider)去自动地在互联网中搜索信息。一个典型的网络蜘蛛工作的方式,是查看一个页面,并从中找到相关信息, 然后它再从该页面的所有链接中出发,继续寻找相关的信息,以此类推,直至穷尽。网络蜘蛛要求能够快速、全面。网络蜘蛛为实现其快速地浏览整个互联网,通常在技术上采用抢先式多线程技术实现在网上聚集信息。通过抢先式多线程的使用,你能索引一个基于URL链接的Web页面,启动一个新的线程跟随每个新的URL链接,索引一个新的URL起点。当然在服务器上所开的线程也不能无限膨胀,需要在服务器的正常运转和快速收集网页之间找一个平衡点。在算法上各个搜索引擎技术公司可能不尽相同,但目的都是快速浏览Web页和后续过程相配合。目前国内的搜索引擎技术公司中,比如网络公司的网络蜘蛛采用了可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息,并把所 获得的信息保存下来以备建立索引库和用户检索。
索引库的建立
关系到用户能否最迅速地找到最准确、最广泛的信息,同时索引库的建立也必须迅速,对网络蜘蛛抓来的网页信息极快地建立索引,保证信息的及时性。对网页采用基于网页内容分析和基于超链分析相结合的方法进行相关度评价,能够客观地对网页进行排序,从而极大限度地保证搜索出的结果与用户的查询串相一致。新浪搜索引擎对网站数据建立索引的过程中采取了按照关键词在网站标题、网站描述、网站URL等不同位置的出现或网站的质量等级等建立索引库,从而保证搜索出的结果与用户的查询串相一致。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/xdtech/archive/2009/09/22/4579795.aspx
B. 举例说明《中国学术期刊全文数据库》的检索方法和技巧
文献信息检索与利用基本知识介绍
第二届华侨华人文献信息检索与利用讲座讲义(二)
主讲人 覃建宁
一、网上电子资源检索与利用
l 检索方法的使用
1、布尔逻辑检索
所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。
常用的布尔逻辑运算有三种,分别是逻辑或、逻辑与、逻辑非。
逻辑或:运算符为“OR”、“or”、“+”,有时也可以用“|”表示。
检索式A OR B ,表示包含检索词A的文献或包含检索词B的文献或者同时包含A和B的文献均为命中文献。使用逻辑或相当于增加检索主题的同义词与近义词,扩大了检索范围。
例:华侨 OR 华人
逻辑与:运算符为“AND”、“and”、“*”,有时也可能用“&”表示。
检索式A AND B,表示文献中同时包含检索词A和检索词B的文献才是命中文献。使用逻辑与缩小了检索范围,增强了检索的专指性。
例:华侨 AND 马来西亚
逻辑非:运算符为“NOT”、“not”、“-”,有时也可能用“!”表示。
检索式A NOT B,表示包含检索词A同时不包含检索词B的文献为命中文献。逻辑非排除了不希望出现的检索词,增强了检索专指性。但在使用时要特别注意,因为它同时排除了有用的文献。
例:华侨 NOT 马来西亚
上述三种逻辑运算的关系见图3.1。对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。在没有括号的情况下,And、Or、Not的运算次序,在不同的系统中有不同的规定,例如DIALOG系统中依次为Not→And→Or;STAIRS系统和ORBIT系统中依次为And和Not按自然顺序执行,然后执行Or运算。检索时应注意了解各机检系统的规定。
每个搜索引擎可以使用的布尔运算符是不同的,有的只允许使用大写的“AND”、“NOT”、“OR”运算符,有的大小写通用,有的可支持“&”、“|”、“!”符号操作,有的不支持或仅支持其中的一个等等。
例如,Google和"Yahoo!中国"都支持布尔逻辑检索。Google可用"AND"、"and"、"&"进行逻辑"与"运算,但只能用大写"OR"表示逻辑"或",不支持"NOT"逻辑符操作,允许使用"-"符号代替逻辑"非"运算;"Yahoo!中国"可用"AND"、"and"、"&"进行逻辑"与"运算,以"OR"进行逻辑"或"运算,以"NOT"、"not"进行逻辑"非"运算。
确切地知晓每一种搜索引擎的检索功能与特性,无需死记硬背。只要在使用时,查看帮助信息便是了。
2、词组检索
词组检索(phrase),也称为短语检索,或字符串检索。它是将一个词组或短语用双引号“""”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。检索结果必须含有与提问式完全一样 ( 包括次序 ) 的字串。几乎所有的搜索引擎都支持词组检索。
例如,以"侨务新闻"作为提问关键词检索时,检索结果则仅反馈侨务新闻的内容。
3、 位置检索
位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。机检系统中常用的位置算符(按限制强度递增顺序排列)如下:
(1).(f)算符Field:要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如 happiness(f)sadness and crying
(2).(s)算符Sub-field/Sentence:要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如 machine(s)plant
(3).(n)算符near:(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3…),且词序任意。例如 information(n)retrieval 可以检出 information retrieval 和 retrieval information,又如econom ?? ?(2n) recovery 可以检出economic recovery、recovery of the economy 、recovery from economic troubles
(4).(w)算符With:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒。例如 input(w)output可检出input output而wear(1w)materials可检出wear materials、wear of materials
采用位置算符检索时,通常最严谨的算符放在最左面,例如:
european(w)economic(w)community(f)patio,
redwood(3n)deck?(s)(swimming(w)pool?)
注意:不同的机检系统,位置检索的功能及算符不同,应参看机检系统的说明。
4、截词检索
截词检索(Truncation)是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。
截词的方式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度可以分为有限截断和无限截断。
(1).右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。若输入PY=199?,会把90年代的记录全部查出来。
(2).左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。
(3).中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。
(4).复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。
(5).有限截断:是指允许截去有限个字符。例如“acid? ?”表示截去一个字符,它可检出acid、acids,但不能检出acidic、acidicity、acidity等词。又如comput??? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。
(6).无限截断:是指允许截去的字符数量不限,也称开放式截断。上面右截断、左截断所举的例子均属此类型。
由上述可见:任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。另外,不同的机检系统使用的截词符不同、各数据库所支持的截断类型也不同,例如DIALOG系统和STN系统用?、ORBIT系统用:、BRS系统用$、ESA-IRS系统用+等。
5、 字段检索
字段检索(field)是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,多以字段限定方式实现。搜索引擎常用的字段有:Title/t、Subject、Text、host(主机)、URL/u、domain(域名)、link(链接)等。
Title:(或t:)表示查找标题中包含检索提问式的页面;
URL:(或/u:)表示查找URL中包含检索提问式的页面;
Link:表示查找含有链接至URL的页面;
host:表示在指定的服务器上查找页面;
domain:表示查找指定域名的各页面;
subject:表示查找主题中包含检索提问式的页面;
text:表示文本中包含检索提问式的页面。
l 数据库检索的常用方法和技巧
1、数据库常用的检索字段有哪些?
数据库常用的检索字段列表:
西文数据库常用字段 中文数据库常用字段
字段名称 字段代码
Abstract AB 文摘
Author AU 作者
Corporate CS 机构名称
Descriptor/Subject DE 叙词/主题词
Document Type DT 文献类型
Full-text FT 全文
ISSN ISSN 国际标准连续出版物号
Journal Name/Publication Title JN 期刊名称
Keyword/Topic KW 关键词
Langage LA 语言
Publication Year PY 出版年
Title TI 题名
2、如何扩大检索范围?
对检索数量比较少的结果,可以进行扩检,提高查全率。常用措施有:
增加一些检索词,或将查询检索词的上位类词、近义词等补充进去;
调整组配算符,如改AND为OR;
使用截词检索,如改center为cent*;
取消或放宽一些检索限定,如年限、学科、文种等;
增加或修改检索入口,如改题名为文摘或全文等。
3、如何进行缩小检索范围?
检索结果过多是信息检索过程中一个常见问题,从中挑选出相关度高的资料还要花费很长时间。当检索结果过多时可考虑进行缩检,提高查准率。常用措施与扩检相反,如减少一些相关性不强的检索词,增加AND组配算符,增加检索限定,减少检索入口等。
4、数据库比较通用的检索功能主要有哪些?
比较通用的检索功能主要有三种:
简单检索:为用户提供一个简单的检索界面,页面上通常只有一个检索框。
复杂检索:为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细致的检索式,帮助用户进行精确检索。
二次检索:在检索结果内进一步检索,使检索结果更精练、准确。
5、科技文献类型有哪些?如何识别?
科技文献类型主要包括:科技图书、科技期刊、科技报告、专利文献、会议文献、学位论文、标准文献、产品资料、技术档案、政府出版物等。
类型 常用字样
科技图书 Sci-Tech book:Monograph, Anthology, Textbook,Reference book
科技期刊 Sci-Tech Journal:magazine, serial, periodical
科技报告 Sci-Tech Report
专利文献 Patent Document:Patent specification/bulletin/aids
会议文献 Conference paper:Proceedings, compilation, collected paper, records Meeting: workshop, seminar, colloquium, symposium, conference
学位论文 Dissertation, Thesis
6、如何找到与课题相关的文献?
首先应利用本领域的核心数据库。即根据课题内容归纳出中、英文关键词,尽可能检索可以利用的、与课题相关的文献信息数据库,从而获得相关文献;
其次注意通过引文途径进一步获取相关文献。即利用已有文献中的参考文献作为获取新文献的线索,通过检索引文数据库获得更多文献;
有时通过浏览相关学会和研究机构的网站也能得到一些有用的信息。
最后从检索结果中选出最感兴趣的若干篇文献,根据文献的出处设法获取原文。
7、如何识别数据库的学科范围?
一般数据库都有自己特定的学科范围、文献类型。选择数据库时,关键是识别所选数据库中是否收录了所查找学科主题范围内的文献,是否有所需要的文献类型。识别方法:
通过数据库收录的来源期刊的学科范围识别;
通过图书馆网站中资源推介栏目中描述的每种数据库的学科范围来识别;
8、如何选择最适合自己的数据库?
选择数据库时要考虑以下几个因素:
所需信息的水平:广度、深度、专指度、学术性。
文献类型:报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告等。
数据库主题范围:专业数据库还是综合性数据库。
数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆馆藏数据库的印本文献。
另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐合适的数据库。
l 数据库检索策略
所谓检索策略,广义讲是指为实现检索目标而制定的全盘计划和方案;狭义讲是指检索式。检索式是用来表达用户检索提问的逻辑表达式,是检索策略的综合体现,通常由检索词和各种逻辑算符、位置算符及系统规定的其它连接符号构成。
在联机检索中,检索策略直接关系到检索结果的成败,需要对检索课题进行深入的分析并能运用各种检索方法和技巧。
一般来说,构造检索策略通常包括以下步骤:
1. 分析课题。
2. 选择数据库。
3. 分析概念,选择检索词
4. 构造检索式
5. 进行检索
6. 获取全文
以下举例说明这些过程,假设我们要检索华侨华人文献信息专题数据库建设方面的资料,
1.分析课题
现在,我们分析这个课题并描述之,显然,本课题可描述为:华侨华人文献信息专题数据库建设。
另外,在明确了检索课题的主题内容后,还应预期得到什么样的检索结果,是专业文献还是一般性或通俗文章,对文献类型、时间范围及地理范围有无特殊要求等。
显然,课题要求得到有关该主题的专业文献。
2. 选择数据库。
选择数据库时要考虑以下几个因素:
所需信息的水平:广度、深度、专指度、学术性。
文献类型:报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告等。
数据库主题范围:专业数据库还是综合性数据库。
数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆馆藏数据库的印本文献。
另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐合适的数据库。
分析本课题,我们可以选择维普和中国期刊网进行检索。
3.分析概念,选择检索词
一个检索课题往往涉及多个概念,这一步的任务就是将检索课题涉及的所有概念分离出来,并针对每一个概念选择尽可能多的检索词。分析概念可从课题名称入手。如本例中,“华侨华人”、“文献”、“信息”、“数据库”即为概念词。
4.构造检索式
构造检索式需要使用各种检索技术,如根据概念之间的逻辑关系需使用布尔逻辑检索技术,根据词与词之间的位置关系需使用位置检索等,关于信息检索技术的详细内容,详见前述内容。
本例中,我们根据这几个概念词逻辑关系,构造如下检索式:
华人华人*文献*信息*数据库
5.入库检索
进入相关数据库,如维普数据库,输入以上检索策略式
6.获取全文
注意,不同的数据库系统获取全文的方式不完全一致,具体操作请参阅分库使用指南。
l 免费电子报刊、电子图书、电子论文的查找
1、本馆的电子资源
说明:只有校园网用户(包括校园宽带网用户和校园网拨号用户)才能使用本馆的网络数据库;如果设置了代理服务器,请去掉代理服务器后再使用;在网络中心申请的出国代理不影响数据库的使用。本馆数据库都有详细的检索帮助,如有困难,可参看帮助。
u 万方数据库
学位论文全文、数字期刊都有人文科学类,可以查到华侨华人研究的论文和资料。
u PQDD
美国博、硕士论文 1861年至今,可看到前24页全文。
u UMI博士论文全文库
美国博、硕士论文全文 提供PQDD论文全文。时间从1998年起至2003年。 注意:从PQDD中检索到并非都能在此找到全文。
u 中国学术期刊网
期刊全文 要下载安装CAJ浏览器。
u 维普中文期刊全文数据库
要下载安装维普全文浏览器。
u EBSCO
Academic Search Premier:综合类期刊,可检索到华侨华人方面的文章。
u SDOS
期刊全文 包含有社会科学。
u Kluwer
期刊全文 涵盖20多个学科专题,包括生物法律、医学、心理学、物理学、航空航天、哲学、数学、计算机科学、工程、电子工程、材料、地学、社会人文、化学、商业管理等
u 科学在线
期刊全文
数学 物理 天文学 地球科学 化学 材料科学 生物 医学 计算机 环境科学 经济 教育 历史 哲学 心理学 社会科学,(免费期刊)
u 方正Apabi电子图书
图书全文 经济、文学、艺术、数理化、生物、医药卫生、计算机科学
u 书生之家电子图书
u NetLibrary 电子图书
只能在线阅读,不能下载。
2、互联网上的电子资源
u HighWire Press (http://intl.highwire.org)
英文网站,需要出国帐号。
u CALIS高校学位论文库 http://opac.calis.e.cn/
CALIS学位论文数据库以合作建设、资源共享为目的,建立为高校师生提供学位论文和会议论文的查询、文摘索引的浏览、全文提供(传递)等配套服务。
u 毕业论文网 http://www.bylw.com/
免费,不需要注册,有相当数量的论文。
u 论文库 http://www.syiae.com/lunwen/
u 论文帝国 http://www.papersempire.com/
u 168论文网 http://www.168lunwen.com/
u 学生大论文 http://paper.studa.com/
u 无忧论文网 http://www.51lunwen.com/
只提供文摘和目录,想获取全文需要交费。
u 论文资料网 http://www.51paper.net/
只提供文摘和目录,想获取全文需要交费。
u 超星数字图书馆 http://www.ssreader.com/
有超星数字卡即可使用,要下载安装超星图书阅览器。
l 常用搜索引擎简介
1、Google搜索引擎 http://www.google.com/intl/zh-CN/
目前最优秀的支持多语种的搜索引擎之一,也是全球最常用的搜索引擎。约搜索3,083,324,652 张网页。提供网站、图像、新闻组等多种资源的查询。包括35个国家和地区的语言的资源。
2、网络中文搜索引擎 http://www..com
全球最大中文搜索引擎。提供网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、网络搜霸、搜索援助中心。
3、 一搜搜索引擎 http://www.yisou.com/
“一搜”是雅虎中国推出的一个中文搜索网站。目前设立了网页、图片、MP3和网址四个频道。“一搜”采用雅虎花费数十亿美元打造出的搜索技术(YST),用户可以抓取到全球50亿网页(其中3亿个中文网页)、9000万张图片、100多万个免费音乐的海量资料。
4、 中国搜索(原慧聪搜索) http://www.zhongsou.com/
中国搜索拥有全球领先的中文搜索引擎技术,现在已被新浪、搜狐、网易、TOM四大门户,以及1400多家联盟成员网站所采用。每天有数千万次的搜索服务是通过中搜的技术实现的。与一般的搜索引擎相比,中国搜索具有网页覆盖率高、数据更新快、支持中文模糊查询、强大的个性化查询、智能查询、内容相关性分析、便利的专业信息查询等优势,被公认为第三代智能搜索引擎的代表。
5、 新浪分类搜索引擎 http://www.sina.com.cn
互联网上规模最大的中文搜索引擎之一。设大类目录18个,子目1万多个,收录网站20余万。提供网站、中文网页、英文网页、新闻、汉英辞典、软件、沪深行情、游戏等多种资源的查询。
6、 搜狐分类搜索引擎 http://www.sohu.com
搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国影响力最大的分类搜索引擎。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。
7、 网易分类搜索引擎 http://www.netease.com/
网易新一代开放式目录管理系统。拥有近万名义务目录管理员。为广大网民创建了一个拥有超过一万个类目,超过25万条活跃站点信息,日增加新站点信息500~1000条,日访问量超过500万次的专业权威的目录查询体系。
8、 北大天网中英文搜索引擎 http://e.pku.e.cn/
由北京大学开发,简体中文、繁体中文和英文三个版本。提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点)。目前大约收集了100万个WWW页面(国内)和14万篇Newsgroup(新闻组)文章。支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索。
9、 一些常用的英文搜索引擎
MSN Search、AOL Search、Terra Lycos、Altavista、ASK jeeves
二、馆际互借介绍
·石牌六校馆际互借
到本馆办理石牌六校通过阅览证,即可到其他石牌六校中的任何一校的图书馆阅览图书资料。
l 清华大学、国家图书馆的馆际互借
·服务内容
1、 清华大学图书馆
书、刊、会议论文、学位论文、报告、标准等文献的复印件。另清华大学图书馆是国内馆际互借中心,可代用户向国内其他图书馆和国外图书馆申请复印。
2、中国国家图书馆
馆藏中英文图书的借阅及复印,包含如下文献:
u 查询参考工具书:网络全书、工具书、机构名录、外文年鉴。中、英、俄等主要文种的社会及自然科学技术类文摘、索引。
u 国际组织和外国政府出版物:联合国系统、欧洲共同体、经济合作与发展组织及美国政府出版(图书、期刊、文件)。
u 中国学位论文数据库(1990-)(原文只提供纸本复印)
u 中国社科报刊数据库(1993-)
u NTIS美国政府报告(1983-)
u 声像资料
二〇〇四年十月二十八日
C. 常见的数据检索算法有哪些数据库都采用什么样的检索方式如何提高检索的效率
您好,你的问题,我之前好像也遇到过,以下是我原来的解决思路和方法,希望能帮助到你,若有错误,还望见谅!信息检索方法包括:普通法、追溯法和分段法。1、普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。普通法又可分为顺检法和倒检法。2、追溯法是利用已有文献所附的参考文献不断追踪查找的方法,在没有检索工具或检索工具不全时,此法可获得针对性很强的资料,查准率较高,查全率较差。3、分段法是追溯法和普通法的综合,它将两种方法分期、分段交替使用,直至查到所需资料为止。(3)信息检索如何从数据库里比较扩展阅读检索原因信息检索是获取知识的捷径美国普林斯顿大学物理系一个年轻大学生名叫约瀚·菲利普,在图书馆里借阅有关公开资料,仅用四个月时间,就画出一张制造原子弹的设计图。他设计的原子弹,体积小(棒球大小)、重量轻(7.5公斤)、威力大(相当广岛原子弹3/4的威力),造价低(当时仅需两千美元),致使一些国家(法国、巴基斯坦等)纷纷致函美国大使馆,争相购买他的设计拷贝。二十世纪七十年代,美国核专家泰勒收到一份题为《制造核弹的方法》的报告,他被报告精湛的技术设计所吸引,惊叹地说:“至今我看到的报告中,它是最详细、最全面的一份。”但使他更为惊异的是,这份报告竟出于哈佛大学经济专业的青年学生之手,而这个四百多页的技术报告的全部信息来源又都是从图书馆那些极为平常的、完全公开的图书资料中所获得的。参考资料来源:网络——信息检索,非常感谢您的耐心观看,如有帮助请采纳,祝生活愉快!谢谢!