如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
1第三章检索原理和搜索引擎本章内容第一节信息检索原理1、从“图灵实验”说起2、计算机检索的奥妙:关键词匹配3、信息存储与检索存储4、信息检索原理What?Where?How?6、“关键词原则”是信息检索的根本原则7、信息检索类型8、主要计算机检索系统类型第二节搜索引擎的原理和发展概况1、网络信息资源种类2、网络信息资源的特点搜索引擎SearchEngineInternet网络信息检索工具4、搜索引擎的发展历史4、搜索引擎发展历史搜索引擎的起源——Archie1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和DavidFilo共同创办了Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。Yahoo!---几乎成为20世纪90年代的因特网的代名词。第三代搜索:网页搜索5、搜索引擎的工作原理搜索引擎至少由三部分组成:爬行器(即机器人、蜘蛛等搜索程序)索引生成器(即网页索引数据库)查询检索器(即用户检索界面)随着搜索引擎的发展,许多搜索引擎在此基础上增加特色功能。如百度增加了监控程序。26搜索引擎的工作原理就像超市28第三节两类搜索引擎及网页搜索引擎两类搜索引擎的代表第一类搜索引擎:网页搜索引擎以谷歌和百度为代表1、Google搜索引擎Google简介:Google简介:35Google检索功能介绍1逻辑与功能逻辑非功能逻辑或功能指定网域指定文件类型Google检索功能介绍2高级搜索界面示例1:限定区域人类白血病的干细胞移植治疗(非动物实验,一定要包括儿童)Google检索功能介绍3Google检索功能介绍4强制搜索“”、“-”、“\”、“+”、“=”、“,”“'”想一想Google学术搜索scholar.google.cn学术搜索高级检索示例5.Google学术查找文献Google更多服务Google更多服务Google更多服务Google更多服务Google更多服务Google退出中国2、百度(baidu)http://www.baidu.com一、概况百度(Baidu.com,Inc)于1999年底成立于美国硅谷,2000年,落户中国。2001年8月,发布Baidu.com搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式。2001年10月22日正式发布Baidu搜索引擎。2005年8月5日,百度在美国纳斯达克上市。“百度”二字取自辛弃疾的《青玉案》“众里寻她千百度”。现在百度已成为世界上最大的中文搜索引擎。用户能够访问超过6亿的中文网页,5000多万张图片、500多万首中文mp3及各种格式的音乐。百度VSGoogle关于搜索的一些思想用搜索引擎查英文一次文献2.如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google里搜索,用作者的名字来搜索,是因为我发现很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(homepage)上,这样可能也是为了让别的研究者更加了解自己的学术领域,顺便推销自己吧。这样你就有可能下到你想要的文献的全文了。甚至可以下到那个作者相近的内容的其它文章。如果文献是由多个作者写的,第一作者查不到个人主页,就按上面的方法查第二作者,以此类推。用文章的title来搜索,是因为在国外有的网站上,例如有的国外大学的图书馆可能会把本校一年或近几年的学术成果的Publication的PDF全文献挂在网上,或者在这个大学的ftp上也有可能会有这样类似的全文.这样就很可能会免费下到你想要的全文了.3.如果上面两个方法都没有查到你要的文献,那你就直接写邮件向作者要。一般情况下作者都喜欢把自己的文献给别人,因为他把这些文献给别人,也相当于在传播他自己的学术思想。一般讲英语的国家的作者给文章的机率会大,一般你要就会给,其它不讲英语的国家,如德国,法国,日本等国家的作者可能不会给。出于礼貌,如果你要的文献作者E-mail给你了,千万别忘记回信致谢.向老外作者要文献的一个常用的模板第四节P2P搜索引擎使用方法第二类搜索引擎:FTP或P2P搜索引擎以迅雷和天网为代表互联网的基本工作原理互联网提供的服务WWW的工作原理什么是FTP资源FTP的工作原理FTP的工作原理FTP的工作原理什么是P2P举一个简单的例子,在QQ出现之前,人们上网聊天大多通过聊天室,信息的传递方式是:用户A-聊天室服务器-用户B。这些不是P2P的方式。在QQ时代,用户与服务器的交互仅用来完成登陆、维持在线状态等等,信息用户之间的信息