WEB搜索引擎分析设计与实现.doc
上传人:天马****23 上传时间:2024-09-12 格式:DOC 页数:41 大小:1.9MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

WEB搜索引擎分析设计与实现.doc

WEB搜索引擎分析设计与实现.doc

预览

免费试读已结束,剩余 31 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本科毕业论文WEB搜索引擎分析设计与实现院(系)名称:专业名称:学生姓名:指导教师:二○○九年六月摘要随着互联网的高速发展,信息在海量的增长。用户想要寻找到一些有用的知识非常困难,于是搜索引擎应运而生,满足广大用户的需要,现在人们已经把搜索引擎当做日常学习、工作、休闲不可缺少的一个工具。大家都知道用搜索引擎可以快速地找到自己所要的资料或信息,那么搜索引擎是怎么工作的呢?本文将会对这个问题进行解答。本文首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,并利用目前流行的Heritrix+Lucene框架,分析、设计、实现了“SoEdu”搜索引擎。论文中附上了搜索引擎的实现代码,并配上贴图,力图使本文生动,容易理解。关键词:搜索引擎索引HeritrixLuceneAbstractAlongwiththehighspeeddevelopmentoftheInternet,theinformationintheInternetisincreasingmagnanimity.It’sverydifficultforuserstofindsomeusefulinformationintheInternet.SotheSearchEngineappealstomeettheusers’requirements.Thepeoplealreadytreateditasanessentialtoolforstudy,workandtheleisureactivities.Everybodyknowswiththesearchengineonemaygetthematerialorinformationthathewantstofind,andthenhowdoesthesearchenginework?Thethesiswillanswerthisquestion.Firstofall,thethesisintroducesthesystemstructureofthesearchenginebasedontheInternetandthetheoryofthepopularsearchengine,andusesthepopularframeworkofHeritrixandLucene.Thenanalyze,designandimplement”SoEdu”searchengine.Inthethesistherearesomecorecodeandpicturestomakemythesisvividandunderstanding.Keywords:SearchEngineIndexHeritrixLucene目录TOC\o"1-3"\h\z\uHYPERLINK\l"_Toc229996736"第1章绪论PAGEREF_Toc229996736\h1HYPERLINK\l"_Toc229996737"1.1课题背景PAGEREF_Toc229996737\h1HYPERLINK\l"_Toc229996738"1.2国内外关于该论题的研究现状和发展趋势PAGEREF_Toc229996738\h1HYPERLINK\l"_Toc229996739"1.3本文内容安排PAGEREF_Toc229996739\h2HYPERLINK\l"_Toc229996740"第2章搜索引擎概述PAGEREF_Toc229996740\h3HYPERLINK\l"_Toc229996741"2.1搜索引擎定义PAGEREF_Toc229996741\h3HYPERLINK\l"_Toc229996742"2.2搜索引擎起源及发展PAGEREF_Toc229996742\h3HYPERLINK\l"_Toc229996743"2.3搜索引擎分类PAGEREF_Toc229996743\h4HYPERLINK\l"_Toc229996744"2.3.1全文搜索引擎PAGEREF_Toc229996744\h5HYPERLINK\l"_Toc229996745"2.3.2目录索引PAGEREF_Toc229996745\h5HYPERLINK\l"_Toc229996746"2.3.3元搜索引擎PAGEREF_Toc229996746\h5HYPERLINK\l"_Toc229996747"第3章搜索引擎的原理PAGEREF_Toc