如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
内蒙古工业大学本科毕业设计说明书学校代码:10128学号:040201117本科毕业设计说明书(题目:搜索引擎的系统体系结构的研究与应用学生姓名:李敏学院:信息工程学院系别:计算机系专业:计算机科学与技术班级:计算机04-2班指导教师:苏依拉副教授钱庭荣工程师二○○八年六月摘要近年来,互联网上的信息呈几何级数爆炸性增长,丰富多彩的网络资源给人们的生活工作以及学习带来巨大方便的同时,信息的浩繁,庞杂无序和动态性又极大地影响了用户获取信息的速度,准确性和有效性。海量的存贮和科学的信息搜索是用户信息行为中两种重要的能力,互联网的发展已经实现了信息的海量存贮,为了解决大海捞针似的信息搜索问题,搜索引擎便应运而生了。目前搜索引擎技术已成为计算机工业界和学术界争相研究和开发的热点技术。对于实现网络信息的海量搜索,搜索引擎的体系结构设计成为提高搜索效率的关键。本文中所设计的搜索引擎,主要有四个大的模块组成:一是抓取模块:实现了对网页信息的下载。二是索引模块:实现了对网页信息的排序,索引。三是搜索模块:实现了对网页信息的快速检索。四是用户接口:实现了系统的前台操作。本系统是对网站数据及相关数据库数据进行搜索,管理配置了对应数据源和搜索途径,实现了对网络信息的快速搜索。关键词:搜索引擎;体系结构;索引AbstractInformationontheinternetgrowsgeometricallyandexplosivelyinrecentyears.Diversifiedresourcesofnetworkbroughtgreatconveniencetopeople'slife.Atthesametime,thevoluminousofinformation,andthedynamicandmixeddisorganizationalsogreatlyaffectthespeed,theaccuracy,andtheeffectivenessofaccessingtoinformation.Massivestorageandsearchingofscientificinformationistwoimportantcapacityofinformationact.Thedevelopmentoftheinternethasachievedthestorageofamassofinformation.Thesearchenginewillcomeintobeinginordertosolvetheproblemofsearchinginformation.Atpresent,technologyofsearchenginehasbecomethehottechnologyofresearchinganddevelopingincomputerindustryandacademia.Fortheachievementofmassivesearchingofnetworkinformation,designingofsearchenginearchitecturebecomesthekeyofimprovingtheefficiencyofthesearch.Thedesigningofsearchenginesinthispapercomposedbyfourmajormodules.Firstiscrawlingmodules:Implementationofthedownloadpageofinformation.Thesecondisindexingmodules:thesearchengineanddatasourcesconnectedtotheestablishment,modificationandremoval.Third,theindexingmodule:toachievetherapidindexingofnetworkinformation.Fourth,thesearchmodules:itrealizedtherapidretrievalofinformationpages.Thissystemistosearchthesiteofdataanddatarelatedtothedatabaseandmanagementconfigurationofthecorrespondingdatasourcesanditrealizesrapidresearchofnetworkinformation.Keywords:Searchengine;Architecture;Index目录