如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
第"F卷2第)期重庆邮电学院学报)##"年&月:"_$"FS"$)W"X74?_"\9["4A3V4A/4V)67|V5}"\E"|5|?4~D6_6Z"##X4VZ?5V"4|WX4$)##"4444444444444444444444444444444444444444444444444444444444444444444文章编号!"##$%&’$()##"*#)##%+#$1,-./0-/.数据挖掘原理及实现宋伟2王举成2马根峰2赵济林(重庆邮电学院2重庆$###&%*摘要!分析了34567465数据挖掘的特点8目标及其原理2重点探讨了文本知识挖掘及其9:;<模型8搜索引擎数据挖掘及其=><模型及基于3457?465的多软件机器人体系结构和基于@A645的个性化检索2最后指出了34567465数据挖掘的发展方向B关键词!34567465C数据挖掘C文本知识挖掘C搜索引擎C个性化检索中图分类号!DEF’F文献标识码!@,-./0-/.GH.HIJ-J-KL0J-MJNO/H-P,QNO/Q/-.H.JR-;=STU6V2U@STWXYZ[64A2<@T64Y\64A2]^@=WVY_V4(‘abcdcecfghijajkflfac2mngakodakpadqfrbdcsghtgbcbjauvfwfxglleadxjcdgab2mngakodak$###&%2mndaj*yz{.0HM.!D[V|?75VZ_6?4?_}|6|5[6Z[?7?Z567V|5VZ|25?7A65?4~!7V4ZV!_6"\34567465~?5?#V4V4A$D[64V5~V|ZX||6|Z[V6\_}5[656%5&4"’_6~A6#V4V4A’V5[V5|9:;<#"~6_25[6|6?7Z[V4A64AV46~?5?#V4V4A’V5[V5|=><#"~6_25[6#X_5VY|"\5’?767"("5?7Z[V56Z5X76(?|6~"43457?465?4~5[6V4~V)V~X?_|6?7Z[V4A(?|6~"4?A645$@5_?|55[6!?!67!"V45|"X55[6\X5X765764~"\~6)6_"!#645V4~?5?#V4YV4A$*/+,R0P{!34567465C~?5?#V4V4AC56%5&4"’_6~A6#V4V4AC|6?7Z[64AV46CV4~V)V~X?_|6?7Z[V4A34567465数据挖掘与34567465数据组织形式有#概述着密切的关系B34567465中最多的是以^D<-文档组成的U6(页面2再就是T"![672.DE2/|6S65234567465数据挖掘是个人8企业8网站从34567YS6’|T7"X!200;2<?V_-V|5等2为了方便用户定位465提供的信息资源中2根据各自不同的目的和特网站2出现了一些相关的搜索引擎2如针对T"![67点2抽取有关数据并且从中发现数据中隐含的规则的U@3;2针对.DE的@7Z[V62针对U6(页面的引和知识2从而更进一步地获取数据的过程B擎最多2如1?[""2;"[X等2还有一些用户通过34Y34567465数据挖掘总的来讲2有F个目标!一是57?465实现34567465数据挖掘B不同的数据组织形精确度2即返回数据符合用户需求的程度C二是覆盖式有着不同的特点2除U6(站点内的数据主要为率2即有多少符合用户需求的数据被返回C三是效^D<-格式的半结构化数据外2其余的多为层次化率2即响应速度B的结构化的形式B对于U@3;8@7Z[V68T"![678收稿日期1!)###"")+作者简介!宋伟("’5&Y*2男2湖北应城人2研究生2研究方向为管理信息系统C王举成("’5FY*2男2重庆开县人2研究生2研究方向为管理信息系统C马根峰("’5$Y*2男2河南新郑人2研究生2研究方向为数据库理论及应用C赵济林("’$&Y*2重庆邮电学院管理学院院长2副教授2硕士导师B2%+2宋伟$王举成$马根峰$赵济林;67)’87’)数据挖掘原理及实现^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^!"#$%&’(’)$**+等结构化数据,一般通过在用户模型1?@+=;?A989B)’8C&)CB@’B)D8+E9B’=DF’G3与它们之间增加中介检索代理来实现,比较简便-故的,一般过程如图2所示0本文主要讨论如何实现数据挖掘它主要有下禁用词集概念集已分类文档库JJJ.’/0JJJKJJJKJJJJJJJJJJJJJJJJJJJHJJJJ训练特J面的问题需要解决概