如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
自动发卡平台www.770pay.comiyd摘要:本文提出了一种基于模糊聚类分析中传递闭包法的汉语学习者兴趣分组算法,从日志整理出特征,得出聚类结果,为汉语教学个性化、风格化提供了依据。中国论文网关键词:国际汉语言文化传播;聚类分析;传递闭包中图分类号:TP391.6文献标识码:A文章编号:1674-7712(2012)12-0169-01一、引言对外汉语网络教学是国际汉语言文化传播的有效手段之一。教育个性化理论认为每个学习者的行为特征都不一样,因此,学习需求和语言接受能力对于每个汉语学习者也就不尽相同。在汉语网络教学中对学习者进行科学的有针对性的分析与设计,将使得学习更具个性化、风格化,学习效果更好。二、基于传递闭包兴趣分组聚类分析是指将物理或抽象对象的集合分组成由类似的对象组成的多个类的分析过程。(一)传递闭包法传递闭包法是将经典集合理论中的等价关系应用到模糊集合中,产生新的模糊等价关系。该模糊聚类分析方法是按照传递闭包不同截集λ(0≤λ≤1)来进行分类。首先要得到模糊相似矩阵R,然后求出矩阵R的传递闭包T(R),即包含R的最小模糊传递矩阵,最后通过T(R)进行聚类,即将模糊关系矩阵足传递性,所以要对模糊相似关系进行处理,可以通过求传递闭包来满足传递性,形成模糊等价关系,只要设定阀值就能将这种关系直接用于聚类,得到聚类分析的结果。(二)兴趣分组聚类算法定义1:设学习者的兴趣集I={I1,…Ii,…In},则学习者第i个兴趣为Ii,可表示为Ii=(Ki,Qi),Ki为Ii的名称,Qi为Ii在兴趣集I中的重要程度。定义2:第i个兴趣的日志挖掘信息表示为Li={Li0,Li1,Li2,Li3,Li4}。式中,Li0为兴趣i的初值,Li1为学习者访问兴趣i的资源节点数,Li2为学习者收藏兴趣i的数量,Li3为评论兴趣i的数量,Li4为访问兴趣i页面花费的总时间。通常,学习者对某种兴趣的喜好度可以用Li1到Li3这几种行为表示。考虑到学习者对兴趣喜好度高的资源上花时更长,故加入Li4并对其进行预处理。设通过日志获取访问开始到结束的本次访问时间t,t1表示最小阅读时间限制,t2表示是最大阅读时间限制。当t≤t1时,认为学习者没有访问该页面;当t≥t2时,认为学习者并不一定特别关注该资源。学习者兴趣的计算:式中,α和β是可以由相关教育专家根据统计结果作出改变的参数,Ii0为更新后的值。通过以上计算能得出学习者每种兴趣的权值,这里分两种情况:若考虑学习者只有一种兴趣,就以权值最大的的兴趣来进行分组;若认为学习者有多种兴趣,则可以采用以下模糊聚类传递闭包方法进行分组:首先,用向量相似度法计算两个学习者间的相似度,将每个学习者的兴趣看作一个由多关键字组成的向量,用向量的夹角余弦表示相似度,计算公式如下:式中,Qi为学习者每种兴趣的权值。Au1*u2越接近1,则表示两个学习者的兴趣越接近,若Au1*u2=1,则表示两个学习者的兴趣完全相似。然后,以学习者为行、列构造相似度满足对称性和自反性矩阵S。S中的元素表示学习者间的相似度。一般S不具传递性,要将S转换模糊等价关系,求S的包含关系其最小的传递性矩阵T,然后设置截集λ(0≤λ≤1,取值越大分类精度越高)的大小进行聚类。以下是总结兴趣分组聚类算法:1.预处理输入值Web日志信息,得到如浏览数、评论数、收藏数、浏览时长等所需要的信息;2.利用上一步的结果,通过公式2和公式3得到学习者每种兴趣的权值Qi;3.通过公式3得到学习者间的兴趣相似度Au1*u2,构建相似度矩阵S;4.通过S计算出传递闭包T;5.确定λ值,输出值=学习者的聚类模式。三、算法评估本文的系统评估模型={个人满意度,学习效果},主要从个人满意度和学习效果两个指标来进行评估。满意度通过调查问卷的形式采集,学习效果通过学完后测试来完成。根据智力活动复杂程度和国外学习者实际情况,将认知能力目标分成三个层次:识记、理解、应用,每层次可给出1-5分。设D'={D1',D2',D3'},D1'、Ds'、D3'分别表示教育专家决定的三层次学习效果分量隶属度,且D1'+D2'+D3'=1。设F={F1,F2,F3},F1、F2、F3分别表示各层次的分数,则学习者的学习效果最终评估结果R=F1D1'+F2D2'+F3D3'。若R>3,表明学习效果达到及格目标。最终系统评估的结果为:R总=λ1R满意度+λ2R学习效果。其中,λ1和λ2为参数(λ1+λ2=1)。参数一般取值为λ1=0.5、λ2=0.5,若学习者没有完成满意度调查,参数取值为λ1=0、λ2=1。若R总≥3,则表明通过评估。四、实验结果将有一定间隔时间的5083条控制日志信息输送到目的控制台或文件中,识别出282条会话。