如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
机器学习是人工智能的核心研究领域之一任何一个没有学习能力的系统都很难被认为是一个真正的智能系统经典定义:利用经验改善系统自身的性能随着该领域的发展,主要做智能数据分析并已成为智能数据分析技术的源泉之一典型任务:预测(例如:天气预报)数据挖掘美国航空航天局JPL实验室的科学家在《Science》(2001年9月)上撰文指出:机器学习对科学研究的整个过程正起到越来越大的支持作用,……,该领域在今后的若干年内将取得稳定而快速的发展入侵检测:是否是入侵?是何种入侵?常用技术:神经网络支持向量机隐马尔可夫模型贝叶斯分类器k近邻决策树序列分析聚类…………例子3:搜索引擎美国的PAL计划RADAR(ReflectiveAgentswithDistributedAdaptiveReasoning),承担单位为CMU,首期7百万美元目标:“thesystemwillhelpbusymanagerstocopewithtime-consumingtasks”“RADARmustlearnbyinteractingwithitshumanmasterandbyacceptingexplicitadviceandinstruction”CALO(CognitiveAgentthatLearnsandObserves),承担单位为SRI,首期2千2百万美元除SRI外,这个子计划的参加单位有20家:Boeing,CMU,DejimaInc.,FetchTechInc.,GATech,MIT,OregonHSU,Stanford,SUNY-StonyBrook,UCBerkeley,UMass,UMich,UPenn,Rochester,USC,UTAustin,UW,Yale,…CALO无疑是PAL中更核心的部分美国的PAL计划:CALO子计划(2)美国的PAL计划:CALO子计划(3)历史回顾(1)历史回顾(2)历史回顾(3)从主要范式的发展可以看出,ML实际上是一个应用驱动的学科,其根本的驱动力是“更多、更好地解决实际问题”由于近20年的飞速发展,机器学习已经具备了一定的解决实际问题的能力,似乎逐渐开始成为一种基础性、透明化的“支持技术、服务技术”基础性:在众多的学科领域都得以应用(“无所不在”)透明化:用户看不见机器学习,看见的是防火墙、生物信息、搜索引擎;(“无所不在”)“机器更好用了”(正如CALO的一些描述:“youwon’tleavehomewithoutit”;”embodiedasasoftwareenvironmentthattranscendsworkstations,PDA’s,cellphones,…”)作为支持和服务技术的“普适机器学习”带来了挑战和机遇:出现了很多被传统ML研究忽视、但非常重要且尚无好的解决方案的问题(下面将以医疗和金融为代表来举几个例子)ML支持和服务的学科领域越多,新问题越多ML与众多学科领域产生了交叉,而交叉领域正是大有可为处医疗:以乳腺癌诊断为例,“将病人误诊为健康人的代价”与“将健康人误诊为病人的代价”是不同的金融:以信用卡盗用检测为例,“将盗用误认为正常使用的代价”与“将正常使用误认为盗用的代价”是不同的传统的ML技术基本上只考虑同一代价如何处理代价敏感性?在教科书中找不到现成的答案,例如:TomMitchell,MachineLearning,McGraw-Hill,1997NilsJ.Nilsson,IntroductiontoMachineLearning,draft1996-2004医疗:以乳腺癌诊断为例,“健康人”样本远远多于“病人”样本金融:以信用卡盗用检测为例,“正常使用”样本远远多于“被盗用”样本传统的ML技术基本上只考虑平衡数据如何处理数据不平衡性?在教科书中找不到现成的答案医疗:以乳腺癌诊断为例,需要向病人解释“为什么做出这样的诊断”金融:以信用卡盗用检测为例,需要向保安部门解释“为什么这是正在被盗用的卡”传统的ML技术基本上只考虑泛化不考虑理解如何处理可理解性?在教科书中找不到现成的答案走向普适机器学习致谢请各位专家批评指正!