缺失值的处理.ppt
上传人:天马****23 上传时间:2024-09-10 格式:PPT 页数:21 大小:376KB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

缺失值的处理.ppt

缺失值的处理.ppt

预览

免费试读已结束,剩余 11 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第一节资料检查与校订第二节资料编码一、编码的一般规则有些调查要对无回答和不知道的答案进行编码对无回答的编码常用的是0.对不知道的编码常为9.或99,或999.但是少数问题可能很麻烦,如家庭子女数.所以对无回答和不知道的编码必须是在经验上决不会出现的数字.这样编码往往要多一列,如无回答为99,不知道为98.三个孩子要填03.(1)工作后您是否参加过成人教育?1.是()2.否()(2)如参加过,是哪一类?(如没有参加过,编码用9)1.初中文化补习()2.高中文化补习()3.专门的职业培训()4.其他的进修学习()(3)总共()年。(如没有参加过,编码用99)二、开放题编码技术三、编码手册编码卡片的第一行读到这样的数字000165089441,这时我们可以根据编码手册转译过来,即第00001号被调查者,年龄是65岁,业务专长是国际贸易,住宅面积65平方米以上,属于该退未退的工作人员,未退休的理由是身体健康尚能工作。四、特殊题型的编码第三节数据录入与整理一、录入方式二、数据清理2.逻辑一致性的清理举例:一项调查样本规模为1,000个个案,以分文卷的字符数(数据的个数)为200个,研究者从中随机抽取3%的个案,即30份进行对照检查,结果发现由2个字符输入错误,这样2÷(200×30)=≈0.03%可知,数据差错率在0.03%左右.这也就是说在总共20万个数据中,大约有60个左右的差错.我们虽无法查出他们,但却知道他们占多大的比例,对我们的调查结果有多大程度的影响.三、缺失值的处理四、统计表与统计图2.统计表的制作