如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
通话数据分析方案摘要用户分类是通讯公司改善通讯设施、拓展新的通讯业务的基石。用户价值包括当前价值和潜在价值两部分,对于通讯公司实现用户价值目标,最主要的两个用户信息变量为通话时间和通话频数。对用户的两个变量的离群数据进行分析,将用户分为49小类3大类,不同类别的用户应采取不同的管理策略。在此基础上构建用户分类器和用户分类模型,并进行用户分类的实例研究。本文主要完成的任务有:=1\*ROMANI关于用户类型转化预测的研究中,划分用户群体的原则是采用帕累托“二八法则”。=2\*ROMANII对于问题一,根据给出的通话记录信息,采用帕累托“二八法则”来划分用户群体,以用户的通话时间和通话频数这两个信息变量为指标,可建立一个用户分类模型。对用户的两个变量的离群数据进行分析,将主叫和被叫均分为49小类,3大类。=3\*ROMANIII对于问题二,分析了主叫与被叫之间的关系,因其不存在必然的联系,同时根据现有的通讯公司的收费情况和运转方向,故可不考虑被叫。进而可根据问题一的分类结果,则可为通讯公司开发一项新的业务选择合理的用户作为推广人选。=4\*ROMANIV对于问题三,计算出每个通讯设施(基站)上调查的总的通话时间和通话频数,将基站划分成8个区域,则算出每个区域的相应的用户指标和基站个数,即可得相应区域的单位面积上的用户指标数t。观察用户指标数t与其对应的基站个数是否相协调,若相协调,则表明其通讯设备设置合理;否则,根据每区域的用户指标数t调整各区域的基站个数。关键词:离群数据用户分类通讯业务通讯设施通话时间通话频数帕累托“二八法则”一、问题重述与问题分析1.1问题重述通讯技术的不断发展拉近了人与人之间的距离。电话作为主要的通讯工具之一悄无声息地将我们联系在一起,形成一个巨大的社交网络。这个巨大的社交网咯对当前的通讯设备和业务提出了更高的要求。如何利用现有的通话记录数据进行概括分析,以便做出合理的决策,进而改善通讯设施、拓展新的通讯业务,依然是很多通讯公司所面临的一个难题。附件给出了一家通信公司公布的2009年6月份某地300个用户10天内的通话记录,试完成以下问题。请根据这些通话记录信息建立数学模型以对用户分类。如果需要退出一款新的通信业务,如何合理选择部分用户作为首选推广人群。说明你的理由,并撰写一份不超过两页的给公司经理的建立。该地现有的通信设施(如基站等)建设情况是否合理。如需改进,请给出合理的建议。图一基站的位置2.1问题分析对用户分类的依据在于用户对通讯公司的效益会产生多大的影响,以用户的通话时间和通话频数为指标,通过对这两个变量参数的离群数据的挖掘,可以发现重要用户的有利信息。从而可根据帕累托“二八法则”对用户进行分类,即可分为49小类,3大类。对于问题二,选择合理用户作为新业务的推广人选,则要基于用户分类的基础上。同时,先要分析主叫与被叫之间的联系,若其之间无必然的联系,同时根据现有的通讯公司的收费情况和运转方向,则可不考虑被叫。若其之间有相关的联系,则要同时考虑被叫情况。考虑主叫根据问题一得分类,则可从用户的当前价值和潜在价值两个维度分析,被叫同理。对于问题三,根据调查给出的通话记录,即可得每个通讯设施(基站)的通话总时间和通话总频数,分析其两种之间的关系,若其两者对反应基站的利用合理性能达到统一效果,则可选其一进行分析,否则用他们的综合效应来衡量基站的合理性。可利用相应区域的单位面积上的用户指标数t作为衡量指标,若t小,而其区域所占的基站数多,则表明基站设施不合理,否则设施合理。二、模型假设根据题意,可以进行如下假设:1、当前用户的消费习惯在短期时间内没有很大变化2、现有的通讯设施对当地居民无很大的障碍3、通讯公司的效益大致符合帕累托“二八法则”4、通讯公司调查的通话记录数据具有代表性5、基站的地理位置以图中一个小方格为最小划分区域6、若基站处于方格线上,则认为该基站同时属于此相连的两个方格三、符号说明变量名称符号说明A通话数据T最高通话时间P最高通话频数ti第i阶段通话时间对应的人数比例pi第i阶段通话频数对应的人数比例count(i,j)落在ti、pi相应区间的人数比例t相应区域的单位面积上的用户指标数Ti第i个用户的通话总时间TiPi第i个用户的通话总频数Pi其中i、j=1、2、3………...7四、模型的建立与求解本文模型的整体框架如下:模型一模型二模型三检验通讯设施模型用户分类模型选择用户模型采用帕累托“二八法则”分类根据用户类别选择根据相应区域的单位面积上的用户指标数检验