SPSS Modeler数据挖掘:回归分析

摘要:
所谓客户流失预警模型的构建是基于数据挖掘技术的电信运营状态和客户状态分析判断系统。本质上,它是对数据特征的挖掘,也是一个分类问题。

SPSS Modeler数据挖掘:回归分析

1 模型定义

回归分析法是最基本的数据分析方法,回归预测就是利用回归分析方法,根据一个或一组自变量的变动情况预测与其相关的某随机变量的未来值。

回归分析是研究一个变量(被解释变量)与另一个或几个变量(解释变量)的具体依赖关系的计算方法和理论。

回归分析的主要内容:

从一组数据出发,确定某些变量之间的定量关系,即建立数学模型并估计其中的未知参数,进行可信程度检验,一般用最小二乘法估计参数。判断哪个(或哪些)自变量的影响是显著的,哪些是不显著的,将影响显著的选入模型,而提出影响不显著的,通常应用逐步回回、向前回归和向后回归等方法。

利用所求的关系式对某一生产过程进行预测或控制。

回归分析研究的主要问题:

确定Y与X之间的关系表达式(回归方程)

对求得的回归方程的可信度进行统计检验

判断自变量X对因变量Y有误影响极其程度

利用所得的回归方程进行变量的预测和控

2 模型应用

回归分析时分析现象之间相关的具体形式,确定其因果关系,并用数学模型来边线其具体关系。

一般来讲,回归分析时通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好地拟合,则可以根据自变量做出进一步预测。

R2、F检验值和T检验值。

3 建模步骤

建立变量

建立预测模型

进行相关分析

计算预测误差

确定预测值

4 应用实例:客户流失因素分析

研究背景

随着电信企业的发展,企业之间的竞争不断加剧,电信运营商在不断地推出新的业务与套餐,一次占领市场竞争高地。但是,与此同时,也大大增加了客户的不稳定性,而数据挖掘技术的应用,有效地降低了客户离网率。因此,研究数据挖掘技术在电信客户流失预警中的应用有必要性。

对于电信企业而言, 海量的客户数据是企业的一笔巨大财富,简单而讲企业若能够及时准确地挖掘出数据中的信息,并且从中分析出隐含的价值信息与知识,就能制定弧科学的运营方案,才能更好地为客户服务,进而在市场竞争中取得一席之地。

所谓的客户流失预警模型的构建就是在基于数据挖掘技术的基础上,对电信运营状态及客户状态的一种分析与判定系统,从本质上讲,就是对数据特征的一种挖掘,同时,也是一种分类问题。

客户信息主要分为两大类:一种是由离网倾向的客户;另一种是无离网倾向的客户。以数据挖掘技术为基础,对已离网客户的信息进行特征分析,进行总结归纳,并作参考,若企业产生新的客户信息时,一次来识别其是否存在离网倾向,确定其是否在企业对客户维护开销范围外,若低于次开销值,则说明其不具有任何产生价值,相关信息应该删除。

5 研究方法

在客户流失分析系统中,根据以前拥有的客户流失数据建立客户属性、服务属性、客户消费数据与客户流失可能关联的数学模型,找出客户属性、服务属性、客户消费数据与客户流失的最终状态的关系。

SPSS Modeler数据挖掘:回归分析第1张

4.2.3 数据分析

定义数据源
 SPSS Modeler数据挖掘:回归分析第2张
数据理解
将值为0、1的变量设为标志字段
将客户类别(custcat)设置为目标
 SPSS Modeler数据挖掘:回归分析第3张
数据准备
过滤掉无关字段
 SPSS Modeler数据挖掘:回归分析第4张
建立模型
模型采用:多项式 和 逐步法 的回归分析方法;
专家模式

SPSS Modeler数据挖掘:回归分析第5张

SPSS Modeler数据挖掘:回归分析第6张

模型评估
评估模型的优劣是建模过程的必须步骤,本例中采用数据审核节点和数据评估节点来对模型的结果进行评估。

SPSS Modeler数据挖掘:回归分析第7张

研究结论

免责声明:文章转载自《SPSS Modeler数据挖掘:回归分析》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Docker Swarm 常用命令Python---捕捉窗口下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

IL 汇编学习笔记(一)

今天我开始了 IL 汇编语言的学习,下面都是对一篇文章学习过程的翻译和摘要。原文:http://www.codeproject.com/dotnet/ilassembly.asp先从一个 HelloWorld 例子开始: //Test.IL//Asimpleprogrammewhichprintsastringontheconsole.assemblyex...

Dapper的数据库连接管理(打开、关闭)

  Dapper对于数据库连接的管理:如果已经打开,它会关闭连接。如果你只是做一个快速查询-让Dopter自己处理它。   如果你做了很多事情,你应该自己打开连接,并在最后关闭连接,所有的查询在中…只是从效率的角度来看。 bool wasClosed = cnn.State == ConnectionState.Closed; using (var cmd...

转载:数据库 ' 库名' 已打开,并且一次只能有一个用户访问。 (Microsoft SQL Server,错误: 924)

USE master; GO DECLARE @SQL VARCHAR(MAX); SET @SQL='' SELECT @SQL=@SQL+'; KILL '+RTRIM(SPID) FROM master..sysprocesses WHERE dbid=DB_ID('库名'); EXEC(@SQL); GO ALTER DATABASE 库名 SET...

python数据处理的常用操作

python数据处理 1.生成数据2.数据表检查3.数据表清洗4.数据预处理5.数据提取6.数据筛选7.数据汇总8.数据统计9.数据输出 1.生成数据 1.导入数据表 df=pd.read_excel('C:/Users/Admin/Desktop/types/output.xlsx')df1=pd.read_csv('C:/Users/Admin/...

ansible-乱

工作机制:ssh 无客户端 工作方式: 1,CMDB 2,公有云私有云API 3,使用ad-hoc 4,ansible-playbook ansible 执行命令,底层调用传输连接模块,将命令或文件传输至远程服务器的/tmp目录,远程执行,操作完后删除,返回结果。 配置文件 /etc/ansible 功能;inventory 主机信息配置 工具功能 /us...

mui 上拉刷新加载template数据

html没什么好说的,就是主要刷新列表要套多套一层,要不动画会不见 //待刷新区域 <div style="margin-top: 30px;"> <div id="cx_lst2"> </div> </div> //临时数组var cx = [{ "ypmc": "11", "jg": 100, "id":...