-
第一章 :应用线性回归预测医疗费用
线性回归的模型原理
案例:预测医疗费用
1)数据特征说明——样本量、变量类型、目标变量
2)探索和准备数据——变量转码、数据分布特征的计算和图表展示、数据关联性分析
3)基于数据训练模型——训练模型的操作步骤、模型结果的解读
4)评估模型的性能——拟合优度、残差分析
5)提高模型的性能——改进模型提高分析效果
-
第二章:房屋数据集的主成分分析
主成分分析和因子分析基本原理
案例:房屋数据集的降维的处理
1)数据特征说明——样本量、数据特征
2)探索和准备数据——统计数据特征、数据进行规范化、数据关联性分析
3)基于数据训练模型——训练模型的操作步骤、模型结果的解读
4)主成分提取个数分析——特征值标准、解释变异的比例标准、最小共线标准、坡度图标准
5)主成分描述——剖析主成分的特点
-
第三章:基于K-Means聚类的客户流失数据分析
K-Means基本原理
案例:客户流失数据分析
1)数据特征说明——样本量、数据特征
2)探索和准备数据——统计数据特征、数据进行规范化
3)基于数据训练模型——k-means聚类的操作
4)类间比较——类间特征比较、类别起名字
5)使用类别成员关系预测客户流失
-
第四章:应用决策树识别高风险银行贷款
决策树的模型原理
案例:识别高风险银行贷款
1)数据特征说明——样本量、变量类型
2)探索和准备数据——比较数据、分割数据
3)基于数据训练模型——训练模型、选择算法、配置信息
4)评估模型的性能——模型评估指标解读、混淆矩阵
5)查看单个客户的违约概率
-
第五章:心脏病预测
逻辑回归基本原理
案例:心脏病预测分析
1)数据特征说明——样本量、数据特征
2)探索和准备数据——变量转换、拆分数据集为训练集和测试集
3)基于数据训练模型——逻辑回归的SPSS操作、模型结果的解读
4)评估模型的性能——对模型进行显著性检验
5)检查共线性
6) 模型改进
课程简介
在移动时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么“做”线性回归分析,在你遇到实际数据时仍然不知道如何分析。
本课程充分根据我们日常的思维习惯来理解统计分析的原理,将各种统计方法之间的联系阐述清楚,同时提供了如何实现实例结果的SPSS软件操作。
优秀学员/ Outstanding students

石筱璇
CPDA北京第89期学员从事银行运营工作

王婧
CPDA万宝盛华第四期学员
冯静
CPDA四川第8期学员 北京东方国信科技公司
李娜
CPDA苏州第8期学员西交利物浦大学教育技术高级顾问

赖蛟娇
CPDA苏州8期学员
李小琳
CPDA武汉学员 就职于通信行业
李骏杰
CPDA西安第15期学员 中国航天科技集团九院771所