主要内容
- 数据清理
- 单个变量的描述性分析
- 两个变量的相关性分析
- 回归分析
- 非预期结果的处理
数据清理
- 样本选择
- 缺失值的处理
- 变量数据类型转换、重命名、重新编码、新生成;
- 数据合并、变形
- 特殊变量(时间、类别、文本等)的处理
描述性统计
- 单个离散性变量的统计
- 单个连续性变量的统计
- 极端值的处理
两个变量相关性分析
回归分析
- 虚拟变量
- 顺序变量
- 分类变量
- 计数变量
- 连续变量
- 事件变量
- Logistic regression
- Ordered logistic regression
- Multinomial logistic regression
- poisson regression
- Simple regression
- Survival
递进回归
- 先看核心解释变量的效应
- 逐步加入控制变量,看核心变量效应的变化
- 根据研究设计,加入非线性变量,或者交互变量
- 分组回归