数据分析之一

Yangyong ye

2023-03-23

主要内容

  • 数据清理
  • 单个变量的描述性分析
  • 两个变量的相关性分析
  • 回归分析
  • 非预期结果的处理

数据清理

  • 样本选择
  • 缺失值的处理
  • 变量数据类型转换、重命名、重新编码、新生成;
  • 数据合并、变形
  • 特殊变量(时间、类别、文本等)的处理

描述性统计

  • 单个离散性变量的统计
  • 单个连续性变量的统计
  • 极端值的处理

两个变量相关性分析

回归分析

  • 虚拟变量
  • 顺序变量
  • 分类变量
  • 计数变量
  • 连续变量
  • 事件变量
  • Logistic regression
  • Ordered logistic regression
  • Multinomial logistic regression
  • poisson regression
  • Simple regression
  • Survival

递进回归

  • 先看核心解释变量的效应
  • 逐步加入控制变量,看核心变量效应的变化
  • 根据研究设计,加入非线性变量,或者交互变量
  • 分组回归