作业5参考答案

1.请以学生抑郁指数(取c25题各项目得分的均值)为因变量,以学生家庭经济情况、是否独生子女、认知能力标准分、父母关系好坏、是否寄宿为自变量进行回归分析。其中,家庭经济情况和认知能力当作连接变量,其它自变量当作因子变量。完成以下工作:a.对变量进行必要清理;b.生成一个描述性表格,对所使用的变量进行描述性分析;c.生成一个回归表格,对各变量名称使用中文标注,除系数、标准误和标星信息外,还包括样本量、 R2信息。d.对回归结果进行解读。(解读部分空缺)

library(tidyverse)
library(rio)
library(sjmisc)
library(here)       # 仅是quarto文档中需要使用here()命令打开、保存文件
std <- import(here("files/data/cepsw2studentCN.dta"))

std1 <- std %>% 
  select(w2cog3pl,w2c2501:w2c2510,ses=w2a09,
         only=w2a05,relation=w2a17,board=w2b15,health=w2c04) %>%  #health为额外增加变量
  drop_na() %>% 
  rowwise() %>%
  mutate(m=mean(w2c2501:w2c2510)) %>% 
  ungroup() %>% 
  mutate(across(c(only,relation,board),to_label))

library(modelsummary)
std1 %>% 
  select(独生子女=only, 父母关系=relation, 寄宿与否=board,健康情况=health,
        经济条件=ses,认知能力=w2cog3pl,抑郁指数=m) %>% 
  datasummary_balance(~1,data=.,
                      title = "表1. 学生特征描述性统计表",
                      notes = "数据来源:CEPS 2014-2015数据.")
表1. 学生特征描述性统计表
Mean Std. Dev.
健康情况 3.9 0.9
经济条件 2.9 0.6
认知能力 0.3 0.8
抑郁指数 2.2 0.8
N Pct.
独生子女 4005 44.1
不是 5072 55.9
父母关系 8168 90.0
不好 909 10.0
寄宿与否 2766 30.5
6311 69.5
数据来源:CEPS 2014-2015数据.
model <- lm(m ~ only + relation + board + ses + health + w2cog3pl, data=std1)

modelsummary(list("模型1"=model),stars = TRUE,
             coef_rename = c('(Intercept)'='常数项','only不是'='独生子女(不是)',
                             'relation不好'='父母关系(不好)','board否'='寄宿(否)',
                             'ses'='经济条件','health'='健康情况','w2cog3pl'='认知能力'),
             gof_omit = 'F|Log.Lik.|R2 Adj.|AIC|BIC|F|RMSE',
             gof_map = list(list("raw" = "nobs", "clean" = "N", "fmt" = 0),
                            list("raw" = "r.squared", "clean" = "R<sup>2</sup>", "fmt" = 3)),
             title = "表2. 学生抑郁指数回归分析表",
             notes = "数据来源:CEPS 2014-2015数据."
  )
表2. 学生抑郁指数回归分析表
模型1
常数项 3.040***
(0.057)
独生子女(不是) 0.077***
(0.019)
父母关系(不好) 0.266***
(0.029)
寄宿(否) −0.081***
(0.020)
经济条件 −0.068***
(0.015)
健康情况 −0.158***
(0.009)
认知能力 −0.096***
(0.011)
N 9077
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
数据来源:CEPS 2014-2015数据.

2.请以学生是否恋爱经历为因变量,以学生性别、是否对异性产生浪漫情感、抑郁指数、胖瘦情况、长相情况、家庭经济条件为自变量进行回归分析,其中,除学生性别、是否对异性产生浪漫情感作因子变量外,其它自变量当作连续变量。完成以下工作:a.对变量进行必要清理;b.生成一个描述性的表格,对所使用的变量进行描述性分析;c.生成一个回归表格,对各变量名称使用中文标注,除系数(转换为odds ratio)、标准误和标星信息外,还包括样本量、 F信息。d.对回归结果进行解读。(解读部分空缺)

sex <- import(here("files/data/student_raw.dta")) %>% 
  select(ids,sex)

std2 <- std %>% 
  select(ids,w2cog3pl,w2c2501:w2c2510,ses=w2a09,love=w2d05,
         obese=w2c03,face=w2c23,imagine=w2d04,object=w2d08) %>% #object为额外增加变量
  left_join(sex,by="ids") %>% 
  drop_na() %>% 
  rowwise() %>%
  mutate(m=mean(w2c2501:w2c2510)) %>% 
  ungroup() %>% 
  mutate(across(c(love,sex,imagine,object),to_label))

std2 %>% 
  select(恋爱与否=love,性别=sex,浪漫想像=imagine,反对恋爱=object,
        经济条件=ses,长相=face,肥胖=obese,抑郁指数=m) %>% 
  datasummary_balance(~1,data = .,
                      title = "表3. 学生特征描述性统计表",
                      notes = "数据来源:CEPS 2014-2015数据.")
表3. 学生特征描述性统计表
Mean Std. Dev.
经济条件 2.9 0.6
长相 3.1 0.7
肥胖 3.2 0.9
抑郁指数 2.2 0.8
N Pct.
恋爱与否 谈过或者正在谈 987 11.5
没谈过 7580 88.5
性别 4404 51.4
4163 48.6
浪漫想像 3520 41.1
没有 5047 58.9
反对恋爱 反对 7520 87.8
不反对 1047 12.2
数据来源:CEPS 2014-2015数据.
model2=glm(love ~ sex + imagine + object + ses + face + obese + m,
           family=binomial(link="logit"),data = std2)

modelsummary(list("logit"=model2,"odds ratio"=model2), 
             stars = TRUE,exponentiate =c(FALSE,TRUE),
             coef_rename = c('(Intercept)'='常数项','sex女'='性别(女)',
                             'imagine没有'='浪漫想像(没有)',
                             'object不反对'='周围人反对(不反对)',
                             'ses'='经济条件',
                             'face'='长相','obese'='肥胖','m'='抑郁指数'),
             gof_omit = 'Log.Lik.|AIC|BIC|RMSE',
             gof_map = list(list("raw" = "nobs", "clean" = "N", "fmt" = 0),
                            list("raw" = "F", "clean" = "F值", "fmt" = 3)),
             title = "表4. 学生抑郁指数回归分析表",
             notes = "数据来源:CEPS 2014-2015数据.")
表4. 学生抑郁指数回归分析表
logit odds ratio
常数项 2.601*** 13.478***
(0.299) (4.024)
性别(女) 0.120 1.128
(0.079) (0.089)
浪漫想像(没有) 3.390*** 29.678***
(0.141) (4.196)
周围人反对(不反对) −0.379*** 0.684***
(0.104) (0.071)
经济条件 −0.132* 0.877*
(0.061) (0.053)
长相 −0.154** 0.857**
(0.053) (0.045)
肥胖 0.052 1.053
(0.042) (0.044)
抑郁指数 −0.358*** 0.699***
(0.043) (0.030)
N 8567 8567
F值 99.485 99.485
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
数据来源:CEPS 2014-2015数据.