1.请以学生抑郁指数(取c25题各项目得分的均值)为因变量,以学生家庭经济情况、是否独生子女、认知能力标准分、父母关系好坏、是否寄宿为自变量进行回归分析。其中,家庭经济情况和认知能力当作连接变量,其它自变量当作因子变量。完成以下工作:a.对变量进行必要清理;b.生成一个描述性表格,对所使用的变量进行描述性分析;c.生成一个回归表格,对各变量名称使用中文标注,除系数、标准误和标星信息外,还包括样本量、 R2信息。d.对回归结果进行解读。(解读部分空缺)
library(tidyverse)
library(rio)
library(sjmisc)
library(here) # 仅是quarto文档中需要使用here()命令打开、保存文件
std <- import(here("files/data/cepsw2studentCN.dta"))
std1 <- std %>%
select(w2cog3pl,w2c2501:w2c2510,ses=w2a09,
only=w2a05,relation=w2a17,board=w2b15,health=w2c04) %>% #health为额外增加变量
drop_na() %>%
rowwise() %>%
mutate(m=mean(w2c2501:w2c2510)) %>%
ungroup() %>%
mutate(across(c(only,relation,board),to_label))
library(modelsummary)
std1 %>%
select(独生子女=only, 父母关系=relation, 寄宿与否=board,健康情况=health,
经济条件=ses,认知能力=w2cog3pl,抑郁指数=m) %>%
datasummary_balance(~1,data=.,
title = "表1. 学生特征描述性统计表",
notes = "数据来源:CEPS 2014-2015数据.")
表1. 学生特征描述性统计表
健康情况 |
|
3.9 |
0.9 |
经济条件 |
|
2.9 |
0.6 |
认知能力 |
|
0.3 |
0.8 |
抑郁指数 |
|
2.2 |
0.8 |
|
|
N |
Pct. |
独生子女 |
是 |
4005 |
44.1 |
|
不是 |
5072 |
55.9 |
父母关系 |
好 |
8168 |
90.0 |
|
不好 |
909 |
10.0 |
寄宿与否 |
是 |
2766 |
30.5 |
|
否 |
6311 |
69.5 |
数据来源:CEPS 2014-2015数据. |
|
|
|
model <- lm(m ~ only + relation + board + ses + health + w2cog3pl, data=std1)
modelsummary(list("模型1"=model),stars = TRUE,
coef_rename = c('(Intercept)'='常数项','only不是'='独生子女(不是)',
'relation不好'='父母关系(不好)','board否'='寄宿(否)',
'ses'='经济条件','health'='健康情况','w2cog3pl'='认知能力'),
gof_omit = 'F|Log.Lik.|R2 Adj.|AIC|BIC|F|RMSE',
gof_map = list(list("raw" = "nobs", "clean" = "N", "fmt" = 0),
list("raw" = "r.squared", "clean" = "R<sup>2</sup>", "fmt" = 3)),
title = "表2. 学生抑郁指数回归分析表",
notes = "数据来源:CEPS 2014-2015数据."
)
表2. 学生抑郁指数回归分析表
常数项 |
3.040*** |
|
(0.057) |
独生子女(不是) |
0.077*** |
|
(0.019) |
父母关系(不好) |
0.266*** |
|
(0.029) |
寄宿(否) |
−0.081*** |
|
(0.020) |
经济条件 |
−0.068*** |
|
(0.015) |
健康情况 |
−0.158*** |
|
(0.009) |
认知能力 |
−0.096*** |
|
(0.011) |
N |
9077 |
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001 |
|
数据来源:CEPS 2014-2015数据. |
|
2.请以学生是否恋爱经历为因变量,以学生性别、是否对异性产生浪漫情感、抑郁指数、胖瘦情况、长相情况、家庭经济条件为自变量进行回归分析,其中,除学生性别、是否对异性产生浪漫情感作因子变量外,其它自变量当作连续变量。完成以下工作:a.对变量进行必要清理;b.生成一个描述性的表格,对所使用的变量进行描述性分析;c.生成一个回归表格,对各变量名称使用中文标注,除系数(转换为odds ratio)、标准误和标星信息外,还包括样本量、 F信息。d.对回归结果进行解读。(解读部分空缺)
sex <- import(here("files/data/student_raw.dta")) %>%
select(ids,sex)
std2 <- std %>%
select(ids,w2cog3pl,w2c2501:w2c2510,ses=w2a09,love=w2d05,
obese=w2c03,face=w2c23,imagine=w2d04,object=w2d08) %>% #object为额外增加变量
left_join(sex,by="ids") %>%
drop_na() %>%
rowwise() %>%
mutate(m=mean(w2c2501:w2c2510)) %>%
ungroup() %>%
mutate(across(c(love,sex,imagine,object),to_label))
std2 %>%
select(恋爱与否=love,性别=sex,浪漫想像=imagine,反对恋爱=object,
经济条件=ses,长相=face,肥胖=obese,抑郁指数=m) %>%
datasummary_balance(~1,data = .,
title = "表3. 学生特征描述性统计表",
notes = "数据来源:CEPS 2014-2015数据.")
表3. 学生特征描述性统计表
经济条件 |
|
2.9 |
0.6 |
长相 |
|
3.1 |
0.7 |
肥胖 |
|
3.2 |
0.9 |
抑郁指数 |
|
2.2 |
0.8 |
|
|
N |
Pct. |
恋爱与否 |
谈过或者正在谈 |
987 |
11.5 |
|
没谈过 |
7580 |
88.5 |
性别 |
男 |
4404 |
51.4 |
|
女 |
4163 |
48.6 |
浪漫想像 |
有 |
3520 |
41.1 |
|
没有 |
5047 |
58.9 |
反对恋爱 |
反对 |
7520 |
87.8 |
|
不反对 |
1047 |
12.2 |
数据来源:CEPS 2014-2015数据. |
|
|
|
model2=glm(love ~ sex + imagine + object + ses + face + obese + m,
family=binomial(link="logit"),data = std2)
modelsummary(list("logit"=model2,"odds ratio"=model2),
stars = TRUE,exponentiate =c(FALSE,TRUE),
coef_rename = c('(Intercept)'='常数项','sex女'='性别(女)',
'imagine没有'='浪漫想像(没有)',
'object不反对'='周围人反对(不反对)',
'ses'='经济条件',
'face'='长相','obese'='肥胖','m'='抑郁指数'),
gof_omit = 'Log.Lik.|AIC|BIC|RMSE',
gof_map = list(list("raw" = "nobs", "clean" = "N", "fmt" = 0),
list("raw" = "F", "clean" = "F值", "fmt" = 3)),
title = "表4. 学生抑郁指数回归分析表",
notes = "数据来源:CEPS 2014-2015数据.")
表4. 学生抑郁指数回归分析表
常数项 |
2.601*** |
13.478*** |
|
(0.299) |
(4.024) |
性别(女) |
0.120 |
1.128 |
|
(0.079) |
(0.089) |
浪漫想像(没有) |
3.390*** |
29.678*** |
|
(0.141) |
(4.196) |
周围人反对(不反对) |
−0.379*** |
0.684*** |
|
(0.104) |
(0.071) |
经济条件 |
−0.132* |
0.877* |
|
(0.061) |
(0.053) |
长相 |
−0.154** |
0.857** |
|
(0.053) |
(0.045) |
肥胖 |
0.052 |
1.053 |
|
(0.042) |
(0.044) |
抑郁指数 |
−0.358*** |
0.699*** |
|
(0.043) |
(0.030) |
N |
8567 |
8567 |
F值 |
99.485 |
99.485 |
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001 |
|
|
数据来源:CEPS 2014-2015数据. |
|
|