题目
- 以”cepsw2studentCN.dta“为源生成一个新的数据,满足以下条件:
a.包含以下信息:学生id,w2班级代码,学校id, 认知能力原始得分,数学期中成绩, 英语期中成绩,父母关系好坏情况,父母的教育期望,好朋友的数量, 参加兴趣班/课外辅导班的情况;
f.将好朋友数量的变量命名为nfriend, 父母期望命名为expectation;
b.将父母好坏情况和父母教育期期望的变量放置在学校id后面;
d.选择出数学和英语成绩都是实行150分制的学生;
c.删除以上变量具有缺失值的个体;
e.按认知能力降序排列;
g.生成新变量表示学生英语和数学的加和;
- 以上题数据为基础,生成一个新的数据,包含每所学校的数学平均成绩和英语平均成绩。
- 以数据”cepsw2teacherCN.dta“为基础,生成一个只包括数学老师信息的数据,并将此数据与第1题中的数据合并生成一个新的数据。
- 使用第1题的数据,将学生参与兴趣班的多个变量变成一个变量,取值变成另外一个变量,即将一个wide的数据变成long数据,并计算出每位学生参加兴趣班的数量总和。
要求
- 提交以上四题生成的四个数据,格式”.dta”,数据命名为”姓名_1Q1.dta”,“姓名_1Q2.dta”,依次类推。
- 提交一个R script文件,包含完成以上任务的所有命令,文件名命名为”姓名_1R”。
- 作业须下周上课前完成,并统一发给李诺linuoseu@163.com。
- 李诺收齐之后统一发给我yea027@ruc.edu.cn。