作业一:数据清理

题目

  1. 以”cepsw2studentCN.dta“为源生成一个新的数据,满足以下条件:
    a.包含以下信息:学生id,w2班级代码,学校id, 认知能力原始得分,数学期中成绩, 英语期中成绩,父母关系好坏情况,父母的教育期望,好朋友的数量, 参加兴趣班/课外辅导班的情况;
    f.将好朋友数量的变量命名为nfriend, 父母期望命名为expectation;
    b.将父母好坏情况和父母教育期期望的变量放置在学校id后面;
    d.选择出数学和英语成绩都是实行150分制的学生;
    c.删除以上变量具有缺失值的个体;
    e.按认知能力降序排列;
    g.生成新变量表示学生英语和数学的加和;
  2. 以上题数据为基础,生成一个新的数据,包含每所学校的数学平均成绩和英语平均成绩。
  3. 以数据”cepsw2teacherCN.dta“为基础,生成一个只包括数学老师信息的数据,并将此数据与第1题中的数据合并生成一个新的数据。
  4. 使用第1题的数据,将学生参与兴趣班的多个变量变成一个变量,取值变成另外一个变量,即将一个wide的数据变成long数据,并计算出每位学生参加兴趣班的数量总和。

要求

  1. 提交以上四题生成的四个数据,格式”.dta”,数据命名为”姓名_1Q1.dta”,“姓名_1Q2.dta”,依次类推。
  2. 提交一个R script文件,包含完成以上任务的所有命令,文件名命名为”姓名_1R”。
  3. 作业须下周上课前完成,并统一发给李诺linuoseu@163.com。
  4. 李诺收齐之后统一发给我yea027@ruc.edu.cn。

参考答案

请独立完成作业后,查看答案