数据描述统计

时间:2023年10月6日 地点:公二2107

课程内容

  1. 对于种类变量的表述;
  2. 对于离散变量的描述;
  3. 对连续变量的表述;
  4. 各类表格的生成:频数表\交叉表\统计表\回归表;
  5. table 1的生成;
  6. 对表格进行格式调整,涉及表头、表尾、注释,条件格式调整等;

阅读材料

优秀的R pacakges的一大优点就是其有一个提供详细的说明材料和学习材料的官方网站,这周主要学习的modelsummary 和flextable,也提供很好的学习材料,前者为一个官方网站,后者有一本供学习的Ebook;

需要安装的软件

关于表格的创建和美化,有很多packages。可用于生成表格的package有base, rstatix, sjmisc, janitor, gtsummary, modelsummary。其中gtsummary 和modelsummary,专注于表格的生成,gtsummary兼容pipe,可识别变量labels attribute,且对labelled的数据支持比较友好,但其将统计数据整合在一个单元格,后期调整空间较小,相反,modelsummary生成的数据表格的功能和可调整空间都较大一些,尤其是对统计回归表格的支持更为广泛。对表格进行美化的package有gtgtExtrasflextableformattablekableExtraDTreactable。本课程主要讲述modelsummaryflextable,部分讲解rstatixsjmisc, kableExtra, DT。因此,需要大家下载安装以下package:

  • rstatix, 主要是生成统计分析表格;主要使用的function有get_summary_stats;
  • sjmisc, 快捷生成频数表和统计表,主要使用的function有descr, frq;
  • modelsummary, 可用于生成各种类型的表格;
  • flextable,表格美化,表格风格比较适用word文档;
  • kableExtra,美化表格,对html格式的表格比较友好;
  • DT,用于生成可交互的表格;

课程课件

第三节课课件
提示

按左右方向键可浏览ppt,按F键可全屏显示。

演示代码

下载