数据可视化学习材料
数据可视化是数据分析一个重要内容,在探索性分析、确定性分析以及结果结果呈现等都发挥着重要的作用,尤其是在探索性阶段是我们发现一些不可见的事实的重要工具,通过单个变量的可视化,可以知晓对象特征的表现与分布,通过呈现多组变量的信息,可以知晓变量之间的关系。数据可视化技术发展较为丰富,有各种各样的图形。需要我们掌握各种图形的生成技术,也需要我们理解不同图形的功能,根据自己的研究需要选择可适图形。图形作为一种传递信息的媒介,不仅需要准确地表征数据信息,而且需要具有一定美感,提供信息的传播效果。
R语言同其它数据分析语言,比如python,一个重要的优势在于其强大制图功能,其有积累各种制图的package。学习R的制图技术有很多优秀的学习材料,这包括教材、package教程和网络课程,本文主要是向大家推荐一些优质的学习材料。这包括books, packages和workshop。
书本资源
ggplot2是一个功能强大作图工具包,数据分析常见的图形基础上都可以由其完成。学习R作图,以下三本书,尤其前两本为必读书目。
ggplot2: Elegant Graphics for Data Analysis 系统介绍如何使用ggplot2做图。
Fundamentals of Data Visualization,从美学的角度讲如何制作和设计图。
R Graphics Cookbook, 2nd edition,以具体问题出发手把手教如何做图。
工具篇
R做图主要是依据功能强大ggplot2及以ggplot2为基础的ggplot2 extensions gallary. ggplot2的拓展packages很多,这两类,一类是对ggplot2生成的图形进行修饰,另一种是生成新的类型图。以下是我认为使用频率较高且较为有用的一些packages.
Essential:
Special:
- gganimate, ggstatsplot, see, ggdist, ggbump, ggridges, ggdag, ggradar, surviminer, ggpie
课程资源
- Graphci Design with ggplot2, 关于ggplot2作图workshop,包括课程内容、ppt、示例及代码;