常用分析工具及其优劣
数据分析工具可以分为两类,一类是主要通过菜单与点击进行操作,比如SPSS, Power BI, Tableau等,一类通过代码进行操作,主要Stata, R和python,其它的还有sas, matlab等,因为数据分析的重复性,前者越来越低效。另一方面,随着编程技术我模块化和高阶化,使用编程语言进行数据分析越来越简单。因此,进行数据分析,使用编程性分析工具逐渐成为一种必须。因此,想学习量化研究方法的同学应当根据需求和时间学习一种编程语言,进行数据分析。
Stata,商业软件,专注统计分析,具备数据清理、数据可视化、各种主流的统计模型。性能稳定,功能更加体系化,具有一定可拓展性。语法结构简单,学习难度小。
R,开源软件,专业的统计分析、作图软件,具备强大的数据清理、可视化、和前沿的统计模型模块。可拓展性超强,具备大量附属功能。以functions为基础的高阶命令为基础,易于理解。
python,一个通用的编程语言,具备网站建设、系统管理、软件开发等,数据分析只是其功能之一,尤其在前沿的机器学习方面的功能强大。以object为基础的语法结构,在学习其数据分析功能之前,需要学习一些Python编程的基础知识。
每一种编辑语言都在不断进化,因此,在数据分析方面,各软件的功能在不断趋同,仅是其实现的方式有所不同而已。数据。对于常规的数据分析,各编程语言差异不大,只是一些特殊的数据领域,不同分析语言具有各自的优势,比如python在机器学习、文本处理上更强大一些,R在数据可视化更强大一些,统计和计量方法研究者多使用R,最前沿的研究方法相关的实现方式主要来自R。因此,不必过于纠结掌握哪一种分析语言。可根据今后使用数据分析技术的可能性决定学习哪一种分析语言。如果只是完成学业,今后也不会从事数据分析相关的工作,可学习Stata即可,投入的时间少一些。如果今后从事量化研究工作,建议学习R语言。如果今后可能去企业从事数据分析工作,建议学习Python。
另外,学习分析工具的难处并不在于操作,就操作而言,以上分析软件,根据教程,练习一段时间,基本熟练快速熟练掌握。因为毕竟是一种技术,需要投入一定时间练习。学习分析工具的难点在于如何选择各种分析技术,并对软件提供的结果进行解读。这些需要量化研究设计和统计分析知识,是与分析语言无关的内容。