数据分析】python数据分析需要学习哪些内容?

2020-04-23 14:35发布

2条回答
小李
1楼 · 2020-04-23 14:47.采纳回答

1.统计基础

理工科的学生在本科阶段学习过概率论与数理统计,单从做数据分析的角度已经够用。其他方面,可以根据需要查看相关书籍,随时进行查漏补缺即可。个人推荐《深入浅出统计学》,可以让统计理论的学习有趣又自然。

2.数据库知识

关系型数据库很重要。在学习数据分析的初期甚至很长一段时间,你接触到的数据都存储在关系型数据库中,需要学习SQL语言进行数据查询。关于SQL语言,强力推荐《SQL必知必会》,整本书通俗易懂,是学习SQL语言的不二之选。

学习数据库的本质就是在学习一种与数据打交道的逻辑思维与能力。编程中的很多思想都和关系型数据库、SQL相通,比如:SQL中对data进行group by的操作,这个在Excel里类似于透视表,在Python/R中也有相应的group function去处理数据。甚至在以后的进阶过程,你会接触到分布式数据库和所对应的no-SQL语句。

3.编程能力

Excel。 透视表(Pivot Table)是做数据分析的必备技能。透视表可以帮你迅速汇总数据,看到各类型数据的直观特征就像是让你站在更高的视角看待数据。作为进阶,Excel自带的函数、各种插件,以及VBA也是很好的工具。


魏魏姐
2楼 · 2020-04-23 14:44

数据分析主要步骤是:数据采集、数据处理、数据分析、数据展现和撰写报告。

python数据分析,会网络爬虫,在数据采集这的工作基本就没有问题了;

数据处理用Python的numpy和pandas,可以作为入门的方向,dataFrame可以派上用场;掌握的理论知识,和代码工具使用方法,结合一些常见案例,自己模仿,了解原理,同时巩固第一阶段的代码工具的使用技巧;通过自己的项目经验,融汇贯通,思考如何做分析,怎么做分析,从什么角度去做,使用哪种方法更好,效率更高,对数据有一定的宏观认识,利用自己之前的积累,对数据有一定的掌控和结果输出。

数据可视化方面,用matplotlib可以实现,Python也可以做词云可视化等等,

报告撰写方面,需要多锻炼锻炼写作能力。


相关问题推荐

没有解决我的问题,去提问