很多学习数据分析的同学苦于没有基础数据,导致自己在学习过程中单纯的学习理论知识,却无法进行实操练习。针对这个问题教育培训网的老师结合实际可用数据,专注于使用 Pandas 进行数据准备、清洗、整理、计算与可视化,讲授了最专业的数据清洗与处理工具OpenRefine, 最主流的数据可视化框架Seaborn和Echarts,并利用Bokeh实现动态可视化图表与控制面板。
在本门课程中都可以学到哪些知识呢?
1、EDA探索性数据分析方法
综合运营算法与图表探索数据分布与关系,从而发现数据的规律。
2、数据清洗与处理利器
详细讲解行业主流数据清洗工具OpenRefine,可快速筛选数据、清洗数据、排重、分析时间维度上的分布与趋势等,功能十分强大,工作效率大幅度提升!在实战项目中动手实操并掌握OpenRefine。
3、数据可视化利器
详细讲解行业主流的数据可视化工具Seaborn和国内流行的Echarts可视化框架,绘制高级报表不在话下!
4、五大综合实战项目
根据数据类型的不同,设计了多个典型数据分析实战项目,覆盖多种数据分析方法,包括统计分析方法、时序分析方法、地理分析方法等。项目包括:chipotle西餐厅外卖订单数据分析,UouTube视频流行趋势数据分析,2012年美国总统选举捐款数据分析,北京市空气质量数据分析,2015-2017年美国芝加哥市犯罪记录数据分析。
5、商业智能拓展
以“纽约市出租车数据分析”项目为例,利用Bokeh实现数据分析结果的动态可视化,与商业智能控制面板的实现。
在数据分析实战中应该着重学习那些Python的第三方库呢?目前Python被公认为是数据分析最佳的编程语言,在Python的第三方库中,有大量实现数据科学的模块,那这门课中的实战案例使用到了哪些Python数据分析的库呢?
1、Numpy:支持高级大量的维度数组与矩阵运算,运行效率高校,是处理大量数组类结构和机器学习框架的基础。
2、Pandas:目前最流行的数据分析库,高性能、易使用的数据结构与数据分析工具,是数据的使用既简单又直观。
3、Matplotlib:快速绘制折线图、直方图、饼图、散点图等,适用于简单、朴素的数据呈现、
4、Seaborn:专攻于统计可视化,Matplotlib的高级化,可以做出更具吸引力的图。
5、Bokeh:简单易用,天然支持Python和Pandas,适合与多种场合。
通过本门课程相信大家在掌握数据分析理论的基础上能够实现,全面掌握Python相关数据分析的第三方库的使用;能够掌握数据清洗、分组和聚合等数据分析必备的知识技能;同时能够掌握时间序列、文本序列相关的数据分析方法;并且结合这些实战案例,提高动手实操的能力,可以独立对数据进行处理分析以及其可视化,达到举一反三的水平从而get到自己满意的数据分析岗位工作。课程地址:Python数据分析实战