数据分析主要需要学习:认识数据、数据基础运算:科学计算模块Numpy—基础操作、数据统计分析:科学计算模块Numpy进阶—统计分析、数据可视化基础:matplotlib基础绘图模块、数据可视化高阶:pyecharts三方库html动图绘制、表格数据操作:pandas操作表格数据、pandas进阶—数据清洗 、数据集成、数据规约等内容。
认识数据:数据的定义、数据的类型、数据的度量方式、数据来源、脏数据来源、为什么做数据处理、数据处理有哪些维度。
数据基础运算:科学计算模块Numpy—基础操作:简介、矩阵的创建、矩阵的运算、矩阵的属性、自定义数组的创建、数组的属性、特定形式数组的创建、随机数组的创建、数组的索引、数组的形状变换、数组的拆分和合并、数组运算
数据统计分析:科学计算模块Numpy进阶—统计分析:numpy文件读写、数组去重和重复、数组排序、常用统计分析函数
数据可视化基础:matplotlib基础绘图模:块折线图绘制、散点图绘制、柱状图绘制、子图绘制、直方图绘制、饼图绘制、箱线图绘制、雷达图绘制、三维图绘图、动图的绘制
数据可视化高阶:pyecharts三方库html动图绘制:yecharts简介、柱状图绘制、饼图绘制、折线图绘制、组合图绘制、流向地图绘制、中国地图绘制、世界地图绘制
表格数据操作:pandas操作表格数据:Pandas简介、Dataframe与Series的创建、Dataframe与Series属性、Dataframe索引修改、Pandas文件读写、Dataframe查询操作、Dataframe增删改操作、Pandas统计分析、Pandas时间数据、Pandas分组聚合、Pandas透视表及交叉表
pandas进阶—数据清洗 、数据集成、数据规约:认识数据处理、数据集成、数据集成-堆叠合并、数据集成-主键合并、数据集成-重叠合并、数据清洗--重复值处理、数据清洗--缺失值处理。
数据分析就是指用适当的数据统计分析方法对搜集来的很多数据信息进行分析,将他们加以归纳和理解并消化吸收,以求最大化地开发数据的功能,充分发挥数据的作用。数据分析是为了能提取有效信息和形成结论而对数据加以详细研究和概括总结的过程。
微信扫码关注公众号
获取更多考试热门资料