python如何做数据分析

Python做数据分析比较好用且流行的是numpy、pandas库，有兴趣的话，可以深入了解、学习一下。2020-09-18

用Python做数据分析，大致流程如下：
1、数据获取
可以通过SQL查询语句来获取数据库中想要数据。Python已经具有连接sql server、mysql、orcale等主流数据库的接口包，比如pymssql、pymysql、cx_Oracle等。
2、数据存储
企业当中的数据存储，通过通过数据库如Mysql来存储与管理，对于非结构化数据的存储可以使用MongoDB等。对于使用Python进行网络抓取的数据，我们也可以使用pymysql包快速地将其存储到Mysql中去。
3、数据预处理/数据清洗
大多数情况下，原始数据是存在格式不一致，存在异常值、缺失值等问题的，而不同项目数据预处理步骤的方法也不一样。Python做数据清洗，可以使用Numpy和Pandas这两个工具库。
4、数据建模与分析
常见的数据挖掘模型有：分类、聚类、回归等，这些常见的算法模型，Python也有Scikit-learn和Tensorflow工具库来支持。
5、数据可视化分析
在数据可视化方面，Python有Matplotlib、Seaborn、Pyecharts等工具库可用。
2020-09-18

mengvlog 阅读 61 次 更新于 2025-12-14 02:48:02 我来答关注问题 0

2 个回答檬味博客专题活动

其他Python类似问题

檬味博客在线解答立即免费咨询

Python相关话题

二维数组python 有用 (46)
python拟合有用 (50)
python排列有用 (44)
python日志有用 (48)
python计算机二级有用 (61)
python基本有用 (57)
pythonkey 有用 (50)
封装python 有用 (46)
python范围有用 (45)
python字节有用 (57)