【Python进阶系列】DataFrame透视表|图解 + 示例代码

Python进阶系列中,DataFrame透视表是一种强大的数据汇总工具,它通过行和列上的分组键动态地组织数据,提供数据的多维度分析。以下是关于DataFrame透视表的详细解答:关键参数:data:指定要创建透视表的数据源,通常是一个DataFrame对象。index:用于设置数据的分组依据,决定了数据透视的方向。可以设置单个或...
【Python进阶系列】DataFrame透视表|图解 + 示例代码
Python进阶系列中,DataFrame透视表是一种强大的数据汇总工具,它通过行和列上的分组键动态地组织数据,提供数据的多维度分析。以下是关于DataFrame透视表的详细解答:
关键参数:
data:指定要创建透视表的数据源,通常是一个DataFrame对象。index:用于设置数据的分组依据,决定了数据透视的方向。可以设置单个或多个分组键,实现多级分组。values:一个列名列表,用于指定要进行透视分析的字段。默认情况下,pivot_table会对这些字段进行平均值计算。columns:用于设置透视表的列标签,可以进一步细分数据。aggfunc:指定聚合函数,用于对values参数中的字段进行汇总计算。常用的聚合函数包括求和、平均值、标准差等,也可以自定义函数。方法使用:
DataFrame对象内置的pivot_table方法和pandas的顶级函数pandas.pivot_table功能相同,可以灵活选择使用。在设置index参数时,需要了解数据结构,确定分组键的顺序。可以使用unstack和stack方法调整行和列的索引,以满足不同的分析需求。但需要注意列数据类型,如作为values参数的列需要为数值型。与groupby方法的区别:
透视表与groupby方法功能相似,都是用于数据分组和汇总。但pivot_table提供了更直观的表格式结果,便于查看和分析。在实际使用中,可以根据具体需求灵活选择pivot_table或groupby方法。示例代码:“`pythonimport pandas as pd
# 示例数据 data = { ‘Age’: [25, 30, 35, 40, 25, 30], ‘Gender’: [‘Male’, ‘Female’, ‘Male’, ‘Female’, ‘Female’, ‘Male’], ‘Salary’: [5000, 6000, 7000, 8000, 5500, 6500] }
df = pd.DataFrame
# 创建透视表 pivot_table = pd.pivot_table
print “`
上述代码将创建一个按年龄和性别分组的薪资透视表,并计算各组的平均薪资。
2025-03-31
mengvlog 阅读 10 次 更新于 2025-07-19 02:40:47 我来答关注问题0
檬味博客在线解答立即免费咨询

Python相关话题

Copyright © 2023 WWW.MENGVLOG.COM - 檬味博客
返回顶部