Python的pandas库提供了强大的DataFrame数据处理功能,使得在Excel数据中进行各种操作变得简单易行。例如,你可以轻松计算总分,如总分=语文+数学+英语,只需一行代码df['总分']=df['语文']+df['数学']+df['英语']。这个例子中,我们使用read_excel函数读取Excel数据,然后对学生成绩表进行操作。21.1 ...
Python其Frame数据处理
Python的pandas库提供了强大的DataFrame数据处理功能,使得在Excel数据中进行各种操作变得简单易行。例如,你可以轻松计算总分,如总分=语文+数学+英语,只需一行代码df['总分']=df['语文']+df['数学']+df['英语']。这个例子中,我们使用read_excel函数读取Excel数据,然后对学生成绩表进行操作。
21.1 列间求和
总分计算仅需一个语句,可以用来填充DataFrame的相应列。
21.2 数据替换
DataFrame提供了replace()函数,可以替换满足条件的行或列,甚至整个数据集。例如,替换总分列中特定数值,如df['总分'].replace(310,'x',inplace=True)。
21.3 排序
sort_values()函数允许按照一个或多个列进行排序,支持升序或降序。如df=df.sort_values(by=['总分'],ascending=False)。
21.4 字段截取与抽取
使用slice()函数可以截取字符串,如df['年级'] = df['学号'].str.slice(0,2)。df[df.总分>300]则用于抽取总分大于300的记录。
21.5 修改记录
整列替换如df['总分']=df['语文']+df['数学']+df['英语']。个别修改则通过replace()函数实现,例如df.replace('99','100')。
21.6 记录合并
使用concat()函数,如df3 = pandas.concat([df2,df1]),可以合并DataFrame,保持或重置索引。
21.7 统计次数
使用value_counts()函数统计某列值出现的次数,如df['语文'].value_counts(),或者统计占比,如df['语文'].value_counts(ascending=True,normalize=True)。
21.8 按值查找
isin()函数用于查找特定值的记录,如print(df['语文'].isin([84,91]))。
21.9 数据分区
cut()函数用于根据指定区间对数据进行分组,如grade = pd.cut(df.语文,bins,right=False,labels=lab),然后添加新的列表示等级。
这些操作使得Python的DataFrame成为数据预处理的强大工具,帮助你高效地处理Excel数据。2024-08-12