← 返回首页
使用分组聚合进行组内计算
发表时间:2024-03-17 14:22:25
使用分组聚合进行组内计算

1.groupby()方法拆分数据

groupby()方法提供的是分组聚合步骤中的拆分功能,能够根据索引或特征对数据进行分组,其基本使用格式如下。

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=<no_default>, observed=False, dropna=True)

分组后的结果并不能直接查看,而是被存在内存中,输出的是内存地址。实际上,分组后的数据对象groupby类似于Series与DataFrame,是pandas提供的一种对象。

groupby对象常用的描述性统计方法及说明如下表。

2.使用agg()方法聚合数据

agg()方法和aggregate()方法都支持对每个分组应用某函数,包括Python内置函数或自定义函数。同时,这两个方法也能够直接对DataFrame进行函数应用操作。

针对DataFrame的agg()方法与aggregate()方法的基本使用格式如下。

DataFrame.agg(func, axis=0, *args, **kwargs)
DataFrame.aggregate(func, axis=0, *args, **kwargs)