Press "Enter" to skip to content

Pandas中groupby分组聚合函数size()和count()的区别

size():只返回分组字段的出现次数,说白了就是查看分组后每组的数量。(size 计数时包含 NaN 值)

count():把每一列的值都返回出现的次数。( count 不包含 NaN值)

举个例子:

首先打开一份数据(这是一份A股2019年3月份所有股票的交易数据)

先用 size() 来测试一下它返回是效果是怎么样的,例如:我想知道3月份里每一天有多少只股票在交易

import pandas as pd

pd.set_option('display.unicode.ambiguous_as_wide', True)  #处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True)   #无法对齐主要是因为列标题是中文

df=pd.read_csv(r'C:\Users\Administrator\Desktop\python练习\xbx_stock_2019\data\a_stock_201903.csv',encoding='gbk')
df1=df.groupby('交易日期').size()
print(df1)

再来看看,使用 count()函数来计数的效果

df2=df.groupby('交易日期').count()

它会返回每一列的统计数据

好了,size()和count()的区别你看懂了吗?

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注