df.dropna()函数用于删除dataframe数据中的缺失数据,即:删除NaN数据(删除空值)
Leave a Comment分类: Pandas
我们有时候需要将一个DataFrame进行行和列的互换操作,即:行转列和列转行,Pandas 提供了非常便捷的 df.T 操作进行转置。
Leave a Comment筛选是我们平时做数据分析时使用非常频繁的功能,pandas库里面除了使用loc和iloc的筛选方法还有其它一些更加高级的方法,例如:isin和str.contains函数。
Leave a CommentDataFrame有一个属性为empty,直接用DataFrame.empty判断就行,DataFrame的empty属性返回一个布尔值,表示数据帧是否为空(没有数据)。如果df为空,则 df.empty 返回 True,反之 返回False。
Leave a Comment数据分组:使用 groupby() 方法进行分组、group.size()查看分组后每组的数量、group.groups 查看分组情况、group.get_group(“名字”) 根据分组后的名字选择分组数
Leave a Commentsize():只返回分组字段的出现次数,说白了就是查看分组后每组的数量。(size 计数时包含 NaN 值)。count():把每一列的值都返回出现的次数。( count 不包含 NaN值)
Leave a Comment在得到数据后,经常需要对数据进行提取、分析和使用,提取数据过程中难免要对数据进行各种切片操作,根据具体的业务需求筛选出所需的数据,pandas提供了一些方法方便我们选取数据,下面主要讲解dataFrame类型的数据选取,Series类型用法类似,可以参考官方文档进行更细致的探究
Leave a Commentgroupby 是pandas中一类非常重要的操作是数据聚合与分组运算。通过groupby方法能够实现对数据集的拆分、统计、转换等操作,这个过程一气呵成。
Leave a Comment