Python Pandas模块数据统计与分析常用方法

新闻
Pandas模块数据统计与分析常用方法。df.describe():按各列返回基本统计量和分位数;df.count():计算非NA值的数量,axis=0 按列计算,axis=1 按行计算,默认axis=0。

 [[270326]]

Pandas模块数据统计与分析常用方法

  • df.describe():按各列返回基本统计量和分位数
  • df.count():计算非NA值的数量,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.max():计算***值,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.min():计算最小值,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.sum():计算和,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.mean():计算平均值,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.median():计算中位数,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.var():计算方差,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.std():计算标准差,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.mad():根据平均值计算平均绝对偏差,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.cumsum():计算累计求和,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.cov():计算协方差矩阵,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df1.corrwith(df2):计算相关系数
  • df1['col1'].groupby(df1['col2']):列1 按照列2 分组,即列2为Key。
  • grouped.agg({ 'col1':'fun1' , 'col2':'fun2' }):通过分组系列,还可以传递函数的列表或字典来进行聚合。对不同的列应用不同的函数的聚合,函数可以是多个。

示例数据集说明

接下来,我们将以如下数据集,分享各函数的使用方法。

Python Pandas模块数据统计与分析常用方法

df.describe()

按各列返回基本统计量和分位数。

Python Pandas模块数据统计与分析常用方法

df.count()

计算非NA值的数量,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

​df.max()

计算***值,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.min()

计算最小值,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.sum()

计算和,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.mean()

计算平均值,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.median()

计算中位数,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.var()

计算方差,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.std()

计算标准差,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.mad()

根据平均值计算平均绝对偏差,axis=0 按列计算,axis=1 按行计算,默认axis=0。

{!-- PGC_COLUMN --}

Python Pandas模块数据统计与分析常用方法

df.cumsum()

计算累计求和,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.cov()

计算协方差矩阵,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df1.corrwith(df2)

计算相关系数。

Python Pandas模块数据统计与分析常用方法

df1['col1'].groupby(df1['col2'])

列1 按照列2 分组,即列2为Key。

Python Pandas模块数据统计与分析常用方法

df.groupby('col1')

DataFrame按照列1分组。

Python Pandas模块数据统计与分析常用方法

grouped.agg(['fun1','fun2'])

根据多个函数聚合,表现成多列,函数名为列名。

Python Pandas模块数据统计与分析常用方法

grouped.agg({ 'col1':'fun1' , 'col2':'fun2' })

通过分组系列,还可以传递函数的列表或字典来进行聚合。对不同的列应用不同的函数的聚合,函数可以是多个。

Python Pandas模块数据统计与分析常用方法
责任编辑:华轩 来源: 今日头条
相关推荐

2015-02-12 16:05:51

微信SDK

2015-02-12 15:45:05

微信SDK

2015-02-12 16:17:09

微信SDK

2015-02-12 16:53:22

微信SDK

2022-06-24 09:58:35

大数据JavaPython

2010-11-04 15:43:49

DB2数据统计与分析系

2017-09-01 09:52:20

PythonPandas数据分析

2021-06-10 09:53:04

数据统计统计分析数据

2014-10-28 14:59:42

手游付费行为数据统计分析

2020-08-14 10:58:27

R语言Python统计分析

2023-12-08 07:55:37

MySQL数据统计InnoDB

2020-05-15 15:21:58

SPSS数据分析

2023-11-21 09:11:31

2015-11-23 18:12:52

2023-11-23 06:51:50

PandasPython

2016-10-18 14:13:21

数据统计模型

2011-05-23 16:50:12

python

2016-12-16 12:43:38

大数据OLAP数据统计

2020-12-14 13:24:17

PandasSQL数据集

2018-08-31 08:01:27

数据统计机器学习深度学习
点赞
收藏

51CTO技术栈公众号