3.9 KiB
熊猫数据框架平均值——如何计算平均值?
原文:https://www.askpython.com/python-modules/pandas/pandas-dataframe-mean
在本文中,我们将计算 Python pandas 中的数据帧平均值。Python 被广泛用于数据分析和处理。所以一般来说 python 是用来处理庞大且未分类的非正式数据的。为了从我们现有的数据中获得有意义的信息,我们使用统计概念,如均值、中值和众数。这些概念有助于我们对数据进行适当的分类和建模,以便提出一个非常有效的模型。
什么是卑鄙?
Mean 基本上是我们数据集的平均值。对于一个数据集,算术平均值,也称为算术平均值,是一组有限数字的中心值:具体来说,是值的总和除以值的个数。平均值由以下公式给出:
|
| = | 等差中项 |
|
| = | 值的数量 |
|
| = | 数据集值 |
熊猫的数据帧均值
我们在 pandas 中有一个内置的均值函数,可以用在我们的数据框对象上。为了使用 mean 函数,我们需要在代码片段中导入 pandas 库。现在让我们理解均值函数的基本语法和性质
熊猫。数据帧.平均值
mean 函数在应用于系列时将返回系列的平均值,在应用于 dataframe 对象时,将返回 dataframe 中所有系列的平均值列表。现在让我们理解均值函数的语法和参数。
句法
DataFrame.mean(axis=None,skipna=None,level=None,numeric_only=None,**kwargs)
因素
- 轴:取值可以是 0,也可以是 1。默认值为 0,表示索引/行轴。 当轴= 0 时,该功能应用于索引轴和
- 当 axis = 1 时,它应用于列。
- skipna: 计算结果时排除所有空值。
- **级别:**与特定级别一起计数,如果轴是多指标(分层),则折叠成一个系列。
- numeric_only: 只包含 int、float、boolean 列。如果没有,它将尝试使用所有数据,然后只使用数字数据。未针对系列实施。
- **kwargs: 要传递给函数的附加关键字参数。
返回系列或数据帧的平均值。
既然我们已经熟悉了函数的语法和参数,现在让我们通过一些例子来理解函数的工作原理。
示例–如何计算数据帧平均值
import pandas as pd
data = [[4, 1, 5], [3, 6, 7], [4, 5, 2], [2, 9, 4]]
df = pd.DataFrame(data)
print(df.mean(axis = 0))
输出
0 3.25
1 5.25
2 4.50
dtype: float64
我们可以看到,平均值是为数据帧的每一行/索引计算的
示例–用轴 1 计算数据帧平均值
import pandas as pd
data = [[4, 1, 5], [3, 6, 7], [4, 5, 2], [2, 9, 4]]
df = pd.DataFrame(data)
print(df.mean(axis = 1))
输出
0 3.333333
1 5.333333
2 3.666667
3 5.000000
dtype: float64
这里我们可以看到,平均值是为每一列计算的。
在下一个例子中,我们将看到如何将均值函数应用于数据帧中的特定序列。
示例 3–计算不带轴的平均值
import pandas as pd
data = [[4, 1, 5], [3, 6, 7], [4, 5, 2], [2, 9, 4]]
df = pd.DataFrame(data)
print(df[0].mean())
上面的代码将打印数据帧中第一个索引轴的平均值。
输出
3.25
这里我们可以验证输出是一个标量值,它是 df[0] = {4,3,4,2}的平均值。即(4+3+4+2)/3 = 3.25
结论
通过本文,我们了解了 mean()函数在熊猫图书馆中的用途和应用。
参考
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.mean.html
