geekdoc-python-zh/docs/askpython/pandas-read-csv-with-header...

4.1 KiB
Raw Permalink Blame History

如何使用熊猫阅读带标题的 CSV

原文:https://www.askpython.com/python-modules/pandas/pandas-read-csv-with-headers

虽然 Python 完全适合于分析数据,但它天生就没有应该分析的数据集来源。所有这些数据集都将从其他地方获得,并被输入 Python以便让奇迹发生。我们将探索一种这样的技术使用 Python 的内置特性之一将数据导入 Python。本文中感兴趣的文件也应该有点特殊——一个带头文件的 CSV 文件!

我们将使用下面的数据集来演示操作的顺序,其中一行中的每个条目都由一个“制表符”分隔开。我们开始吧!

Sample Dataset

Text File for Demonstration

也读: Python 熊猫模块教程


进口熊猫:

我们应该使用下面的代码将 Pandas 库导入到活动的 Python 窗口中。

import pandas as pd

完成后点击回车&等待一会儿,软件会在后台加载“熊猫”库。这可以通过每行代码前的箭头很好地发现。在“熊猫”满载之前,这些箭头不应出现在新行中。

Pandas Loading

No Arrows when Pandas are loading

只有在成功加载熊猫后,这些箭头才会出现,如下图所示。

Arrows Appear

Arrows Appear after Pandas are Loaded


使用 read_csv() 读取带头文件的 csv 文件

CSV 代表逗号分隔值。你会问,哪些值是文本文件中的值!

这意味着文本文件中的值由逗号分隔,以将一个条目与另一个条目隔离开来。尽管 CSV 只使用“逗号”作为分隔符,但它被广泛用于表示文本文件,在这些文件中,分隔符是由制表符、空格甚至冒号来实现的。

下面是 read_csv() 的语法。

df = pd.read_csv(filename.txt,sep=x, header=y, names=[name1, name2’…])

在哪里,

  • df-数据帧
  • filename . txt要导入的文本文件的名称。
  • x中使用的分隔符类型。csv 文件。
    • “\ t”-制表符
    • “,”–逗号
    • “”–空间等等
  • y数据中的标题类型
    • 无–如果第一行中的条目不是标题
    • 0如果第一行中的条目是标题

现在我们将应用这个语法从本文前面显示的文本文件中导入数据。

“filename.txt”被替换为“Sales Data.txt”“x”被替换为“\ t”& y 被替换为 0(零),因为数据包含标题行。在这些替换之后,产生的代码应该如下所示:

df = pd.read_csv("Sales Data.txt", sep="\t", header=0)

按回车键&如果箭头在完全沉默片刻后出现,应该知道没有任何错误。

No Error 1

The Arrowheads Appear!

箭头表明数据已经成功地导入到 Python 中,但是如果我们没有偷偷看一眼,这会让我们感到满意吗?

Python 中可用的 print()命令就是为了达到这个目的。使用 read_csv()命令加载数据的数据框现在可以使用,

print(df)

输入上述&后,点击回车,导入的数据如下图所示。

Imported Data

Viewing the Imported Data

还要注意的是,即使 header=0 在代码中被跳过read_csv()被设置为默认选择 0 作为头(即第一行)作为头,以便数据被导入时考虑相同的内容。

Importing Data With Default Setting

Importing Data With Default Header Setting


总结

既然我们已经到了这篇文章的结尾,希望它已经详细阐述了如何使用 Python 中的 Pandas 来读取带头文件的 CSV 文件。这里有另一篇文章详细介绍了 fillna()方法在 Pandas 中的用法。在 AskPython 中还有许多其他有趣的&文章,这些文章可能对那些想提高 Python 水平的人有很大帮助。