📅  最后修改于: 2023-12-03 15:41:28.892000             🧑  作者: Mango
在Python中,pandas是数据处理中广泛使用的工具。pandas的主要数据结构是数据框,也称作DataFrame。数据框是一个二维表结构,可以存储不同种类的数据(整数、浮点数、字符串等),并且可以方便地处理和操作数据。
本文将介绍如何获取有关数据框的信息,包括数据类型、数据大小、列名、索引等。
数据框中的每一列都有相应的数据类型。可以使用dtypes
属性来获取数据框中各列的数据类型。例如:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.1, 2.2, 3.3], 'C': ['foo', 'bar', 'baz']})
print(df.dtypes)
输出结果为:
A int64
B float64
C object
dtype: object
其中,int64
表示整数类型,float64
表示浮点数类型,object
表示字符串类型。
数据框中包含的数据量可以使用shape
属性来获取,它以元组的形式返回数据框的行数和列数。例如:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.1, 2.2, 3.3], 'C': ['foo', 'bar', 'baz']})
print(df.shape)
输出结果为:
(3, 3)
其中,3
表示数据框的行数,3
表示数据框的列数。
我们可以使用columns
属性来获取数据框的列名。例如:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.1, 2.2, 3.3], 'C': ['foo', 'bar', 'baz']})
print(df.columns)
输出结果为:
Index(['A', 'B', 'C'], dtype='object')
其中,Index(['A', 'B', 'C'], dtype='object')
表示数据框的列名及其数据类型。
pandas支持多种类型的索引,例如整数索引、标签索引、多级索引等。我们可以使用index
属性来获取数据框的索引。例如:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [1.1, 2.2, 3.3], 'C': ['foo', 'bar', 'baz']})
print(df.index)
输出结果为:
RangeIndex(start=0, stop=3, step=1)
其中,RangeIndex(start=0, stop=3, step=1)
表示数据框的索引类型为整数索引,索引范围为[0, 3)
,步长为1
。
以上就是如何获取有关数据框的信息的介绍。希望本文能对您的Python学习和工作有所帮助!