📌  相关文章
📜  Python Pandas 中的数据框属性(1)

📅  最后修改于: 2023-12-03 14:46:01.906000             🧑  作者: Mango

Python Pandas 中的数据框属性

Pandas 是 Python 语言中重要的数据分析工具,而 Pandas 中最重要的数据结构之一就是数据框(DataFrame)了。在 Pandas 中数据框的常用属性包括以下几个:

数据框的形状属性
  • .shape 属性

该属性返回数据框的行数和列数,即 (行数, 列数) 的元组。例如:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.shape)

输出:

(100, 5)
数据框的列属性
  • .columns 属性

该属性返回数据框的列名列表。例如:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.columns)

输出:

['name', 'age', 'gender', 'salary', 'city']
数据框的内部结构属性
  • .index 属性

该属性返回数据框的行索引。例如:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.index)

输出:

RangeIndex(start=0, stop=100, step=1)
数据框的元素属性
  • .values 属性

该属性返回数据框的所有元素构成的二维数组,即不包括行索引和列名。例如:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.values)

输出:

[['Tom' 28 'M' 5000 'Beijing']
 ['Jerry' 35 'M' 8000 'Shanghai']
 ...
 ['Lucy' 24 'F' 4000 'Shenzhen']]
数据框的数据类型属性
  • .dtypes 属性

该属性返回数据框中每一列的数据类型。例如:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.dtypes)

输出:

name       object
age         int64
gender     object
salary      int64
city       object
dtype: object
数据框的摘要统计属性
  • .describe() 方法

该方法返回一个包含数据框主要数值变量的摘要统计信息的数据框。例如:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.describe())

输出:

              age       salary
count  100.000000   100.000000
mean    29.350000  6187.000000
std      6.372672  2570.269848
min     18.000000  2000.000000
25%     24.750000  4000.000000
50%     29.500000  5500.000000
75%     34.000000  8000.000000
max     45.000000  9900.000000