← 返回首页
Python3基础教程(八十八)
发表时间:2023-03-25 23:06:18
DataFrame

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

DataFrame可以被看做是由Series组成的字典,并且共用一个索引。

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

1.DataFrame入门实例

import pandas as pd

# 使用列表创建
data1 = [['张三丰', 100], ['张无忌', 98], ['乔峰', 97]]

# 使用 ndarrays 创建
data2 = {'姓名': ['东方不败', '风清扬', '令狐冲'], '分数': [100, 98, 92]}

# 使用字典创建
data3 = [{'姓名': '王重阳', '分数': 100}, {'姓名': '黄药师', '分数': 95, '住址': '浙江桃花岛'}]

#使用json创建
data4 = {
    "姓名": ['孤独求败', '杨过', '金轮法王'],
    "分数": [100, 97, 92],
    "住址": [None,'古墓','布达拉宫']
}


df1 = pd.DataFrame(data1, columns=['姓名', '分数'], dtype=float)
df2 = pd.DataFrame(data2, columns=['姓名', '分数'], dtype=float)
df3 = pd.DataFrame(data3)

# 数据载入到 DataFrame 对象
df4 = pd.DataFrame(data4)

#指定索引
df5 = pd.DataFrame(data4, index = ["No.1", "No.2", "No.3"])

print(df1)
print(df2)
print(df3)
print(df4)
print(df5)

# 返回第二行
print(df4.loc[1])

# 返回第一行和第二行
print(df4.loc[[0, 1]])

# 获取DataFrame的行数
# 方法1:使用len()函数
num_rows = len(df4)


# 方法2:使用shape属性
num_rows2 = df4.shape[0]

运行效果:

    姓名     分数
0  张三丰  100.0
1  张无忌   98.0
2   乔峰   97.0
     姓名     分数
0  东方不败  100.0
1   风清扬   98.0
2   令狐冲   92.0
    姓名   分数     住址
0  王重阳  100    NaN
1  黄药师   95  浙江桃花岛
     姓名   分数    住址
0  孤独求败  100  None
1    杨过   97    古墓
2  金轮法王   92  布达拉宫
        姓名   分数    住址
No.1  孤独求败  100  None
No.2    杨过   97    古墓
No.3  金轮法王   92  布达拉宫
姓名    杨过
分数    97
住址    古墓
Name: 1, dtype: object
     姓名   分数    住址
0  孤独求败  100  None
1    杨过   97    古墓