DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
DataFrame可以被看做是由Series组成的字典,并且共用一个索引。

DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
1.DataFrame入门实例
import pandas as pd
# 使用列表创建
data1 = [['张三丰', 100], ['张无忌', 98], ['乔峰', 97]]
# 使用 ndarrays 创建
data2 = {'姓名': ['东方不败', '风清扬', '令狐冲'], '分数': [100, 98, 92]}
# 使用字典创建
data3 = [{'姓名': '王重阳', '分数': 100}, {'姓名': '黄药师', '分数': 95, '住址': '浙江桃花岛'}]
#使用json创建
data4 = {
"姓名": ['孤独求败', '杨过', '金轮法王'],
"分数": [100, 97, 92],
"住址": [None,'古墓','布达拉宫']
}
df1 = pd.DataFrame(data1, columns=['姓名', '分数'], dtype=float)
df2 = pd.DataFrame(data2, columns=['姓名', '分数'], dtype=float)
df3 = pd.DataFrame(data3)
# 数据载入到 DataFrame 对象
df4 = pd.DataFrame(data4)
#指定索引
df5 = pd.DataFrame(data4, index = ["No.1", "No.2", "No.3"])
print(df1)
print(df2)
print(df3)
print(df4)
print(df5)
# 返回第二行
print(df4.loc[1])
# 返回第一行和第二行
print(df4.loc[[0, 1]])
# 获取DataFrame的行数
# 方法1:使用len()函数
num_rows = len(df4)
# 方法2:使用shape属性
num_rows2 = df4.shape[0]
运行效果:
姓名 分数
0 张三丰 100.0
1 张无忌 98.0
2 乔峰 97.0
姓名 分数
0 东方不败 100.0
1 风清扬 98.0
2 令狐冲 92.0
姓名 分数 住址
0 王重阳 100 NaN
1 黄药师 95 浙江桃花岛
姓名 分数 住址
0 孤独求败 100 None
1 杨过 97 古墓
2 金轮法王 92 布达拉宫
姓名 分数 住址
No.1 孤独求败 100 None
No.2 杨过 97 古墓
No.3 金轮法王 92 布达拉宫
姓名 杨过
分数 97
住址 古墓
Name: 1, dtype: object
姓名 分数 住址
0 孤独求败 100 None
1 杨过 97 古墓