Pandas 是python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。 pandas的两大主要数据结构 Series和DateFrame,其中Series 是带标签的一维数组,可存储整数、浮点数、字符串、Python 对象等类型的数据。轴标签统称为索引,它由两部分组成。

特点:数据对齐事内在的,标签与数据默认对齐,除非特殊情况,一般不会断开连接,因此通过索引取值非常方便,不需要循环,可以直接通过字典方式,key 获取value。
注意:因为pandas是基于NumPy的一种分析工具,因此安装pandas默认会安装numpy!

索引和切片 head(n) tail(n) unique() notnull() isnull()
实例:
import pandas as pd
import numpy as np
#定义原始数据
nums = [1,2,3,4,5]
lans = ['Java','C','HTML','Python']
citys= {"010":"北京","020":"广州","028":"成都","029":"西安"}
scores =[98,96,95,86,75,60]
stus=['张三','李四',None,'王五',None]
#构造series
s1 = pd.Series(nums)
s2 = pd.Series(lans)
#字典创建
s3 = pd.Series(citys)
# 设置series的名字
s4 = pd.Series(citys,index=["028","029"],name="westcitys")
# 设置显式索引
s5 = pd.Series(scores,index=['A','B','C','D','E','F'])
# numpy创建
s6 = pd.Series(np.random.randint(1,5,size=5),index=['A','B','C','D','E'])
s7 = pd.Series(stus)
#打印series
print(s1)
print(s2)
print(s3)
print(s4)
print(s5)
print(s6)
#输出series的长度
print(s1.size)
print(s2.size)
print(s3.size)
print(s4.size)
#输出维度
print(s1.ndim)
print(s2.ndim)
print(s3.ndim)
print(s4.ndim)
#输出形状
print(s1.shape)
print(s2.shape)
print(s3.shape)
print(s4.shape)
#输出数据类型
print(s1.dtype)
print(s2.dtype)
print(s3.dtype)
print(s4.dtype)
#显示头尾多少行
print(s3.head(2))
print(s3.tail(2))
#切片操作
print(s3[0:3])
#修改元素
s2[2]='SQL'
print(s2)
#判断是否为None
print(s7.notnull())
#过滤掉None元素
print(s7.dropna())