Pandas之Series - 博客详情

1.Series简介

Pandas 是python的核心数据分析支持库，提供了快速、灵活、明确的数据结构，旨在简单、直观地处理关系型、标记型数据。 pandas的两大主要数据结构 Series和DateFrame，其中Series 是带标签的一维数组，可存储整数、浮点数、字符串、Python 对象等类型的数据。轴标签统称为索引，它由两部分组成。

values:一组数据(ndarray类型)
index:相关的数据索引标签

特点：数据对齐事内在的，标签与数据默认对齐，除非特殊情况，一般不会断开连接，因此通过索引取值非常方便，不需要循环，可以直接通过字典方式，key 获取value。

2.Series创建的几种方式

列表创建
numpy创建
字典创建

注意：因为pandas是基于NumPy的一种分析工具，因此安装pandas默认会安装numpy!

3.Series常用属性

4.Series常见操作

索引和切片 head(n) tail(n) unique() notnull() isnull()

5.综合实例

实例：

import pandas as pd
import numpy as np

#定义原始数据
nums = [1,2,3,4,5]
lans = ['Java','C','HTML','Python']
citys= {"010":"北京","020":"广州","028":"成都","029":"西安"}
scores =[98,96,95,86,75,60]
stus=['张三','李四',None,'王五',None]

#构造series
s1 = pd.Series(nums)
s2 = pd.Series(lans)

#字典创建
s3 = pd.Series(citys)
# 设置series的名字
s4 = pd.Series(citys,index=["028","029"],name="westcitys")
# 设置显式索引
s5 = pd.Series(scores,index=['A','B','C','D','E','F'])
# numpy创建
s6 = pd.Series(np.random.randint(1,5,size=5),index=['A','B','C','D','E'])
s7 = pd.Series(stus)

#打印series
print(s1)
print(s2)
print(s3)
print(s4)
print(s5)
print(s6)

#输出series的长度
print(s1.size)
print(s2.size)
print(s3.size)
print(s4.size)

#输出维度
print(s1.ndim)
print(s2.ndim)
print(s3.ndim)
print(s4.ndim)

#输出形状
print(s1.shape)
print(s2.shape)
print(s3.shape)
print(s4.shape)


#输出数据类型
print(s1.dtype)
print(s2.dtype)
print(s3.dtype)
print(s4.dtype)

#显示头尾多少行
print(s3.head(2))
print(s3.tail(2))

#切片操作
print(s3[0:3])

#修改元素
s2[2]='SQL'
print(s2)

#判断是否为None
print(s7.notnull())
#过滤掉None元素
print(s7.dropna())