← 返回首页
Pandas之Series
发表时间:2024-02-29 08:47:42
Pandas之Series

1.Series简介

Pandas 是python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。 pandas的两大主要数据结构 Series和DateFrame,其中Series 是带标签的一维数组,可存储整数、浮点数、字符串、Python 对象等类型的数据。轴标签统称为索引,它由两部分组成。

特点:数据对齐事内在的,标签与数据默认对齐,除非特殊情况,一般不会断开连接,因此通过索引取值非常方便,不需要循环,可以直接通过字典方式,key 获取value。

2.Series创建的几种方式

注意:因为pandas是基于NumPy的一种分析工具,因此安装pandas默认会安装numpy!

3.Series常用属性

4.Series常见操作

索引和切片 head(n) tail(n) unique() notnull() isnull()

5.综合实例

实例:

import pandas as pd
import numpy as np

#定义原始数据
nums = [1,2,3,4,5]
lans = ['Java','C','HTML','Python']
citys= {"010":"北京","020":"广州","028":"成都","029":"西安"}
scores =[98,96,95,86,75,60]
stus=['张三','李四',None,'王五',None]

#构造series
s1 = pd.Series(nums)
s2 = pd.Series(lans)

#字典创建
s3 = pd.Series(citys)
# 设置series的名字
s4 = pd.Series(citys,index=["028","029"],name="westcitys")
# 设置显式索引
s5 = pd.Series(scores,index=['A','B','C','D','E','F'])
# numpy创建
s6 = pd.Series(np.random.randint(1,5,size=5),index=['A','B','C','D','E'])
s7 = pd.Series(stus)

#打印series
print(s1)
print(s2)
print(s3)
print(s4)
print(s5)
print(s6)

#输出series的长度
print(s1.size)
print(s2.size)
print(s3.size)
print(s4.size)

#输出维度
print(s1.ndim)
print(s2.ndim)
print(s3.ndim)
print(s4.ndim)

#输出形状
print(s1.shape)
print(s2.shape)
print(s3.shape)
print(s4.shape)


#输出数据类型
print(s1.dtype)
print(s2.dtype)
print(s3.dtype)
print(s4.dtype)

#显示头尾多少行
print(s3.head(2))
print(s3.tail(2))

#切片操作
print(s3[0:3])

#修改元素
s2[2]='SQL'
print(s2)

#判断是否为None
print(s7.notnull())
#过滤掉None元素
print(s7.dropna())