← 返回首页
合并数据
发表时间:2024-04-07 14:32:53
合并数据

合并数据

1.堆叠合并数据

又分为横向堆叠和纵向堆叠。

横向堆叠,即将两个表在x轴向拼接在一起,可以使用concat函数完成。concat函数的基本使用格式如下。

pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)

2.主键合并数据

主键合并,即通过一个或多个键将两个数据集的行连接起来,类似于SQL中的join。

针对两张包含不同特征的表,将根据某几个特征一一对应拼接起来,合并后数据的列数为两个原数据的列数和减去连接键的数量。

和数据库的join一样,merge函数也有左连接(left)、右连接(right)、内连接(inner)和外连接(outer)。

比起数据库SQL语言中的join,merge函数还有其自身独到之处,如可以在合并过程中对数据集中的数据进行排序等,merge函数的基本使用格式如下。

pandas.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

3.重叠合并数据

在数据分析和数据处理过程中偶尔会出现两份数据的内容几乎一致的情况,但是某些特征在其中一张表上是完整的,而在另外一张表上的数据则是缺失的。

combine_first()方法来进行重叠数据合并,其原理如下图所示。