发布时间:2023-08-11 12:30
本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。
利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。
paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator, how=\'left\',left_on=\'出版物\',right_on=\'名称\',sort=False)
结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:
出版物 名称 指标 出版物A 出版物A 指标1 出版物A 出版物A 指标2 #多余的行
这里选择预先删除 表2出版物指标 中的重复出版物信息。
publicationIndicator.drop_duplicates(subset=[\'名称\'], keep=\'first\',inplace=True)
这样结果就没有问题了。
到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
AutoJs4.1.0实战教程---js文件打包发布成APK文件
python打包flask 项目_手把手教你将Flask应用封装成Docker服务的实现
Visual Studio中C++部分的官方文档链接【微软(Microsoft)所有产品的官方文档链接】
Python实现读取HTML表格 pd.read_html()
数据质量管理工具预研——Griffin VS Deequ VS Great expectations VS Qualitis
JavaScript核心知识第四章---PC端、移动端网页特效(含大量代码分析)
用python-OpenCV做一个魔方墙找茬 (3D视眼训练)