python匹配兩個excel數據
在excel處理大量數據匹配過程中,雖然可以使用vlookup,但是數據量超過10萬進行批量匹配的時候,效率非常差,因此使用python。經查,發現python通過pandas庫的merge可以實現類似於SQL中join的功能
import pandas as pd
import numpy as np
# %%
with pd.ExcelFile('xx.xlsx') as xls:
df1 = pd.read_excel(xls,'Sheet1')
df2 = pd.read_excel(xls,'Sheet2')
outer=pd.merge(df1,df2,on='key')
outer.to_excel('outer_function.xlsx',index=False,encoding='utf-8')
最終實現Sheet1和Sheet2基於相同key字段的匹配,拼接。