master

分支 (1)

管理

管理

master

finance_report
/
匹配相似客商名称.py

# -*- coding: utf-8 -*-
"""
Created on Sun Jan  2 10:13:50 2022

@author: Administrator
"""

import pandas as pd
import numpy as np
import os
import Levenshtein
import copy

path = r'C:\Users\Administrator\Desktop\三公司账龄汇总'
file = '2016年至2021年12月23日应收账款借方余额-汇总表好确认.xls'
os.chdir(path)

df = pd.read_excel(
        file,
        sheet_name = '2016-2021年应收账款',
        header = 1
        )
df = df[df['核算组']=='三公司']
df.columns

names = list(set(df['客商辅助核算名称']))

res_dict = {}
for name in names:
    tmp = copy.deepcopy(names)
    tmp.remove(name)
    相似度字典 = {x:Levenshtein.jaro(name,x) for x in tmp}
    相似度排序 = sorted(相似度字典.items(), key = lambda x:x[1],reverse = True)
    相似度大于70 = list(filter(lambda x:x[1]>0.9,相似度排序))
    相似度大于70的前三 = 相似度大于70[:3]
    res_dict.update({name:[x[0] for x in 相似度大于70的前三]})

res = {k:v for k,v in res_dict.items() if v}