代码拉取完成,页面将自动刷新
# -*- coding: utf-8 -*-
"""
Created on Sun Jan 2 10:13:50 2022
@author: Administrator
"""
import pandas as pd
import numpy as np
import os
import Levenshtein
import copy
path = r'C:\Users\Administrator\Desktop\三公司账龄汇总'
file = '2016年至2021年12月23日应收账款借方余额-汇总表好确认.xls'
os.chdir(path)
df = pd.read_excel(
file,
sheet_name = '2016-2021年应收账款',
header = 1
)
df = df[df['核算组']=='三公司']
df.columns
names = list(set(df['客商辅助核算名称']))
res_dict = {}
for name in names:
tmp = copy.deepcopy(names)
tmp.remove(name)
相似度字典 = {x:Levenshtein.jaro(name,x) for x in tmp}
相似度排序 = sorted(相似度字典.items(), key = lambda x:x[1],reverse = True)
相似度大于70 = list(filter(lambda x:x[1]>0.9,相似度排序))
相似度大于70的前三 = 相似度大于70[:3]
res_dict.update({name:[x[0] for x in 相似度大于70的前三]})
res = {k:v for k,v in res_dict.items() if v}
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。