加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
匹配相似客商名称.py 1.01 KB
一键复制 编辑 原始数据 按行查看 历史
fengmingshan 提交于 2022-01-02 11:47 . 创建仓库
# -*- coding: utf-8 -*-
"""
Created on Sun Jan 2 10:13:50 2022
@author: Administrator
"""
import pandas as pd
import numpy as np
import os
import Levenshtein
import copy
path = r'C:\Users\Administrator\Desktop\三公司账龄汇总'
file = '2016年至2021年12月23日应收账款借方余额-汇总表好确认.xls'
os.chdir(path)
df = pd.read_excel(
file,
sheet_name = '2016-2021年应收账款',
header = 1
)
df = df[df['核算组']=='三公司']
df.columns
names = list(set(df['客商辅助核算名称']))
res_dict = {}
for name in names:
tmp = copy.deepcopy(names)
tmp.remove(name)
相似度字典 = {x:Levenshtein.jaro(name,x) for x in tmp}
相似度排序 = sorted(相似度字典.items(), key = lambda x:x[1],reverse = True)
相似度大于70 = list(filter(lambda x:x[1]>0.9,相似度排序))
相似度大于70的前三 = 相似度大于70[:3]
res_dict.update({name:[x[0] for x in 相似度大于70的前三]})
res = {k:v for k,v in res_dict.items() if v}
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化