• 模糊字符串匹配:FuzzyWuzzy


    FuzzyWuzzy

    模糊字符串匹配,它使用Levenshtein Distance来计算简单易用的包中序列之间的差异。

    前置条件

    • Python 2.7 or higher

    • difflib

    • python-Levenshtein(可选的,在字符串匹配中提供4-10倍的加速,不过在某些情况下可能导致不同的结果)

    测试

    • pycodestyle

    • hypothesis

    • pytest

    安装

    使用PIP经由PyPI安装

    模糊字符串匹配:FuzzyWuzzy

    或者用如下命令安装

    模糊字符串匹配:FuzzyWuzzy

    使用PIP经由Github安装

    模糊字符串匹配:FuzzyWuzzy

    添加你的requirementrequirements.txt文件(然后运行 pip install -r requirements.txt)

    模糊字符串匹配:FuzzyWuzzy

    经由Git手动安装

    模糊字符串匹配:FuzzyWuzzy

    用法

    模糊字符串匹配:FuzzyWuzzy

    简单匹配率

    模糊字符串匹配:FuzzyWuzzy

    部分匹配率

    模糊字符串匹配:FuzzyWuzzy

    符号排序后匹配率

    模糊字符串匹配:FuzzyWuzzy

    符号集合匹配率

    模糊字符串匹配:FuzzyWuzzy

    Process

    模糊字符串匹配:FuzzyWuzzy

    你也可以给extractOne方法传额外的参数,使它使用一个特定的积分器(scorer).一个典型的用法是匹配文件路径:

    模糊字符串匹配:FuzzyWuzzy

    已知移植

    FuzzyWuzzy也被移植到了其他语言!以下是我们知道的一些移植:

    • Java: xpresso"s fuzzywuzzy implementation

    • Java: fuzzywuzzy (java port)

    • Rust: fuzzyrusty (Rust port)

    • JavaScript: fuzzball.js (JavaScript port)

    • C++: Tmplt/fuzzywuzzy

    • C#: fuzzysharp (.Net port)

    • Go: go-fuzzywuzz (Go port)

  • 相关阅读:
    第三周作业
    xxx生成式
    生成器
    迭代器
    叠加多个装饰器的执行原理
    装饰器——有参装饰器
    装饰器
    修改linux主机名称
    安装nagios出现的两个错误记录
    导入CSV文件之后出现换行符问题
  • 原文地址:https://www.cnblogs.com/cuiyubo/p/10175283.html
Copyright © 2020-2023  润新知