拼写检查

拼写检查

检查拼写是任何文本处理或分析的基本要求。 python中的pyspellchecker包提供了这个功能,可以找到可能错误拼写的单词,并建议可能的更正。

首先,我们需要在python环境中使用以下命令安装所需的包。

pip install pyspellchecker

现在在下面看到如何使用包来指出错误拼写的单词以及对可能的正确单词提出一些建议。

from spellchecker import SpellChecker

spell = SpellChecker()

# find those words that may be misspelled
misspelled = spell.unknown(['let', 'us', 'wlak','on','the','groun'])

for word in misspelled:
    # Get the one `most likely` answer
    print(spell.correction(word))

    # Get a list of `likely` options
    print(spell.candidates(word))

当运行上面的程序时,我们得到以下输出 -

group
{'group', 'ground', 'groan', 'grout', 'grown', 'groin'}
walk
{'flak', 'weak', 'walk'}

区分大小写
如果使用Let代替let,那么这将成为单词与字典中最接近的匹配单词的区分大小写的比较,结果现在看起来不同。

from spellchecker import SpellChecker

spell = SpellChecker()

# find those words that may be misspelled
misspelled = spell.unknown(['Let', 'us', 'wlak','on','the','groun'])

for word in misspelled:
    # Get the one `most likely` answer
    print(spell.correction(word))

    # Get a list of `likely` options
    print(spell.candidates(word))

当运行上面的程序时,我们得到以下输出 -

group
{'groin', 'ground', 'groan', 'group', 'grown', 'grout'}
walk
{'walk', 'flak', 'weak'}
get
{'aet', 'ret', 'get', 'cet', 'bet', 'vet', 'pet', 'wet', 'let', 'yet', 'det', 'het', 'set', 'et', 'jet', 'tet', 'met', 'fet', 'net'}