AC自動機是多模式匹配的一個經典數據結構,原理是和KMP一樣的構造fail指針,不過AC自動機是在Trie樹上構造的,但原理是一樣的。官方github:
https://github.com/WojciechMula/pyahocorasick/
類似的匹配工具,還有:
親測,好像pyahocorasick更快~
1 安裝
This module is written in C. You need a C compiler installed to compile native CPython extensions. To install:
pip install pyahocorasick
Then create an Automaton.
當然筆者window機器