python nltk.tokenize模块,常用函数和类

下面列出了python nltk.tokenize 模块中定义的常用函数和类,我们从259个开源python项目中,按照使用频率进行了排序。

函数和类 使用项目数
1. word_tokenize() 用在( 128 )个项目中
2. sent_tokenize() 用在( 61 )个项目中
3. RegexpTokenizer() 用在( 50 )个项目中
4. TweetTokenizer() 用在( 35 )个项目中
5. wordpunct_tokenize() 用在( 30 )个项目中
6. WordPunctTokenizer() 用在( 17 )个项目中
7. WhitespaceTokenizer() 用在( 13 )个项目中
8. TreebankWordTokenizer() 用在( 13 )个项目中
9. line_tokenize() 用在( 8 )个项目中