阿拉伯文字的Python ISRIStemmer
发布于 2021-01-29 16:03:01
我在IDLE(Python)上运行以下代码,我想输入阿拉伯字符串并获取其词根,但实际上不起作用
>>> from nltk.stem.isri import ISRIStemmer
>>> st = ISRIStemmer()
>>> w= 'حركات'
>>> join = w.decode('Windows-1256')
>>> print st.stem(join).encode('Windows-1256').decode('utf-8')
运行它的结果是w中的相同文本是’حركات’,而不是词干
但是何时执行以下操作:
>>> print st.stem(u'اعلاميون')
结果成功,并返回词干“علم”
为什么将一些单词传递给stem()函数不会返回茎?
关注者
0
被浏览
51