POS标记德语

发布于 2021-01-29 17:11:23

我正在使用NLTK从以下命令开头的文本字符串中提取名词:

tagged_text = nltk.pos_tag(nltk.Text(nltk.word_tokenize(some_string)))

它的英文很好用。 有没有一种简便的方法也可以使其适用于德语?

(我没有自然语言编程的经验,但是我设法使用了到目前为止很棒的python nltk库。)

关注者
0
被浏览
47
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    自然语言软件通过利用语料库及其提供的统计数据来发挥其魔力。您需要告诉nltk一些德语语料库,以帮助它正确地标记德语。我相信EUROPARL语料库可能会帮助您前进。

    请参阅nltk.corpus.europarl_raw及其配置示例的答案

    另外,考虑使用“ nlp”标记该问题。



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看