解析维基百科转储

发布于 2021-01-29 18:24:43

例如,使用此Wikipedia转储:

http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=lebron%20james&rvprop=content&redirects=true&format=xmlfm

我是否可以使用现有的Python库来创建带有主题和值映射的数组?

例如:

{height_ft,6},{nationality, American}
关注者
0
被浏览
50
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    看来您确实希望能够解析MediaWiki标记。有一个为此目的设计的python库称为mwlib。您可以使用python的内置XML包从API的响应中提取页面内容,然后将该内容传递到mwlib的解析器中以生成对象表示形式,您可以在代码中浏览和分析该对象表示形式以提取所需的信息。mwlib已获得BSD许可。



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看