在Python中加载大型JSON列表的最佳方法是什么?[重复]

发布于 2021-01-29 14:56:13

这个问题已经在这里有了答案

将巨大的(95Mb)JSON数组拆分成较小的块? (4个答案)

5天前关闭。

我可以访问一组文件(每个文件约80-800mb)。不幸的是,每个文件中只有一行。该行仅包含一个JSON对象(列表列表)。加载并将其解析为较小的JSON对象的最佳方法是什么?

关注者
0
被浏览
94
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    已经有一个类似的帖子在这里。这是他们提出的解决方案:

    import json
    with open('file.json') as infile:
      o = json.load(infile)
      chunkSize = 1000
      for i in xrange(0, len(o), chunkSize):
        with open('file_' + str(i//chunkSize) + '.json', 'w') as outfile:
          json.dump(o[i:i+chunkSize], outfile)
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看