aws.py 文件源码

python
阅读 27 收藏 0 点赞 0 评论 0

项目:CommonCrawlJob 作者: qadium-memex 项目源码 文件源码
def get_index(self, prefix):
        """
        :param prefix: str
            Prefix to S3 bucket

        :return: Uncompressed warc index
        :rtype: str
        """
        crawl = self.select_crawl(prefix)
        botokey = Key(self.bucket, crawl + 'warc.paths.gz')
        return [i.strip() for i in GzipFile(fileobj=BytesIO(botokey.read()))]
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号