data_generator.py 文件源码

python
阅读 32 收藏 0 点赞 0 评论 0

项目:py_stringsimjoin 作者: anhaidgroup 项目源码 文件源码
def generate_tokens(mean, std_dev, num_tokens):
    tokens = {}
    cnt = 0
    while cnt < num_tokens:
        length = int(round(random.normalvariate(mean,
                                                std_dev)))
        if length < 2:
            continue
        flag = True
        while flag:
            new_token = ''.join(random.choice(string.ascii_lowercase)
                                for i in range(length))
            if tokens.get(new_token) is None:
                tokens[new_token] = True
                flag = False
        cnt += 1
    return list(tokens.keys())
评论列表


问题


面经


文章

微信
公众号

扫码关注公众号