create_inspections_subset.py 文件源码

python
阅读 41 收藏 0 点赞 0 评论 0

项目:triage 作者: dssg 项目源码 文件源码
def create_subset(src, dest, n=250):
    "Given a csv file `src`, create a subset `dest` with `n` unique entities"
    df = pd.read_csv(src)
    lics = pd.unique(df["License #"])
    sublics = lics[random.sample(range(0,len(lics)), n)]
    subset = df[df["License #"].isin(sublics)]
    # Make the column names a little more readable
    subset.columns = map(clean_column_name, subset.columns)
    subset.to_csv(dest, index=False)
评论列表
文章目录


问题


面经


文章

微信
公众号

扫码关注公众号