从单列Pandas数据框生成词云
我有一个带有一栏的Pandas数据框:犯罪类型。该列包含16种不同的犯罪“类别”,我想将其形象化为一个词云,并根据数据帧内词频的大小确定词的大小。
我尝试使用以下代码执行此操作:
导入数据:
fields = ['Crime type']
text2 = pd.read_csv('allCrime.csv', usecols=fields)
生成词云:
wordcloud2 = WordCloud().generate(text2)
# Generate plot
plt.imshow(wordcloud2)
plt.axis("off")
plt.show()
但是,我收到此错误:
TypeError: expected string or bytes-like object
我可以使用下面的代码从完整的数据集中创建一个较早的词云,但我希望该词云仅从特定列“ crime type”(“
allCrime.csv”包含大约13列)中生成词。 :
text = open('allCrime.csv').read()
wordcloud = WordCloud().generate(text)
# Generate plot
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
我是Python和Pandas的新手(并且通常是编码!),所以将不胜感激地收到所有帮助。