前几天,川普又在推特因为宣扬暴力翻车了,不过,对于这位翻车王来说,已经是常规操作了。在推特上指点江山已经成为他新的治国方式。我无意中关注了他的推特,看手机时推特 push 消息一直响个不停,一看,全是川普发的,一位总统一天能发 200 条推特,我服了。
有时,川普会在推特上发表的一些言论和观点,在现实中,把自己在推特上说的全部否定,这是最强的打脸永动机,很魔幻。
没有人🙌
比我👌
更懂👐
推特☝️
我整理了一份川普从 2017 年 1 月份 到 2020 年 5 月 31 号的所有推特消息。这是一份英文 Excel 文档,为了方便中文分词和查看,我把它翻译成了中文。
读取信息并分词
然后直接读取 Excel 文档读取特定列的推特信息并返回结果。
接下来用中文分词库 jieba 库对这些信息进行分词。
配置词云图参数
在把分好词的单词进行统计,通过 WordCloud 库把单词展示在出来生成词云图,出现的次数越多的词字体越大。
WordCloud 库里面的参数说明下:
scale 控制图片的清晰度,最高 64,我设置的 32,已经很高清了,这个值越高,生成图片耗时越长。
background_color 词云图背景颜色
mask 生成词云图的背景图片
font_path 你电脑里的字体,需要给出具体字体的路径
max_words 词云图显示的单词数量
max_font_size 出现次数最多单词的字体大小
random_state 随机生成颜色
我把背景图换成川普的侧脸图。
参数设置完成后,就可以生成词云图了。
川普推特词云图
这次我把川普推特上发的消息做成词云图,看看一天发 200 推特的内容说的都是啥!
(30M的高清词云图可在公众号回复「川普词云」获取)
假新闻这个词出现的频率最高,只要特朗普想回避的问题,那都是假新闻,没有人比他更懂假新闻。
接下来是让川普从竞选中脱颖而出的经典台词「让美国再次强大」。
当然,词云中肯定少不了一个单词「China」,川普多次在推特中提到中国,5 月底更是连发了三次「China」,所以川普被 B 站鬼畜区的朋友们戏称为中国的「卧底」,泪目。
川普在当选总统前还客串参加过摔角比赛,在娱乐节目中跳热舞,多才多艺,更多的梗可点击左下方阅读原文观看川普的视频版,川普的各种梗都在视频里面。
词云图生成代码、川普Twitter信息Excel文件、视频中的30M高清词云图有需要的话可在公众号「Python知识圈」后台输入框回复「川普词云」获取。