,今天跟大家唠唠我这几天搞的“刘鑫宇”这事儿,纯属个人实践,大家随便看看哈。
事情是这样的,前几天突然对花样滑冰感兴趣,然后就搜到了柳鑫宇,这名字一下就吸引我了。就想着,能不能用我学的那些东西,看看能不能搞点啥出来。
第一步,信息搜集。
- 打开浏览器,各种搜,百度、微信、微博、知乎,凡是能搜到的,全给扒拉下来。
- 主要就是想看看这哥们儿的基本情况,有什么新闻,有什么相关的讨论。
- 把搜集到的信息简单整理一下,去重,然后分个类,比如新闻类、评论类、个人资料类。
第二步,数据分析。
光看那些零散的信息没啥用,得想办法把它们串起来,看看能不能发现点
- 情感分析: 看看大家对柳鑫宇的态度是咋样的,是支持的多还是反对的多,正面的评价多还是负面的评价多。我就找了个现成的工具,把评论数据扔进去跑一下,看看结果。
- 关键词提取: 看看大家提到柳鑫宇的时候,都喜欢说些啥词,比如“实力”、“颜值”、“搭档”等等。把这些关键词提取出来,能大概了解他在大家心目中的形象。
- 关系挖掘: 看看柳鑫宇都跟哪些人或者事儿有联系,比如他的搭档、教练、比赛等等。把这些关系挖出来,能更全面地了解他。
第三步,可视化展示。
分析完了,总得有个直观的东西展示出来,不然谁知道你干了
- 情感分析结果: 我就做了个简单的饼图,展示一下正面、负面、中性评价的比例。
- 关键词云图: 把提取出来的关键词做成云图,越大说明这个词出现的频率越高。
- 关系网络图: 把柳鑫宇和他相关的人或事儿用线连起来,形成一个网络图,能清晰地看到他们之间的关系。
第四步,实践
这回“刘鑫宇”实践,虽然没搞出啥惊天动地的大新闻,但是让我对信息搜集、数据分析、可视化展示这些流程有了更深的理解。以后再遇到类似的事情,心里就有数了。
遇到的坑:
- 信息太多,太杂,整理起来费劲。
- 数据分析工具不太会用,还得现学。
- 可视化展示效果不太还得继续研究。
这回实践还是挺有意思的,下次准备搞点更复杂的东西玩玩。

还没有评论,来说两句吧...