今天跟大家唠唠我鼓捣“科比数据”那点事儿,纯粹个人兴趣,大神勿喷哈!
一开始就是觉得科比的数据挺有意思,想自己动手扒下来,看看能不能捣鼓出点啥来。网上找了一堆,要么就是太理论,要么就是代码跑不通,索性自己撸起袖子干!
第一步:找数据源。
这可是个体力活,满世界找靠谱的篮球数据网站。NBA官网肯定要看,但是数据太分散,不好整。后来发现几个数据统计网站还不错,能导出CSV格式,省了我不少事儿。找到了几个比较全的网站,把科比职业生涯的常规赛、季后赛数据,得分、篮板、助攻啥的都扒拉下来,存
第二步:数据清洗。
这步最恶心,真的!导出来的数据各种格式不对,还有空值、乱码。我用Excel吭哧吭哧地搞,先把格式统一了,日期搞成标准的,把那些奇奇怪怪的符号都删掉。空值就用平均值或者0填充,反正不能让它影响后面的分析。这一步搞了我大半天,眼睛都快瞎了。
第三步:开始分析。
数据洗干净了,就可以开始玩了!我想看看科比生涯各个赛季的得分变化趋势,就用Python的Pandas库,把数据读进去,然后用Matplotlib画了个折线图。哇,那图一出来,真有感觉!能明显看到科比前期慢慢涨,中间有个巅峰,后面因为伤病啥的开始下滑。再把季后赛的数据也画出来,对比一下,发现季后赛得分更高,果然关键时刻不手软!
我还想看看科比的投篮热图,就是看看他各个位置的投篮命中率。这个稍微麻烦点,要先把球场坐标系搞清楚,然后把每次投篮的位置数据转换成坐标,再用热图的方式展示出来。我用了Seaborn库,搞了好久才弄明白。热图一出来,发现科比果然是左侧45度角的进攻狂人,那一片红得发紫!
第四步:深入挖掘。
光看这些还不够,我想看看科比和其他球星的数据对比,比如乔丹、詹姆斯。我就又去扒了他们的数据,然后算了一些高阶数据,比如PER值(球员效率值)、胜利贡献值啥的。发现科比的PER值确实很高,但和乔丹比还是有点差距,胜利贡献值也差不多。不过这数据也不能完全说明问题,毕竟时代不一样了。
我还想看看科比在关键时刻的表现,就筛选了比赛5分钟,分差在5分以内的数据,算了他的命中率。发现科比的关键时刻命中率还可以,但也不是最高的。只能说,他关键时刻敢出手,有曼巴精神!
- 数据清洗是关键,一定要耐心!
- Python的Pandas、Matplotlib、Seaborn库很好用,要学
- 光看数据还不够,要结合比赛录像和背景知识一起分析!
这回搞“科比数据”,虽然累,但是也学到了不少东西。以后有机会,还想搞点更有意思的数据分析,比如预测比赛结果啥的,想想就刺激!
就分享到这儿,大家有什么问题可以留言,一起交流!
还没有评论,来说两句吧...