让我们先来看则新闻,元旦联盟爆炸出一惊人记录,就是绿军与热火的比赛中,凯尔特人后卫小托马斯爆砍52分,其中第四节一人独揽29分,且命中杀死比赛的三分球。但小托马斯身高仅仅175cm。不禁会想身高会限制位置吗,还有现在的NBA为什么后卫闪耀中锋却凤毛麟角?
从NBA中国官方网站获取449名现役NBA球员的位置,身高,体重,国籍等数据。
球员身高分布
library(ggplot2)ggplot(hy0209,aes(x=Position,y=Height,col=Position)) geom_dotplot(binaxis = "y",binwidth=0.5,stackdir="center")几个有意思的异常值
NBA运动员最矮的人
> hy0209[hy0209$Height==min(hy$Height),] Player player team Position Height Weight years country44 Thomas, Isaiah 托马斯, 以赛亚 凯尔特人 后卫 175 83.9 5 美国78 Felder, Kay 菲尔德, 凯 骑士 后卫 175 79.8 0 美国意外发现联盟里有两名175cm的球员,这给那些热爱篮球的身高不够的骚年们多大的鼓励啊!!
NBA运动员最高的人
> hy0209[hy0209$Height==max(hy$Height),] Player player team Position Height Weight years country146 Marjanovic, Boban 马亚诺维奇, 鲍班 活塞 中锋 221 131.5 1 塞尔维亚326 Porzingis, Kristaps 波尔津吉斯, 克里斯塔普斯 尼克斯 前锋 221 108.9 1 拉脱维亚看到也有两个人身高同时达到了221cm,而且还都不是美国人。
可以发现,NBA中锋球员明显少于后卫及中锋,中锋的数量不及后卫及前锋的三分之一,近几年NBA缺少中锋的言论确实不少,
NBA球员国籍分布
hy02091<-table(hy0209$country)hy02091<-as.data.frame(hy02091)hy020912),]hy02091<-hy02091[-1,]ggplot(hy02091,aes(x=Var1,y=Freq)) geom_bar(stat="identity")NBA里容纳43个国家的顶级球员,还有4名球员国籍不详。75.5%的球员是来自美国,6.5%来自法国,加拿大,巴西。
各个球队的中锋配置hy02092<-hy0209[which(hy0209$Position=="中锋"),]ggplot(hy02092,aes(x=team)) geom_bar(stat="count")在中锋匮乏的NBA,有8个球队只配备了一名中锋,黄蜂队却配置了4个中锋,快攻见长的勇士也配有3名中锋,根据市场供给原则,大胆的预测下,在今年球员交易日截止前,黄蜂队必有中锋被交易。
1. 位置水平下的方差分析
将篮球队员的7个位置(我也不知道为何官方这样划分: 后卫, 后卫-前锋 , 前锋, 前锋-后卫, 前锋-中锋,中锋,中锋-前锋)看成7个水平,将7个位置下的身高看成该水平下的观测值
我们看不同水平下的观测值是否一样
> lamp lamp.aov summary(lamp.aov) Df Sum Sq Mean Sq F value Pr(>F) A 1 25918 25918 1277 <2e-16 ***Residuals 447 9073 20 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1看到P值 <2e-16,所以不同位置下的身高明显不同。
数据探讨先看下球员身高体重的分布
既然身高对位置有影响,不妨按身高体重进行聚类,用kmeans聚成3类,看聚类的效果好不好
> cust kmeans_result1 hy$jl2 table(hy$Position,kmeans_result1$cluster)> ggplot(hy,aes(x=Height,y=Weight,colour=jl2)) geom_point()发现聚类的效果还算明显,基本上也契合了位置的分布,第一类是中锋,第二类锋卫摇摆人,第三类后卫。
小结身高确实限制了NBA球员的位置
黄蜂队会有中锋被交易。
End.
运行人员:中国统计网小编(微信号:itongjilove)
微博ID:中国统计网
中国统计网,是国内最早的大数据学习网站,公众号:中国统计网
http://www.itongji.cn
特别声明:所有资讯或言论仅代表发布者个人意见,乐多体育仅提供发布平台,信息内容请自行判断。