畫圖不裝逼,和咸魚有什么區(qū)別,風(fēng)控中兩個(gè)看異常分布的圖
今天放假了回家過年了,分享兩個(gè)看異常分布的圖,很好看,也很實(shí)用。不會(huì)用或者不會(huì)畫的,隨時(shí)私聊我。畢竟現(xiàn)在過年也沒啥事。
一、箱線圖箱盒圖(也稱盒圖,箱線圖等)是在1977年由美國統(tǒng)計(jì)學(xué)家John Tukey發(fā)明,分析數(shù)據(jù)需要為定量數(shù)據(jù)。通過箱盒圖,可以直觀的探索數(shù)據(jù)特征。箱盒圖共有兩個(gè)用途:1)直觀地識(shí)別數(shù)據(jù)中異常值(離群點(diǎn));2)直觀地判斷數(shù)據(jù)離散分布情況,了解數(shù)據(jù)分布狀態(tài)。
箱盒圖共由五個(gè)數(shù)值點(diǎn)構(gòu)成,下邊緣,25%分位數(shù)(Q1),中位數(shù),75%分位數(shù)(Q3),上邊緣。其中:1)中橫線?= 中位數(shù)2)下邊緣?= Q1 – 1.5 IQR ?其中:IQR=75%分位數(shù)(Q3)-25%分位數(shù)(Q1)3)上邊緣?= Q3 + 1.5 IQR特別說明:箱盒圖里面的上邊緣值并非最大值,下邊緣值也不是最小值。如果數(shù)據(jù)有存在離群點(diǎn)即異常值,他們超出最大或者最小觀察值,此時(shí)將離群點(diǎn)以“圓點(diǎn)”形式進(jìn)行展示。
#安裝與加載包install.packages('ggplot2')library(ggplot2)#抽樣部分?jǐn)?shù)據(jù)dsmall?=?diamonds[sample(nrow(diamonds),5000),]#比較基礎(chǔ)的圖形ggplot(dsmall,aes(x=color,y=price,fill=color))+geom_boxplot()+scale_fill_manual(values=c('blue','cyan',?'yellow',?'orange',?'red',?'Cyan1',?'DeepPink1'))+facet_grid(.~clarity )

ggplot(mpg,aes(x=trans,y=displ,fill=trans))+theme_bw()+geom_boxplot()+theme(plot.title =element_text(size=20,face="bold",color="red", hjust=0.5,vjust=0.5,lineheight=0.01,family="myFont"),#axis.title.x=element_text(size=12,face="bold",color="black",hjust=0.5),axis.title.y=element_text(size=12,face="bold",color="black",hjust=0.5),#axis.text.x =element_text(size=08,face="plain",color="black",angle=90,vjust=0.5,lineheight=0.01,family="myFont"),axis.text.y =element_text(size=08,face="plain",color="black",family="myFont"),panel.grid=element_blank(),panel.background = element_blank(),??????legend.position='none')
業(yè)務(wù)中的一些圖,不同類目的商品價(jià)格,不同城市的消費(fèi)水平等等,基本上能夠一目了然的發(fā)現(xiàn)問題。是一個(gè)既實(shí)用又裝逼的圖,大家可以試試。

二、密度圖密度圖特別適合對(duì)比黑白樣本同樣的特征的分布問題
qplot(carat,data = dsmall,geom = c('density'),fill = cut,colour = cut)

qplot(depth,data = dsmall,geom = c('density'),fill = cut,colour = cut,alpha = I(2/10))

qplot(depth,data = dsmall,geom = c('density'),fill = cut,colour = cut,alpha = I(2/10))

業(yè)務(wù)中的一些數(shù)據(jù)對(duì)比,為黑白樣本同一個(gè)特征的分布對(duì)比,可以看到有比較大的不同


希望對(duì)大家有幫助,來都來了,點(diǎn)個(gè)在看再走唄
長按關(guān)注公眾號(hào)? ?? ? ? ??長按加作者好友? ? ??
評(píng)論
圖片
表情
