數(shù)據(jù)分布和各種檢驗(yàn)
左偏的話偏度<0,右偏的話偏度>0
正態(tài)分布的峰度是3,所以一般峰度-3。越尖越大

正確的異常值
錯誤的異常值
下限:Q1 - 1.5IQR
上限:Q3 + 1.5IQR
中位數(shù):Q2
異常值:上下限之外的數(shù)值
誤差和置信水平有關(guān),置信水平越高(99%),則區(qū)間越大;
誤差和樣本方差有關(guān),樣本方差越大,區(qū)間越大
誤差和樣本數(shù)量有關(guān),樣本數(shù)量越小,區(qū)間越大
【第一類錯誤】如果原假設(shè)為真,而被我們拒絕了(新功能并沒有比原功能更好,卻被我們誤以為新功能更好)的錯誤,叫做第一類錯誤。犯第一類錯誤的概率叫做顯著性水平,一般我們會取0.05,0.1。
【第二類錯誤】如果備則假設(shè)為假,而被我們拒絕了(新功能比原功能更好,卻沒有被發(fā)現(xiàn))的錯誤,叫做第二類錯誤。犯第二種錯誤的概率一般取0.2,反過來一般我們稱之為統(tǒng)計(jì)功效 power = 1-?
?
https://zhuanlan.zhihu.com/p/69888032

推薦閱讀
歡迎長按掃碼關(guān)注「數(shù)據(jù)管道」
評論
圖片
表情
