數(shù)據(jù)分析師技能樹(shù)
每隔一段時(shí)間,都會(huì)整理下自己的技能樹(shù),看看有哪些可以再加上去,然后平時(shí)學(xué)習(xí)時(shí),沿著技能樹(shù)的內(nèi)容查漏補(bǔ)缺。下面是最近整理的,覺(jué)得還有需要補(bǔ)充的同學(xué)可以留言說(shuō)一下。
MySQL
基礎(chǔ)查詢語(yǔ)句:查詢語(yǔ)句 select、表來(lái)源 from、條件語(yǔ)句 where、數(shù)據(jù)分組 group by、數(shù)據(jù)過(guò)濾 having、數(shù)據(jù)排序 order by、限制行數(shù) limit; 多表查詢語(yǔ)句:內(nèi)連接(join/inner join)、左連接(left join) 、右連接(right join) ; 條件函數(shù):case when、if; 聚合函數(shù):求和 sum()、均值 avg()、計(jì)數(shù) count()、最大值 max()、最小值 min(); 窗口函數(shù): 累計(jì)計(jì)算窗口函數(shù):sum()over(partition by ... order by ...)、avg()over(partition by ... order by ...); 分區(qū)排序窗口函數(shù):row_number()over()、rank()over()、dense_rank()over(); 分組排序窗口函數(shù):ntile()over(); 偏移分析窗口函數(shù):lag()over()、lead()over(); SQL定義與操作語(yǔ)言:創(chuàng)建表 create 、插入語(yǔ)句 insert into 、更新語(yǔ)句 update 、刪除語(yǔ)句 delete。
Python
NumPy、Pandas、matplotlib庫(kù); sklearn 庫(kù)。
機(jī)器學(xué)習(xí)
算法模型:決策樹(shù)、隨機(jī)森林、回歸模型、K-Means聚類(lèi)、K近鄰、貝葉斯、支持向量機(jī)、Apriori關(guān)聯(lián)規(guī)則等; 特征工程:特征縮放/歸一化,分類(lèi)變量,數(shù)據(jù)降維,特征選擇。
統(tǒng)計(jì)學(xué)
描述統(tǒng)計(jì):頻數(shù)分析、集中趨勢(shì)、離散程度、數(shù)據(jù)分布; 參數(shù)估計(jì):總體、個(gè)體、樣本;點(diǎn)估計(jì)和區(qū)間估計(jì);中心極限定理;正態(tài)分布; 假設(shè)檢驗(yàn):雙邊檢驗(yàn)、單邊檢驗(yàn);Z檢驗(yàn)、t檢驗(yàn)、卡方檢驗(yàn)、F檢驗(yàn); 線性回歸:一元線性回歸、多元線性回歸、損失函數(shù); 時(shí)間序列分析:AR、MA、ARMA、ARIMA模型。
思維
認(rèn)知:PEST、5W2H、SWOT、4P理論、用戶行為理論,波士頓矩陣,二八原則; 數(shù)據(jù):AARRR,用戶增長(zhǎng)。
Tableau
工作表、儀表盤(pán)和故事; 可視化:柱狀圖和條形圖、折線圖和面積圖、餅圖和環(huán)形圖、散點(diǎn)圖和氣泡圖、箱線圖。
數(shù)學(xué)
線性代數(shù) 微積分 概率論
大數(shù)據(jù)
Java,Linux,Hadoop,Spark,Hive,ETL,F(xiàn)link。
其他技能
SPSS、Excel;
評(píng)論
圖片
表情
