天池和Kaggle:Notebook使用對比
天池競賽平臺作為阿里云旗下的重要競賽社區(qū),每年都會舉辦上百場數(shù)據(jù)競賽。數(shù)據(jù)競賽不僅可以匯集參賽選手,同時也可以沉淀具體的學(xué)習(xí)內(nèi)容。
拿Kaggle舉例,其魅力之處就在于Kaggle Notebook有很多豐富的學(xué)習(xí)資料,可以供學(xué)習(xí)者學(xué)習(xí)和使用。
從2019年開始天池逐步推出DSW (Data Science Workshop)運(yùn)行環(huán)境,可供選手可以在云平臺完成編碼和學(xué)習(xí)。據(jù)筆者了解,天池DSW是國內(nèi)首個支持GPU和CPU的學(xué)習(xí)環(huán)境,非常值得使用的。
本文從在線學(xué)習(xí)環(huán)境的角度(即在線Notebook)將天池與Kaggle進(jìn)行對比:
Notebook與平臺生態(tài) Notebook使用體驗(yàn)對比
Notebook與平臺生態(tài)
首先我們從Notebook與競賽平臺生態(tài)進(jìn)行分析,在天池和Kaggle中在線Nobteook都是非常重要的一個環(huán)節(jié)。開源在競賽中隨處可見,從競賽參賽方式、賽題數(shù)據(jù)集到賽題在線Notebook,都是各種的眾包參與形式,且內(nèi)容都可以多人一起貢獻(xiàn)。

在上述元素中,Notebook是特別重要的一個環(huán)節(jié)。
天池Notebook(DSW):https://tianchi.aliyun.com/notebook-ai/ Kaggle Notebook:https://www.kaggle.com/notebooks
Notebook作為在線運(yùn)行環(huán)境:
提供一個配置好環(huán)境的運(yùn)行的環(huán)境,所有參賽選手免去在本地配置環(huán)境的環(huán)節(jié); 可以作為代碼和思路的分享,比如比賽分析過程和解決方案的展示; 可以作為比賽比賽提交的入口,如比賽最終提交可以從Notebook提交; 可以提供系列的學(xué)習(xí)資源和實(shí)踐教材,可以作為在線教材;
Notebook作為在線展示方式:
具備有版本存儲的功能,可以存儲歷史運(yùn)行的代碼; 具備有渲染Markdown、圖片和公式的功能,展示方式更加靈活; 具備有與數(shù)據(jù)集和比賽交互的過程;
Notebook使用體驗(yàn)

https://www.kaggle.com/code

https://dsw-dev.data.aliyun.com/
Notebook對比
| 天池DSW | Kaggle Notebook | |
|---|---|---|
| 界面 | Juypter Lab | 自定義網(wǎng)頁 |
| 使用時間 | 總共使用時間不限制 CPU和GPU單次鏈接8小時 每次鏈接可以運(yùn)行多個Notebook | CPU時間不限,GPU每周35小時 可以同時運(yùn)行多個CPU Notebook 只能運(yùn)行一個GPU Notebook |
| 文件目錄 | 工作目錄與文件目錄混合 | 工作目錄與數(shù)據(jù)文件分開 |
| 文件系統(tǒng) | 多個Notebook共享 | 單個Notebook獨(dú)占 |
| Markdown目錄 | 支持 | 不支持 |
| 數(shù)據(jù)集 | 支持掛載數(shù)據(jù)集 | 支持掛載數(shù)據(jù)集 |
| 內(nèi)存 | 4G,多個Notebook共享 | 16G,單個Notebook獨(dú)占 |
| 顯存 | 16G,多個Notebook共享 | 11G,單個一個Notebook獨(dú)占 |
| 聯(lián)網(wǎng) | CPU模型可以聯(lián)網(wǎng) GPU模型不可以聯(lián)網(wǎng) | CPU和GPU都可以聯(lián)網(wǎng) |
| 穩(wěn)定性 | CPU較為穩(wěn)定 GPU穩(wěn)定性一般 | 較為穩(wěn)定 |
| Shell | 支持 | 不支持 |
| 上傳文件 | 支持 | 不支持,可在Dataset頁面上傳 |
| 發(fā)布 | 支持發(fā)布到天池論壇 | 支持發(fā)布到Kaggle論壇 |
| 版本 | 支持版本管理,但不完善 | 支持版本管理,比較完善 |
| Copy & Fork | 支持 | 支持 |
| 評論 | 支持 | 支持 |
從上表對比可知,天池DSW與Kaggle Notebook環(huán)境雖然整體都為在線Notebook,但在使用上存在一定的差異性:
資源分配:天池DSW環(huán)境可以同時運(yùn)行多個Notebook,且多個Notebook資源共享;Kaggle Notebook每個資源獨(dú)立,且文件各自不共享; 使用方式:天池DSW環(huán)境與Juypter Lab比較類似,而Kaggle Notebook是固定好輸入情況下的代碼運(yùn)行環(huán)境;
從使用角度天池DSW比較靈活強(qiáng)大,而Kaggle Notebook每個功能比較單一。所以如果大家在國內(nèi),建議使用天池DSW。
往期精彩回顧
本站qq群851320808,加入微信群請掃碼:
