你參加過(guò)爬蟲(chóng)相關(guān)的比賽嗎?這有一個(gè)
“閱讀本文大概需要 3 分鐘”
同樣是做爬蟲(chóng),為什么別人月薪三萬(wàn),而你月薪只有三千?別人爬的數(shù)據(jù)能做出來(lái)好多東西,而你爬下來(lái)的數(shù)據(jù)可能就只是數(shù)據(jù)(還可能是照片,技術(shù)男都懂)
你要明白,爬蟲(chóng)是一種提升效率的工具,能“解放雙手還我自由”,但你要思考的不只是怎么爬數(shù)據(jù),而是爬取下來(lái)的數(shù)據(jù)該怎么用,這才是拉開(kāi)工資差距的根本原因。

相信關(guān)注我公眾號(hào)的人,都是喜歡編程,喜歡爬蟲(chóng)的,所以我今天給大家介紹一場(chǎng)比賽,適合學(xué)生黨和上班族:
“讓數(shù)據(jù)回家”為主題的數(shù)據(jù)爬蟲(chóng)開(kāi)發(fā)大賽!
這個(gè)比賽不僅僅是爬數(shù)據(jù),還可以開(kāi)動(dòng)大腦,基于數(shù)據(jù)做創(chuàng)意應(yīng)用。不但能增加實(shí)戰(zhàn)經(jīng)驗(yàn),還能給你的簡(jiǎn)歷增光添彩,為接下來(lái)的秋招做準(zhǔn)備!
大賽旨在旨在為開(kāi)發(fā)者和數(shù)據(jù)爬蟲(chóng)愛(ài)好者提供一個(gè)有趣的框架平臺(tái),盡情的表達(dá)關(guān)于數(shù)據(jù)的靈感。
參賽者可以通過(guò)爬蟲(chóng)技術(shù),將屬于自己的數(shù)據(jù)從互聯(lián)網(wǎng)拿回自己手中,然后基于這些數(shù)據(jù)開(kāi)發(fā)出各類(lèi)有趣的應(yīng)用,做數(shù)據(jù)的主人!
這次比賽的獎(jiǎng)項(xiàng)真的很誘人!
獲獎(jiǎng)制度
AWARD SETTINGS
1.獎(jiǎng)金預(yù)設(shè)
一等獎(jiǎng)(1支隊(duì)伍):10000元 + 證書(shū);
二等獎(jiǎng)(3支隊(duì)伍):5000元 + 證書(shū);
三等獎(jiǎng)(6支隊(duì)伍):2000元 + 證書(shū);
優(yōu)秀獎(jiǎng)(若干):將根據(jù)實(shí)際參賽隊(duì)伍數(shù)量確定優(yōu)秀獎(jiǎng)名額,將獲得神秘禮品。
2.開(kāi)源爬蟲(chóng)獎(jiǎng)
對(duì)于基于GitHub項(xiàng)目( https://github.com/MyDataHomes/Spider? )開(kāi)發(fā)的爬蟲(chóng)工具,主辦方將挑選優(yōu)秀作品提交至Github項(xiàng)目庫(kù)中,被選作品將獲得“開(kāi)源爬蟲(chóng)獎(jiǎng)”,并獲得神秘禮物。(本獎(jiǎng)項(xiàng)與前述獎(jiǎng)項(xiàng)不沖突,可同時(shí)獲?。?/p>
參賽規(guī)則
RULES OF ENTRY
01
組隊(duì)要求
個(gè)人或自由組隊(duì)參賽,每支隊(duì)伍不超過(guò)3人,每人只能參加一支隊(duì)伍,以隊(duì)伍參賽須確定一名隊(duì)長(zhǎng),便于后續(xù)賽事聯(lián)系和通知;
參賽選手報(bào)名須提供真實(shí)聯(lián)系信息。
02
參賽作品
作品內(nèi)容:爬蟲(chóng)工具(含源代碼、使用文檔、測(cè)試用例等),作品介紹材料;
作品要求:
進(jìn)行爬蟲(chóng)工具的開(kāi)發(fā),爬蟲(chóng)工具能夠幫助用戶抓取自己的個(gè)人數(shù)據(jù),抓取的數(shù)據(jù)源類(lèi)型不限(如淘寶、京東等);
參賽者可基于爬蟲(chóng)工具獲取的數(shù)據(jù),自主進(jìn)行數(shù)據(jù)應(yīng)用的設(shè)計(jì),本要求為可選項(xiàng);
參賽作品可基于比賽指定Github項(xiàng)目( https://github.com/MyDataHomes/Spider? )進(jìn)行開(kāi)發(fā),也可自行開(kāi)發(fā);
參賽作品的開(kāi)發(fā)語(yǔ)言不限;
作品介紹文檔需涵蓋爬蟲(chóng)算法思路、實(shí)現(xiàn)方法、爬蟲(chóng)運(yùn)行與測(cè)試方法、數(shù)據(jù)應(yīng)用介紹(如有)等,介紹文檔格式不限。
03
評(píng)審標(biāo)準(zhǔn)
由來(lái)自隔鏡科技、上海交通大學(xué)軟件學(xué)院以及其他機(jī)構(gòu)的專家評(píng)判打分,評(píng)分標(biāo)準(zhǔn)如下:
爬蟲(chóng)評(píng)分(100分)
爬蟲(chóng)性能(40%):包括爬取數(shù)據(jù)的完整度、性能,爬蟲(chóng)魯棒性等指標(biāo);
代碼質(zhì)量(30%):包括代碼撰寫(xiě)是否規(guī)范、接口定義是否清晰、注釋是否完整等;
創(chuàng)新性(30%):包括在數(shù)據(jù)獲取方式、爬蟲(chóng)算法設(shè)計(jì)等方面的創(chuàng)新等。
附加分(20分)
用戶界面(10%):良好的用戶界面設(shè)計(jì),操作方式、風(fēng)格等方面具有創(chuàng)意和美感;
數(shù)據(jù)應(yīng)用(10%):數(shù)據(jù)應(yīng)用的實(shí)用價(jià)值、創(chuàng)新性等;
賽事日程
EVENT SCHEDULE
6月
29日
開(kāi)啟報(bào)名
(1)關(guān)注公眾號(hào)我的數(shù)據(jù)百寶箱(微信號(hào):mydatabox),回復(fù)“報(bào)名”,獲取報(bào)名鏈接;
(2)通過(guò)社區(qū)論壇置頂鏈接報(bào)名,論壇地址:https://mydata.homes/
加比賽群
添加大賽客服微信:mydatahome,回復(fù)“開(kāi)發(fā)者+姓名”,加入大賽技術(shù)協(xié)作群;
準(zhǔn)備作品
首先想到一個(gè)關(guān)于個(gè)人數(shù)據(jù)采集的好點(diǎn)子;
我們準(zhǔn)備了一個(gè)簡(jiǎn)單的框架和一些爬蟲(chóng)樣例,我們希望您fork我們的爬蟲(chóng)代碼庫(kù)( https://github.com/MyDataHomes/Spider ),并基于此進(jìn)行創(chuàng)作;您也可以選擇其他語(yǔ)言和框架進(jìn)行開(kāi)發(fā)。
完成的作品應(yīng)當(dāng)具備完整可運(yùn)行的代碼、測(cè)試用例、使用文檔、項(xiàng)目介紹材料(可以包括文檔、PPT、視頻等)。
提交作品
確認(rèn)已經(jīng)完成了報(bào)名流程(提交了團(tuán)隊(duì)信息,并且同意了參賽協(xié)議);
確認(rèn)比賽作品已經(jīng)完成,并且可以通過(guò)閱讀項(xiàng)目README文檔獲取所有資料。如果是私有庫(kù),請(qǐng)確認(rèn)已經(jīng)給官方賬號(hào)(id: MyDataHomes)添加了閱讀權(quán)限;
fork本倉(cāng)庫(kù),拷貝作品提交模板( https://github.com/MyDataHomes/GeJing-Cup )來(lái)創(chuàng)建一份副本,仔細(xì)閱讀模板并填充團(tuán)隊(duì)和項(xiàng)目信息,注意不要遺漏必填項(xiàng),也不要修改其他任何文件;
重命名為 團(tuán)隊(duì)名稱.md;
發(fā)起一次pull request完成作品提交申請(qǐng)。
7月
22日
報(bào)名&提交作品截止
在7月22日 22:00 前完成報(bào)名,并提交作品,請(qǐng)注意合理安排項(xiàng)目進(jìn)程,避免錯(cuò)過(guò)提交作品時(shí)間;
8月
07日
評(píng)比公布
參賽作品由評(píng)審委員會(huì)評(píng)審并打分,全部評(píng)分完畢后將通過(guò)公眾號(hào)、論壇、郵箱等公布成績(jī)!
獲獎(jiǎng)用戶領(lǐng)獎(jiǎng)
獲得一二三等獎(jiǎng)的用戶,在10個(gè)工作日內(nèi)聯(lián)系主辦方領(lǐng)取獎(jiǎng)品,優(yōu)秀獎(jiǎng)、開(kāi)源爬蟲(chóng)獎(jiǎng)用戶獲得神秘禮品一份!
用代碼來(lái)喚醒沉睡的數(shù)據(jù)資產(chǎn),贏現(xiàn)金大獎(jiǎng)!
點(diǎn)
閱讀原文,立即報(bào)名!
