有了這些,我覺得我又行了!
大家好,我是 Jack。
適合練手的開源項目分享,建議收藏!
一直有小伙伴問我,想找算法工程師的工作,項目經(jīng)歷應(yīng)該怎么準(zhǔn)備?
機器學(xué)習(xí)、深度學(xué)習(xí)算法基礎(chǔ)知識這些不用說了,多背一背,多看面經(jīng)。數(shù)據(jù)結(jié)構(gòu)就多刷題。
那項目經(jīng)歷呢?
很多時候,光看基礎(chǔ)知識是不夠的,更重要的是動手練習(xí)。
上學(xué)期間,能幫助我們提高實戰(zhàn)能力的,除了導(dǎo)師項目和科技競賽,那就是一些開源項目了。
導(dǎo)師項目算是可遇不可求,但開源項目,倒是有很多。
找一些開源的競賽項目,自己跟著做一遍,深刻理解一下,再包裝一下,項目經(jīng)歷不就有了嗎?
今天,給大家整理一些適合小白練手的開源項目,有需要的小伙伴,可以收藏一下。
有科技競賽的開源項目,也有一些公開數(shù)據(jù)集的項目。
面向初學(xué)者的機器學(xué)習(xí)項目
在本部分中,列出了針對初學(xué)者/初學(xué)者的頂級機器學(xué)習(xí)項目,如果你已經(jīng)從事基礎(chǔ)機器學(xué)習(xí)項目,請?zhí)料乱徊糠郑褐屑墮C器學(xué)習(xí)項目
1、鳶尾花分類項目

項目構(gòu)想:鳶尾花有不同的種類,你可以根據(jù)花瓣和萼片的長度來區(qū)分它們。這是機器學(xué)習(xí)初學(xué)者預(yù)測新鳶尾花種類的基礎(chǔ)項目。
數(shù)據(jù)集:鳶尾花分類數(shù)據(jù)集
https://archive.ics.uci.edu/ml/datasets/Iris
2、Emojify–使用Python創(chuàng)建自己的表情符號

項目構(gòu)想:該機器學(xué)習(xí)項目的目標(biāo)是對人的面部表情進行分類并將其映射為表情符號。我們將建立一個卷積神經(jīng)網(wǎng)絡(luò)來識別面部表情。然后,我們將使用相應(yīng)的表情符號或頭像來映射這些情感。
源代碼:Emojify項目
https://data-flair.training/blogs/create-emoji-with-deep-learning
3、使用機器學(xué)習(xí)進行貸款預(yù)測
項目構(gòu)想:該ML項目背后的構(gòu)想是建立一個模型,該模型將對用戶可以貸款多少進行分類。它基于用戶的婚姻狀況,教育程度,受撫養(yǎng)人數(shù)和就業(yè)情況。我們可以為此項目建立一個線性模型。
數(shù)據(jù)集:貸款預(yù)測數(shù)據(jù)集
https://www.kaggle.com/altruistdelhite04/loan-prediction-problem-dataset
4、住房價格預(yù)測項目
項目構(gòu)想:數(shù)據(jù)集包含波士頓剩余區(qū)域的房價。房子的費用根據(jù)犯罪率,房間數(shù)量等各種因素而變化。對于初學(xué)者來說,這是一個很好的ML項目,它可以根據(jù)新數(shù)據(jù)預(yù)測價格。
數(shù)據(jù)集:房屋價格預(yù)測數(shù)據(jù)集
https://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html
5、MNIST數(shù)字分類機器學(xué)習(xí)項目
項目構(gòu)想:MNIST數(shù)字分類python項目使機器能夠識別手寫數(shù)字。該項目對于計算機視覺可能非常有用。在這里,我們將使用MNIST數(shù)據(jù)集使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型。
數(shù)據(jù)集:MNIST數(shù)字識別數(shù)據(jù)集
https://drive.google.com/file/d/1hJiOlxctFH3uL2yTqXU_1f6c0zLr8V_K/view
源代碼:手寫數(shù)字識別項目
https://data-flair.training/blogs/python-deep-learning-project-handwritten-digit-recognition/
6、使用機器學(xué)習(xí)預(yù)測股價
項目構(gòu)想:有許多可用于股票市場價格的數(shù)據(jù)集。這個機器學(xué)習(xí)初學(xué)者的項目旨在根據(jù)上一年的數(shù)據(jù)預(yù)測股票市場的未來價格。
數(shù)據(jù)集:股票價格預(yù)測數(shù)據(jù)集
https://www.kaggle.com/c/two-sigma-financial-news/data
源代碼:股票價格預(yù)測項目
https://data-flair.training/blogs/stock-price-prediction-machine-learning-project-in-python/
7、泰坦尼克號生存計劃
項目構(gòu)想:這將是一個有趣的項目,因為我們將預(yù)測某人是否會在泰坦尼克號飛船中幸存下來。對于這個初學(xué)者的項目,我們將使用泰坦尼克號數(shù)據(jù)集,其中包含幸存者和在泰坦尼克號飛船中死亡的人的真實數(shù)據(jù)。
數(shù)據(jù)集:《泰坦尼克號生存》數(shù)據(jù)集
https://www.kaggle.com/c/titanic
8、葡萄酒質(zhì)量檢測項目

項目構(gòu)想:在該項目中,我們可以構(gòu)建一個界面來預(yù)測紅酒的質(zhì)量。它將使用葡萄酒的化學(xué)信息,并基于機器學(xué)習(xí)模型,它將為我們提供葡萄酒質(zhì)量的結(jié)果。
數(shù)據(jù)集:葡萄酒質(zhì)量數(shù)據(jù)集
https://archive.ics.uci.edu/ml/datasets/wine+quality
9、假新聞檢測項目
項目構(gòu)想:虛假新聞像野火一樣傳播,這在這個時代是一個大問題。我們可以學(xué)習(xí)如何將假新聞與真實新聞區(qū)分開。我們可以使用監(jiān)督學(xué)習(xí)來實現(xiàn)這樣的模型。
數(shù)據(jù)集:檢測虛假新聞數(shù)據(jù)集
https://drive.google.com/file/d/1er9NJTLUA3qnRuyhfzuN0XUsoIC4a-_q/view
源代碼:假新聞檢測項目
https://data-flair.training/blogs/advanced-python-project-detecting-fake-news/
中級機器學(xué)習(xí)項目
1、音樂流派分類機器學(xué)習(xí)項目
項目構(gòu)想:該python機器學(xué)習(xí)項目的思想是開發(fā)一個機器學(xué)習(xí)項目,并自動對音頻中的不同音樂流派進行分類。我們需要使用它們的頻域和時域低級特征對這些音頻文件進行分類。
源代碼:音樂流派分類項目
https://data-flair.training/blogs/python-project-music-genre-classification/
2、比特幣價格預(yù)測器項目
項目構(gòu)想:比特幣價格預(yù)測器是一個有用的項目。區(qū)塊鏈技術(shù)正在發(fā)展,并且有許多數(shù)字貨幣在上升。該項目將幫助你使用以前的數(shù)據(jù)預(yù)測比特幣的價格。
數(shù)據(jù)集:比特幣價格預(yù)測數(shù)據(jù)集
https://www.kaggle.com/team-ai/bitcoin-price-prediction/version/1
3、Uber數(shù)據(jù)分析項目
項目構(gòu)想:該項目可用于對超級數(shù)據(jù)執(zhí)行數(shù)據(jù)可視化。該數(shù)據(jù)集包含紐約市中的450萬個超級拾取器。為了分析行程,需要精美地表示很多數(shù)據(jù),以便可以進一步改善業(yè)務(wù)。
數(shù)據(jù)集:Uber數(shù)據(jù)分析數(shù)據(jù)集
https://drive.google.com/file/d/1emopjfEkTt59jJoBH9L9bSdmlDC4AR87/view
源代碼:Uber數(shù)據(jù)分析項目
https://data-flair.training/blogs/r-data-science-project-uber-data-analysis/
4、人格預(yù)測項目
項目構(gòu)想:Myers Briggs類型指示器是一種個性類型系統(tǒng),根據(jù)內(nèi)向,直覺,思維和感知能力將一個人分為16個不同的個性。我們可以根據(jù)他們在社交媒體上發(fā)布的帖子的類型來確定其個性。
數(shù)據(jù)集:個性預(yù)測數(shù)據(jù)集
https://www.kaggle.com/datasnaek/mbti-type
5、Xbox游戲預(yù)測項目
項目構(gòu)想:人們在搜索時生成的數(shù)據(jù)可用于預(yù)測用戶的興趣。BestBuy消費電子公司已提供了來自用戶的數(shù)百萬次搜索的數(shù)據(jù),我們將預(yù)測用戶最有興趣購買的Xbox游戲。這將用于向游客推薦游戲。
數(shù)據(jù)集:Xbox游戲預(yù)測數(shù)據(jù)集
https://www.kaggle.com/c/acm-sf-chapter-hackathon-small/overview
6、信用卡欺詐檢測項目
項目構(gòu)想:使用卡進行大量交易的公司需要發(fā)現(xiàn)系統(tǒng)中的異常情況。該項目旨在建立信用卡欺詐檢測模型。我們將使用交易及其標(biāo)簽作為欺詐或非欺詐來檢測客戶進行的新交易是否為欺詐。
數(shù)據(jù)集:信用卡欺詐檢測數(shù)據(jù)集
https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view
源代碼:信用卡欺詐檢測項目
https://data-flair.training/blogs/data-science-machine-learning-project-credit-card-fraud-detection/
7、使用機器學(xué)習(xí)進行客戶細分
項目構(gòu)想:客戶細分是一種根據(jù)客戶的購買歷史,性別,年齡,興趣等對客戶進行細分的技術(shù)。獲取此信息非常有用,以便商店可以在個性化營銷方面獲得幫助,并為客戶提供相關(guān)的信息交易。在該項目的幫助下,公司可以運行特定于用戶的活動并提供特定于用戶的報價,而不是向所有用戶廣播相同的報價。
數(shù)據(jù)集:客戶細分?jǐn)?shù)據(jù)集
https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view
源代碼:客戶細分項目
https://data-flair.training/blogs/r-data-science-project-customer-segmentation/
高級機器學(xué)習(xí)項目
1、使用機器學(xué)習(xí)進行情感分析

項目構(gòu)想:情感分析是分析用戶情感的過程。我們可以將他們的情緒分為正面,負面或中性。了解如何進行情感分析是一個很棒的項目,并且如今已被廣泛使用。這是最受歡迎的機器學(xué)習(xí)項目之一。其背后的原因是每家公司都試圖了解客戶的情緒,如果客戶滿意,他們會留下來。該項目可能顯示出減少客戶流失的途徑。
數(shù)據(jù)集:情感分析數(shù)據(jù)集
http://ai.stanford.edu/~amaas/data/sentiment/
源代碼:情感分析項目
https://data-flair.training/blogs/data-science-r-sentiment-analysis-project/
2、安然調(diào)查項目
項目構(gòu)想:安然公司(Enron)在2000年倒閉,但可提供數(shù)據(jù)進行調(diào)查。該數(shù)據(jù)庫包含500,000名在公司工作的真實員工的電子郵件,因此數(shù)據(jù)對于執(zhí)行數(shù)據(jù)分析非常有用,許多數(shù)據(jù)科學(xué)家都使用此數(shù)據(jù)集。
數(shù)據(jù)集:安然調(diào)查數(shù)據(jù)集
https://www.cs.cmu.edu/~enron/
3、語音情感識別機器學(xué)習(xí)項目

項目構(gòu)想:這是最好的機器學(xué)習(xí)項目之一。語音情感識別系統(tǒng)使用音頻數(shù)據(jù)。它以語音的一部分作為輸入,然后確定說話者以何種情緒說話。我們可以識別出不同的情緒,例如快樂,悲傷,驚訝,生氣等。該項目可能有助于在與呼叫中心通話期間識別客戶情緒。
數(shù)據(jù)集:語音情感識別數(shù)據(jù)集
https://drive.google.com/file/d/1wWsrN2Ep7x6lWqOXfr4rpKGYrJhWc8z7/view
源代碼:語音情感識別項目
https://data-flair.training/blogs/python-mini-project-speech-emotion-recognition/
4、抓非法捕魚項目

項目構(gòu)想:這是一個有趣的機器學(xué)習(xí)項目。海洋上有許多船,船,不可能手動跟蹤每個人的活動。這將是一個了不起的項目,它可以通過衛(wèi)星和地理位置數(shù)據(jù)識別非法偷獵動物并捕撈捕魚活動。Global Fishing Watch免費提供實時數(shù)據(jù),可用于構(gòu)建系統(tǒng)。
數(shù)據(jù)集:捕捉非法捕魚數(shù)據(jù)集
https://globalfishingwatch.org/map-and-data/
5、使用機器學(xué)習(xí)的電影推薦系統(tǒng)

項目構(gòu)想:推薦系統(tǒng)無處不在,無論是在線購買應(yīng)用程序,電影流媒體應(yīng)用程序還是音樂流媒體。他們都根據(jù)目標(biāo)客戶推薦產(chǎn)品。電影推薦系統(tǒng)是增強你的作品集的絕佳項目。
數(shù)據(jù)集:電影推薦系統(tǒng)數(shù)據(jù)集
https://drive.google.com/file/d/1Dn1BZD3YxgBQJSIjbfNnmCFlDW2jdQGD/view
源代碼:電影推薦系統(tǒng)項目
https://data-flair.training/blogs/data-science-r-movie-recommendation/
6、車牌自動識別系統(tǒng)
項目構(gòu)想:該機器學(xué)習(xí)項目的目的是檢測和識別車輛的牌照號,并讀取印在牌照上的牌照號。這可能是用于安全掃描,流量監(jiān)視等的良好應(yīng)用程序。
源代碼:自動車牌識別項目
https://techvidvan.com/tutorials/python-project-license-number-plate-recognition/
參考鏈接:
https://data-flair.training/blogs/machine-learning-project-ideas/
整理自:網(wǎng)絡(luò)

