本文介紹了 GitHub 上 star 量最高的 5 個機器學(xué)習(xí)項目,涉及人臉識別、文本處理、機器學(xué)習(xí)框架等。
轉(zhuǎn)載來源
公眾號:機器之心
“ 閱讀本文大概需要 6 分鐘。
”機器學(xué)習(xí)領(lǐng)域正在飛速發(fā)展。GitHub 是一張舉世矚目的白板,高質(zhì)量的代碼通常被發(fā)布在這張充滿智慧的無限大白板上。
顯然,我們不可能追蹤機器學(xué)習(xí)世界中的所有東西,但是 GitHub 上每個項目都具備自己的 star 量。即,如果你標(biāo)星了一個倉庫,這意味著你對這個項目表達了贊賞,同時也跟蹤了你覺得有意思的倉庫。
星數(shù)排名可作為了解最受關(guān)注項目的重要指標(biāo)。本文就介紹了機器學(xué)習(xí)領(lǐng)域星數(shù)排名最高的 5 個項目。
Face Recognition:26073★
GitHub 地址:https://github.com/ageitgey/face_recognition?source=post_page---------------------------這是世界上最簡潔的人臉識別工具。它提供對 Python 和命令行的應(yīng)用程序接口(API),其用途是識別以及操作圖像中的人臉。它使用 Dlib 最先進的人臉識別算法構(gòu)建,該深度學(xué)習(xí)模型在 LFW(Labeled Faces in the Wild)數(shù)據(jù)集上達到了 99.38% 的準(zhǔn)確率。
它還提供了 face_recognition 命令行工具,它可以讓你在包含圖像的文件夾中使用命令行來進行人臉識別!
這個庫還可以處理實時人臉識別。
fastText:18931 ★
GitHub 地址:https://github.com/facebookresearch/fastText?source=post_page---------------------------
fastText 是由 Facebook 團隊開發(fā)的免費開源庫,用于高效詞表征學(xué)習(xí)。它是輕量級的,允許用戶學(xué)習(xí)文本表征和句子分類器。它可以在標(biāo)準(zhǔn)通用硬件上運行,模型甚至可以被壓縮到適應(yīng)移動設(shè)備的大小。
文本分類是很多應(yīng)用的核心問題,例如垃圾郵件檢測、情感分析或智能回復(fù)。文本分類的目標(biāo)是給文檔(例如電子郵件、博客、短信、產(chǎn)品評論等)分配多個類別。
詞類示例(圖源:Alterra.ai)
對自然語言處理(NLP)愛好者而言,這是一款非常有用的工具。
圖源:https://fasttext.cc/?source=post_pag (https://fasttext.cc/?source=post_pag%EF%BC%89)Awesome TensorFlow:14501★
GitHub 地址:https://github.com/jtoy/awesome-tensorflow
這是一個幫你理解和使用 TensorFlow 的資源集合。該 repo 涵蓋一系列資源列表,如很棒的 TensorFlow 實驗、庫和項目。
TensorFlow 是 Google 開發(fā)的端到端開源機器學(xué)習(xí)平臺。它有全面的生態(tài)系統(tǒng),包括工具、庫和社區(qū)資源,允許研究者創(chuàng)建最先進的機器學(xué)習(xí)算法。使用 TensorFlow,開發(fā)者可以很容易地構(gòu)建并部署由機器學(xué)習(xí)驅(qū)動的應(yīng)用。
圖源:https://www.tensorflow.org/tutorials/keras/basic_classification?source=post_page?
Apache predictionio 11866 ★
GitHub 地址:https://github.com/apache/predictionio
Apache PredictionIO 是供開發(fā)者、數(shù)據(jù)科學(xué)家和終端用戶使用的開源機器學(xué)習(xí)框架。用戶可使用該框架構(gòu)建真實的機器學(xué)習(xí)應(yīng)用,并進行部署和測試。
它甚至支持事件收集、評估,以及查詢預(yù)測結(jié)果。它基于可擴展的開源服務(wù),如 Hadoop、HBase 等。
就機器學(xué)習(xí)而言,該工具減輕了開發(fā)人員的思維負(fù)擔(dān)。
圖源:http://predictionio.apache.org/appintegration/?source=post_page?
Style2Paints:9860?★
GitHub 地址:https://github.com/lllyasviel/style2paints
該 repo 與前面 4 個有點不一樣,因為缺乏資金,它已經(jīng)被關(guān)閉了!它確實是一個有趣的設(shè)想,使用 AI 給圖像上色。
創(chuàng)建者稱 Style2paints V4 是當(dāng)前最好的 AI 線稿上色工具。
他們稱這個項目與之前的端到端圖像轉(zhuǎn)換方法不同,因為它是第一個用真實的人類作業(yè)流程為線稿上色的系統(tǒng)。很多藝術(shù)家熟悉這個流程。
素描-->彩色填充/扁平化-->漸變/細(xì)節(jié)添加-->陰影處理
Style2Paints?就是根據(jù)這個流程設(shè)計的。只用兩次點擊,該流程就可以使下圖中最左的圖變成中間的圖。
圖源:https://style2paints.github.io/?source=post_page僅僅點擊 4 次,你就能夠得到下面這張圖:
圖源:https://github.com/lllyasviel/style2paints?source=post_page
原文鏈接:https://towardsdatascience.com/highest-rated-ml-projects-on-github-694486293512