本周優(yōu)秀開源項目分享:用于多動物姿勢跟蹤的深度學習框架、面部數據集的完整版本 等8大項目
?sweetviz 只需一行代碼即可可視化和比較數據集
Sweetviz是一個開放源代碼Python庫,可生成漂亮的高密度可視化文件,以單行代碼啟動探索性數據分析。輸出是一個完全獨立的HTML應用程序。
該系統圍繞快速可視化目標值和比較數據集而構建。其目標是幫助快速分析目標特征,訓練與測試數據以及其他此類數據表征任務。

主要特性:
目標分析
目標值(布爾值或數字值)與其他功能的關系
可視化和比較
不同的數據集(例如培訓與測試數據)
組內特征(例如男性與女性)
混合型關聯
Sweetviz無縫集成了數字(皮爾森相關性),分類(不確定性系數)和分類數字(相關性)數據類型的關聯,以提供所有數據類型的最大信息。
類型推斷:
自動檢測數字,類別和文本特征,并帶有可選的手動替代
摘要信息:
類型,唯一值,缺失值,重復行,最頻繁的值
數值分析:
最小/最大/范圍,四分位數,均值,眾數,標準偏差,和,中位數絕對偏差,變異系數,峰度,偏度
Sweetviz當前支持Python 3.6+和Pandas 0.25.3+。
項目地址:
https://github.com/fbdesignpro/sweetviz
?sleap 用于多動物姿勢跟蹤的深度學習框架

社會性LEAP估計動物姿勢(SLEAP)是通過深度學習進行多動物身體部位位置估計的框架。
它是LEAP的后繼者。SLEAP完全用Python編寫,支持多動物姿勢估計,動物實例跟蹤,并帶有支持主動學習的標簽/訓練GUI。
項目地址:
https://github.com/murthylab/sleap
?champ 基于MIT Cheetah I的四足機器人
CHAMP四足控制器的ROS軟件包。

CHAMP是一個開放源代碼開發(fā)框架,用于構建新的四足機器人和開發(fā)新的控制算法。該控制框架基于“利用模式調制和阻抗控制實現高度動態(tài)運動的分層控制器:在MIT獵豹機器人上實現”。
核心特性:
完全自主(使用ROS導航堆棧)。
設置助手,以配置新建的機器人。
預先配置的URDF,例如Anymal,MIT Mini Cheetah,Boston Dynamic的LittleDog和SpotMicroAi。
Gazebo模擬環(huán)境。
演示機器人使用可訪問的組件構建,因此您可以在家中構建它。
演示應用程序,如TOWR和雞頭穩(wěn)定器。
可以在SBC和微控制器上運行的輕量級C++僅標頭庫。
項目地址:
https://github.com/chvmp/champ
OpenPCDet是一個清晰,簡單,獨立的開源項目,用于基于LiDAR的3D對象檢測。
OpenPCDet是基于PyTorch的常規(guī)代碼庫,用于從點云進行3D對象檢測。它目前支持多種先進的3D對象檢測方法,這些方法具有針對一階段和兩階段3D檢測框架的高度重構的代碼。
基于OpenPCDet工具箱,在所有僅LiDAR方法中的3D檢測,3D跟蹤,域適應三個方面贏得了Waymo開放數據集挑戰(zhàn),并且Waymo相關模型將很快發(fā)布到OpenPCDet。
目前正在積極更新此存儲庫,不久將支持更多數據集和模型。
設計模式:
具有統一點云坐標的數據模型分離,可輕松擴展到自定義數據集。
統一的3D框定義:(x,y,z,dx,dy,dz,heading)。
靈活清晰的模型結構可輕松支持各種3D檢測模型。
在一個框架內支持以下各種模型。
支持特性:
支持一階段和兩階段3D對象檢測框架
支持使用多個GPU和多臺機器進行分布式培訓和測試
支持不同比例的多個頭部以檢測不同的類別
支持堆疊版本集抽象,以編碼不同場景中的多個點
支持自適應訓練樣本選擇(ATSS)進行目標分配
支持RoI感知點云池和RoI網格點云池
支持GPU版本3D IoU計算和旋轉NMS
模型組件:
KITTI 3D對象檢測基準
下表顯示了受支持的選定方法。結果是在KITTI數據集的值集上具有中等難度的3D檢測性能。

NuScenes 3D對象檢測基準

項目地址:
https://github.com/open-mmlab/OpenPCDet
? C-MS-Celeb MS-Celeb-1M面部數據集的完整版本
這是MS-Celeb-1M人臉數據集的干凈版本,其中包含94,682名名人的6,464,018張圖像。由于原始MS-Celeb-1M的標簽圖像過多,因此我們希望清理此數據集以進行更好的模型訓練。
我們的C-MS-Celeb清潔數據集包含6,464,018張圖像,屬于94,682位名人。下表將我們的數據與其他公開清除的MS-Celeb數據集進行了比較:

我們的C-MS-Celeb大型,清潔且多樣化。
大型:
首先,從該表中,與其他清潔列表相比,我們可以看到C-MS-Celeb在清潔過程中為更多人保留了更多圖像。
清潔:
其次,根據我們的經驗評估,正確標記了C-MS-Celeb中97.3%的圖像。
多樣的:
我們基于社區(qū)檢測的清潔方法還可以為每個人保留面部圖像的多樣性。以下是我們清潔結果中“ Lady Gaga”和“ Quinn Cummings”的一些示例圖像:

從這些樣本結果中,我們可以看到在清潔過程中可以保留各種妝容的圖像(左半邊是Gaga夫人)。從清潔結果還可以觀察到不同年齡的多樣性(右半部分的奎因·卡明斯)。
下圖說明了我們基于社區(qū)檢測的清潔方法。我們首先使用預先訓練的人臉識別模型構造人臉相似度圖。相似度圖中的每個節(jié)點代表一個圖像,兩個節(jié)點之間的鏈接權重量化了這兩個圖像之間的相似度。
然后,我們刪除弱連接并在該圖上運行社區(qū)檢測算法。最后,我們將圖像保留在大型社區(qū)(此圖中右側的彩色社區(qū))中,并刪除分散的節(jié)點和次要社區(qū)(圖中的灰色節(jié)點)。
因此,我們能夠在數據清理期間實現高清理度和豐富的數據多樣性。


項目地址:
https://github.com/EB-Dodo/C-MS-Celeb
?TensorFlowTTS Tensorflow 2的實時最新語音合成
TensorFlowTTS基于TensorFlow 2提供了實時的最新語音合成架構,例如Tacotron-2,Melgan,Multiband-Melgan,FastSpeech,FastSpeech2。
借助Tensorflow 2,我們可以加快訓練/推理進度,通過使用偽量化感知和修剪進一步優(yōu)化程序,使TTS模型可以比實時運行更快,并且能夠部署在移動設備或嵌入式系統上。
特性:
語音合成方面的高性能。
能夠微調其他語言。
快速,可擴展和可靠。
適合部署。
易于實現基于抽象類的新模型。
如果可能的話,混合精度可以加快訓練速度。
在基礎訓練器類別中同時支持單/多GPU。
所有支持模型的TFlite轉換。
Android示例。
支持多種語言(當前,我們支持中文,韓文,英文。)
支持C ++推理。
支持將某些模型的重量從pytorch轉換為tensorflow以加快速度。
系統需求:
該存儲庫已在Ubuntu 18.04上經過以下測試:
Python 3.7以上
CUDA 10.1
CuDNN 7.6.5
Tensorflow 2.2 / 2.3
Tensorflow插件> = 0.10.0
支持架構:
MelGAN?
Tacotron-2?
FastSpeech?
Multi-band MelGAN
FastSpeech2?
Parallel WaveGAN
項目地址:
https://github.com/TensorSpeech/TensorflowTTS
? aquvitae 輕量級深度學習的最簡單的知識蒸餾庫

AquVitae是一個Python庫,通過一個非常簡單的API即可最輕松地執(zhí)行知識蒸餾。該庫支持TensorFlow和PyTorch。
知識蒸餾是最有代表性的模型壓縮技術,以及權重運行和量化。該庫具有流行且多樣化的知識提取算法。
如果您的項目中使用的深度學習模型過于繁重,則可以使用AquVitae使速度非常快,而不會損失性能。
在AquVitae中實現的知識蒸餾算法列表:

項目地址:
https://github.com/aquvitae/aquvitae
? spark-rapids 使用GPU加速Apache Spark
用于Apache Spark的RAPIDS加速器為Apache Spark提供了一組插件,這些插件利用GPU通過RAPIDS庫和UCX加速處理。

上表顯示了根據TPCxBB基準測試運行ETL查詢的結果。這些絕對不是官方結果。它使用存儲在parquet中的10TB數據集(比例因子10,000)。
處理發(fā)生在兩個節(jié)點的DGX-2群集上。每個節(jié)點具有96個CPU內核,1.5TB主機內存,16個V100 GPU和512 GB GPU內存。
項目地址:
https://github.com/NVIDIA/spark-rapids
今天給大家推薦【機器學習集訓營 第十二期】課程,下周一開課!
1
專業(yè)的教學模式
【機器學習集訓營?第十二期】,采取十二位一體的教學模式,包括12個環(huán)節(jié):“入學測評、直播答疑、布置作業(yè)、階段考試、畢業(yè)考核、一對一批改、線上線下結合、CPU&GPU雙云平臺、組織比賽、聯合認證、面試輔導、就業(yè)推薦”。
2
完善的實戰(zhàn)項目
只學理論肯定是不行的,學機器學習的核心是要做項目,本期集訓營共13大實戰(zhàn)項目.




3
專家級講師團隊
本期集訓營擁有超豪華講師團隊,學員將在這些頂級講師的手把手指導下完成本期課程的學習,挑戰(zhàn)40萬年薪。


授課老師、助教老師,多對一服務。從課上到課下,從專業(yè)輔導到日常督學、360度無死角為學員安心學習鋪平道路。陪伴式解答學員疑惑,為學員保駕護航。
4
六大課程特色


5
完善的就業(yè)服務
學員在完成所有的階段學習后,將會有一對一的就業(yè)服務,包括簡歷優(yōu)化、面試求職輔導及企業(yè)內推三大部分。
為了確保學員能拿到滿意的offer,七月在線還專門成立就業(yè)部,會專門為集訓營學員提供就業(yè)服務,保證每一位學員都能拿到滿意的offer。
掃碼查看課程詳情,同時大家也可以去看看之前學員的面試經驗分享。
戳↓↓“閱讀原文”和課程老師申請優(yōu)惠!

