PyTorch實現(xiàn),GitHub 4000星:這是微軟開源的計算機視覺庫
本文介紹了微軟開源的計算機視覺庫,它囊括了計算機視覺領(lǐng)域的最佳實踐、代碼示例和豐富文檔。

項目地址:
https://github.com/microsoft/computervision-recipes
該庫沒有從頭開始創(chuàng)建實現(xiàn),而是基于已有的 SOTA 庫發(fā)展而來,并圍繞加載圖像數(shù)據(jù)、優(yōu)化和評估模型、擴展至云端構(gòu)建了額外的工具函數(shù)。
此外,微軟團隊表示,希望通過該項目回答計算機視覺領(lǐng)域的常見問題、指出頻繁出現(xiàn)的缺陷問題,并展示如何利用云進行模型訓(xùn)練和部署。
Jupyter notebooks 地址:
https://github.com/microsoft/computervision-recipes/blob/master/scenarios
工具函數(shù)地址:
https://github.com/microsoft/computervision-recipes/blob/master/utils_cv
該庫的目標群體是具備一定計算機視覺知識背景的數(shù)據(jù)科學家和機器學習工程師,因為庫的內(nèi)容以 source-only(僅源代碼)的形式呈現(xiàn),支持自定義機器學習建模。
這個庫提供的工具函數(shù)和示例旨在為現(xiàn)實世界的視覺問題提供解決方案加速器。










對于高密度人群圖像,MCNN 模型取得了良好的效果;
對于低密度場景,OpenPose 表現(xiàn)良好。
而當人群密度未知時,該項目采用啟發(fā)式方法。在滿足以下條件時使用 MCNN 進行預(yù)測:OpenPose 預(yù)測大于 20,MCNN 大于 50。反之,則使用 OpenPose 預(yù)測。模型的閾值可以根據(jù)使用者的場景進行更改。
此外,該目錄還展示了依賴項、安裝過程、測試及性能。
項目地址:
https://github.com/microsoft/computervision-recipes

