推薦5最佳免費圖像注釋工具
點擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時間送達(dá)

圖像標(biāo)注是有監(jiān)督機器學(xué)習(xí)中的數(shù)據(jù)標(biāo)注技術(shù)之一,要做圖像注釋,必須需要一個專用的注釋工具,現(xiàn)在有很多圖像注釋工具。
在本文中,我們將根據(jù)在項目中使用它們以及我們尋找最適合使用的工具時的個人經(jīng)驗,為你們推薦五個最好的免費圖像注釋工具。

imglab是我們嘗試過的最新工具,此工具是基于web的工具,但你們也可以在本地安裝。這本身就是一個優(yōu)勢,因為你們可以訪問該網(wǎng)站并啟動注釋項目。此外,不需要任何登錄。

這是imglab必須提供的功能列表,它做到了上面所說的。非常好的工具,易于訪問的網(wǎng)站,非常簡單,用戶友好的界面。
VoTT是Microsoft的一個注釋工具,它有幾個與其他工具不同的有趣特性。此工具的安裝非常簡單,因為你們只需根據(jù)自己的操作系統(tǒng)從Github頁面下載安裝程序即可。

VoTT提供了主動學(xué)習(xí),但我們很少使用它。你們可以在主動學(xué)習(xí)功能中選擇預(yù)測標(biāo)記和自動檢測。除了圖像注釋外,該工具還可用于視頻注釋。VoTT還支持多種導(dǎo)出格式,如Azure自定義Vision服務(wù)、CSV、CNTK、Pascal VOC、Tensorflow記錄和VoTT Json。為了方便你們注釋圖像,可以在VoTT中探索許多功能,缺點是VoTT中的注釋類型僅限于矩形和多邊形。

CVAT是Intel開發(fā)的計算機視覺注釋工具,除了圖像注釋外,CVAT還像VoTT一樣支持視頻注釋。這個工具背后的人還專門制作了一個關(guān)于CVAT的youtube視頻,但是現(xiàn)在它已經(jīng)過時了,因為CVAT已經(jīng)有了很多改進(jìn),單從界面上就可以看到。CVAT最棒的地方是它的界面整潔,同時還加入了很多功能。你可以選擇五種類型,其中包括一個長方體,這是很多工具都沒有的,而這個叫做“AI工具”的功能也沒有機會使用它。至于安裝,它不是最容易安裝的工具,因為你們首先需要docker。
labelimg是我在圖像標(biāo)記方面的第一個工具。這是我第一次接觸到圖像標(biāo)簽,因為我以前的項目或工作是為語音識別注釋音頻。

作為當(dāng)時的第一個計時器,我驚訝于安裝工具和啟動程序是多么容易。由于用戶界面友好,理解該工具也不難。此工具的缺點是,它只提供一個形狀,即邊界框或矩形形狀。你們可以在GitHub頁面上通過編程添加另一個形狀,但我不是程序員,所以我不能這么做。
labelimg還提供了兩種類型的文件,你們可以將文件保存到其中。第一個是PascalVOC,第二個是YOLO。盡管如此,對于初學(xué)者來說,它仍然是一個很棒的工具,如果你們的項目僅依賴于邊界框,那么這個工具非常適合。
這是我目前用于圖像注釋項目的最佳工具。labelme在易于安裝和界面方面與labelimg更為相似,它們之間的區(qū)別在于labelme具有一些特性,使我將其用作日常注釋工具。

在我看來,最好的特性之一是右下角的“文件列表”。當(dāng)你們有很多圖像需要注釋時,可能會忘記對其中一些圖像進(jìn)行注釋。這就是為什么“文件列表”很方便,因為它不僅列出了你們的文件,而且還為已經(jīng)注釋的每個文件提供了一個復(fù)選標(biāo)記。
在labelme中,可以自由選擇它擁有的六種類型,從多邊形、矩形、圓形、直線、點和線條開始。labelme提供了注釋圖像的靈活性,同時也易于使用。labelme對我來說唯一的缺點是它只能以JSON格式保存文件。但是,如果ml工程師對格式?jīng)]有意見,這也不是問題。
交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細(xì)分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

