英特爾開源計算機(jī)視覺標(biāo)注工具CVAT
CVAT 旨在為用戶提供一套方便的工具來注釋數(shù)字圖像和視頻。CVAT 支持與對象檢測、圖像分類和圖像分割有關(guān)的監(jiān)督機(jī)器學(xué)習(xí)任務(wù)。它使用戶能夠用四種類型的形狀注釋圖像:框、多邊形(一般和分割任務(wù))、折線(可用于注釋道路上的標(biāo)記)和點(例如,用于注釋面部標(biāo)志或姿勢估計) .
此外,CVAT 提供了有助于典型注釋任務(wù)的功能,例如許多自動化工具(包括使用TensorFlow* 對象檢測 API復(fù)制和傳播對象、插值和自動注釋的能力)、視覺設(shè)置、快捷方式、過濾器等.
CVAT 很容易通過基于瀏覽器的界面訪問;通過Docker *進(jìn)行簡單部署后,無需進(jìn)一步安裝。CVAT 支持團(tuán)隊之間的協(xié)作以及個人的工作。用戶可以創(chuàng)建公共任務(wù)并在其他用戶之間分配工作。CVAT 也非常靈活,支持多種不同的標(biāo)注場景,多種可選工具,以及嵌入到Onepanel等平臺的能力*。CVAT 是為專業(yè)注釋和算法團(tuán)隊開發(fā)的,并得到他們的支持,我們試圖提供這些團(tuán)隊認(rèn)為最有價值的功能。
像許多早期的開源項目一樣,CVAT 也有一些已知的限制。其客戶端僅在 Google Chrome* 中進(jìn)行過測試,在其他瀏覽器中可能表現(xiàn)不佳。盡管 CVAT 支持一些自動測試,但所有檢查都必須手動完成,這會減慢開發(fā)過程。CVAT 的文檔目前有些有限,這可能會妨礙參與該工具的開發(fā)。最后,由于 Chrome 沙盒的限制,CVAT 在某些用例中可能會出現(xiàn)性能問題。盡管有這些缺點,但 CVAT 應(yīng)該仍然是圖像注釋工作流程的有用工具。此外,我們希望通過未來的發(fā)展來解決其中的一些缺點。
