App下載

在python中視覺注釋工具有幾種?五種流行用于對象檢測的計算機視覺注釋工具!

宇宙一級潛在鴿王 2021-08-25 09:57:56 瀏覽數(shù) (2690)
反饋

計算機視覺是人工智能的一個子集,專注于教機器如何正確解釋來自圖片、視頻幀和其他來源的數(shù)據(jù)。我們通常需要使用帶注釋的數(shù)據(jù)來監(jiān)控深度學習模型,以利用當代計算機視覺技術(shù)。為了使用對象檢測和識別等計算機視覺技術(shù),需要使用這些對象的特定圖像實例訓練 ML 模型并標記它們。 

以下是五種常用的計算機視覺注釋工具,用于對訓練數(shù)據(jù)集進行對象識別和標記。

視覺工具流程圖解

1. ?LabelImg? : LabelImg 是一個開源的用于圖像處理和標注的標注工具。它是用 ?Python ?開發(fā)的,并有一個用 Qt 構(gòu)建的圖形用戶界面。這是一種快速且免費的圖像標簽方式。使用此標記工具完成的注釋以 PASCAL VOC XML 格式保存。

2. ?Computer Vision Annotation Tool (CVAT)?:Computer Vision Annotation Tool (CVAT) 是由 Intel 創(chuàng)建的免費圖像標記程序。它也是開源的,使用 ?CSS?、?Python?、?Django?、?TypeScript ?和 ?React ?等編程語言編寫。CVAT 有助于監(jiān)督學習任務(wù),如對象檢測、圖像分割和分類等。 CVAT 提供強大的功能,可以利用深度學習模型進行半自動注釋。

3.視覺對象標記工具(?VOTT?):微軟團隊創(chuàng)建了一個視覺對象標記工具(?VOTT?)來使用計算機視覺識別和注釋視頻和圖像,并使用 TypeScript 進行編程。如果你的數(shù)據(jù)存儲在 Azure Blob 存儲中或者你正在使用 Bing 圖像搜索,你可以直接通過他們的網(wǎng)站使用 VOTT。使用每個版本的安裝包是本地安裝 VoTT 的最便捷方式。適用于 Mac OSX 的 VoTT、適用于 Linux 的 VoTT 和適用于 Windows 的 VoTT 均作為安裝包提供。

4. ?Labelme?:Labelme是麻省理工學院計算機科學與人工智能實驗室于2012年開發(fā)的開源標注庫,它有助于使用圓形、矩形、三角形、點、線和線條對圖像進行標注。Labelme 是使用 Python 編寫的,對于圖形界面,它使用 Qt。使用 Labelme 可以輕松完成語義分割、邊界框和圖像分類。

5. ?RectLabel? : RectLabel 是一個圖像標注工具,用于標注圖片以識別和分割邊界框?qū)ο?。此圖像注釋工具可自動與一些核心 ML 模型配合使用,無需任何其他實現(xiàn)。Rectlabel 支持 PASCAL VOC XML 格式。支持使用骨架、多邊形、邊界框、線、點和三次貝塞爾曲線繪制關(guān)鍵點。您還可以自定義標簽對話框,以便它可以與特征一起使用。RectLabel 可以導出為 YOLO、COCO JSON 和 CSV 格式。這樣,用戶還可以導出索引掩碼圖像和分離的掩碼圖像,同時還可以執(zhí)行圖像調(diào)整大小和增強等任務(wù)。


0 人點贊