在python中視覺注釋工具有幾種？五種流行用于對象檢測的計算機視覺注釋工具！

宇宙一級潛在鴿王 2021-08-25 09:57:56 瀏覽數(shù) (2690)

反饋

計算機視覺是人工智能的一個子集，專注于教機器如何正確解釋來自圖片、視頻幀和其他來源的數(shù)據(jù)。我們通常需要使用帶注釋的數(shù)據(jù)來監(jiān)控深度學習模型，以利用當代計算機視覺技術(shù)。為了使用對象檢測和識別等計算機視覺技術(shù)，需要使用這些對象的特定圖像實例訓練 ML 模型并標記它們。

以下是五種常用的計算機視覺注釋工具，用于對訓練數(shù)據(jù)集進行對象識別和標記。

視覺工具流程圖解

1. ?LabelImg? : LabelImg 是一個開源的用于圖像處理和標注的標注工具。它是用 ?Python ?開發(fā)的，并有一個用 Qt 構(gòu)建的圖形用戶界面。這是一種快速且免費的圖像標簽方式。使用此標記工具完成的注釋以 PASCAL VOC XML 格式保存。

2. ?Computer Vision Annotation Tool (CVAT)?：Computer Vision Annotation Tool (CVAT) 是由 Intel 創(chuàng)建的免費圖像標記程序。它也是開源的，使用 ?CSS?、?Python?、?Django?、?TypeScript ?和 ?React ?等編程語言編寫。CVAT 有助于監(jiān)督學習任務(wù)，如對象檢測、圖像分割和分類等。 CVAT 提供強大的功能，可以利用深度學習模型進行半自動注釋。

3.視覺對象標記工具（?VOTT?）：微軟團隊創(chuàng)建了一個視覺對象標記工具（?VOTT?）來使用計算機視覺識別和注釋視頻和圖像，并使用 TypeScript 進行編程。如果你的數(shù)據(jù)存儲在 Azure Blob 存儲中或者你正在使用 Bing 圖像搜索，你可以直接通過他們的網(wǎng)站使用 VOTT。使用每個版本的安裝包是本地安裝 VoTT 的最便捷方式。適用于 Mac OSX 的 VoTT、適用于 Linux 的 VoTT 和適用于 Windows 的 VoTT 均作為安裝包提供。

4. ?Labelme?：Labelme是麻省理工學院計算機科學與人工智能實驗室于2012年開發(fā)的開源標注庫，它有助于使用圓形、矩形、三角形、點、線和線條對圖像進行標注。Labelme 是使用 Python 編寫的，對于圖形界面，它使用 Qt。使用 Labelme 可以輕松完成語義分割、邊界框和圖像分類。

5. ?RectLabel? : RectLabel 是一個圖像標注工具，用于標注圖片以識別和分割邊界框?qū)ο?。此圖像注釋工具可自動與一些核心 ML 模型配合使用，無需任何其他實現(xiàn)。Rectlabel 支持 PASCAL VOC XML 格式。支持使用骨架、多邊形、邊界框、線、點和三次貝塞爾曲線繪制關(guān)鍵點。您還可以自定義標簽對話框，以便它可以與特征一起使用。RectLabel 可以導出為 YOLO、COCO JSON 和 CSV 格式。這樣，用戶還可以導出索引掩碼圖像和分離的掩碼圖像，同時還可以執(zhí)行圖像調(diào)整大小和增強等任務(wù)。

Python 大數(shù)據(jù) 人工智能工具

0 人點贊

在python中視覺注釋工具有幾種？五種流行用于對象檢測的計算機視覺注釋工具！

在python中視覺注釋工具有幾種？五種流行用于對象檢測的計算機視覺注釋工具！