中国老头和老太婆黄色一级,日本韩国欧美在线观看

用Python和OpenCV為對象檢測任務實現(xiàn)最流行、最高效的數(shù)據(jù)擴充

2021-12-15 10:41

磐創(chuàng)AI

關(guān)注

數(shù)據(jù)擴充是一種增加數(shù)據(jù)集多樣性的技術(shù)，無需收集更多真實數(shù)據(jù)，但仍有助于提高模型精度并防止模型過擬合。

在本文中，你將學習使用Python和OpenCV為對象檢測任務實現(xiàn)最流行、最高效的數(shù)據(jù)擴充過程。

即將引入的一組數(shù)據(jù)擴充方法包括：

1．隨機裁剪

2．Cutout

3．顏色抖動

4．增加噪音

5．過濾

首先，在繼續(xù)之前，讓我們導入幾個庫并準備一些必要的子例程。

import os

import cv2

import numpy as np

import random

def file＿lines＿to＿list（path）：

＇＇＇
＃＃＃在TXT文件里的行轉(zhuǎn)換為列表＃＃＃
path：文件路徑
＇＇＇
with open（path） as f：
content ＝ f．readlines（）
content ＝［（x．strip（））．split（） for x in content］
return content

def get＿file＿name（path）：
＇＇＇
＃＃＃獲取Filepath的文件名＃＃＃
path：文件路徑
＇＇＇
basename ＝ os．path．basename（path）
onlyname ＝ os．path．splitext（basename）［0］
return onlyname

def write＿anno＿to＿txt（boxes， filepath）：
＇＇＇
＃＃＃給TXT文件寫注釋＃＃＃
boxes： format ［［obj x1 y1 x2 y2］，．．．］
filepath：文件路徑
＇＇＇
txt＿file ＝ open（filepath，＂w＂）
for box in boxes：
print（box［0］， int（box［1］）， int（box［2］）， int（box［3］）， int（box［4］）， file＝txt＿file）
txt＿file．close（）

下面的圖片是在這篇文章中使用的示例圖片。

隨機裁剪隨機裁剪隨機選擇一個區(qū)域并進行裁剪以生成新的數(shù)據(jù)樣本，裁剪后的區(qū)域應具有與原始圖像相同的寬高比，以保持對象的形狀。

從上圖中，左側(cè)圖像表示具有邊界框（紅色）的原始圖像，通過裁剪橙色框內(nèi)的區(qū)域創(chuàng)建一個新樣本作為右側(cè)圖像。在新示例的注釋中，將刪除與左側(cè)圖像中的橙色框不重疊的所有對象，并細化位于橙色框邊界上的對象的坐標，使其適合新圖像示例。原始圖像的隨機裁剪輸出為新裁剪圖像及其注釋。

Cutout

Terrance DeVries和Graham W．Taylor在2017年的論文中介紹了Cutout，它是一種簡單的正則化技術(shù)，用于在訓練過程中隨機屏蔽輸入的方塊區(qū)域，可用于提高卷積神經(jīng)網(wǎng)絡的魯棒性和整體性能。

這種方法不僅非常容易實現(xiàn)，而且還表明它可以與現(xiàn)有形式的數(shù)據(jù)擴充和其他正則化工具結(jié)合使用，以進一步提高模型性能。

如本文所述，剪切用于提高圖像識別（分類）的準確性，因此，如果我們將相同的方案部署到對象檢測數(shù)據(jù)集中，可能會導致丟失對象的問題，尤其是小對象。

在下圖中，cutout區(qū)域（黑色區(qū)域）內(nèi)的大量小對象被移除，這不符合數(shù)據(jù)擴充的精神。

為了使這種方式適用于對象檢測，我們可以進行簡單的修改，而不是僅使用一個蒙版并將其放置在圖像中的隨機位置。當我們隨機選擇一半數(shù)量的對象并將剪切應用于這些對象區(qū)域時，效果會更好。增強圖像如下圖中的右圖所示。

剪切輸出是新生成的圖像，我們不移除對象或更改圖像大小，則生成圖像的注釋與原始圖像相同。

def cutout（img， gt＿boxes， amount＝0．5）：
＇＇＇
＃＃＃ Cutout ＃＃＃
img：圖像
gt＿boxes： format ［［obj x1 y1 x2 y2］，．．．］
amount：蒙版數(shù)量／對象數(shù)量
＇＇＇
out ＝ img．copy（）
ran＿select ＝ random．sample（gt＿boxes， round（amount＊len（gt＿boxes）））
for box in ran＿select：
x1 ＝ int（box［1］）
y1 ＝ int（box［2］）
x2 ＝ int（box［3］）
y2 ＝ int（box［4］）
mask＿w ＝ int（（x2 － x1）＊0．5）
mask＿h ＝ int（（y2 － y1）＊0．5）
mask＿x1 ＝ random．randint（x1， x2 － mask＿w）
mask＿y1 ＝ random．randint（y1， y2 － mask＿h）
mask＿x2 ＝ mask＿x1 ＋ mask＿w
mask＿y2 ＝ mask＿y1 ＋ mask＿h
cv2．rectangle（out，（mask＿x1， mask＿y1），（mask＿x2， mask＿y2），（0， 0， 0）， thickness＝－1）
return out