用 OpenCV 檢測貓臉
Python中的OpenCV貓臉檢測代碼
使用 OpenCV 的預訓練級聯(lián)分類器可以輕松檢測照片或視頻中的貓臉。完成所有工作的代碼:
import cv2
cascade = cv2.CascadeClassifier('haarcascade_frontalcatface.xml')
cap = cv2.VideoCapture(0)
while True:
ret, img = cap.read()
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
faces = cascade.detectMultiScale(img_gray, 1.5, 5)
for (x,y,w,h) in faces:
cv2.rectangle(img,(x,y),(x+w,y+h),(255,255,0),2)
roi_gray = img_gray[y:y+h, x:x+w]
roi_color = img[y:y+h, x:x+w]
cv2.imshow('img',img)
k = cv2.waitKey(30) & 0xff
if k == 27:
break
cap.release()
cv2.destroyAllWindows()
讓我們逐行檢查:
cv2 庫被導入。
如果你還沒有安裝cv2:
#install cv2
pip install opencv-python
#1
import cv2
· 加載級聯(lián)分類器 XML 文件。
#3
cascade = cv2.CascadeClassifier('haarcascade_frontalcatface.xml')
級聯(lián)分類器
級聯(lián)是一種集成學習方法,是一種使用多個分類器來提高準確率的方法。第一個級聯(lián)分類器是 Viola 和 Jones (2001) 的臉部檢測器。這個分類器的要求是快速,以便在低功耗 CPU 上實現(xiàn),例如相機和電話。
級聯(lián)是一種訓練分類器的方法(分類器是一種機器學習算法,可用于標記事物),以便它們在鏈中協(xié)同工作。鏈中的第一個分類器訓練在幾百張你試圖檢測的事物的“正面”圖像上,以及一堆不包含該事物的“負面”圖像上。
然后,可以將該分類器應用于圖像的一個區(qū)域,并嘗試檢測該對象。如果它沒有找到它,它將移動到下一個區(qū)域,依此類推,直到它找到了東西或搜索了整個圖像。這個過程最常用于面部檢測和識別。
該算法通過掃描圖像并尋找與訓練數(shù)據中的特征相匹配的 Haar 特征來工作。如果找到匹配項,則將該區(qū)域標記為臉。如果未找到匹配項,則將該區(qū)域標記為不是臉。
在整個圖像中進行這種搜索是一項非常昂貴的業(yè)務。想想看,即使是 24x24 的圖像也有 160000 個特征。因此,它使用積分圖像,這是克服這一問題的有效方法。
積分圖像允許快速計算給定矩形下的像素總和,用于計算各種特征。這種方法比傳統(tǒng)方法快得多,因此非常適合用于大圖像。
位置1的值是A中像素的總和。位置2的值是A和B的總和。位置3:A+C。位置 4 A+B+C+D。D 的值為 (4+1) - (2+3)。
在我們得到這些特征(會有很多)之后,我們需要對它們進行某種過濾,我們需要找出那些能夠告訴我們一些東西的特征。Adaboost 是一種機器學習算法,有助于從大量特征中選擇最佳特征。它通過關注與手頭任務最相關的特征來做到這一點。
我們將每個特征應用于訓練圖像并獲得正負示例中提供的最佳閾值。選擇在兩個方向上具有最低錯誤率的特征。Adaboost 的基礎分類器很弱。但是當同時使用許多基礎分類器時,Adaboost 可以達到一個強大的水平。通過將特征從 160000 個減少到 6000 個特征,實現(xiàn)了超級增益。
通常,包含臉部的區(qū)域與整個圖像區(qū)域相比非常小。因此,到處尋找臉部仍然是低效的。相反,在你的臉更有可能出現(xiàn)在照片中間的區(qū)域。
Cascade of Classifiers 是一個引入的概念,以便更有效地將所有特征應用于窗口。這些特征被分組到分類器的不同階段并被一一應用。如果窗口在第一階段失敗,則不考慮剩余的特征。如果通過,則應用第二階段的特征并繼續(xù)該過程。通過所有階段的窗口就是臉部區(qū)域。
· 為了訪問和讀取從網絡攝像頭接收到的數(shù)據,我們創(chuàng)建了一個視頻捕獲對象并傳遞我們的設備編號。
VideoCapture 類用于捕獲視頻。你可以傳遞視頻文件的路徑。
#5
cap = cv2.VideoCapture(0)
· 啟動循環(huán)以確保視頻數(shù)據的連續(xù)流。
#7
while True:
· VideoCapture 對象(cap)讀取并解碼,返回下一幀視頻。#8
ret, img = cap.read()
#ret is True if there is a video data
#img is the image
· 我們將接收到的圖像轉換為灰度以最小化計算成本。
#9
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
· 現(xiàn)在,是時候在提供的圖像幀中檢測臉部了。我們將使用我們的級聯(lián)方法。
detectMultiScale方法檢測給定圖像中各種大小的對象。它接受灰度圖像、scaleFactor、minNeighbors、minSize、maxSize。
scaleFactor用于創(chuàng)建比例金字塔,它是一系列不同大小的圖像,用于檢測圖像中不同大小的臉部。較小的比例因子會導致更徹底的臉部搜索,但速度較慢,而較大的比例因子會導致搜索速度更快,但可能會遺漏一些臉部。
minNeighbors 參數(shù)指定每個候選矩形應該保留多少個鄰居。該參數(shù)會影響檢測到的臉部質量。數(shù)值越高,檢測次數(shù)越少,質量越高。3~6是很好的參考取值。
minSize確定被檢測對象的閾值大小。對于maxSize,則相反。
#10
faces = cascade.detectMultiScale(img_gray, 1.5, 5)
· 在圖像中的面部周圍繪制矩形。
#12-13-14-15
for (x,y,w,h) in faces:
cv2.rectangle(img,(x,y),(x+w,y+h),(255,255,0),2)
roi_gray = img_gray[y:y+h, x:x+w]
roi_color = img[y:y+h, x:x+w]
收聽事件以結束程序。(在我們的例子中按下退出鍵)。
#19-20-21
k = cv2.waitKey(30) & 0xff
if k == 27:
break
結果:
參考
原文標題 : 用 OpenCV 檢測貓臉
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-10.29立即報名>> 2024德州儀器嵌入式技術創(chuàng)新發(fā)展研討會
-
10月31日立即下載>> 【限時免費下載】TE暖通空調系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月14日立即報名>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市