小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

OpenCV訓練分類器制作xml文檔

 xinminima 2014-04-11

opencv 2.1網(wǎng)上查的另一種資料

訓練分類器成功,在此與大家分享。

參考英文資料網(wǎng)址: http://note./SciSoftware/haartraining.html#e134e74e

樣本訓練要求

1、杯子的背景要統(tǒng)一嗎,因為有些背景是白色,有些是淡淡的背景色,還有些深色的背景色

答:背景色要統(tǒng)一

2、整個圖的大小就是最外面一個框框起來那么大,

問題是:我需要在原圖基礎(chǔ)上截圖嗎,如:只把紅框框起來的那部分截出來???

答:不用的

3、那圖片是256色的還是彩色的呢?

答:灰度最佳

5、一般來說,訓練分類器用的什么 圖片 就用什么 圖片作測試
即來源圖片分別用于訓練和測試

6、那正樣本選擇方面有沒有要求,如玻璃杯
當然有要求。

最好各種形狀的玻璃杯有樣本,每種玻璃杯從不同角度拍攝的樣本都有
7、那網(wǎng)上截些有關(guān)玻璃杯的圖可以嗎?大小是要歸一化的
可以的。網(wǎng)上的圖像實際上也來源于生活或科研拍攝的

其實可以不是圖片的歸一化,還可以是特征的歸一化
歸一化的話可以根據(jù)緩需求,不同應(yīng)用場合就有不同的歸一化方法

8、那關(guān)于杯子這個正樣本,我要弄大約多少張圖片呀?
樣本要多,當然并不是越多越好,而是每一張都有代表性能反映一定意義

9、負樣本最好含有正樣本中的背景部分

訓練失敗的原因很多:

1、負樣本數(shù)目太少,導致Adaboost算法漢有跳出死循環(huán),

2、負樣本之間重復部分過多,或正樣本尺寸過大,導致訓練分類器時內(nèi)在溢出。

.vec文件里的東西是用二進制的形式表示的。
首先寫的是樣本的數(shù)量,然后是樣本大小width*height,后面就是圖片像素值。

在opencv下的cvsamples.cpp就能看的很清楚了。

本文現(xiàn)在正在做人頭檢測。視頻中的人頭尺寸,光照,角度都很不相同。
1. 請問haar訓練中正樣本是不是只能是在光照尺寸和角度都一致的情況下進行訓練?
正樣本的光照可以是有變化的,正樣本應(yīng)該保留一些樣本以外的背景,但不能過大,角度的話,人臉轉(zhuǎn)90度都還可以接受。
其實你正樣本的種類(不同角度.不同光照.不同人臉)越多,就需要更多的矩形特徵來作分類。

2.正負樣本需要一樣的大小么?
人臉建議使用20*20,大小要盡量統(tǒng)一,這樣在做Description txt file時,比較方便。人臉在圖片中的位置盡量也相同。

3.有人說正負樣本數(shù)量比例最好是7:3,也有人說正負樣本須一樣多。這是怎么回事?
我怎麼聽說 正:負=1:3比較好。建議你可以先試試看1000:3000應(yīng)該不用花太多時間訓練。

4.在訓練中,本人發(fā)現(xiàn)了一種情況:如果正負樣本差別較小,即負樣本從待檢測視頻圖像中的背景獲取,并且與正樣本一樣大的話,訓練就會在某一個節(jié)點上停下來,并且?guī)滋煲策^不了這個節(jié)點;而如果負樣本與正樣本差別很大(尺寸與取樣上都差別很大)的話,訓練結(jié)束比較快,但是用得到的xml文件去做檢測的話,效果很不好。請問這是不是矛盾,該怎么解決?
正負樣本照理說應(yīng)該不會差別不大,除非你是要偵測笑臉/非笑臉,另外可能是你負樣本太少,所以false alarm數(shù)值太高,所以haartraining 沒有正常terminate

5.參數(shù)stage一般設(shè)置多大?
我目前使用如下指令
opencv_haartraining.exe -data "d:\training0421\20s" -vec "d:\training0421\positive\positives.vec" -bg "d:\training0421\negative\negative.txt" -npos 1681 -nneg 3406 -nstages 20 -nsplits 2 -minhitrate 0.995 -maxfalsealarm 0.5 -mode ALL -mem 2000 -w 20 -h 20
使用profermance來測試原始訓練樣本(200*200p)可以有八成的hitrate,false大概幾十個。

整個過程分為兩步:

1. 創(chuàng)建樣本

2. 訓練分類器

3、 利用訓練好的分類器進行目標檢測。

現(xiàn)在讓我一一講述。

1. 創(chuàng)建樣本

◆ 樣本分兩種: 正樣本與負樣本(也有人翻譯成:正例樣本和反例樣本),其中正樣本是指待檢目標樣本(例如人臉,汽車,鼻子等),負樣本指其它任意圖片。

◆ 所有樣本圖片都應(yīng)該有同一尺寸,如20 * 20,并放在相應(yīng)文件目錄下,

◆ 集合文件格式(collection file format)和描述文件格式(description file format)

集合文件格式(collection file format)就是如下形的描述文件:

[filename]

[filename]

[filename]

描述文件格式(description file format)就是如下形的描述文件:

[filename] [# of objects] [[x y width height] [... 2nd object] ...]

[filename] [# of objects] [[x y width height] [... 2nd object] ...]

[filename] [# of objects] [[x y width height] [... 2nd object] ...]

….

(x, y) 指左上角的坐標,width和 height 分別是樣本的寬和高,這里我的圖片是20*20的,所以兩個值都是20

負樣本用集合文件格式描述,正樣本用描述文件格式描述?。ㄟ@點網(wǎng)上很多文章都搞錯了!)

▼創(chuàng)建樣本步驟:

一. 把所有正樣本圖片放在posdata的文件夾下,把所有負樣本圖片放在negdata文件夾下

(這里我以人臉圖片樣本為例)

(注:以上這些 20*20 的圖片均來自MIT人臉庫,可以在csdn下載)

二. 分別為正樣本和負樣本創(chuàng)建描述文件

A. 為正樣本創(chuàng)建描述文件格式文件info.txt,并且把這個文件放在與樣本圖片同一目錄下,例如我的目錄為C:/OpenCV2.1/bin/posdata

a) 在命令行下 輸入以下命令: dir /b > info.txt

b) 打開info.txt, 按ctrl+h, 把所有的bmp 換成 bmp 1 0 0 20 20

c) 刪除info.txt最后一行的 “info.txt”

d) 結(jié)果如下:(1代表一個文件,0 0 20 20表示這個文件的2個頂點位置坐標)

B. 為負樣本創(chuàng)建集合文件格式文件bg.txt, 并且把這個文件放在與樣本圖片同一目錄下,例如我的目錄為I:/negdata

a) 在命令行下 輸入以下命令: dir /b > bg.txt

b) 刪除bg.txt最后一行的 “bg.txt”

c) 結(jié)果如下:

三. 創(chuàng)建樣本。

Opencv 自帶有創(chuàng)建樣本的exe 文件,在 …/OpenCV2.1/bin 目錄下, 這里我創(chuàng)建120個sample:

命令是: opencv_createsamples.exe -info e:\test\posdata0\info.txt -vec e:\test\posdata0\pos.vec -num 120 -w 20 -h 20

如圖:

結(jié)果如圖:

(關(guān)于 opencv_createsamples.exe 的參數(shù)用法,在參考英文資料網(wǎng)址http://note./SciSoftware/haartraining.html#e134e74e,里有詳細介紹;

需要說明的是,我這里用的參數(shù)并沒有 –bg, 因為根據(jù)那份文檔,有了 –vec 和 –info 之后,就表示:Create training samples from some (從很多正樣本中創(chuàng)建sample, 沒有distortions)

經(jīng)歷千辛萬苦,我們終于看到sample被創(chuàng)建成功了,接下來的工作就簡單多了

▼訓練分類器

還是在…/OpenCV2.1/bin目錄下,輸入命令:

opencv_haartraining.exe -data e:\test\data0\cascade0 -vec e:\test\posdata0\pos.vec -bg e:\test\negdata0\negdata0.txt -npos 120 -nneg 120 -nsplits 2 -mem 512 -nonsym -w 20 -h 20 -minpos 100 -nstages 4

回車

(注意:

1. 參數(shù)-vec 一定要是剛剛創(chuàng)建樣本產(chǎn)生的a.vec,且把完整路徑也寫上去,我試過用相對路徑,但總會訓練失??; bg.txt 也要用絕對路徑;

.vec文件里的東西是用二進制的形式表示的。
首先寫的是樣本的數(shù)量,然后是樣本大小width*height,后面就是圖片像素值。

在opencv下的cvsamples.cpp就能看的很清楚了。

2. –w 和 –h 都要寫上與樣本大小的一致的尺寸

3. 若遇到“內(nèi)存什么不能read”的問題,很有可能是bg.txt的格式有誤,回去

4. 關(guān)于 opencv_haartraining.exe 的參數(shù)用法,在參考英文資料網(wǎng)址http://note./SciSoftware/haartraining.html#e134e74e,里有詳細介紹

結(jié)果如下:

(可能實際結(jié)果與上圖有出入, 但看到最后的 ,就說明訓練成功了。

在E:\test\data0目錄會生成一份cascade0.xml文檔,這個就是我們想要的結(jié)果了!

============================================================================

OpenCV訓練分類器制作xml文檔之一

我的問題:有了opencv自帶的那些xml人臉檢測文檔,我們就可以用cvLoad()這個函數(shù)加載他們,讓他們對我們的人臉進行檢測,但是,現(xiàn)在生活中的計算機視覺并不遠遠是檢測人臉,還有很多物品需要識別,所以,能不能自己做個xml的檢測文檔,用它來檢測自己需要的東西呢?例如,檢測一個可樂瓶!
問題解決:
首先了解下,目標檢測分為三個步驟:
1、 樣本的創(chuàng)建
2、 訓練分類器
3、 利用訓練好的分類器進行目標檢測。
一,樣本的創(chuàng)建:

(1)收集訓練樣本:

訓練樣本包括正樣本和負樣本。正樣本,通俗點說,就是圖片中只有你需要的目標。而負樣本的圖片只要其中不含有目標就可以了。但需要說明的是,負樣本也并非隨便選取的。例如,你需要檢測的目標是汽車,那么正樣本就應(yīng)該是僅僅含有汽車的圖片,而負樣本顯然不能是一些包含天空的,海洋的,風景的圖片。因為你最終訓練分類器的目的是檢測汽車,而汽車應(yīng)該出現(xiàn)在馬路上。也就是說,分類器最終檢測的圖片應(yīng)該是那些包含馬路,交通標志,建筑物,廣告牌,汽車,摩托車,三輪車,行人,自行車等在內(nèi)的圖片。很明顯,這里的負樣本應(yīng)該是包含摩托車、三輪車、自行車、行人、路面、灌木叢、花草、交通標志、廣告牌等。

另外,需要提醒的是,adaboost方法也是機器學習中的一個經(jīng)典算法,而機器學習算法的前提條件是,測試樣本和訓練樣本獨立同分布。所謂的獨立同分布,可以簡單理解為:訓練樣本要和最終的應(yīng)用場合非常接近或者一致。否則,基于機器學習的算法并不能保證算法的有效性。此外,足夠的訓練樣本(至少得幾千張正樣本、幾千張負樣本)也是保證訓練算法有效性的一個前提條件。

訓練樣本分為正例樣本和反例樣本,其中正例樣本是指待檢目標樣本(例如可樂瓶,人臉等),反例樣本指其它任意圖片,所有的樣本圖片都被歸一化為同樣的尺寸大小(例如,20x20)。
1 、負樣本(反例樣本)可以來自于任意的圖片,但這些圖片不能包含目標特征。
負樣本由背景描述文件來描述。背景描述文件是一個文本文件,每一行包含了一個負樣本圖片的文件名(基于描述文件的相對路徑)。該文件必須手工創(chuàng)建。
2,正樣本
現(xiàn)在,我們來看正樣本的創(chuàng)建步驟:

正樣本由程序createsample程序來創(chuàng)建。該程序的源代碼由OpenCV給出,并且在bin目錄下包含了這個可執(zhí)行的程序
正樣本可以由單個的目標圖片或者一系列的事先標記好的圖片來創(chuàng)建。
createsamples程序的命令行參數(shù):
命令行參數(shù):
vec <vec_file_name>
訓練好的正樣本的輸出文件名。
img<image_file_name>
源目標圖片(例如:一個公司圖標)
bg<background_file_name>
背景描述文件。
num<number_of_samples>
要產(chǎn)生的正樣本的數(shù)量,和正樣本圖片數(shù)目相同。 maxidev<max_intensity_deviation>
背景色最大的偏離度。
maxangel<max_x_rotation_angle>
maxangle<max_y_rotation_angle>,
maxzangle<max_x_rotation_angle>
最大旋轉(zhuǎn)角度,以弧度為單位。
show
如果指定,每個樣本會被顯示出來,按下"esc"會關(guān)閉這一開關(guān),即不顯示樣本圖片,而創(chuàng)建過程繼續(xù)。這是個有用的debug選項。
w<sample_width>
輸出樣本的寬度(以像素為單位)
h<sample_height>
輸出樣本的高度,以像素為單位。
注:正樣本也可以從一個預先標記好的圖像集合中獲取。這個集合由一個文本文件來描述,類似于背景描述文件。每一個文本行對應(yīng)一個圖片。每行的第一個元素是圖片文件名,第二個元素是對象實體的個數(shù)。后面緊跟著的是與之匹配的矩形框(x , y ,寬度,高度)。
下面是一個創(chuàng)建樣本的例子:
假定我們要進行人臉的檢測,有18個正樣本圖片文件face00001.bmp,…face00100.bmp;有45個背景圖片文件:B1_00001.bmp, …B1_00200.bmp,文件目錄結(jié)構(gòu)如下:
e:\test\negdata\
face0001.bmp

……
face0018.bmp

info.txt

e:\test\posdata

B1_001.bmp

……
B1_0045.bmp
negdata.dat
正樣本描述文件info.txt的內(nèi)容如下:
face00001.bmp 1 0 0 20 20
……
face00100.bmp 1 0 0 20 20

背景(負樣本)描述文件negdata.txt的內(nèi)容如下:
B1_00001.bmp ……
B1_00200.bmp

圖片imag1.bmp包含了單個目標對象實體,矩形為(0,0,20,20)。
注意:要從圖片集中創(chuàng)建正樣本,要用-info參數(shù)而不是用-img參數(shù)。

info <collect_file_name>
標記特征的圖片集合的描述文件。cmd窗口下來進行樣本的創(chuàng)建:

C:\Program Files\OpenCV\bin>createsamples -info e:\test\posdata\info.txt -vec e:\test\posdata\pos.vec -num 18 -w 20 -h 20【解釋下】。。。。

小貼士1:

可以采用Dos命令生成樣本描述文件(一般樣本圖片上萬幅),Dos下進入圖片目錄,輸入dir /b *.bmp > negdata.txt, 則會在此目錄中產(chǎn)生一個negdata.txt,文件中包含所有當前目錄下的文件名,就可以建成負樣本描述文件。對于正樣本描述文件,方法同負樣本,只要把bmp替換成1 0 0 20 20即可。如果樣本圖片太多,在txt中替換會導致程序無法響應(yīng),可以先把內(nèi)容拷貝到word中替換后再拷貝回來。

小貼士2:

一些處理后的人臉圖片的網(wǎng)址
http://vasc.ri./idb/html/face/frontal_images/

http://www./challenges/VOC/databases.html#VOC2005_1

三、訓練分類器
樣本創(chuàng)建之后,接下來要訓練分類器,這個過程是由haartraining程序來實現(xiàn)的。該程序源碼由OpenCV自帶,且可執(zhí)行程序在OpenCV安裝目錄的bin目錄下。
Haartraining的命令行參數(shù)如下:
data<dir_name>
存放訓練好的分類器的路徑名。
vec<vec_file_name>
正樣本文件名(由trainingssamples程序或者由其他的方法創(chuàng)建的)
bg<background_file_name>
背景描述文件。
npos<number_of_positive_samples>
nneg<number_of_negative_samples>
用來訓練每一個分類器階段的正/負樣本。合理的值是:nPos = 7000;nNeg = 3000
nstages<number_of_stages>
訓練的階段數(shù)。
nsplits<number_of_splits>
決定用于階段分類器的弱分類器。如果1,則一個簡單的stump classifier被使用。如果是2或者更多,則帶有number_of_splits個內(nèi)部節(jié)點的CART分類器被使用。
mem<memory_in_MB>
預先計算的以MB為單位的可用內(nèi)存。內(nèi)存越大則訓練的速度越快。
symdefault
nonsym
指定訓練的目標對象是否垂直對稱。垂直對稱提高目標的訓練速度。例如,正面部是垂直對稱的。
minhitrate<min_hit_rate>
每個階段分類器需要的最小的命中率??偟拿新蕿?/span>min_hit_ratenumber_of_stages次方。
maxfalsealarm<max_false_alarm_rate>
沒有階段分類器的最大錯誤報警率??偟腻e誤警告率為max_false_alarm_ratenumber_of_stages次方。
weighttrimming<weight_trimming>
指定是否使用權(quán)修正和使用多大的權(quán)修正。一個基本的選擇是0.9
eqw
mode<basic(default)|core|all>
選擇用來訓練的haar特征集的種類。basic僅僅使用垂直特征。all使用垂直和45度角旋轉(zhuǎn)特征。
w<sample_width>
h<sample_height>
訓練樣本的尺寸,(以像素為單位)。必須和訓練樣本創(chuàng)建的尺寸相同。
一個訓練分類器的例子:

C:\Program Files\OpenCV\bin>haartraining -data e:\test\data\cascade -vec e:\test\posdata\pos.vec -bg e:\test\negdata\negdata.txt -npos 18 -nneg 45 -nsplits 1 -mem 512 -mode ALL -w 20 -h 20 -minhitrage 0.998 -maxfalsealarm 0.5 -nstages

訓練開始,如下圖,可能會一小段時間才訓練完成。

(可能實際結(jié)果與上圖有出入, 但看到最后的 ,就說明訓練成功了。

在bin目錄會生成一份可愛的data.xml文檔,這個就是我們想要的結(jié)果了!

訓練結(jié)束后,會在目錄data下生成一些子目錄,即為訓練好的分類器。

訓練結(jié)束后,還要使用haarconv.exe生成xml文件,可以通過下列網(wǎng)頁下載。

http://www./forum/viewtopic.php?t=5181

重要!可能遇到的問題:

1.如果跑到某一個分類器時,幾個小時也沒有反應(yīng),而且顯示不出訓練百分比,這是因為你的負樣本數(shù)量太少,或者負樣本的尺寸太小,所有的負樣本在這個分類器都被reject了,程序進入不了下一個循環(huán),果斷放棄吧。解決方法:負樣本盡量要大一些,比如我的正樣本是40*15,共300個,負樣本是640*480,共500個。(我當時的錯誤就出現(xiàn)在這,把負本改大后,就成功了)

2.讀取樣本時報錯:Negative or too large argument of CvAlloc function,網(wǎng)上說這個錯誤是因為opencv規(guī)定單幅iplimage的內(nèi)存分配不能超過10000,可是我的每個負樣本都不會超過這個大小,具體原因不明。后來我把負樣本的數(shù)量減少,尺寸加大,這個問題就解決了。

3.訓練的過程可能經(jīng)常出錯,耐心下來不要著急,我在訓練MRI分類器的時候失敗了無數(shù)次。失敗的時候有兩件事可以做,第一,調(diào)整正負樣本的數(shù)量,再試。第二,調(diào)整負樣本的大小,祝大家好運。

=============================================================================================

opencv haar訓練--訓練樣本(4)

1.海爾訓練
現(xiàn)在,我們使用haartraining.exe來訓練我們自己的分類器。訓練語句如下:

  1. Usage: ./haartraining
  2. -data <dir_name>
  3. -vec <vec_file_name>
  4. -bg <background_file_name>
  5. [-npos <number_of_positive_samples = 2000>]
  6. [-nneg <number_of_negative_samples = 2000>]
  7. [-nstages <number_of_stages = 14>]
  8. [-nsplits <number_of_splits = 1>]
  9. [-mem <memory_in_MB = 200>]
  10. [-sym (default)] [-nonsym]
  11. [-minhitrate <min_hit_rate = 0.995000>]
  12. [-maxfalsealarm <max_false_alarm_rate = 0.500000>]
  13. [-weighttrimming <weight_trimming = 0.950000>]
  14. [-eqw]
  15. [-mode <BASIC (default) | CORE | ALL>]
  16. [-w <sample_width = 24>]
  17. [-h <sample_height = 24>]
  18. [-bt <DAB | RAB | LB | GAB (default)>]
  19. [-err <misclass (default) | gini | entropy>]
  20. [-maxtreesplits <max_number_of_splits_in_tree_cascade = 0>]
  21. [-minpos <min_number_of_positive_samples_per_cluster = 500>]


Kuranov et. al. 指出,20*20的樣本識別的正確率最高。另外,對于18*18的尺寸,四分裂節(jié)點表現(xiàn)最好。而對于20*20的樣本,兩節(jié)點顯然更好。分裂節(jié)點數(shù)分別是2、3或4的弱樹分類器間的差小于它們的中間節(jié)點。
此外,關(guān)于20階訓練有個說法。假設(shè)我的測試集合代表了學習任務(wù),我可以期望一個報錯率是0.5^20≈9.6e-07,識對率是0.999^20≈0.98。
所以,使用20*20的樣本大小,并且Nsplit=2, Nstages=20, MINhitrate=0.9999(default: 0.995), MAXfalsealarm=0.5(default: 0.5), weighttrimming=0.95(default: 0.95)是比較優(yōu)的組合。

  1. $ haartraining -data haarcascade -vec samples.vec -bg negatives.dat -nstages 20 -nsplits 2 -minhitrate 0.999 -maxfalsealarm 0.5 -npos 7000 -nneg 3019 -w 20 -h 20 -nonsym -mem 512 -mode ALL


"-nonsym"選項用于沒有垂直(左-右)對稱的對象類。如果對象類是垂直對稱的,例如正臉,則用"-sym (default)"。這樣會增大運算速度,因為類海爾特征只有一半投入使用。
"-mode ALL"使用了類海爾特征的擴展集。默認只使用豎直特征,ALL除了能使用豎直特征,還能使用轉(zhuǎn)角為45°的特征集合。
"-mem 512"是以MB為單位的預計算可使用的內(nèi)存大小。默認是200MB。
另外還有一些選項沒有用到:

  1. [-bt <DAB | RAB | LB | GAB (default)>]
  2. [-err <misclass (default) | gini | entropy>]
  3. [-maxtreesplits <max_number_of_splits_in_tree_cascade = 0>]
  4. [-minpos <min_number_of_positive_samples_per_cluster = 500>]


#你可以使用OpenMP(multi-processing).
#一次訓練持續(xù)三天。

2.生成XML文件
當海爾訓練過程完全結(jié)束,它將會生成一個xml文件。
如果你想要將一個中級海爾訓練輸出目錄樹轉(zhuǎn)化為一個xml文件,在目錄OpenCV/samples/c/convert_cascade.c下有個程序可供使用。
輸入的格式為:

  1. $ convert_cascade --size="<sample_width>x<sampe_height>" <haartraining_ouput_dir> <ouput_file>


舉例:

  1. $ convert_cascade --size="20x20" haarcascade haarcascade.xml

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多