opencv hog 예제

0 0

그라데이션 벡터를 정규화하면 픽셀 값의 곱셈에 고정되도록 할 수도 있습니다. 아래 예제를 살펴보십시오. 첫 번째 이미지는 원본 이미지에서 빨간색으로 강조 표시된 픽셀을 표시합니다. 두 번째 이미지에서는 모든 픽셀 값이 50씩 증가했습니다. 세 번째 이미지에서 원본 이미지의 모든 픽셀 값에 1.5를 곱했습니다. 안녕하세요 애드리안, 우선, 모든 사람과 전문 지식과 지식을 공유 주셔서 감사합니다. 내 자신의 경험에 따르면, 컴퓨터 비전과 opencv에 대해 배우는 것은 몇 가지 주제에 대한 유용한 정보를 찾을 수 없을 때 매우 도전적이고 매우 실망 스러울 수 있습니다. 다시 한번 : 감사합니다! 그 동안이 예제는 여전히 자동차의 로고를 인식하기 위해 지향 그라데이션 설명기와 k-NN 분류기의 히스토그램을 사용하는 방법을 보여 줄 수 있었다. 여기서 중요한 점은 이미지 데이터 집합의 ROI를 일관되게 감지하고 추출할 수 있는 경우 HOG 설명자가 적용할 이미지 설명자 목록에 반드시 있어야 한다는 것입니다.

기계 학습과 함께. 이전 섹션에서 동일한 예제 이미지를 다시 사용해 보겠습니다. 전체 이미지에 대해 계산한 것을 기억하십시오. 그림 3. 예제 이미지에 소벨 연산자 커널을 적용합니다. 이 훌륭한 블로그주셔서 감사합니다. 전경 여자와 배경 아이를 보여주는 예에서, 녹색 경계 상자는 여자의 이마를 통해 잘라, 그래서 나는 HOG 검출기가 그녀의 다리와 몸통을 발견 가정하지만, 그녀의 머리를 놓친 (?) 다른 경우에는 상자가 잘 중앙에 있고 인간의 그림을 보여주는 모든 픽셀을 완전히 포함하지만 상당한 추가 배경도 포함합니다. 이 알고리즘은 본질적으로 정확한 윤곽선에 대해 „퍼지“인가, 아니면 사람의 실제 경계와 더 밀접하게 일치하도록 조정할 수 있습니까? 다시 한번 감사드립니다! 2. http://docs.opencv.org/2.4/modules/objdetect/doc/cascade_classification.html#void%20groupRectangles%28vector%3CRect%3E&%20rectList,%20int%20groupThreshold,%20double%20eps%29 우리의 예를 살펴이 더 명확하게하자 이미지 로 나누어 16 x 16 픽셀 셀: 완전성의 문제로, 여기에 입력 된 이미지의 x 와 y 그라데이션을 모두 계산의 예입니다: HOG 사람 감지기로 신속 하 게 실행 해야 하는 몇 가지 예제 코드에 대 한이 게시물을 체크 아웃 웹캠을 비디오 소스로 사용할 수 있습니다. HOG 설명자는 다른 크기에 대해 계산할 수 있지만 이 게시물에서는 원본 용지에 제시된 숫자를 고수하여 하나의 구체적인 예제로 개념을 쉽게 이해할 수 있습니다.

그림 1: 이미지의 특정 영역에 대한 지향 그라데이션의 히스토그램을 계산하는 예입니다. 이러한 각 브랜드에 대해 Google에서 5개의 교육 이미지를 수집했습니다. 이러한 이미지는 각 자동차 로고가 어떻게 생겼는지 기계 학습 알고리즘을 가르치는 데 사용할 예제 이미지입니다. 아래에서 볼 수 있는 교육 데이터 집합: 가장자리 감지, 흐림, 선명화 등 다양한 목표에 대해 서로 다른 커널이 만들어집니다. 더 많은 예제와 참조는 이 위키 페이지를 확인하십시오. HOG 사람 검출기는 이해하기 매우 간단합니다 (예를 들어 SIFT 개체 인식과 비교). 주된 이유 중 하나는 „로컬“ 기능 모음이 아닌 „전역“ 기능을 사용하여 사람을 설명하기 위해 사용되기 때문에 입니다. 간단히 말해서, 이것은 전체 사람이 사람의 작은 부분을 나타내는 많은 기능 벡터와 는 달리 단일 기능 벡터로 표현된다는 것을 의미합니다. 이 훌륭한 게시물에 감사드립니다.

당신의 접근 방식과 함께 나는 그것이 거짓 긍정을 많이 가지고 있음을 관찰했다. 거짓 긍정의 한 예는 내가 남자와 개 (전면보기)와 함께 사진에 그것을 테스트하고 그 두 사람을 사람으로 감지한 것입니다. 당신은 내가 문제의이 종류를 해결하는 데 도움이 하시기 바랍니다 수 있습니까? 위의 코드에서는 [200, 200]에 있는 왼쪽 상단 모서리가 있는 블록을 예로 들며 이 블록의 최종 정규화된 히스토그램입니다.