Vision_/배경지식

Patch란?

대장장ㅇi 2024. 7. 29. 16:11

VIT_논문

 

위에서 보듯이 이미지가 있으면 오른쪽과 같이 이미지를 나눠 픽셀 단위가 아닌 작은 정사각형 block 으로 나눠져 각 block 을 하나의 입력단위로 사용하는것을 patch 라고 한다. 

 

예를들어 224x224 크기의 이미지를 16x16 크기의 patch 로 나눈다면(224/16= 14, 따라서 14x14=196) 이미지는 총 196개의 patch 로 분할된다.

'Vision_ > 배경지식' 카테고리의 다른 글

Loss Function 란?  (0) 2024.09.04