Portfolio

referring된 object를 segmentation

DETR: feature extraction → query

ReferFormer: text를 이용해서 query를 만듦

동적인 설명 부족한 데이터 셋들 → 이 문제를 해결한 데이터 셋

LMPM model: object token을 이용해서 매칭 → 이 부분 나중에 한 번 알아보기

parser를 통해서 static한 부분과 motion 부분을 나눈다. → motion을 인식하는 것에 대한 시도

RVOS에서의 핵심 task는 motion인 것 같다!

motion은 time에 dependency할 것이다.

IOU → 겹치는 박스

F → boundary 부분 score

video에서 움직임은 frame 간에 픽셀 차이를 통해서 인식한다.

RVOS