About RVOS (introducing of RVOS)
referring된 object를 segmentation
DETR: feature extraction → query
ReferFormer: text를 이용해서 query를 만듦
MeViS (dataset)
동적인 설명 부족한 데이터 셋들 → 이 문제를 해결한 데이터 셋
LMPM model: object token을 이용해서 매칭 → 이 부분 나중에 한 번 알아보기
DSHMP
parser를 통해서 static한 부분과 motion 부분을 나눈다. → motion을 인식하는 것에 대한 시도
RVOS에서의 핵심 task는 motion인 것 같다!
Experiment
motion은 time에 dependency할 것이다.
Metric
IOU → 겹치는 박스
F → boundary 부분 score
video에서 움직임은 frame 간에 픽셀 차이를 통해서 인식한다.
