Image + text multimodal을 빠르게 돌려보자!⇒ CV vs Multimodal
- 해결해야 할 부분들
- 비교 기준(benchmark metric)을 어떻게 설정?
- 참값을 기준으로 유사도를 판단한다면, 그 참값은 어떻게 설정?? (교수님께 조언 받기)
- 데이터셋 구축
- 이미지에 대한 설명 text를 어떻게 얻어올 거??
- 지헌: 화장품으로 시작해보자
- 소스코드가 없음
- 교수님께 조언 받기
- Dominant color detection 모델로 naive 진행
- 못 찾은 걸수도 있지만, 현재까지 검색 결과로는 true color detection CV model은 없었음
+) color와 관련된 LLM도 가능하면 찾아보기