Notice / Previous Week
[전체]
[From Team 철]
[From Team 헌]
Memos
Refs
Image Segmentation 정리 (computer vision)
[Image Segmentation] [목적] computer vision 및 digital image processing의 sub-domain이며 이미지의 유사한 영역 또는 부분(segment)를 해당 클래스 레이블로 그룹화 하는 것을 목표로 함 object가 있는 위치, 해당 object의 모양, 어떤 pixel이 어떤 object에 속하는지 등을 알려고 할 때 [개요] 전체 프로세스가 디지털이기 때문에, 아날로그 이미지를 pixel 형태로 표현할 수 있으므로, 부분(segment)를 구성하는 작업이 픽셀을 그룹화하는 작업과 동일 [Recognition + Localization] Image segmentation은 Image recognition의 확장으로 recognition 외에도 localiz..
Paper
Superpixel-Based Fast Fuzzy C-Means Clustering for Color Image Segmentation: 코드가 존재(Matlab…). 더 좋은 논문이 없다면 Core Paper로 가져가면 좋을 것 같음.
U-Net: 데이터가 적어도 높은 성능을 보이기 때문에 UGRP에서 유용할 것으로 생각됨. **Pix2Pix를 활용하는 방안.
CoRe: Color Regression for Multicolor Fashion Garments: 소스 코드는 없지만, 방법론이 자세히 설명되어 있기 때문에 논문을 공부하는 과정에서 충분히 구현 가능할 것으로 생각됨.
A survey of superpixel methods and their applications: If 지수는 낮지만, Q1이기 때문에 참고할 수 있을 것으로 생각됨.
기타 아이디어
- 굳이 Color segmentation을 해야하는지에 대한 의문이 존재. 단순히 tag를 달아주는 것은 어떨지. Yolo를 이용하면 실시간으로 객체 탐지를 할 수 있음.
- Yolo를 이용해 main object 탐지
⇒ main object에 대해 ROI 구분
⇒ ROI의 RGB 값을 하나로 뭉개기
⇒ 각 ROI에 대한 color naming 붙이기 (일단은 Berlin and Key’s 11 color terms) * 기본은 11가지 색상으로, 필요 시 확장.
방법 1: U-Net + Pix2Pix
방법 2: Superpixel
방법 3: Yolo, Colornaming (+ Contrastive learning)
task 1) 강지헌/김지현
task 2) 김상우/박영진
matlab 코드 python으로 변환
task 3) 강민철/전상우/김지현
YOLO-based model 구축
화요일 주 미팅 이외에 중간 보고(토요일, 시간은 오후 8시, 회의 시간은 2시간 이내) 일정 추가. 각자 맡은 업무에 따라 팀원끼리 의논해서 진행할 것.
이후 진행될 발표(커피타임)은 일정 학정 후 자율적으로 참석.
컨퍼런스
- 강연 내용 정리
느낀 점, 좋았던 점
- 강민철
- 학회/컨퍼런스 참석 전에는 체력 비축을 잘해두는 것도 잘 배우기 위한 준비 자세
- 세션별
- 세션1 - 코드에 이론이 제대로 적용됐는지 검증을 하는 과정도 필요함(막무가내로 짜지 말자) | 에러코드 작업을 성실히 해두는 게 장기적으로 도움이 됨
- 세션2 - 프로젝트를 진행하기 전, 혹은 진행 과정 중에 같은 아이디어를 이미 구현해둔 게 없는지 찾아보는 과정도 중요함 (효율적인 시간 분배)
- 세션3 - 오픈소스 프로젝트 기여에 겁먹지 말자 | ECMAScript documentation 구조가 매우 깔끔해서 참고할만 함
- 김상우
- 연구 분야가 아닌 실제 서비스를 제공하는 기업의 시각에서 컴퓨터 과학을 볼 수 있었던 점과 개벌자들의 경험을 들을 수 있었던 점이 좋았다.
- LLM을 활용해 간단한 프로젝트를 만드는 시현을 볼 수 있어 좋았다. → 추후 UGRP에서 LLM을 다룰 때 참고하면 좋을 것 같다.
- 코드 구현에 있어 전체적인 설계도의 유무가 추후 수정 및 관리에서 큰 영향을 준다는 점을 다시금 느낄 수 있었다.
- 김지현
- ‘소주 만들기 : 언어 모델 증류와 합성 데이터 리파인’이라는 주제로 들은 강연에서 고품질 데이터의 중요성을 다시 한번 깨달았다. 쓰레기 데이터로는 제대로 된 성능을 기대할 수 없음을 실감했으며 UGRP 연구에서도 쓰레기 데이터가 많이 포함된 input 데이터로부터 고품질의 데이터로 가공하여 걸러내는 작업이 모델의 정확도 향상을 위해 중요한 과정이 되리라 생각하였다.
- 박영진
- 오픈소스 gemma를 사용해서 한국어 데이터셋을 refine하는 과정이 흥미로웠음. 강연 날짜 기준 3일전 발표되었던 llama 3.1을 비슷한 방식으로 fine tuning해보는 프로젝트도 재미있을 것 같음
- 현업에서 코드관리의 효율성을 위해 refactoring의 중요성을 다시금 깨달았음
- semantic kernel을 사용하여 spotify playlist를 생성할 때의 workflow가 참신했음. 실전적으로 여러 api 활용 과정을 상세히 알려주어 좋았음
- 광명역은 멂
- 전상우
- llm을 연계하여 추출해낸 색상을 바탕으로 이미지에 대한 설명을 필요로 하는 연구 → llm을 연계하는 과정에서 해당 api를 위한 client를 두어 모듈화를 하는 것도 좋을 것 같다
- 직접적인 연관은 없지만 웹이나 앱 개발 시 프론트엔드와 백엔드 구분의 중요성을 느낌 → 상호 연관성이 떨어지는 프로그램이나 코드 간의 뒤섞임 방지를 위한 모듈화의 중요성을 깨달음
- 평소 아무 생각 없이 이용하는 오픈 소스에 대해 기여자의 경험담을 들을 수 있어서 좋았음 → 오픈 소스가 중요한 개발자로서 해당 분야에 기여가 필요하다고 느낌
- 다양한 주제를 바탕으로 한 개발 실무에 대한 경험담 등을 들을 수 있어 귀중한 경험이었다고 생각함
아쉬운 점
- 강민철
- 기업 부스의 부재
- 촉박한 일정
- 질문 시간이 사라짐
- 발표 간 여유시간의 부재
- “최대 규모”라는 타이틀에 비해 다소 열악한 환경
- 불안정한 네트워크 상태
- 냉방 이슈
- 김상우
- 생각보다 깊이 있거나 새로운 지식(정보)을 다루지 않은 점이 아쉬웠다.
- 김지현
- 사전에 강연 내용에 대한 대략적인 소개 PPT나 설명이 있었다면 강연을 선택하는데 있어 더 도움이 될 수 있었을 거 같다.
- 체험형 부스와 같이 몸소 체험하며 즐길거리가 있었다면 좋았을 거 같다.
- 박영진
- 대부분의 세션에서 스케쥴링이 안되어 qna 과정이 생략되었음
- 냉방이 열악했음
- ai관련 내용은 아무래도 llm 중심이었어서 다양하지 않았음
- 전상우
- 회의장 내 인터넷 연결이 불안정하여 opening 및 연사자의 발표 때 버퍼링이 있었음
- 연사자들에게 주어진 시간이 너무 짧아 질문을 위한 시간이 확보되지 않음
- 세션 후 연사자 및 청중들의 생각을 나누어볼 수 있는 discussion time이 없어 아쉬웠음
