Portfolio

💡

TODO - 서로 Code Reivew > 문제점 찾아내기, 해석 1~2명 정도 - 각자 하고 싶은 거 하나, 추천해주는거 2개 정도(adapter, lora 빼고 파인튜닝방법) - fine tuning말고도 적은 데이터로 높은 정확도 낼 수 있는 방법 찾아보기

1. Code Review

JIWON’s

Full Code (ViTLoRA)


import math
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms
import torchvision.datasets as datasets
from torch.utils.data import Subset, DataLoader
from torch.utils.data.dataset import Dataset
from PIL import Image
import timm

# ViT 모델 로드
def load_vit_model():
    model = timm.create_model('vit_base_patch16_224', pretrained=True)
    preprocess = transforms.Compose([
        transforms.Resize((224, 224)),
        transforms.ToTensor(),
        transforms.Normalize(mean=(0.5, 0.5, 0.5), std=(0.5, 0.5, 0.5)),
    ])
    return model, preprocess

class FilteredCIFAR10(Dataset):
    def __init__(self, root, train=True, transform=None, download=False):
        self.cifar10 = datasets.CIFAR10(root=root, train=train, transform=transform, download=download)
        self.data = []
        self.targets = []
        for img, target in zip(self.cifar10.data, self.cifar10.targets):
            if target < 8:  # Only keep classes 0-7
                self.data.append(img)
                self.targets.append(target)

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        img, target = self.data[idx], self.targets[idx]
        img = Image.fromarray(img)
        if self.cifar10.transform:
            img = self.cifar10.transform(img)
        return img, target

class ViTLoRA(nn.Module):
    def __init__(self, base_model, num_classes, lora_rank):
        super(ViTLoRA, self).__init__()
        self.base_model = base_model
        self.fc = nn.Linear(self.base_model.head.in_features, num_classes)  # 새로운 Fully Connected Layer 추가

        # LoRA 레이어 추가
        self.lora_a = nn.Parameter(torch.randn(self.base_model.head.in_features, lora_rank))
        self.lora_b = nn.Parameter(torch.randn(lora_rank, num_classes))

        self.reset_parameters()

    def reset_parameters(self):
        nn.init.kaiming_uniform_(self.lora_a, a=math.sqrt(5))
        nn.init.zeros_(self.lora_b)

    def forward(self, x):
        x = self.base_model.forward_features(x)
        x = x[:, 0]  # 첫 번째 클래스 토큰만 사용
        lora_out = torch.matmul(x, self.lora_a)
        lora_out = torch.matmul(lora_out, self.lora_b)
        x = self.fc(x)
        return x + lora_out

# GPU 사용 설정
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# ViT 모델과 전처리 함수 로드
base_model, preprocess = load_vit_model()
model = ViTLoRA(base_model, num_classes=8, lora_rank=6).to(device)  # num_classes와 lora_rank 변경

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)  # 학습률 스케줄러 추가

# 전처리 함수로 데이터 로딩
train_dataset = FilteredCIFAR10(root='./data', train=True, download=True, transform=preprocess)
test_dataset = FilteredCIFAR10(root='./data', train=False, download=True, transform=preprocess)

# 훈련 및 테스트 데이터셋에서 100개의 샘플 선택
train_subset = Subset(train_dataset, range(100))
test_subset = Subset(test_dataset, range(100))

# 데이터 로더
train_loader = DataLoader(train_subset, batch_size=64, shuffle=True, num_workers=2)
test_loader = DataLoader(test_subset, batch_size=64, shuffle=False, num_workers=2)

# 훈련 루프 (간단히)
num_epochs = 20

for epoch in range(num_epochs):
    model.train()
    for images, labels in train_loader:
        images, labels = images.to(device), labels.to(device)
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

    scheduler.step()  # 학습률 스케줄러 스텝

    print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

    # 에포크마다 정확도 계산
    model.eval()
    with torch.no_grad():
        correct = 0
        total = 0
        for images, labels in test_loader:
            images, labels = images.to(device), labels.to(device)
            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()

        accuracy = 100 * correct / total
        print(f'Accuracy after epoch {epoch+1}: {accuracy:.2f} %')

print('Finished Training')

# 최종 정확도
model.eval()
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        images, labels = images.to(device), labels.to(device)
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print(f'Final Test Accuracy: {100 * correct / total:.2f} %')

ViTLoRA

ViT 모델 load

- timm 라이브러리 -- pretrain된 모델(테라 사이즈 정도 됨)을 가지고 있는 라이브러리 - 여기서 ViT모델을 가져옴. - 그 뒤 계산 형식에 맞게 전처리(resize, tensor화, normalize)하는 듯

FilteredCIFAR10 class - CIFAR-10 dataset 중 0~7까지 클래스만 포함하는 데이터를 사용할 수 있도록 함. *CIFAR-10 dataset? 총 10개의 class(비행기, 자동차, 새, 고양이, 사슴, 개, 개구리, 말, 배, 트럭) - 50,000장: train, 10,000장: test

ViTLoRA class - 로드한 ViT 모델에 LoRA layer를 추가 - 여기서 super 함수는 뭘까요? A. 부모 클래스에 접근할 때 쓰는 함수

모델학습 - base_model, preprocess는 1번에서 한걸 이용 - model은 3번에서 만든 LoRA 추가한 모델로 설정 - cross entropy 손실함수 이용 - 최적화는 SGD 방식 - 스케줄러는 뭘까요? OS 시간에 배울걸요

그렇다면 여기서 사용하는 CIFAR-10 dataset 중 실제 data는 얼마인가?

*사용해보기 pip list

- timm

이어서…

2. Recommend methods

Knowledge Distillation

큰 모델에서 학습한 지식의 일부를 작은 모델에 전달하며 작은 모델의 학습성장을 돕는다!

Prefix Tuning

사전 훈련된 모델의 입력에 추가적인 prefix token 첨부. prefix token의 가중치만 학습되고, 나머지는 고정된 상태 >특정 task에 최적화되게 만듦

BitFit (Bit Flipping)

가중치 matrix 중 특정 비트를 flip 시켜 fine tuning

모델 전체구조를 변경하지 않으면서도 계산, 메모리 비용 줄일 수 있다는 장점

3. Other methods

MAML(Model-Agnostic Meta-Learning)

적은 양의 데이터로 새로운 작업에 빠르게 적응할 수 있도록 만드는 알고리즘이라고 함

GPT 曰 “소수의 이미지만으로 새로운 클래스를 분류해야 하는 few-shot 학습 문제에서 MAML이 자주 사용”

[2024 August 03] LoRA review

1. Code Review

JIWON’s

2. Recommend methods

3. Other methods