[PyTorch] learning rate scheduler 직접 짜기

코딩/pytorch

[PyTorch] learning rate scheduler 직접 짜기

curious_cat 2023. 2. 4. 23:36

728x90

PyTorch에 많은 learning rate scheduler이 있지만 직접 짜고 싶을 때도 있다.

방법은 어렵지 않다.

torch.optim.lr_scheduler에 있는 _LRScheduler를 기반으로 class를 하나 만들면 된다. 미니멀하게는 __init__이랑 get_lr만 잘 정의해주면 된다.

linear하게 learning rate를 warmup해주는 scheduler을 예로 들어보자:

from torch.optim.lr_scheduler import _LRScheduler

class LinearWarmup(_LRScheduler):
    def __init__(self,optimizer,base_lr,warmup_steps,last_epoch=-1):
        self.base_lr = base_lr # warmup후 갖게되는 learning rate
        self.warmup_lr_init = 0.0001 # 처음에 갖게되는 learning rate
        self.warmup_steps = warmup_steps # warmup 할 총 step 수 (epoch x)
    	# optimizer을 사용해서 _LRScheduler을 initialize해주자
        # 보통 last_epoch는 -1로 두면 된다.
    	super().__init__(optimizer, last_epoch, False) 

    def get_warmup_lr(self):
    	""" learning rate 계산해주는 method"""
        # alpha: learning rate를 계산할 때 사용 할 multiplicative factor
        # alpha = (현제 step 수) / (warmup할 사용하는 총 step 수)
        # 밑에 식에서 self.last_epoch를 사용하지만 현제 step이라고 생각하면 된다 (나중에 추가 설명)
        alpha = float(self.last_epoch) / float(self.warmup_steps)
        _lr = self.base_lr * alpha
        return [_lr for _ in self.optimizer.param_groups] # optimizer에 있는 param group만큼 lr을 리턴

    def get_lr(self):
        if self.last_epoch == -1: # 처음 initialize됐을 때 self.warmup_lr_init 사용
            return [self.warmup_lr_init for _ in self.optimizer.param_groups]
        if self.last_epoch < self.warmup_steps: # 총 warmup할 step까지 get_warmup_lr 사용해서 lr 계산
            return self.get_warmup_lr()
        else:
            return [self.base_lr for _ in self.optimizer.param_groups] # 이후 base_lr 사용

사용 방법: optimizer이랑 scheduler을 정의했으면 같이 optimizer의 step()을 콜 하고 scheduler의 step()을 콜 하면 된다.

optimizer.step()
scheduler.step()

참고로 learning rate scheduler의 scheduler.step()을 콜 하면 last_epoch가 1씩 증가한다. 그래서 위에서 self.last_epoch를 기반으로 learning rate scheduler을 작성했다.

728x90

'코딩 > pytorch' 카테고리의 다른 글

PyTorch 와 PyTorch Lightning을 위한 간단 도커파일 (Dockerfile) 작성 & 사용 (0)	2023.08.03
[PyTorch] 간단한 pytorch lightning 설명과 템플릿 코드 (0)	2023.07.30
[numpy][pytorch] np.memorymap로 빠른 dataloading (0)	2023.01.29
ddp 학습 중단 오류--한번에 프로세스 죽이기 (0)	2023.01.23

현재글[PyTorch] learning rate scheduler 직접 짜기

좋아하는 것에 대해서 이것저것 올리는 장소.

250x250

로스팅, 생두, 커피, 간단, 리트코드, Semi-Supervised Learning, object detection, pytorch, 핸드드립, 카페, 논문 리뷰, 맛집, python, 알고리즘, 고수, 강릉, 정리, self-supervised learning, 홈 로스팅, 맥주,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

curiosity killed the cat