[DeepLearning] 딥러닝의 기초와 메모리 최적화 기법 복습

DeepLearning

dong_seok 2025. 4. 16. 22:12

728x90

오늘은 복습겸 딥러닝의 기초과 되는 핵심 원리와 기법에 대해 간단하게 얘기하고자 합니다.

1) 순전파

입력 데이터가 모델의 각 층을 거쳐 예측값을 생성합니다. 이 과정에 각 층의 계산 결과와 상태값이 메모리에 저장됩니다.

2) 손실 계산

모델의 예측값과 실제 정답 간의 차이 즉, 손실을 계산합니다. 이 손실은 모델의 정확도를 측정하는 지표가 됩니다.

3) 역전파

계산된 손실을 기준으로 각 층을 거슬러 올라가며 가중치가 손실에 미치는 영향 즉, 그래디언트를 계산합니다. 이때 순전파에서 저장해둔 상태값들이 활용됩니다.

4) 가중치 업데이트

계산된 그래디언트를 바탕으로 옵티마이저가 모델의 가중치를 조정합니다. 이 과정을 통해 모델은 점점 더 정확한 예측을 할 수 있게 됩니다.

1) 레이어(Layer)

레이어 또는 층은 인공 신경망의 기본 구조 단위입니다.

2) 활성화 함수(Activation Function)

3) 손실 함수(Loss Function)

4) 옵티마이저(Optimizer)

5) 그래디언트

그래디언트는 손실 함수의 기울기를 의미합니다.

6) 정규화 기법(Regularization)

딥러닝 모델이 커질수록 메모리 요구량도 증가합니다. 제한된 리소스에서 효율적인 훈련을 위한 주요 기법 몇가지를 정리합니다.

1) KV 캐시(Key-Value Cache)

2) 그래디언트 체크포인팅(Gradient Checkpointing)

3) 기타 메모리 최적화 기법

양자화(Quantization)
- 32비트 부동소수점 → 16비트, 8비트, 4비트로 정밀도 축소
- 모델 크기 및 메모리 사용량 대폭 감소
- 약간의 성능 손실이 발생할 수 있음
모델 병렬화(Model Parallelism)
- 대규모 모델을 여러 GPU/TPU에 분산 배치
- 파이프라인 병렬화: 모델 레이어를 여러 장치에 분할
- 텐서 병렬화: 단일 연산을 여러 장치에서 병렬 처리
혼합 정밀도 훈련(Mixed Precision Training)
- FP32와 FP16을 혼합하여 사용
- 메모리 사용량 감소 및 계산 속도 향상
- 스케일링 기법을 통해 정확도 손실 방지