Growth Diary

  • 홈
  • 태그
  • 방명록

2025/04/14 1

[Transformer] 어텐션 연산과 핵심 구성 요소

1. 어텐션 연산우리는 글을 읽을 때 모든 단어에 동일한 중요도를 부여하지 않습니다. 어떤 단어들은 특별히 주목하고, 다른 단어들은 상대적으로 덜 집중하며 전체 맥락을 파악합니다. 트랜스포머 모델의 핵심인 어텐션 연산은 이러한 인간의 읽기 방식을 모방한 연산입니다. 1) 어텐션이란 무엇인가?어텐션은 단어들 사이의 관계를 파악하여 문맥을 이해하는 방식으로, 다음과 같은 과정으로 작동합니다:단어와 단어 사이의 관계를 계산하여 관련성의 깊이를 판단관련이 깊은 단어는 더 많이, 관련이 적은 단어는 더 적게 맥락에 반영이 연산은 모델이 문장 내에서 단어 간의 복잡한 관계를 이해하고, 문맥에 따라 단어의 의미를 적절히 해석할 수 있게 합니다. 2. QKV(쿼리, 키, 값) 모델 이해하기트랜스포머 아키텍처를 개발한 ..

DeepLearning 2025.04.14
이전
1
다음
더보기
프로필사진

Growth Diary

개발에 관련된 다양한 IT 지식을 공유하고 최신 트렌드 기술을 배워나갑니다.

  • 분류 전체보기 (88)
    • Spring (4)
    • Git&GitHub (7)
    • Flutter (11)
    • Docker (2)
    • Algorithm (3)
    • 자료구조 (2)
    • Langchain (0)
    • CS (5)
    • Streamlit (1)
    • Backend (2)
    • CampusMeet (12)
    • AWS (1)
    • FastAPI (2)
    • RAG (2)
    • DeepLearning (11)
    • Fine-Tuning (4)
    • LLMops (10)
    • FinAgent Lab (5)
    • LangGraph (0)

Tag

Get, LLM, GPU, github, 양자화, 트랜스포머, spring, git, llm 평가, AWS, unsloth, transformer, NKS, 어텐션, MCP, mcp server, model context protocol, Rag, Flutter, mcp client,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/04   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바