[Paper Review] Transformer - Attention is All You Need

2024. 12. 30. 15:22·🐬 ML & Data/📘 논문 & 모델 리뷰
728x90

분명 내가 딥러닝에 입문했을 때도 Transformer가 각광받고 있었는데 아직까지도 Transformer가 각광받고 있다. 세상은 변하는데... 참 응용도도 높고 성능이 좋은 모델임에 틀림없다.

예전에 공부해본바 있지만 경험치가 쌓인 지금 좀 더 지식을 공고히할 겸 정리해봤다. 글로 옮기기 귀찮아서 손글씨 사진으로 대체한다.

 

1. Attention 개념 이해하기

2. Self-Attention이란?

3. Transformer 구조

4. Transformer의 Query, Key, Value 구해보기

5. Multi-head Attention

6. Encoder와 Decoder에서 Self-Attention의 동작

7. Masked Self Attention

8. 기타 개념 및 기법

8.1. Feed Forward

8.2. Residual Connection & Layer Normalization

8.3 모델 학습 기법 - Dropout, Adam Optimizer

728x90
저작자표시 비영리 변경금지 (새창열림)

'🐬 ML & Data > 📘 논문 & 모델 리뷰' 카테고리의 다른 글

[논문 구현] Transformer 텐서플로우로 구현하기  (0) 2025.01.16
[Paper Review] Mamba - Linear Time Sequence Modeling with Selective State Spaces 2  (1) 2024.12.11
[Paper Review] Mamba - Linear Time Sequence Modeling with Selective State Spaces 1  (1) 2024.12.11
[Paper Review] Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning  (0) 2023.08.07
[Model Review] TadGAN(Time series Anomaly Detection GAN)  (0) 2023.05.17
'🐬 ML & Data/📘 논문 & 모델 리뷰' 카테고리의 다른 글
  • [논문 구현] Transformer 텐서플로우로 구현하기
  • [Paper Review] Mamba - Linear Time Sequence Modeling with Selective State Spaces 2
  • [Paper Review] Mamba - Linear Time Sequence Modeling with Selective State Spaces 1
  • [Paper Review] Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning
darly213
darly213
호락호락하지 않은 개발자가 되어보자
  • darly213
    ERROR DENY
    darly213
  • 전체
    오늘
    어제
    • 분류 전체보기 (97)
      • 🐬 ML & Data (50)
        • 🌊 Computer Vision (2)
        • 📮 Reinforcement Learning (12)
        • 📘 논문 & 모델 리뷰 (8)
        • 🦄 라이트 딥러닝 (3)
        • ❔ Q & etc. (5)
        • 🎫 라이트 머신러닝 (20)
      • 🐥 Web (21)
        • ⚡ Back-end | FastAPI (2)
        • ⛅ Back-end | Spring (5)
        • ❔ Back-end | etc. (9)
        • 🎨 Front-end (4)
      • 🎼 Project (8)
        • 🧊 Monitoring System (8)
      • 🐈 Algorithm (0)
      • 🔮 CS (2)
      • 🐳 Docker & Kubernetes (3)
      • 🌈 DEEEEEBUG (2)
      • 🌠 etc. (8)
      • 😼 사담 (1)
  • 블로그 메뉴

    • 홈
    • 방명록
    • GitHub
    • Notion
    • LinkedIn
  • 링크

    • Github
    • Notion
  • 공지사항

    • Contact ME!
  • 250x250
  • hELLO· Designed By정상우.v4.10.3
darly213
[Paper Review] Transformer - Attention is All You Need
상단으로

티스토리툴바