[Paper Review] Transformer - Attention is All You Need

728x90

분명 내가 딥러닝에 입문했을 때도 Transformer가 각광받고 있었는데 아직까지도 Transformer가 각광받고 있다. 세상은 변하는데... 참 응용도도 높고 성능이 좋은 모델임에 틀림없다.

예전에 공부해본바 있지만 경험치가 쌓인 지금 좀 더 지식을 공고히할 겸 정리해봤다. 글로 옮기기 귀찮아서 손글씨 사진으로 대체한다.

1. Attention 개념 이해하기

728x90

[논문 구현] Transformer 텐서플로우로 구현하기 (0)	2025.01.16
[Paper Review] Mamba - Linear Time Sequence Modeling with Selective State Spaces 2 (1)	2024.12.11
[Paper Review] Mamba - Linear Time Sequence Modeling with Selective State Spaces 1 (1)	2024.12.11
[Paper Review] Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning (0)	2023.08.07
[Model Review] TadGAN(Time series Anomaly Detection GAN) (0)	2023.05.17