Transformer 모델이 기계 번역에서 기존의 모델들보다 더 좋은 성능을 낼 수 있었던 이유를 설명하시오.
Transformer 모델에서 Positional Encoding을 사용하는 이유를 설명하시오.
Transformer 모델의 Attention 매커니즘을 Query, Key, Value를 포함하여 간단하게 설명하시오