Domanda di colloquio di TikTok

Why LLM uses Layer Normalization not Batch Normalization