Domanda di colloquio di TikTok

Describe GRPO loss and other RL algorithm