Domanda di colloquio di Huawei Technologies

How do you use RL to optimize LLM?