Domanda di colloquio di Stellantis

Expliquez le Reinforcement Learning from Human Feedbac ?