Domanda di colloquio di Binance

How vision language model works?