Comment géreriez-vous un pipeline de données en cas de pic soudain de volume de données ?
Anonimo
J'ai expliqué que je mettrais en place une architecture scalable, par exemple avec Apache Kafka et Spark, permettant de traiter les données en parallèle. J’ai aussi mentionné l’importance de la mise en cache, du partitionnement et d’une surveillance proactive via des outils comme Prometheus ou Grafana pour détecter les anomalies.