Monitoring et Alerting d’un cluster Kubernetes par Prometheus et Grafana | by Grégoire DAYET | Nov, 2020 | Medium medium.com
Les équipes informatiques comprennent déjà très bien la nécessité de surveiller leur infrastructure. De nombreux produits sont disponibles pour l’infrastructure historique: Nagios, Zabbix sont par exemple des acteurs bien connus dans ce domaine. Mais, dans l’écosystème Kubernetes, il y a de nouveaux et nombreux niveaux d’abstraction. Ainsi, le troubleshooting devient beaucoup plus délicat si vous ne disposez pas des bons outils. Combien de DevOps se sont retrouvés confrontés à la fameuse erreur: Failed scheduling No nodes are available that match all of the following predicates::Insufficient CPU Le suivi des ressources d’un cluster doit être fait en temps réel car par rapport à l’infrastructure traditionnelle, les ressources d’un cluster évoluent et changent constamment. Vous ne pourrez jamais savoir où vos pods seront lancés sur votre cluster. Pour ces raisons, nous devons surveiller à la fois les ressources sous-jacentes mais aussi la santé du cluster lui même.
Report Story