Comment fonctionnent les Spot VMs ?

Déploiement du cloud souverain en France et en Allemagne

fonctionnement de Spot VM dans Google Kubernetes Engine

Code : Sélectionner tout kubectl get pods --all-namespaces | grep -i shutdown | awk '{print $1, $2}' | xargs -n2 kubectl delete pod -n

prix plus bas que les VM du moteur de calcul à la demande ;

utile pour les charges de travail sans état et tolérantes aux pannes qui résistent à la nature éphémère de ces VM ;

fonctionne avec l'autoscaler du cluster et l'auto-provisionnement des nœuds ;

contrairement aux VM préemptibles, qui expirent après 24 heures, les Spot VMs n'ont pas de temps d'expiration. Les Spot VMs ne sont terminées que lorsque le moteur de calcul a besoin des ressources ailleurs.

le moteur de calcul peut arrêter les Spot VMs à tout moment en raison d'événements système. La probabilité que le moteur de calcul arrête les Spot VMs pour un événement système est généralement faible, mais peut varier d'un jour à l'autre et d'une zone à l'autre en fonction des conditions ;

les Spot VMs sont des ressources limitées du moteur de calcul, elles ne sont donc pas toujours disponibles ;

les Spot VM ne peuvent pas utiliser la migration en direct pour devenir des VM standard pendant qu'elles sont en cours d'exécution ou être configurées pour redémarrer automatiquement en cas d'événement de maintenance ;

en raison des limitations précédentes, les Spot VM ne sont couvertes par aucun accord de niveau de service et sont exclues de l'accord de niveau de service de Compute Engine ;

les crédits Google Cloud Free Tier pour Compute Engine ne s'appliquent pas aux Spot VMs.

Les Spot VMs amélioreront l'offre actuelle de capacité de réserve de Google, les Preemptible VMs, et permettront aux clients de réaliser encore plus d'économies avec moins de restrictions. Associés à Spot by NetApp, les utilisateurs disposeront d'une infrastructure cloud rentable, automatisée et optimisée.Spot a été fondée dans le but de révolutionner la façon dont les entreprises consomment les services d'infrastructure en nuage, en utilisant l'analyse et l'automatisation pour fournir une infrastructure fiable, performante et rentable pour chaque charge de travail sur chaque cloud. Suite au partenariat avec Google Cloud, Spot by NetApp prendra en charge les nouvelles VM Spot de Google pour les clients utilisant Elastigroup pour gérer l'infrastructure de leurs charges de travail. Les utilisateurs de Spot Ocean, un moteur de conteneurs sans serveur, pourront aussi bientôt commencer à utiliser les VM de Google Spot via leurs groupes de nœuds virtuels Ocean.Les VM préemptables ont été proposées par Google avec une réduction allant jusqu'à 79 % par rapport à la tarification à la demande, mais elles sont limitées dans le temps. Après 24 heures de fonctionnement, les VM préemptables sont arrêtées, et elles peuvent également être arrêtées ou résiliées à tout moment au cours de la période de 24 heures.Avec le lancement des nouvelles VMs Spot, il n'y a pas de limite de temps pour l'utilisation des instances de capacité libre. Elles peuvent toutefois être interrompues à tout moment. Cela est compensé par des remises encore plus importantes que celles offertes avec les VM préemptibles avec un minimum garanti de 60 % d'économies, et la possibilité d'économiser jusqu'à 91 %. D'autres améliorations ont été apportées pour donner aux utilisateurs un plus grand contrôle sur leurs machines spot, notamment la possibilité de configurer la résiliation et les expirations.Les Spot VM représentent la capacité excédentaire de Google qui offre un moyen abordable de consommer l'infrastructure de calcul en cloud. Les utilisateurs empruntent aux pools de capacité excédentaire de Google à un coût nettement inférieur (jusqu'à 91 %) à celui du modèle de tarification à la demande. Toutefois, ces instances à moindre coût peuvent être reprises sans préavis si Google a besoin de les allouer ailleurs. La résiliation d'une instance peut intervenir à tout moment et peut dépendre de la zone, d'une poussée de la demande et d'autres facteurs. Pour les applications tolérantes aux pannes qui peuvent supporter d'éventuelles interruptions, l'utilisation de la capacité de réserve peut réduire considérablement les coûts de calcul.Spot by NetApp a pris en charge les VM préemptibles de Google dans Elastigroup, le service d'automatisation de l'infrastructure en cloud de Spot. Grâce à Elastigroup, les clients de Google Cloud peuvent bénéficier d'une capacité de réserve sans risque d'interruption de service. Grâce à l'apprentissage automatique et aux algorithmes prédictifs, Elastigroup peut prédire quand une VM Spot sera retirée et la remplacera de manière proactive sans aucune interruption. Soutenu par un accord de niveau de service d'entreprise, Elastigroup permet d'exécuter même les charges de travail critiques et de production sur les Spot VMs.Pour répondre aux besoins des clients et des gouvernements en Europe, Google développe des offres de partenaires de confiance dans le cadre de l’initiative. Selon Google, ces partenaires fourniront aux gouvernements et aux entreprises les plus hauts niveaux de souveraineté numérique, sans compromis sur les fonctionnalités ou le rythme de l'innovation. Chacun de ces partenariats s'appuie sur des technologies différentes. La semaine dernière, le géant Français de la défense, Thales, et Google ont annoncé la création d'une nouvelle entreprise commune pour offrir un service de cloud souverain en France.« En adressant à la fois les aspects techniques et juridiques du label “cloud de confiance'' du gouvernement français, cette approche illustre notre compréhension commune des enjeux et bénéfices du cloud pour les entreprises et institutions françaises, et la volonté de collaborer étroitement et concrètement, en France, pour créer des conditions favorables à l’innovation, de façon ouverte et autonome », a déclaré Samuel Bonamigo, Vice President EMEA South, pour Google Cloud.« Grâce à cette collaboration unique avec Google Cloud, nous pourrons contribuer à alimenter la transformation numérique des organisations de toutes tailles et de tous secteurs qui souhaitent garder le contrôle et la souveraineté sur leurs données et celles de leurs clients. Ensemble, nous répondrons aux critères définis par le gouvernement pour un cloud de confiance, ainsi qu'aux objectifs environnementaux avec une approche durable pour l'infrastructure que nous construirons », a déclaré Marc Darmon, EVP, Responsable de la communications sécurisées et systèmes d'information chez Thales.Sur, Google c’est associé avec T-Systems en Allemagne et OVHcloud en France. T-Systems construit une offre de cloud souverain en partenariat avec Google Cloud pour les organisations du secteur privé et public basées en Allemagne, qui sera disponible à la mi-2022. « T-Systems et Google Cloud partagent un objectif commun : développer des solutions de cloud pour les gouvernements et les entreprises européennes qui répondent à leurs objectifs de souveraineté numérique, de durabilité et d'économie », a déclaré Frank Strecker, Senior Vice President Global Cloud Computing & Big Data and Edge, T-Systems. « Ensemble, nous proposerons aux clients allemands une solution de cloud souverain qui leur permettra de répondre en toute sérénité à leurs exigences en matière de souveraineté des données, des opérations et des logiciels, qui évoluent rapidement. »Google a également annoncé un partenariat stratégique avec OVHcloud pour accélérer la capacité des organisations françaises et européennes à transformer numériquement et à réimaginer leurs activités.« Nous avons vu comment Google Cloud est à l'écoute de ses clients, partenaires et décideurs politiques en Europe et avons entendu le besoin d'un contrôle et d'une autonomie encore plus grands, a déclaré Sylvain Rouri, CSO chez OVHcloud. Ensemble, nous construisons un portefeuille de services de cloud souverain qui offre aux clients un contrôle total sur leurs données, leurs logiciels et leurs opérations tout en tirant parti de toute la puissance de Google Cloud et en répondant aux exigences du Règlement général sur la protection des données. »Lorsque l’utilisateur crée un cluster ou un pool de nœuds avec des Spot VMs, Google Kubernetes Engine (GKE) crée des Spot VMs Compute Engine sous-jacentes qui se comportent comme un groupe d'instances gérées (MIG). Les nœuds qui utilisent des Spot VM se comportent comme des nœuds GKE à la demande, mais sans garantie de disponibilité. Lorsque les ressources utilisées par les Spot VMs sont nécessaires pour exécuter des VMs à la demande, Compute Engine met fin à ces Spot VMs pour utiliser les ressources ailleurs.Lorsque le moteur de calcul doit récupérer les ressources utilisées par les Spot VMs, un avis de résiliation est envoyé à GKE. Les Spot VMs se terminent 30 secondes après la réception d'un avis de résiliation. Sur les clusters exécutant GKE version 1.20 ou ultérieure, la fonction d'arrêt progressif des nœuds (kubelet) est activée par défaut. Le kubelet remarque l'avis de fin d'activité et met fin de manière élégante aux pods qui s'exécutent sur le nœud.Le kubelet accorde 25 secondes aux pods non système pour mettre fin à leur activité de manière sûre, après quoi les pods système (avec les classes de prioritéou) ont cinq secondes pour le faire. Lors de l'arrêt gracieux d'un pod, le kubelet attribue un statut "Failed" et une raison d'arrêt aux pods arrêtés. Lorsque le nombre de Pods terminés atteint un seuil, le garbage collection nettoie les Pods. IL est également possible de supprimer manuellement les pods arrêtés à l'aide de la commande suivante :Notons que GKE permet de créer des pools de nœuds équipés de processeurs NVIDIA Tesla® K80, P100, P4, V100, T4 et A100. Les GPU fournissent une puissance de calcul permettant de mener des tâches d’apprentissage profond telles que la reconnaissance d'images ou le traitement du langage naturel, ainsi que d'autres tâches gourmandes en ressources de calcul, telles que le transcodage de vidéos et le traitement d'images.Les Spot VMs supportent l'utilisation de GPUs. Lorsque l’utilisateur crée un nouveau pool de nœuds GPU, GKE ajoute automatiquement naux nouveaux nœuds. Seuls les Pods ayant la tolérance correspondante peuvent s'exécuter sur ces nœuds. GKE ajoute automatiquement cette tolérance aux Pods qui demandent des GPU.Le cluster doit avoir au moins un pool de nœuds non-GPU existant qui utilise des VM à la demande avant de créer un pool de nœuds GPU qui utilise des VM Spot. Si le cluster ne possède qu'un pool de nœuds GPU avec des VM Spot, GKE n'ajoute pasà ces nœuds. En conséquence, GKE peut planifier des charges de travail système sur les pools de nœuds GPU avec des Spot VM, ce qui peut entraîner des interruptions à cause des Spot VM et augmenter la consommation de ressources, car les nœuds GPU sont plus chers que les nœuds non GPU.Les Spot VMs et les VMs préemptibles partagent de nombreux avantages, dont les suivants :Les Spot VMs fonctionnent comme des VMs standard mais ont les limitations suivantes :Source : Google Quel est votre avis sur le cloud computing ?Que pensez-vous du partenariat entre Google Cloud et les entreprises Spot, OVH et T-System ?Quels commentaires faites vous de la remise garantie à 60 % et sa possibilité d'aller jusqu'à 91 % par Spot VM ?Google serait elle soucieuse de l'économie de ses clients cloud ou s'agit il d'une stratégie marketing ?