NVIDIA Blackwell disponible en France : ce que ça change pour vos LLM
OVHcloud et Scaleway annoncent la disponibilité des GPU NVIDIA Blackwell B200 en France. Avec 2,5x les performances du H100 pour l'inférence LLM, cela rend les déploiements de modèles 70B accessibles à des entreprises de taille intermédiaire.
Les GPU NVIDIA Blackwell (architecture B200) sont désormais disponibles en cloud souverain français via OVHcloud et Scaleway. Pour les entreprises qui veulent déployer des LLM puissants sans dépendre des hyperscalers américains, c'est un changement significatif.
Les performances en inférence LLM
- Llama 3 70B : 2 300 tokens/seconde (vs 900 sur H100)
- Mistral Large 2 : 1 800 tokens/seconde
- Latence P99 : sous 200ms pour des réponses de 500 tokens
- Prix OVHcloud : à partir de 4,20€/heure (vs 3,10€ pour H100)
Ce que ça rend possible
Un déploiement Llama 3 70B avec 4× B200 peut gérer environ 200 utilisateurs simultanés pour des tâches de génération de texte. C'est la puissance dont ont besoin les entreprises de 500 à 2000 employés pour un déploiement interne complet, sans se limiter aux modèles 8B ou 13B.