Solution française • Hébergement souverain • Conformité européenne Blog IA souveraine
Actualité IA Brève
Source : Scaleway

Scaleway lance les GPU H200 en France : ce que ça change pour le fine-tuning et l'inférence LLM

ScalewayGPUH200

Scaleway annonce la disponibilité des GPU NVIDIA H200 dans ses datacenters français, devenant le premier opérateur cloud européen à proposer cette génération de GPU en cloud souverain. Avec 141 Go de mémoire HBM3e par GPU (contre 80 Go pour le H100), le H200 ouvre de nouvelles possibilités pour l'inférence LLM et le fine-tuning sans découpage de modèles.

La mémoire GPU a longtemps été le goulet d'étranglement de l'IA en entreprise. Le NVIDIA H200, avec ses 141 Go de HBM3e, change la donne — et Scaleway est le premier opérateur cloud souverain européen à le rendre accessible en location à l'heure.

H200 vs H100 : ce que ça change concrètement

CritèreH100 SXMH200 SXM
Mémoire VRAM80 Go HBM2e141 Go HBM3e
Bande passante mémoire3,35 TB/s4,8 TB/s
Llama 3.3 70B FP162 GPU requis1 GPU suffit
Llama 4 Maverick (MoE)4 GPU min.2 GPU suffisent

Pricing Scaleway H200

Scaleway positionne le H200 à 4,80€/h à la demande, avec des engagements mensuels à partir de 3,60€/h. Comparé au H100 (3,20€/h à la demande), le surcoût est de 50% pour 76% de VRAM supplémentaire — un rapport favorable pour les workloads qui nécessitent de la VRAM.

Ce qu'il faut retenir

  • Premier H200 en cloud souverain français — avantage concurrentiel pour les entreprises soumises au RGPD
  • Llama 3.3 70B en FP16 (qualité maximale) sur un seul GPU : fin du découpage multi-GPU coûteux
  • Fine-tuning 70B possible sans infrastructure multi-noeud complexe
  • Bande passante HBM3e : vitesse d'inférence augmentée de ~40% vs H100
  • Disponible à la demande et en réservation 1/3/12 mois

Ce que ça change pour le fine-tuning

Le fine-tuning LoRA d'un modèle 70B nécessitait jusqu'ici un minimum de 2 H100 en NVLink, avec la complexité de gestion d'un noeud multi-GPU. Avec le H200, un seul GPU suffit pour le fine-tuning LoRA en FP16, simplifiant considérablement l'architecture infrastructure et réduisant les coûts de formation.

Scaleway et souveraineté

Scaleway (groupe Iliad) est une société française sans actionnariat américain. Elle n'est pas qualifiée SecNumCloud pour ses GPU H200 à ce jour, mais reste hors du périmètre Cloud Act. Pour les données ne nécessitant pas SecNumCloud, c'est un très bon compromis entre souveraineté et performance.

Ce que ça change pour vous
Le H200 chez Scaleway permet aux entreprises françaises de fine-tuner et d'inférer des modèles 70B en qualité maximale sans architecture multi-GPU coûteuse. C'est un saut de productivité significatif pour les équipes data science qui travaillaient en 4-bit quantifié faute de VRAM — avec maintenant un opérateur souverain pour le faire.
Lire la source originale Scaleway