Cherchant à simplifier au maximum la complexité technique de l’optimisation des charges de travail d’inférence pour les LLM sur un GPU ou un accélérateur d’IA particulier, Hugging Face lance un service dédié baptisé HUGS au prix de 1 dollar par heure par conteneur.

A lire également : Comment Oxmiq Labs veut libérer l'IA de la mainmise de Nvidia