Passer au contenu

Le cloud : catalyseur d’architecture pour la Gen AI

Stéphane Minozzi
17 octobre 2024

À l’image du smartphone ou des interfaces web, l’enthousiasme du grand public pour l’IA générative (Gen AI) agit comme un puissant levier pour son adoption en entreprise. Portée par les employés qui en perçoivent le potentiel pour optimiser leur travail, cette tendance pousse les organisations à dépasser le stade des expérimentations limitées et des POC, pour enfin intégrer la Gen AI dans leur stratégie à long terme.

Cependant, les applications grand public telles que ChatGPT offrent une vision simplifiée, voire réductrice, de cette technologie. Si elles en révèlent la « magie », elles masquent aussi une réalité complexe, mais maîtrisable, pour garantir la fiabilité nécessaire à un usage professionnel

L’architecture de la Gen AI sous la loupe 

Un coup d’œil sous le capot des solutions Gen AI déployées par les entreprises les plus avancées révèle des systèmes en plusieurs couches. Derrière une interface web se trouve d’abord un orchestrateur, chargé de diriger les requêtes vers le(s) modèle(s) de langage (LLM) adapté(s).

Ensuite, viennent les LLM, véritable moteur de la révolution, capables de comprendre et de générer du langage naturel. Ils s’appuient souvent sur une base vectorielle (RAG), qui représente le cœur de la connaissance. Bien que l’utilisation du RAG ne soit pas obligatoire, elle permet un contrôle accru sur les informations partagées, réduisant les biais et hallucinations potentiels des IA qui se basent uniquement sur leurs données d’entraînement. 

Les avantages d’une architecture modulaire 

L’un des principaux atouts de cette architecture est de permettre une maîtrise complète des données utilisées et générées par la Gen AI. Plutôt que de puiser dans les vastes ressources du web, le LLM s’appuie sur un RAG personnalisé, constitué à partir des données et de documents propres à l’entreprise. Séparer ainsi la base de connaissances des capacités conversationnelles du LLM permet un contrôle optimal de la qualité et de la fiabilité des réponses. 

De plus, cette modularité offre une grande flexibilité pour construire des solutions sur mesure. Selon les besoins, il est possible de choisir les composants les plus adaptés, souvent issus du cloud.

L’offre y est abondante : open source, éditeurs spécialisés ou hyperscalers. Grâce aux technologies web et aux API standards, ces composants cloud sont facilement intégrables, interactifs et remplaçables. En outre, le cloud fournit l’infrastructure idéale pour la Gen AI : des capacités de calcul et de stockage massives, ainsi qu’une élasticité permettant de multiplier les expérimentations et de passer rapidement à l’échelle. 

Un troisième avantage réside dans la transparence retrouvée grâce à cette architecture modulaire. Elle permet de lever le voile sur la complexité de la Gen AI, en revenant à des pratiques technologiques et de gestion de projet bien établies. Toutefois, les spécificités de la Gen AI nécessitent l’adoption de nouvelles pratiques encore non systématisées. 

Vers des pratiques à généraliser 

Premièrement, étant donné l’immensité des possibilités offertes par la Gen AI, il est essentiel de définir des cas d’usage précis à tester et affiner pour valider leur pertinence. Ensuite, la gouvernance des données devient cruciale : la qualité des réponses dépend de la qualité des connaissances fournies à l’IA.

Il est donc impératif de mettre en place des processus rigoureux pour constituer, vérifier et maintenir le corpus de connaissances. De nombreuses entreprises s’y attellent déjà, mais il s’agit désormais d’une exigence incontournable. Les premiers cas d’usage devraient porter sur des domaines de connaissance restreints et maîtrisés.

Enfin, l’aspect économique est un autre point clé. Pour maîtriser les coûts, il est indispensable d’avoir une visibilité et un suivi précis des services cloud utilisés, dont les tarifs peuvent varier. À mesure que la Gen AI se déploie au sein des organisations, avec des cas d’usage toujours plus complexes, une approche FinOps devient essentielle pour une gestion efficiente des coûts. 

L’architecture modulaire permet non seulement de rendre la Gen AI plus accessible et acceptable en entreprise, mais elle accompagne aussi une transformation profonde. En fournissant toutes les briques nécessaires, le cloud permet une approche progressive de cette révolution. Il offre le temps d’implanter les outils, pratiques et compétences nécessaires, tout en élevant progressivement le niveau de maturité des acteurs impliqués. Cette démarche permet de développer des cas d’usage qui, en croisant des connaissances toujours plus diversifiées, seront aussi générateurs de valeur ajoutée. 

Auteur

Stéphane Minozzi

Service Line Manager Data & AI – PER Est, Capgemini
    Pour aller plus loin

      Cloud de confiance

      Trouvez le juste équilibre entre protection et innovation grâce à notre livre blanc.

      Objectif CLOUD

      Explorez le potentiel du cloud avec notre podcast dédié