Registration is wrong! Please check form fields.

Nouveautés

Détail de l'actualité
2025
6
Février

Modèles multimodaux et IA agentique : l'IA générative en 2025

6 Février 2025

Modèles multimodaux et IA agentique : l'IA générative en 2025

1.jpgAlors que l'année 2025 commence, l'IA générative continue de remodeler la façon dont nous communiquons, résolvons les problèmes et interagissons avec les technologies et entre nous. Cette évolution est mise en évidence par les progrès significatifs des grands modèles multimodaux (LMM) et la croissance rapide de l'IA agentique. Ces innovations et bien d'autres promettent de rendre l'IA plus rapide, plus performante et plus intégrée dans notre vie quotidienne, tout en continuant à soulever d'importantes questions concernant la fiabilité, la réglementation et la mise en œuvre.

Grands modèles multimodaux : élargir le champ d'action de l'IA

Les modèles multimodaux (systèmes qui intègrent le texte, la vision, la parole et, dans certains cas, d'autres éléments) étendent les capacités des flux de travail de l'IA bien au-delà des systèmes essentiellement textuels qui dominaient il y a encore un an. Cette évolution est déjà visible dans les services d'entreprise multimodaux proposés par Google, OpenAI et Anthropic. Mais la solution Open Source suit le mouvement, avec des modèles comme le QVQ-72B Preview d'Alibaba et la prochaine version de Llama 4 de Meta, qui se concentre sur la « parole et le raisonnement ». L'IA Open Source continue de démocratiser l'accès et de favoriser l'innovation dans tous les secteurs d'activité.

L'IA visuelle progresse également à grands pas. Le Segment Anything Model (SAM) de Meta isole les éléments visuels avec un minimum de données, ce qui permet des applications dans le domaine du montage vidéo, de la recherche et des soins de santé. Par ailleurs, le système ARMOR de Carnegie Mellon et Apple, avec ses capteurs de profondeur distribués, a fait progresser la conscience spatiale des robots, réduisant les collisions de 63,7 % et traitant les données 26 fois plus vite que les méthodes traditionnelles.

Les systèmes vocaux progressent également. Des modèles comme Hertz et Moshi de Kyutai atteignent des temps de réponse impressionnants qui dans certains cas sont inférieurs à 120 millisecondes, et promettent des interactions toujours plus naturelles. Pourtant, des difficultés persistent : la personnalisation de la voix, la conservation du contexte et les coûts d'inférence restent des difficultés majeures.

2.jpg

IA agentique : vers une plus grande autonomie

L'IA agentique représente un changement dans le mode de fonctionnement des LLM, en leur conférant divers degrés d'autonomie grâce à un accès contrôlé aux outils et aux flux de travail. Contrairement aux « agents de centre de contact IA » traditionnels, qui servent principalement d'interfaces conversationnelles, les systèmes d'IA agentique existent le long d'un continuum de capacités d'intégration. Cette évolution leur permet de résoudre des problèmes du monde réel au-delà de leurs données de formation en interagissant avec des systèmes externes.

L'IA agentique dans le centre de contact peut être comprise de manière générale comme fonctionnant le long d'un spectre d'autonomie qui pourrait ressembler à ce qui suit :

  • Low Agency (☆☆☆☆): Les LLM génèrent des réponses textuelles aux messages des utilisateurs.

  • Moderate Agency (★☆☆ - ★★☆):  Les LLM classent et transfèrent les appels, récupèrent les données des clients ou interagissent avec des outils tels que la consultation des commandes et des FAQ.

  • High Agency (★★★) : Les LLM gèrent de manière autonome les flux de conversation, initient ou concluent des interactions, et prennent des décisions en temps réel, basées sur des objectifs.

Cette vision de l'IA agentique est soutenue par des acteurs majeurs comme HuggingFace, « Agency évolue sur une spectre continu, au fur et à mesure que vous vous donnez plus ou moins de puissance au LLM dans votre flux de travail. », ainsi que par des analystes du secteur comme Gartner, « AI Agency est un spectre. » Ce spectre met en évidence la façon dont l'IA agentique peut s'adapter aux différents besoins des entreprises. Par exemple, sur la plateforme unifiée Spitch, les solutions de haut niveau comme le Coachin Simulator, ou les Voice Assistants et les chatbots excellent dans les réponses naturelles personnalisables et le transfert avancé des appels, tandis que les systèmes intégrés aux outils comme Agent Assist et Speech Analytics réalisent des automatisations complexes en coulisses pour les interactions en direct et les analyses après appel.

En 2025, l'expansion rapide des cas d'utilisation de l'IA agentique, en particulier dans la gestion de l'expérience client, devrait redéfinir les flux de travail, permettant aux entreprises de trouver un équilibre entre l'automatisation, l'efficacité et l'expérience utilisateur.

Plus petits, plus intelligents, plus rapides : la montée en puissance des SLM

Les petits modèles linguistiques (SLM) sont également en vogue. Dans certains cas, ces modèles égalent les performances de systèmes plus importants comme GPT-4 dans des tâches ciblées, tout en fonctionnant sur du matériel standard. Cette évolution répond aux besoins des entreprises en matière d'IA évolutive et rentable. À cet égard, Google Research et DeepMind ont récemment introduit une nouvelle approche consistant à utiliser les SLM comme enseignants pour former des modèles beaucoup plus grands.

3.jpg

Les centres de contact comme étude de cas

L'évolution de l'impact de l'IA générative est particulièrement évidente dans les centres de contact. Selon un récent rapport McKinsey, cette évolution reflète trois changements majeurs qui couvre le secteur : les centres de contact sont désormais considérés comme des opportunités commerciales plutôt que comme des points de triage, les organisations étendent leurs écosystèmes d'IA pour soutenir ces aspirations, et l'accent est mis de plus en plus sur l'amélioration des compétences du personnel grâce à une meilleure intégration, à une meilleure formation et à un meilleur encadrement.

Les premiers utilisateurs, comme Klarna, ont constaté une réduction de 14 % des coûts du service client, tandis que les systèmes gérés par l'IA traitent jusqu'à 80 % des interactions de routine. Les plateformes de formation gérées par l'IA, comme celle actuellement développée par Spitch, transforment également le développement du personnel, en fournissant un encadrement en temps réel et des simulations personnalisées qui réduisent le temps d'intégration et améliorent les performances des employés.

Malgré ces progrès, l'adoption reste limitée. Seules 6,1 % des entreprises américaines ont mis en œuvre des solutions d'IA en 2024. Les défis à relever sont notamment l'intégration avec les systèmes existants, les coûts de formation élevés et la grande méfiance du public. Selon Qualtrics, 75 % des consommateurs restent sceptiques quant à l'utilisation de l'IA par les entreprises, soit une baisse de 11 % par rapport à 2023.

Relever les défis de l'inférence

L'inférence reste un obstacle de taille à l'adoption généralisée de l'IA. Des entreprises comme Groq et Cerebras développent du matériel spécialisé pour les applications en temps réel, ce qui permet d'obtenir des vitesses d'inférence jusqu'à 70 fois plus rapides. D'autres, comme Acurast, tirent parti de l'informatique distribuée pour exécuter des modèles avancés sur des appareils de base, offrant ainsi des solutions évolutives pour les tâches non critiques en termes de temps. Pendant ce temps, de grands fournisseurs comme OpenAI réduisent fortement l'inférence sur leurs modèles standards destinés aux clients.

4.jpg

Réglementation, données et fiabilité

Avec l'entrée en vigueur de la loi européenne sur l'IA, l'Europe offre l'un des cadres réglementaires les plus avancés pour le déploiement de l'IA, en mettant l'accent sur la robustesse technique, la transparence et la protection de la vie privée. Toutefois, le problème de l'évaluation de la conformité reste entier. Des recherches récentes de l'ETH Zurich mettent en évidence cette lacune et révèlent qu'aucun des grands modèles linguistiques (LLM) les plus largement utilisés aujourd'hui ne répond pleinement aux exigences de la loi. En 2025, cela restera une priorité importante de continuer à développer des critères de conformité qui alignent l'interprétation législative sur des méthodes d'évaluation pratiques, garantissant ainsi que la sécurité et l'innovation prospèrent de concert.

Le cofondateur de l'OpenAI Ilya Sutskever a récemment fait remarquer que nous approchons du « Pic des données ». La disponibilité d'ensembles de données de formation de haute qualité diminue, ce qui pousse l'industrie vers la génération de données synthétiques et l'apprentissage par inférence. Ces avancées définiront probablement la trajectoire de croissance de l'IA dans les années à venir, en passant de la recherche de modèles à un véritable raisonnement et à l'apprentissage adaptatif.

En attendant, les entreprises doivent continuer à donner la priorité à la transparence des données, aux pratiques éthiques et aux avantages mesurables pour les clients afin de vaincre le scepticisme du public et d'encourager l'adoption.

Perspectives 2025 : l'IA en pratique à grande échelle

Cette année s'annonce encore surprenante et promet une adoption accélérée et une intégration pratique de l'IA dans les applications professionnelles et grand public. Les principales tendances à surveiller sont les suivantes :

  • Prolifération des modèles multimodaux : Applications croissantes dans des secteurs tels que les soins de santé, la logistique et le service à la clientèle.

  • Evolution de l'IA agentique : L'autonomie des modèles High Agency progresse rapidement et favorise l'efficacité des flux de travail et de la résolution des problèmes.

  • Adoption par les entreprises :  Mise en œuvre plus large, l'IA prenant en charge un pourcentage de plus en plus élevé de tâches routinières dans les organisations qui l'ont adoptée très tôt.

  • Rentabilité : Les coûts d'inférence sont inférieurs à 10 dollars par million de jetons, ce qui rend l'IA plus accessible et plus applicable à des problèmes de plus en plus complexes.

Le défi pour les organisations est de trouver un équilibre entre l'innovation et la fiabilité, l'automatisation et la satisfaction du client, et la conformité et l'évolutivité. Le succès sera au rendez-vous pour ceux qui sauront gérer ces tensions de manière réfléchie tout en apportant une valeur claire et mesurable, un domaine dans lequel le conseil stratégique fourni par Spitch et son écosystème de partenaires joue un rôle crucial en aidant les entreprises à s'adapter à ce paysage en rapide évolution.

L'IA générative n'est pas qu'un simple outil, c'est une force de transformation. En 2025, les entreprises qui exploiteront son potentiel de manière responsable seront à l'avant-garde de la prochaine vague de collaboration entre l'homme et la machine.

Publications