Français

IA

Le match des titans : comparatif des plus grandes IA du moment

8 janvier 2024

Ahmet Sahin

Le match des titans : comparatif des plus grandes IA du moment

La course à la domination de l’intelligence artificielle s’est intensifiée ces dernières années avec l’apparition de plusieurs géants technologiques et startups innovantes (mention spéciale à la communauté libre de développeurs open-source qui y ajoutent leur grain de sel également). Cet article vise à présenter une analyse approfondie de quatre des plus grandes IA du moment : ChatGPT d’OpenAI, Google Bard, Claude 2 d’Anthropic et LLaMA de Meta.

Interface

  • ChatGPT (OpenAI) : 
ChatGPT
  • Bard (Google) : 
Google Bard
  • Claude 2 (Anthropic) : 
Claude 2 de Anthropic
  • LLaMA (Meta) : LLaMA ne possède pas d’interface utilisateur ! Il s’agit d’un code source à destination des développeurs qui pourront ensuite le personnaliser et l’intégrer dans leur application. D’ailleurs, il s’agit d’un modèle non-entraîné. C’est-à-dire qu’il est dépourvu de données d’entraînement et n’est pas passé par une première étape d’affinage des réponses pertinentes qui est cruciale pour la bonne élaboration des réponses (et ce, contrairement à ChatGPT, Bard, Claude, etc.). Il y a de nombreuses versions dérivées de LLaMA qui sont utilisables en ligne cependant, par exemple sur poe.com, llama2.ai, labs.perplexity.ai, etc. Attention, il s’agit certainement de versions “démo” dont nous ne connaissons pas les modalités d’entraînement ni les données d’entrées donc les résultats peuvent paraître de mauvaise qualité. Cependant, ne doutez pas de ses capacités : LLaMA brille là où il est pleinement entraîné à donner de bonnes réponses mais nous en reparlerons plus loin.

Performance

  • ChatGPT (OpenAI) : que ce soit en version gratuite ou payante, ChatGPT est réputé pour son modèle d’apprentissage profond très large. Sa capacité à comprendre et générer du texte est exemplaire. Le modèle payant, en particulier, offre une performance améliorée et une précision dans la génération de textes.
  • Bard (Google) : fort de l’expérience de Google dans le domaine de la recherche et de l’IA, Bard offre une performance remarquable, notamment en matière de traitement de la langue naturelle, de la recherche sur le Web en temps réel et de son intégration dans l’écosystème Google.
  • Claude 2 (Anthropic) : encore jeune, cette IA est pourtant prometteuse. Elle démontre une performance robuste, capable d’élargir son contexte d’analyse à hauteur d’un roman de plus de 200 pages sans encombre et très rapidement. Anthropic est une entreprise soutenue et financée par Google.
  • LLaMA (Meta) : avec l’appui de la puissance technologique de Meta et son approche open-source, LLaMA ouvre les portes à une myriade de possibilités. En effet, le groupe à l’origine de Facebook souhaite rendre libre d’accès le code source de LLaMA, permettant à de simples développeurs de construire des applications par dessus et paramétrer l’IA en toute flexibilité. Des développeurs indépendants se sont déjà appropriés LLaMA afin de créer Vicuna : une IA qui est à 90 % aussi bonne que GPT-4, la version payante de ChatGPT ! Cela est très prometteur pour l’avenir.

Vitesse de rédaction

ChatGPT (version gratuite GPT-3.5) et Google Bard sont au coude-à-coude en termes de rapidité, grâce à leur infrastructure robuste et leurs optimisations. Claude 2, est extrêmement rapide sur des documents de grandes tailles tels que des PDFs composés de dizaines voire centaines de pages, contrairement à ses confrères qui ont besoin de plus de temps ou qui n’y parviennent simplement pas. LLaMA quant à lui dépendra de la machine sur laquelle il est installé donc il est impossible de le quantifier ainsi.

Réponses pertinentes et structurées

Toutes ces IA ont fait d’énormes progrès dans ce domaine, mais ChatGPT, avec son architecture GPT-4, semble avoir un avantage dans la production de réponses bien structurées. Claude 2 d’Anthropic, axé sur la sécurité et l’éthique, offre également des réponses bien raisonnées et talonne GPT-4. Google Bard est plus performant pour la recherche sur le Web et la conversation simple mais ne parvient pas à structurer des réponses aussi pertinentes que GPT-4 ou Claude 2. LLaMA quant à lui dépendra énormément de son modèle d’entraînement car ne l’oublions pas, LLaMA est un modèle non-entraîné, contrairement à ses concurrents. En prenant le modèle Vicuna, qui est un modèle entraîné de LLaMA, nous constatons des résultats impressionnants, capables de quasiment égaler GPT-4 !

Un comparatif scientifiquement établi

Au-delà de notre ressenti, vous pouvez également retrouver sur Internet un barème établi par une communauté de plus de 70 000 utilisateurs,  permettant ainsi de classer de manière totalement objective les modèles de langage les plus performants. Rendez-vous sur https://chat.lmsys.org/?leaderboard pour retrouver ce classement. Le jour de la rédaction de cet article, GPT-4 est sans contexte le premier de la liste, talonné de peu par Claude, et Vicuna-33B qui sont tout simplement les meilleurs. Malheureusement pour Google Bard, nous ne le retrouvons qu’à la onzième place pour le moment. L’IA est excellente pour la recherche sur le Web ou la conversation mais il lui manque la polyvalence et les fonctionnalités puissantes que GPT ou Claude possèdent actuellement.

Comparatif scientifique des IA

Faites votre propre avis !

Vous pouvez utiliser le comparateur de Chatbot de LMSYS, en vous rendant sur https://chat.lmsys.org/ puis en cliquant sur “Chatbot Arena (side-by-side)”. Choisissez les modèles à comparer et renseignez votre prompt. À vous de jouer ! Ici, nous demandons trois arguments sur “pourquoi utiliser Google Workspace plutôt que Microsoft 365” :

Le comparateur de Chatbot de LMSYS

(Selon nous, Vicuna se débrouille mieux que LLaMA ici 😉)

Conclusion

Le paysage de l’IA est en constante évolution, avec chaque géant apportant sa propre spécialité et expertise. ChatGPT d’OpenAI, avec sa vaste gamme de compétences et son modèle payant, semble être un choix solide pour une variété d’applications. Google Bard est idéal pour les tâches liées à la recherche Web et son intégration à l’écosystème Google, tandis que LLaMA excelle dans le contexte de la personnalisation, de l’open source et de l’avancée technologique communautaire. Claude 2 d’Anthropic, bien que plus récent, montre un potentiel énorme, en particulier dans le domaine de l’analyse de documents, données ou textes longs.

Pour Numericoach et d’autres entreprises axées sur les outils Google Workspace, l’intégration avec Google Bard pourrait être la voie à suivre, étant donné l’écosystème interconnecté de Google. Cependant, il serait sage de rester à jour avec les avancées des autres IA pour une approche complète et diversifiée.

Chaque IA a ses forces, et la meilleure dépendra des besoins spécifiques de l’utilisateur. Dans ce monde en rapide évolution, la clé est d’adopter une mentalité d’apprentissage continu et d’expérimentation. L’avenir est brillant pour l’IA.

Découvrez plus d’articles sur l’IA sur Numericoach et Numeriblog ! Pour en savoir plus sur l’IA vous pouvez aussi consulter nos Webinaires sur le sujet. Vous aussi vous souhaitez monter en compétences sur les outils Google Workspace ? Rendez-vous dans notre catalogue de formations. N’hésitez pas à nous contacter pour une formation et un accompagnement adapté à vos besoins.

Tenté par l’autoformation sur Google Workspace ?

Avec plus de 2.000 articles, Numeriblog est le blog Google Workspace de référence. Idéal pour monter en compétences gratuitement et rapidement !

Vous avez aimé cet article ?
Partagez-le !

Un article écrit par

Photo de Ahmet Sahin

Ahmet Sahin