DeepAgent : L'IA qui Fusionne ChatGPT , Gemini, Deepseek et Grok Pour TOUT FAIRE (sans vous)

5.85k views3328 WordsCopy TextShare

La MasterClass IA

Accès à DeepAgent (Abacus AI) : https://urls.fr/cF1URZ Dans cette vidéo, je décortique DeepAgent, l...

Video Transcript:

un agent autonome surpuissant à 10 dollars seulement par mois qui permettrait de combiner les meilleurs modèles d'Open AI, de Google, de Grock, de Deepsig et j'en passe pour vous permettre de réaliser n'importe quelle tâche. C'est tout simplement la promesse très ambitieuse de 10 PGT d'Abacus qui est sorti avant-hier et qui serait l'agent IA Gottier. Et selon les premiers tests, il représenterait une avancée majeure dans l'automatisation intelligente.

C'est ce qu'on va voir aujourd'hui puisque juste après cette présentation, on va le tester ensemble. Donc qu'est-ce que dit Pent ? C'est ce qu'on appelle un agent général capable d'accomplir des tâches complexes avec une autonomie complète.

Donc comme tous les agents de ce type, il va décomposer intelligemment les tâches, les diviser en sous-tâches qui sont gérables. Mais sa particularité c'est qu'il est multimodè et qu'il va combiner plus de 20 modèles différents pour réaliser la tâche. Donc son architecture technique, c'est Grock pour les recherches approfondies, GPT pour la planification stratégique, Dipsic pour le code, Claude pour la rédaction et Gemini pour perfectionner le code.

Deepad peut être utilisé pour créer des applications et des jeux entiers, des sites web interactifs, des tableaux de bord de visualisation de données très avancé et des rapports et présentations complets puisqu'il peut aussi générer des PowerPoint mais aussi toutes sortes de documentations. Le fonctionnement de PEAD est assez classique. Premièrement, analyser les besoins du projet.

Deuxièmement, élaborer la bonne stratégie. Troisièmement, organiser les ressources et quatrièmement suivre, ajuster, améliorer. Dipadent a aussi une intégration système avec Gmail, Gira qui est un logiciel de gestion de projet, Slack qui est un logiciel collaboratif et il est capable aussi de naviguer sur le web.

Donc il peut se servir d'un ordinateur. Et ce qui rend cet outil très unique et très prometteur, c'est aussi son tarif qui est seulement à 10 dollars mensuel. Il est inclus dans une suite d'outils qui s'appelle chat llm qui est encore plus large et qui permet d'accéder à d'autres outils.

Pour le moment, pour le moment, il n'y a que deux tâches inclus et seulement 100000 points maximum consommés par tâch complexe. À ce stade, je sais pas vraiment ce que ça signifie concrètement dans l'utilisation, mais on va le voir ensemble puisqu'on va le découvrir tout à l'heure avec un projet. Et les cas d'utilisation pratique, ça peut être concrètement de développer des prototypes fonctionnels pour des applications, ça peut être de générer des supports marketing, des présentations, des analyses de données et ça peut être d'automatiser la gestion de projet.

Pour 10 dollars par mois, je dois dire que la promesse est assez intéressante. Maintenant, est-ce que ça va délivrer dans la réalité ? Ici, on va retrouver des exemples réalisés avec Sién.

Donc par exemple ici, Depent a créé un site web sur un club de lecture et il a choisi 12 livres à faire figurer dedans. Donc regardons comment il l'a construit. OK, donc là c'est le prompt initial, il pose quelques questions.

Donc là, ils sont en train de définir le cahier des charges, notamment graphique. Il fait des recherches sur les livres à faire apparaître. Là, il fait un premier bilan, donc il va lister les 12 livres.

Et maintenant, il passe à la création du site web. Donc là, il y a pas eu d'action de l'utilisateur, il est en train d'enchaîner toutes les tâches lui-même. Donc il y a tous les éléments du site web qui sont en train d'être codé.

On voit en dessous qu'il a utilisé 45000 points. Donc ça rentre dans la limite des 100000 points. Et voilà le résultat avec ce site web Classic Romance Book Club qui semble complet.

OK. Ouais, pourquoi pas. Intéressant.

Pour le moment, on est sur un outil qui ressemble quand même beaucoup à Bolt, à Firebase. Donc à voir s'il se démarque vraiment. Encore une fois, le prix est quand même intéressant et pour mon test, moi je vais lui demander de créer une application de suivi d'habitude qui est un vrai potentiel commercial en français optimisé pour le mobile.

L'objectif est d'offrir une expérience plus riche et plus motivante que les trackers basiques. L'appli doit l'appli doit se distinguer par des statistiques et analyses pertinentes, une plus grande flexibilité, des éléments de motivation avancée, des programmes guidés, une interface utilisateur qui doit être soignée, intuitive et engageante et l'application doit être hyper satisfaisante. Et c'est parti.

Donc moi, je lui ai laissé un petit peu de liberté délibérément. J'ai pas fait un prompt qui soit trop restreint. Je veux voir ce que l'outil va nous proposer un peu spontanément sur la base de ce cahier des charges.

Donc là, il est en train de me poser des premières questions de clarification. le nom, le modèle économique, l'intégration de fonctionnalité sociale, les préférences esthétiques particulières, les applications existantes dont j'apprécie certains aspects. Et comme je veux lui laisser une grande liberté, je vais lui demander de décider lui-même selon ce qu'il va trouver sur le marché comme étant les meilleures réponses et les meilleures pratiques.

Fais des recherches en ligne pour analyser le marché et prends les meilleures pratiques des applications les plus successfules en la matière. invente le nom en cherchant également en amont. Et là, normalement, j'ai plus qu'à attendre parce que je lui ai donné toutes les instructions pour que il produise le premier prototype.

On voit sur la gauche qu'il est en train de faire les différentes recherches. Donc, meilleure application de suivi d'habitude, modèle économique des applications de suivi d'habitude, avis d'utilisateur, application suivi d'habitude, tendance marché. Ce que j'apprécie par rapport aux outils classiques et y compris les outils qui ont sorti récemment des Deep research par exemple, c'est que là toutes les requêtes se suivent, se complète et que l'agent est en train de réaliser la tâche entière.

Donc là, il a fait différentes recherches. Maintenant, il est en train d'analyser l'ensemble des résultats. Et pour rappel, je découvre aussi cet outil avec vous.

Je ne l'ai jamais utilisé. Dans la documentation de l'outil, il est indiqué qu'une tâche peut prendre entre 5 et 25 minutes, ce qui est pas grand-chose s'il arrive réellement à produire une application entière. Donc là, il m'indique qu'il a fait une analyse de marché des applications de suivi d'habitude.

Il a écrit un rapport et maintenant il fait une recherche sur les meilleures pratiques d'interface utilisateor. Et là, je suis quand même vraiment impressionné parce que c'est la première fois que j'utilise un agent de ce type et en fait, je suis surpris par la versatilité de ces décisions. Je lui ai demandé de créer une application.

J'ai donné quelques instructions assez précises, mais par exemple, j'aurais pas imaginé qu'il aille voir quelles sont les meilleures pratiques d'interface utilisateur. Et ce que j'apprécie, c'est qu'encore une fois là, je ne suis pas intervenu depuis le deuxième message que j'ai envoyé. On voit qu'il recherche accessibilité ergonomie, application mobile suivi habitude.

Ça y est, il a terminé sa recherche sur les meilleures pratiques d'interface utilisateur. Il m'a fait un résumé du rapport ici. Pattern de navigation et d'interaction, élément visuel favorisant l'engagement.

technique de gammification et de motivation, accessibilité et ergonomie. Donc franchement pas mal du tout. S'il arrive à intégrer tout ça dans l'application qu'il est en train de créer, le prototype risque d'être vraiment pas mal.

Et quand je vois un process comme ça, je ne peux m'empêcher quand même d'imaginer le futur du travail quand des agents de ce type seront intégrés dans toutes les routines quotidiennes du travail. Alors, il a l'air d'être en train de brainstormer sur des noms possibles. Donc, habitudo, Ritu daily, routine plus, Abitrack, Suivisé.

Je sais pas exactement ce qu'il est en train de faire là. Il est en train de lancer des lignes de code mais honnêtement, je m'y connais pas assez pour comprendre exactement de quoi il s'agit. Je n'ai aucune idée de ce qu'il est en train de faire, mais ça fait partie de la magie des agents, c'est-à-dire que vous leur demandez quelque chose et ensuite vous laissez la magie opérer.

Ah, je vois qu'il est en train d'analyser les apps existantes, de générer des noms et de vérifier la disponibilité. Donc, c'est probablement pour ça qu'il fait des recherches. Il vérifie que les noms qu'il a brainstormé ne sont pas déjà utilisés, ce qui est une bonne chose.

Alors, il continue à me faire des rapports réguliers. Donc maintenant, il me dit qu'il a fait une analyse approfondie des noms d'application. Point clé du rapport, vérification de disponibilité et il a sélectionné les cinq meilleurs noms : Ru daily, rythme Day, habitour, routine FR, rituel quotidien.

Et donc là, on voit effectivement ce rapport complet. Wou ! OK, habit bull sticks toist tout ça étant des applications déjà existantes.

Ensuite, on voit qu'il a analysé les tendances de nommage et il a généré des noms originaux. Et c'est comme ça qu'il est arrivé au nom potentiel avec le fameux top 5 qu'il m'a donné tout à l'heure. Il a fait ensuite une vérification des noms de domaine disponible.

Ça, j'aime. Il a sélectionné les cinq meilleurs noms. Il a fait une analyse des points forts et du potentiel marketing.

C'est pour ça qu'il a gardé RITU Daily puisque c'est celui qui a le plus de points forts objectifs dans son analyse. Et ce qui est intéressant c'est que là il me dit je dois interrompre cette tâche immédiatement. C'est un peu dramatique entre nous soit dit.

Le processus a pris beaucoup de temps et de ressources pour plusieurs raisons. Les recherches effectuées ont été très approfondies. Chaque recherche a impliqué de nombreuses requêtes web.

La vérification des disponibilités de noms de domaines a nécessité l'installation d'outils supplémentaires. Waouh, impressionnant. Ça veut dire qu'il a installé sur la machine virtuelle des outils différents de ceux qui font partie du scè de base.

Je n'ai pas encore développé l'application en elle-même, mais les trois rapport fournissent déjà une base solide pour son développement futur. Pour avancer efficacement, je recommande d'utiliser ses recherches comme base pour développer l'appli en suivant les spécifications demandées. OK ?

Et là, on voit qu'il a utilisé 10930 points de compute. Donc je pense que c'est peut-être pour ça qu'il n'a pas codé l'application. Je vais essayer quand même de lui demander.

OK, maintenant code l'application. Et ouais, c'est bien ce que je pensais. Youve reached the maximum number.

Et donc on peut voir qu'il a Et donc on peut voir qu'il a construit ses six fichiers. On peut télécharger ces six fichiers. Comme j'ai droit à une deuxième tâche, je vais lui demander de créer l'application Routi Daily suivie d'habitude et de faire une version web pour le moment.

Je lui ai mis deux fichiers, les meilleures pratiques UX UI, l'analyse de marché qu'il vient de faire. Mais j'ai pas envie que cette fois il s'arrête au milieu et que au final il ne me crée pas l'application. J'ai envie qu'il aille au bout de la tâche.

Donc je vais lui préciser qu'il doit utiliser ses compute point pour coder concrètement l'application. Utilise tes 100000 points pour créer le prototype, ne te disperse pas. Et c'est parti.

Encore une fois, il me demande des questions de clarification, donc je vais le laisser décider. En tout cas, sur la première étape, je dois dire que je suis assez bluffé par la qualité de ce qui a été produit dans les rapports de recherche qui sont préalables à un projet. Sur la partie code, c'est difficile à dire pour le moment, mais on peut déjà imaginer comment on peut utiliser cet outil à 10 dollars pour simplement préparer pour réaliser les recherches préparatoires à un projet.

Et c'est parti. Donc on voit qu'il est en train de consulter les fichiers que je lui ai transmis. Arrivait probablement pas à ouvrir les PDF, donc il les a traduit en texte.

Donc il a bien réalisé l'analyse des documents. J'espère qu'il est pas en train de dilapider ses compute points comme tout à l'heure. Ça y est, il définit l'architecture et il crée les documents de spécification du site web.

OK, donc il est en train d'écrire tout le descriptif du projet. Architecture technique, structure du projet, next. js.

Waouh, c'est quand même pas mal. Je sais pas dans quelle mesure un Bolt aujourd'hui est capable de faire ça. En tout cas, il est pas capable Bolt de réaliser toute l'étape de recherche qu'on a vu juste avant sur le marché.

Ça va loin dans le détail. Carte d'habitude, bouton, formulaire. Donc là, on voit les marges latérales responsives.

Franchement, je m'y connais pas assez en design pour savoir de quoi il s'agit, mais on va voir. Principe d'interaction, feedback immédiat pour toutes les actions, animation fluide et subtile, geste intuitif. Bon, la promesse est encore une fois énorme, mais est-ce qu'il va finir par coder cette application au lieu de décrire, de faire des recherches et encore une fois peut-être de dilapider ses compute points.

J'aime ce que je lis mais maintenant je veux voir ce qu'il va créer. Encore une fois sur la gauche, il me fait un petit récap de ce qu'il vient de faire, donc document de spécification créé avec succès et ça y est, il est en train de coder les différents fichiers de l'application. Enfin, pour moi qui n'ai jamais codé un seul fichier de ma vie, il y a quelque chose d'assez incroyable à voir apparaître comme ça des lignes de code.

J'avais eu le même effet quand j'ai testé Firebase et je vous encourage d'ailleurs à aller voir ma vidéo sur le sujet sur le Vibe coding. Je trouve qu'on est sur une appli qui dépasse un peu le concept du vibe coding pour sûr parce que toutes les étapes antérieures de recherche de marché, d'analyse, des meilleures pratiques et cetera, ça doit normalement aboutir à un meilleur résultat final. Donc on voit qu'il navigue dans un système Ubuntu.

Donc il est aussi voilà sur une espèce de de système virtuel comme tous les agents autonomes. Et il continue le codage. On a un onglet de preview qui est ici mais je peux pas encore cliquer dessus.

Donc là il est en train d'implémenter les core functionalities de l'application. Il a identifié des bugs qu'il est en train de mettre à jour. Je suis très impatient de voir l'application mais je suis un petit peu inquiet aussi parce que je vois que ça continue et je me dis qu'il faudrait pas dépasser ces fameux 100000 points de compute point sinon ça va être le fail.

Et pourtant, je lui ai dit de pas se disperser. Alors là, il a écrit que l'application avait besoin de component additionnels et de fonctionnalité pour vraiment implémenter toutes les features requises. S'il me montre pas un travail à moitié fini, il veut aller au bout du projet.

Et maintenant, il impléte le système de badge et d'achievement. Waouh, franchement, c'est très complet. Il n'abandonne aucune des features initialement pensées dans le cahier des charges.

Et ça, je trouve que c'est assez ouf. Le niveau d'autonomie est vraiment impressionnant. Pour rappel, je lui ai quand même envoyé un prompt qui était assez simple et maintenant ça fait 15 minutes qu'il est en train d'élaborer l'application de manière complètement exhaustée.

J'ai revu le prompt initial et j'ai et l'application inclut maintenant toutes les features requises. Il m' liste les 15 éléments du cahier des charges et ça y est, l'application peut-être previewed. Il m'a donné un lien.

Donc là, il est en train de télécharger tous les fichiers dans le projet et Dipad Junt me dit qu'il a terminé la création de l'application web Routy Daily pour le suivi d'habitude. Elle est disponible à cette adresse, elle comprend toutes les fonctionnalités. Le développement a pris du temps car j'ai analysé en détail.

J'ai créé des spécifications détaillées. OK, j'ai développé une application web complète. J'ai corrigé plusieurs erreurs de build et on a utilisé le nombre de compute points maximal 104000.

Et je vous propose bien sûr de découvrir le résultat ensemble. Voilà à quoi ça ressemble. C'est assez sobre pour le moment, mais ce que je remarque c'est qu'il y a trois thèmes : light, dark et système.

Bon, il y a deux thèmes. Donc si je passe en dark, tout fonctionne bien. Bienvenue sur routid.

Développe de meilleures habitudes et suivez vos progrès quotidiens. Suivi simple, visualisation, motivation. Je vais commencer et j'arrive dans un tableau de bord.

Le secret du changement est de concentrer toute votre énergie non pas à lutter contre le passé mais à construire la vire. Ça conseille de Socrate avec les habitudes totales compléter aujourd'hui. Série totale.

OK. Donc je vais par exemple créer une nouvelle habitude. Boire de l'eau 3 fois 3 L par jour.

Description pour mon hydratation. Catégorie santé productivité bien-être. Apprentissage.

Je vais laisser santé. Waouh ! Donc les animations effectivement sont assez satisfaisantes.

Utiliser un joker pour protéger votre série. OK. Alors, je vais créer une nouvelle habitude.

Me peser chaque matin pour suivre mon poids et je constate qu'il l'a mis à côté mais on dirait qu'elle est en dessous de compléter aujourd'hui. Donc pour moi, elle aurait dû plutôt être là. Et je vais créer une nouvelle habitude de productivité, remplir mon journal de gratitude.

OK, donc là j'ai mon tableau de bord. Quand je vais dans les habitudes ici, rien n'apparaît. Donc c'est pas très fonctionnel tout ça.

Et les statistiqu taux de compétion, meilleure série, totale habitude. Calendrier des séries. Bon, c'est pas trop mal.

Ah bah là, je suis revenu dans le tableau de bord et il n'y a plus rien. Tout ce que j'avais rentré précédemment a disparu. OK, je pense qu'on est face à un outil qui est encore en betta, ce qui peut justifier que les performances ne soient pas absolument incroyables.

Maintenant, je rappelle qu'il est à 10 dollars par mois et qu'il inclut aussi donc chat, LLM. qui est l'interface de Abacus qui permet d'utiliser en fait tous les autres modèles de langage. Donc il est quand même beaucoup moins cher que des outils spécialisés.

Maintenant, on va pas se mentir, je trouve qu'il est aussi beaucoup moins convaincant à ce stade. Encore une fois, il peut évoluer. Il est d'ailleurs écrit dans le blog qu'il est promis à évoluer.

Il y a des choses qui sont quand même intéressantes quand on regarde notamment les étapes préparatoires à l'application. Il a vérifié les noms de domaine, il est allé chercher toutes les meilleures pratiques d'interface utilisateur, il les a intégré au cahier des charges. Pour autant, il a pas créé quelque chose de particulièrement innovant.

Et pour autant aussi, bah avec cette limitation de 100000 points, on voit bien que même s'il a mis toutes les fonctionnalités, le projet ne tient pas la route sur un vibe coding sauvage comme celui que j'ai fait aujourd'hui. Maintenant, est-ce que ça permet de créer des prototypes surmesure rapides pour à peu près n'importe quelle idée ? La réponse est oui.

Est-ce que d'autres outils permettent de faire ça mieux ? Peut-être. Est-ce que d'autres outils permettent de faire ça moins cher ?

Assezu, je pense, à part peut-être Google. Donc, je pense que c'est un nouveau projet à suivre. Je vais vous mettre le lien en description de cette vidéo si vous voulez le tester vous-même.

Encore une fois, c'est 10 dollars l'inscription, mais vous avez derrière l'accès à toutes les autres fonctionnalités d'Abacus qui sont aussi intéressantes et pour lesquelles on pourrait faire d'ailleurs d'autres vidéos. J'espère que cette vidéo vous a plu. N'hésitez pas à vous abonner si vous êtes curieux d'en savoir plus sur le domaine de Lia.

Ma chaîne est encore minuscule, donc un petit pouce bleu sur la vidéo peut lui donner beaucoup de force.