


Grok 4 est là et il est tout simplement brillant! - Analytique Vidhya
Jul 12, 2025 am 09:14 AM?C'est plus intelligent que presque tous les étudiants dipl?més dans toutes les disciplines - Elon Musk.?
Elon Musk et son équipe Grok sont de retour avec leur dernier et meilleur modèle à ce jour: Grok 4. Il y a seulement 3 mois que cette équipe d'experts a lancé Grok 3, un modèle qui est toujours en concurrence avec les Giants d'Openai, Gemini et Anthropic. Mais avec Grok 4, Elon Musk donne à ces entreprises une course pour leur argent. Grok 4 est livré avec des capacités de réflexion et de raisonnement au niveau surhumain. Avec des outils et des agents dans son arsenal, il apporte une meilleure compréhension du monde, à la fois personnel et professionnel. Dans ce blog, nous explorerons tout sur Grok 4: ses fonctionnalités, ses capacités, ses références et enfin, nous le testerons.
Groks!
Table des matières
- Qu'est-ce que Grok 4?
- Caractéristiques clés
- Disponibilité
- Comment accéder à Grok 4?
- Grok 4 en action
- Tache 1: résoudre une question au niveau du doctorat
- Tache 2: effectuer une recherche en plusieurs étapes
- Tache 3: faire du codage avec le contexte
- Grok 4 Benchmarks
- Arc-agi
- Banc de vente
- Applications de Grok 4
- Grok 3 vs Grok 4
- Conclusion
Qu'est-ce que Grok 4?
Grok 4 est le dernier modèle multimodal de grande langue (LLM) de la société d'Elon Musk, X.ai. Il a 100 fois plus de données de formation que Grok 2 (le premier modèle public par X.AI) et 10 fois plus de calcul d'apprentissage par renforcement que tout autre modèle disponible. Grok 4 propose une fenêtre de contexte 256k, une recherche de données en temps réel, des capacités vocales avancées, des capacités d'agence et une intelligence qui imite étroitement le comportement humain.
Grok 4 a deux versions:
- Version normale : Il s'agit de la version à agent unique du Grok 4 LLM. Il dispose d'un comportement agentique, où un agent travaille pour résoudre vos problèmes. Ce modèle est utile pour les taches quotidiennes impliquant la langue, la recherche, le codage, etc. Il est disponible dans le plan Super Grok proposé par X.AI et également via API pour les développeurs.
- Grok 4 Heavy: Il s'agit de la version multi-agents de Grok 4. Lorsqu'elle est invitée, plusieurs agents collaborent, comparent les résultats et génèrent le meilleur résultat. Il est idéal pour un raisonnement complexe, une analyse profonde et une recherche. Il est disponible uniquement sous le plan lourd Super Grok par X.ai.
Caractéristiques clés
- C'est un Whiz académique: Grok 4 brille sur la dernière référence de l'examen de l'humanité (HLE). Sur 2 500 questions couvrant les mathématiques, la physique, la chimie, les sciences humaines et l'informatique, il a obtenu un score à deux chiffres sur la moitié! La plupart des modèles actuels ne gèrent que de faibles chiffres, suggérant que Grok 4 peut s'attaquer aux problèmes de niveau doctoral entre les disciplines.
- Utilisation des outils: Grok 4 a été formé nativement sur l'utilisation des outils, surpassant les outils de recherche de Grok 3. Avec une mise à l'échelle et un calcul approfondis, il peut gérer même les problèmes de texte les plus difficiles.
- Sa conception est agentique : les modèles Grok 4 sont agentiques. Avec des agents simples et multiples travaillant dans les coulisses, ces modèles peuvent effectuer rapidement plusieurs taches.
- Ses capacités vocales améliorées: les modèles Grok 4 sont livrés avec un mode vocal avancé qui semble plus personnel et calme par rapport aux autres modèles d'IA ouverte et de Gémeaux. Il est livré avec une nouvelle voix, ?Eve? - un locuteur britannique qui peut rapidement passer du chant au chuchotement, imitant des émotions humaines. Parallèlement à cela, la latence de leur dernier mode vocal a été réduite de moitié par rapport à sa version précédente.
- Il peut gérer une entreprise : les modèles Grok 4 peuvent raisonner comme les humains et prendre des décisions décisives, des stratégies et des planifications d'une manière qui les rend capables de gérer une entreprise. En fait, ils pourraient aussi vous aider à faire des bénéfices.
En ce qui concerne les capacités multimodales, en particulier l'analyse et la génération d'images, les modèles Grok 4 fonctionnent actuellement plus pauvres que les modèles top comme O3, Gemini 2.4 Pro, Claude 4, etc. Bien que cela puisse s'améliorer considérablement au cours des prochains jours (ou semaines).
Disponibilité
- Super Grok: Comprend Grok 4 et Grok 3. Livré avec une fenêtre de jeton de 128K, des capacités de voix et de vision. Au prix de 30 $ / mois ou 300 $ / an.
- Super Grok Heavy: comprend Grok 4 Heavy et Grok 4. Offre une fenêtre de contexte améliorée et un accès précoce aux nouvelles fonctionnalités. Ce plan premium co?te 300 $ / mois ou 3 000 $ / an, comparable aux niveaux premium d'Openai et de Google.
Comment accéder à Grok 4?
Pour accéder à Grok 4 sur le chat :
- Dirigez- vous vers Gro K.
- Connectez-vous à votre compte Super Grok.
- Dans la Chatbox au milieu de l'écran et cliquez sur la liste déroulante du petit modèle dans le coin de la Chatbox.
- Sélectionnez le modèle ?Grok 4?
- Une fois terminé, vous pouvez commencer.
Pour accéder à Grok 4 sur l'API :
- Allez sur https://x.ai/API et cliquez sur la connexion de la console API .
- Cliquez sur les touches API .
- Cliquez sur Créer la touche API et après cela, donnez un nom à votre touche API et cliquez sur Enregistrer pour générer votre touche API Grok .
- Maintenant, pour accéder au Grok 4 à l'aide de points de terminaison API, visitez https://docs.x.ai/docs/models/grok-4-0709 et utilisez l'extrait de code ci-dessous pour y accéder.
de xai_sdk Importer le client De xai_sdk.chat Importer l'utilisateur, système client = client ( api_host = "api.x.ai", api_key = "<your_xai_api_key_here> " ) chat = client.chat.create (modèle = 'Grok-4-0709', température = 0) CHAT.APPEND (Système ("Vous êtes un mathématicien de niveau doctoral.")) chat.append (utilisateur ("Qu'est-ce que 2 2?")) réponse = chat.sample () imprimer (réponse.Content)</your_xai_api_key_here>
Grok 4 en action
Maintenant que nous avons tout lu sur Grok 4, il est temps de voir si cela apporte le punch comme il le prétend. Pour ce faire, nous testerons Grok 4 sur les taches suivantes:
- Question au niveau du doctorat pour tester leurs capacités de raisonnement
- Recherche en plusieurs étapes pour vérifier ses capacités agentiques
- Codage avec contexte pour tester ses capacités d'utilisation du monde réel
Commen?ons.
Tache 1: résoudre une question au niveau du doctorat
Résultat:
Analyse:
Grok 4 a abordé le problème étape par étape, abordant chaque question dans l'ordre. Il a correctement interprété l'invite, raisonné via la solution, et même généré du code pour les graphiques lorsqu'on lui a demandé. Les visualisations étaient précises et alignées sur l'explication.
Tache 2: effectuer une recherche en plusieurs étapes
Invite : " Parlez-moi de l'analytique du dernier article de l'analytique Vidhya sur X et trouvez le dernier blog sur leur site Web - résumez les informations sur eux en 5 lignes chacune. "
Résultat :
Analyse :
Cette tache qu'elle avait mieux fonctionné que je ne l'avais imaginé. La tache elle-même n'est pas difficile, mais je vois tellement de modèles aux prises avec les dates pour récupérer avec précision les dernières informations. Grok 4 n'a pris que quelques secondes. Il est passé par le site Web et la page Twitter, a trouvé les dernières informations, puis l'a raisonné pour me donner 5 lignes de béton sur chacune.
Vous pouvez le vérifier vous-même sur notre page de blog ou notre page X.
Tache 3: faire du codage avec le contexte
Invite : " Fusiter tous ces PDF et créer un seul fichier JSON."
Fichiers
Résultat:
Analyse:
Cela a bien commencé, en répertoriant le contenu à partir de quelques fichiers, puis a commencé les hallucinations. Tout ce que j'ai obtenu dans le résultat était un flux de #. C'était donc décevant .
Invite 2: ? Convertir le code suivant en python et réagir ?
Fichier de code
Résultat:
Analyse:
Grok 4 a été rapide et assez efficace, il a rapidement généré le code en Python et l'a vraiment compris avec le mot ?réact? dans mon invite. J'avais hate de voir le code pour le frontend de mon application. Il a ensuite présenté le code pour chaque section, ce qui me permet de copier la partie requise au fur et à mesure que cela est nécessaire.
Grok 4 Benchmarks
Grok 4 presque tous les repères que nous regardons habituellement. Voici un résumé:
- GPQA (Archives de questions de physique au niveau des dipl?més) : Cet benchmark Test des connaissances scientifiques de niveau expert de l'expert. Sur cette référence, Grok 4 atteint 87 à 88%, les principaux concurrents comme GPT-4O et Claude 3.5 Sonnet.
- AIME (American Invitational Mathematics Examination) 2025 : Cette référence compare les prouesses mathématiques. Grok 4 scores de 95%, certains rapports réclament jusqu'à 100% de domination. Cela dépasse les modèles SOTA précédents.
- SWE-BENCH (Software Engineering Benchmark): Il évalue le codage et la résolution de problèmes logiciels du monde réel (variante Grok 4 Code). Les scores varient de 72 à 75%, significativement en avance sur O3-MinI (haut) et Claude 3.5 Sonnet.
- Autres références mathématiques et raisonnement: Grok 4 domine le tournoi de mathématiques mathématiques américaines et des mathématiques de Harvard-Mit, et des tests similaires avec des gains massifs sur la sota antérieure. Il excelle également dans le raisonnement général et les taches au niveau du doctorat entre les champs.
Ce sont les repères habituels pour tester n'importe quel dernier LLM. Grok 4 est également venu avec son tableau de bord sur deux nouvelles repères: Arc-Agi et banc de vente.
Arc-agi
Cette référence vérifie à quel point les modèles sont proches de la réalisation de l'AGI, ou de l'intelligence générale artificielle. Cela se fait en marquant leurs performances sur différentes taches de style arc, qui sont une collection de puzzles difficiles .
Grok 4 occupe la première place, brisant la barrière de 10%, ce qui signifie que le modèle a fait ses premiers pas dans le raisonnement général. Les modèles Claude Opus 4 suivent ensuite puis venez O3 (haut), O4-MinI (haut) et autres! Cela semble que Grok 4 est essentiellement plus proche de l'AGI que le reste de ses pairs.
Banc de vente
Cette référence teste les systèmes d'IA agentiques pour mesurer dans quelle mesure ces agents peuvent interagir avec un véritable site Web de commerce électronique pour effectuer des taches complexes. Il est con?u pour souligner la prise de décision, la planification et l'interaction de l'interface utilisateur du monde réel.
Grok 4 excelle aussi, battant des humains, Claude 4, Opus et Gemini 2.5 Pro et O3.
En fait, le Grok 4 a été testé pour exécuter un distributeur automatique pour tester cela, et il a engagé d'énormes bénéfices en le faisant. Anthropic avait publié quelque chose de similaire à propos de Claude exécutant un distributeur automatique il y a quelques jours, et en cela, ils avaient mentionné que la machine avait été défaite!
Applications de Grok 4
Grok 4 est livré avec un excellent ensemble de fonctionnalités et de repères de performances, sur la base desquels il peut être assez utile pour:
- Interaction des médias sociaux en temps réel: il est intégré directement dans X (anciennement Twitter) en tant que chatbot. Il peut être utilisé pour générer des mèmes, des publications, des sondages, des résumés ou une analyse des sentiments.
- Recherche avancée: il peut résoudre des questions au niveau du doctorat, indiquant ainsi qu'elle peut vraiment contribuer à la recherche avancée en mathématiques, en physique et en ingénierie.
- Planification d'entreprise: Il peut aider à cartographier les stratégies et à effectuer une analyse commerciale avancée pour vous aider à obtenir des informations exploitables.
- Codage et écriture: Grok 4 est livré avec des repères SWE brillants et des capacités agentiques, il peut donc assumer de nombreuses taches de codage et les exécuter bien également.
Grok 3 vs Grok 4
Bien que Grok 3 ait été à l'honneur de ses commentaires racistes, avec Grok 4, l'équipe cherche à faire plus que le contr?le des dégats. Grok 4 est livré avec une utilisation d'outils intégrée dès le début, et l'équipe Grok prévoit de mettre à niveau cela en capacités de ?note commerciale?, vous aidant à résoudre des problèmes réels et réels. Parallèlement à cela, nous pouvons nous attendre à ce que Grok 4 ma?trise une analyse et une génération et une génération d'images, nous rapprochant des jeux vidéo générés par AI-Générés et des émissions entièrement générées par l'AI.
Conclusion
Grok 4 est-il un gros problème? Certainement. Dans un marché qui se sent de plus en plus saturé, il se démarque comme une bouffée d'air frais, offrant de réelles améliorations par rapport à ses prédécesseurs. Avec des cas d'utilisation réels émergents, il semble prêt à aider à résoudre de nombreux problèmes quotidiens. Les variantes standard et lourdes sont agentiques, rapides et nettement meilleures pour raisonner. Alors que certains suggèrent qu'il est construit pour AGI, je crois qu'il reste du temps et de la place pour la croissance. Grok 3 a également été lancé avec beaucoup de promesses, mais a ensuite été décalé. Avec cette nouvelle version, ce n'est que le début, de nombreux tests sont encore nécessaires pour comprendre son véritable potentiel.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Notebooklm de Google est un outil de prise de notes SMART IA propulsé par Gemini 2.5, qui excelle à résumer les documents. Cependant, il a toujours des limites dans l'utilisation des outils, comme les bouchons de source, la dépendance au nuage et la fonction récentes ?Discover?

Mais ce qui est en jeu ici n'est pas seulement des dommages rétroactifs ou des remboursements de redevances. Selon Yelena Ambartsumian, un avocat de la gouvernance et de l'IP et fondatrice de l'IP et fondatrice d'Ambart Law PLLC, la vraie préoccupation est tournée vers l'avant. "Je pense que MA de Disney et Universal

Voici dix tendances convaincantes qui remodèlent le paysage de l'IA de l'entreprise. L'engagement financier de la lancement envers les organisations LLMS augmente considérablement leurs investissements dans les LLM, 72% s'attendant à ce que leurs dépenses augmentent cette année. Actuellement, près de 40% A

L'utilisation d'IA n'est pas la même chose que de bien l'utiliser. De nombreux fondateurs l'ont découvert par l'expérience. Ce qui commence comme une expérience d'économie de temps finit souvent par créer plus de travail. Les équipes finissent par passer des heures à réviser le contenu généré par l'IA ou à vérifier les sorties

La société spatiale Voyager Technologies a levé près de 383 millions de dollars lors de son introduction en bourse mercredi, avec des actions offertes à 31 $. L'entreprise fournit une gamme de services liés à l'espace aux clients gouvernementaux et commerciaux, y compris des activités à bord

Je suis bien s?r suivi de près de Boston Dynamics, qui est situé à proximité. Cependant, sur la scène mondiale, une autre entreprise de robotique augmente en tant que présence formidable. Leurs robots à quatre pattes sont déjà déployés dans le monde réel, et

Ajoutez à cette réalité le fait que l'IA reste en grande partie une bo?te noire et que les ingénieurs ont toujours du mal à expliquer pourquoi les modèles se comportent imprévisible

NVIDIA a renommé Lepton AI sous le nom de DGX Cloud Lepton et l'a réintroduit en juin 2025. Comme indiqué par NVIDIA, le service propose une plate-forme d'IA unifiée et calcule le marché qui relie les développeurs à des dizaines de milliers de GPU à partir d'un réseau mondial de CLO
