国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目錄
目錄
什麼是Grok 4?
關鍵功能
可用性
如何訪問Grok 4?
Grok 4在行動中
任務1:解決博士級問題
任務2:進行多步研究
任務3:用上下文進行編碼
Grok 4基準
Arc-Agi
自動攤板
Grok 4的應用
grok 3與Grok 4
結論
首頁 科技週邊 人工智慧 Grok 4在這裡,它簡直太棒了! - 分析Vidhya

Grok 4在這裡,它簡直太棒了! - 分析Vidhya

Jul 12, 2025 am 09:14 AM

“這比所有學科中的幾乎所有研究生 - 埃隆·馬斯克(Elon Musk)都要聰明?!?/span>

埃隆·馬斯克(Elon Musk)和他的格羅克(Grok)團隊迄今為止以最新和最佳的模式回來了:Grok 4。僅3個月前,這支專家團隊推出了Grok 3,該車型仍與OpenAI,Gemini和Anthropic的巨人競爭。但是有了Grok 4,Elon Musk正在為這些公司賺錢。 Grok 4具有超人級別的思維和推理能力。借助工具和代理商,它可以更好地了解個人和專業(yè)的世界。在此博客中,我們將探討有關Grok 4的所有內容:它的功能,功能,基準,最後,我們將對其進行測試。

讓我們吧!

目錄

  • 什麼是Grok 4?
  • 關鍵功能
  • 可用性
  • 如何訪問Grok 4?
  • Grok 4在行動中
    • 任務1:解決博士級問題
    • 任務2:進行多步研究
    • 任務3:用上下文進行編碼
  • Grok 4基準
  • Arc-Agi
  • 自動攤板
  • Grok 4的應用
  • grok 3與Grok 4
  • 結論

什麼是Grok 4?

Grok 4是Elon Musk公司X.AI的最新多模式大型語言模型(LLM)。它的培訓數據比Grok 2(X.AI的第一個公共模型)高100倍,增強學習計算的10倍是任何其他可用模型。 Grok 4具有256K上下文窗口,實時數據搜索,高級語音功能,代理能力和智能,它們緊密模仿了人類行為。

Grok 4有兩個版本:

  • 普通版本:這是Grok 4 llm的單一代理版本。它具有代理行為,其中一個代理可以解決您的問題。該模型對於涉及語言,搜索,編碼等的日常任務很有用。它可以在X.AI和通過API提供的開發(fā)人員提供的超級Grok計劃中提供。
  • Grok 4重:這是Grok 4的多代理版本。當提示時,多個代理商會進行協作,比較結果並產生最佳結果。它是複雜推理,深入分析和研究的理想選擇。它僅在X.AI的Super Grok重型計劃下可用。

關鍵功能

  • 這是一種學術狂熱: Grok 4閃耀著人類的最後考試(HLE)基準。在跨越數學,物理,化學,人文科學和計算機科學的2500個問題中,它在一半的角度得分了!當前大多數模型僅管理低單位數字,這表明Grok 4可以解決跨學科的博士學位問題。
  • 工具使用: Grok 4已接受了工具使用的本地培訓,表現優(yōu)於Grok 3的研究工具。通過廣泛的縮放和計算,它甚至可以解決最嚴重的基於文本的問題。
  • 它的設計是代理:Grok 4型號是代理。借助單身和多個代理在幕後工作,這些模型可以迅速執(zhí)行多個任務。
  • 它增強的語音功能: Grok 4型號具有高級語音模式,與Open AI和Gemini的其他模型相比,它聽起來更個人化和平靜。它帶有一個新的聲音“夏娃” - 英國發(fā)言人,可以迅速從唱歌轉變?yōu)楦`竊私語,模仿人類的情感。隨之而來的是,與以前的版本相比,其最新語音模式的延遲減少了一半。
  • 它可以經營一家業(yè)務:Grok 4型號可以像人類一樣推理,並採取決定性的決策,策略和計劃,以使他們能夠經營業(yè)務。實際上,它們可能也可以幫助您獲利。

當涉及到多模式功能,尤其是圖像分析和發(fā)電的功能時,Grok 4模型目前的性能比O3,Gemini 2.4 Pro,Claude 4等的頂級模型較差。儘管在未來幾天(或幾週)中,這可能會大大改善。

可用性

Grok 4在這裡,真是太好了! - 分析Vidhya

  • Super Grok:包括Grok 4和Grok 3。具有128K令牌窗口,語音和視覺功能。價格為$ 30/月或每年300美元。
  • Super Grok Heavy:包括Grok 4 Heavy和Grok 4。提供了增強的上下文窗口,並儘早訪問新功能。該高級計劃的價格為每月300美元或每年3,000美元,與OpenAI和Google的高級層相當。

如何訪問Grok 4?

在聊天中訪問Grok 4

  1. 前往gro k 。
  2. 登錄到您的超級Grok帳戶。
  3. 在屏幕中間的聊天框中,單擊聊天框角落的小型模型下拉菜單。
  4. 選擇“ Grok 4”模型

Grok 4在這裡,真是太好了! - 分析Vidhya

  1. 完成後,您可以開始。

在API上訪問Grok 4

  1. 轉到https://x.ai/api,然後單擊API控制臺登錄
  2. 單擊API鍵。
  3. 單擊“創(chuàng)建API鍵”,然後為您的API鍵提供一個名稱,然後單擊“保存”以生成Grok API鍵。
  4. 現在,要使用API端點訪問GROK 4,請訪問https://docs.x.ai/docs/models/grok-4-0709 ,並使用以下代碼片段訪問它。
來自xai_sdk導入客戶端

來自XAI_SDK.CHAT導入用戶,系統

客戶端=客戶端(

api_host =“ api.x.ai”,

api_key =”<your_xai_api_key_here> “

)
chat = client.chat.create(model ='grok-4-0709',溫度= 0)

chat.append(系統(“您是博士學位級數學家?!保?
chat.append(用戶(“什麼是2 2?”))

響應= chat.sample()

打印(響應。包含)</your_xai_api_key_here>

Grok 4在行動中

現在,我們已經閱讀了有關Grok 4的所有內容,現在該看看它是否會引起拳頭。為此,我們將在以下任務上測試Grok 4:

  1. 博士級問題以測試他們的推理能力
  2. 多步研究以檢查其代理功能
  3. 用上下文編碼以測試其實際使用功能

讓我們開始。

任務1:解決博士級問題

Grok 4在這裡,真是太好了! - 分析Vidhya

結果:

分析:

Grok 4逐步解決了問題,並按順序解決了每個問題。它正確解釋了提示,通過解決方案進行了推理,甚至在詢問圖形時甚至生成了代碼。可視化是準確的,並與解釋保持一致。

任務2:進行多步研究

提示“告訴我有關Analytics Vidhya在X上的最新帖子的信息,並在其網站上找到最新的博客 - 總結它們的信息,每條5行。

結果

分析

它的執(zhí)行比我想像的要好。任務本身並不困難,但是我看到如此眾多的模型在日期掙扎以準確獲取最新信息。 Grok 4只花了幾秒鐘。它瀏覽了網站和Twitter頁面,找到了最新信息,然後將其推理給了我每個上的5條混凝土線。

您可以在我們的博客頁面或X頁面上自己檢查。

任務3:用上下文進行編碼

提示:“合併所有這些PDF並創(chuàng)建一個JSON文件。”

文件

結果:

Grok 4在這裡,真是太好了! - 分析Vidhya

分析:

它可以很好地從幾個文件中列出內容,然後開始幻覺。我在結果中得到的只是#流。所以這令人失望。

提示2:“將以下代碼轉換為python並反應

代碼文件

結果:

分析:

Grok 4既快速又非常有效,它很快就在Python中生成了代碼,並且實際上在我的提示中使用了“ React”單詞理解這一點。我期待看到應用程序前端的代碼。然後,它還介紹了每個部分的代碼,使我可以簡單地將所需的部分複制在需要時。

Grok 4基準

Grok 4幾乎符合我們通??吹乃谢鶞省_@是一個摘要:

Grok 4在這裡,真是太好了! - 分析Vidhya

  1. GPQA(研究生級物理問題檔案庫) :這款基準測試專家專家級科學知識。在這個基準測試中,Grok 4以87-88%的成績,領先的競爭對手,例如GPT-4O和Claude 3.5十四行詩。
  2. AIME(美國邀請賽數學考試)2025 :該基準比較數學能力。 Grok 4分95%,一些報告聲稱高達100%的優(yōu)勢。這超過了先前的SOTA模型。
  3. SWE-Bench(軟件工程基準):它評估編碼和現實軟件問題解決方案(Grok 4 Code variant)。得分範圍為72-75%,明顯領先於O3-Mini(高)和Claude 3.5十四行詩。
  4. 其他數學和推理基準: Grok 4主導了我們數學奧林匹克運動會和哈佛大學 - 米特數學錦標賽,並進行了類似的測試,對先前的SOTA進行了巨大的收益。它還在一般推理和博士學位跨領域的任務中表現出色。

這些是測試任何最新LLM的通?;鶞省?Grok 4還帶有其記分卡上的兩個新基準:Arc-Agi和自動售貨機。

Arc-Agi

該基準測試可以檢查模型與實現AGI或人工通用情報的距離。這是通過在不同的ARC風格任務上得分的,這是一系列具有挑戰(zhàn)性的難題。

Grok 4在這裡,真是太好了! - 分析Vidhya

Grok 4佔據了第一名,打破了10%的障礙,這意味著該模型已採取了第一步。 Claude Opus 4型號接下來,然後出現O3(高),O4-Mini(高)等!看來,Grok 4基本上比其他同齡人更接近AGI。

自動攤板

該基準測試了代理AI系統,以測量這些代理可以與真實的電子商務網站互動以完成複雜任務的能力。它旨在強調測試現實世界的決策,計劃和UI相互作用。

Grok 4在這方面也很出色,擊敗了一些人,Claude 4,Opus和Gemini 2.5 Pro和O3。

Grok 4在這裡,真是太好了! - 分析Vidhya

實際上,對Grok 4進行了測試,以運行實際的自動售貨機來測試這一點,並在此過程中產生了巨額利潤。 Anthropic幾天前就發(fā)布了有關Claude運行自動售貨機的類似的東西,在那兒,他們提到該機器損失了!

Grok 4的應用

Grok 4具有一系列功能和性能基準,以此為基礎:

  1. 實時社交媒體互動:它直接集成到X(以前為Twitter)中,作為聊天機器人。它可用於生成模因,帖子,民意調查,摘要或情感分析。
  2. 高級研究:它可以解決博士學位級問題,從而表明它可以真正有助於數學,物理和工程學的先進研究。
  3. 業(yè)務計劃:它可以幫助制定策略並執(zhí)行高級業(yè)務分析,以幫助您獲得可行的見解。
  4. 編碼和寫作:Grok 4具有出色的SWE基準和代理功能,因此它可以承擔許多編碼任務並執(zhí)行效果很好。

grok 3與Grok 4

儘管Grok 3因種族主義評論而引起了人們的關注,但Grok 4,該團隊不僅要進行損害控制。 Grok 4從一開始就集成了工具使用,Grok團隊計劃將其升級到“商業(yè)等級”功能,從而幫助您解決實際的現實世界中的問題。除此之外,我們可以期望Grok 4很快能夠掌握視頻和圖像分析和一代,這使我們更接近體驗可玩的AI生成的視頻遊戲和完全AI生成的節(jié)目。

結論

Grok 4很重要嗎?確實。在一個感覺越來越飽和的市場中,它是新鮮空氣的呼吸,為前輩提供了真正的改進。隨著實際用例的出現,似乎有望幫助解決許多日常問題。標準和重型變體都是代理,快速且在推理方面明顯更好。雖然有些人認為它是為AGI建造的,但我相信仍然有時間和增長空間。 Grok 3也以巨大的希望推出,但後來脫離了軌道。有了這個新版本,這僅僅是開始,仍然需要進行許多測試才能了解其真正的潛力。

以上是Grok 4在這裡,它簡直太棒了! - 分析Vidhya的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發(fā)現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

前7個筆記本替代品 前7個筆記本替代品 Jun 17, 2025 pm 04:32 PM

Google的NotebookLM是由Gemini 2.5提供動力的智能AI筆記工具,它在匯總文檔方面表現出色。但是,它在工具使用方面仍然有局限性,例如源蓋,雲依賴性和最近的“發(fā)現”功能

好萊塢起訴AI公司,用於復制沒有許可證的角色 好萊塢起訴AI公司,用於復制沒有許可證的角色 Jun 14, 2025 am 11:16 AM

但是,這裡的危險不僅僅是追溯損失或皇室報銷。根據AI治理和IP律師兼Ambart Law PLLC的創(chuàng)始人Yelena Ambartsumian的說法,真正的關注是前瞻性。 “我認為迪士尼和環(huán)球影業(yè)的MA

您公司的AI流利性如何? 您公司的AI流利性如何? Jun 14, 2025 am 11:24 AM

使用AI與使用良好不同。許多創(chuàng)始人通過經驗發(fā)現了這一點。從節(jié)省時間的實驗開始通常會創(chuàng)造更多的工作。團隊最終花費數小時修改AI生成的內容或驗證輸出

從採用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 從採用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢。對LLMSorganizations的財務承諾正在大大增加其在LLMS的投資,其中72%的人預計他們的支出今年會增加。目前,近40%a

原型:太空公司Voyager的股票在IPO上飆升 原型:太空公司Voyager的股票在IPO上飆升 Jun 14, 2025 am 11:14 AM

航天公司Voyager Technologies在周三的IPO期間籌集了近3.83億美元,股票的價格為31美元。該公司為政府和商業(yè)客戶提供一系列與空間相關的服務,包括在IN上的活動

波士頓動力學和Unitree正在迅速創(chuàng)新四足機器人 波士頓動力學和Unitree正在迅速創(chuàng)新四足機器人 Jun 14, 2025 am 11:21 AM

當然,我一直緊隨位於附近的波士頓動力學。但是,在全球舞臺上,另一家機器人公司正在作為強大的存在。他們的四足機器人已經被部署在現實世界中,並且

什麼是'物理AI”?在推動AI理解現實世界的推動力中 什麼是'物理AI”?在推動AI理解現實世界的推動力中 Jun 14, 2025 am 11:23 AM

再加上這一事實,AI在很大程度上仍然是黑匣子,工程師仍然很難解釋為什麼模型的行為不可預測或如何修復它們,您可能會開始掌握當今行業(yè)面臨的主要挑戰(zhàn)。

NVIDIA想要與DGX Cloud Lepton一起建造一個行星規(guī)模的AI工廠 NVIDIA想要與DGX Cloud Lepton一起建造一個行星規(guī)模的AI工廠 Jun 14, 2025 am 11:17 AM

Nvidia已將Lepton AI重新命名為DGX Cloud Lepton,並於2025年6月重新引入了它。

See all articles