国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 科技週邊 人工智慧 DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

Aug 09, 2024 pm 04:01 PM
deepmind 產(chǎn)業(yè) 乒乓球機(jī)器人

但可能打不過公園裡的老大爺?

巴黎奧運(yùn)會正在如火如荼地進(jìn)行中,乒乓球項(xiàng)目備受關(guān)注。同時,機(jī)器人打乒乓球也取得了新突破。

剛剛,DeepMind 提出了第一個在競技乒乓球比賽中達(dá)到人類業(yè)餘選手水平的學(xué)習(xí)型機(jī)器人智能體。

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

論文地址:https://arxiv.org/pdf/2408.03906

DeepMind 這個機(jī)器人打乒乓球什麼程度呢?大概和人類業(yè)餘選手不相上下:

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

正手反手都會:

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

對手採用多種打法,機(jī)器人也能招架得?。?/p>

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者
不過,比賽激烈程度似乎不如公園老闆對戰(zhàn)。

對機(jī)器人來說,乒乓球運(yùn)動需要掌握複雜的低階技能和策略性玩法,需要長期訓(xùn)練。 DeepMind 認(rèn)為戰(zhàn)略上次優(yōu)但可以熟練地執(zhí)行低階技能可能是更好的選擇。這使乒乓球與國際象棋、圍棋等純粹的戰(zhàn)略遊戲區(qū)分開來。

因此,乒乓球是提升機(jī)器人能力的一個有價值的基準(zhǔn),包括高速運(yùn)動、即時精確和戰(zhàn)略決策、系統(tǒng)設(shè)計(jì)以及與人類對手直接競爭。

對於這一點(diǎn),Google DeepMind 首席科學(xué)家稱讚道:「乒乓球機(jī)器人將有助於我們解決高速控制和感知問題?!?p>

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者
該研究進(jìn)行了29 場機(jī)器人與人類的乒乓球比賽,其中機(jī)器人獲勝45% (13/29)。所有人類選手都是機(jī)器人未見過的玩家,從初學(xué)者到錦標(biāo)賽選手能力不等。

雖然該機(jī)器人輸?shù)袅怂信c最高級別玩家的比賽,但它贏得了100% 的與初學(xué)者的比賽,在與中級選手的對戰(zhàn)中贏得了55% 的比賽,展現(xiàn)出人類業(yè)餘選手的水平。

總的來說,研究的貢獻(xiàn)包括:

  1. 提出一個分層和模組化的策略架構(gòu),其中包括:

  2. 低階控制器及其詳細(xì)的技能描述器,這些描述器對智能體的能力進(jìn)行建模並有助於彌合模擬與真實(shí)的差距;

  3. 選擇低階技能的高階控制器。

  4. 實(shí)現(xiàn)零樣本模擬到真實(shí)的技術(shù),包括定義基於現(xiàn)實(shí)世界的任務(wù)分佈的迭代方法,並定義自動課程(automatic curriculum)。

  5. 即時適應(yīng)未見過的對手。

方法介紹

該智能體由一個低階技能庫和一個高階控制器組成。低階技能庫專注於乒乓球的某個特定方面,例如正手上旋球、反手瞄準(zhǔn)或正手發(fā)球。除了包含訓(xùn)練策略,研究還在線上下和線上收集和儲存有關(guān)每個低階技能的優(yōu)勢、劣勢和限制的資訊。而負(fù)責(zé)協(xié)調(diào)低階技能的高階控制器會根據(jù)當(dāng)前遊戲統(tǒng)計(jì)、技能描述選擇最佳技能。

此外,該研究還收集了少量的人類和人類對打的比賽數(shù)據(jù),作為初始任務(wù)條件的種子,數(shù)據(jù)集包括位置、速度和旋轉(zhuǎn)的資訊。然後使用強(qiáng)化學(xué)習(xí)在模擬環(huán)境中訓(xùn)練智能體, 並採用一些現(xiàn)有技術(shù),將策略無縫部署到真實(shí)硬體中。?

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者
該智能體與人類一起對打以產(chǎn)生更多訓(xùn)練數(shù)據(jù),隨著機(jī)器人的持續(xù)學(xué)習(xí),遊戲標(biāo)準(zhǔn)變得越來越複雜,以此讓智能體學(xué)習(xí)越來越複雜的動作。這種混合的「模擬 - 現(xiàn)實(shí)」循環(huán)創(chuàng)建了一個自動教學(xué),使機(jī)器人的技能隨著時間的推移而不斷提高。?

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

Layered control

Layered control mainly includes the following parts:

  • Table tennis playing style: The high-level controller (HLC, high-level controller) first decides which playing style to use (forehand or Backhand);

  • Adjustment: Maintain each HLC's preference (H value) online based on statistics from matches against opponents;

  • Select the most effective skill: HLC pairs shortlisted players based on adjusted H value Sampling by LLC;

  • Updates: H-values ??and opponent statistics are updated until the end of the game.

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

Results

The researchers compared the agent with 29 table tennis players of different levels, including beginners, intermediate, advanced and advanced + skills. Human players played three games against the robot according to standard table tennis rules, but the rules were slightly modified because the robot was unable to serve.

Facing all opponents, the robot won 45% of matches and 46% of games. Broken down by skill level, the bot won all its matches against beginners, lost all its matches against Advanced and Advanced+ players, and won 55% of its matches against Intermediate players. This shows that the agent reaches the level of an intermediate human player in table tennis rounds.

The reason why robots cannot beat advanced players is due to physical and technical limitations, including reaction speed, camera sensing capabilities, rotation processing, etc., which are difficult to accurately model in a simulation environment.

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

Sparring with robots is also very attractive

Research participants said that they enjoyed playing with robots very much and gave the robots high ratings in terms of "interesting" and "attractive" . They also unanimously expressed that they were "very willing" to fight the robot again. During free time, they played with the robot for an average of 4 minutes and 06 seconds over 5 minutes.

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者
DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

The robot is not good at backspin

The participant with the best skills mentioned that the robot is not good at handling backspin. To test this observation, the researchers plotted the robot's landing rate against the ball's spin, and the results showed that the robot's landing rate dropped significantly as it faced more backspin balls. This flaw is partly caused by the robot trying to avoid colliding with the table when handling low balls, and secondly by the fact that it is really difficult to determine the ball's spin in real time.

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

Reference link:

https://sites.google.com/view/competitive-robot-table-tennis/home?utm_source&utm_medium&utm_campaign&utm_content&pli=1

以上是DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園裡的老大爺?巴黎奧運(yùn)正在如火如荼地進(jìn)行中,乒乓球項(xiàng)目備受關(guān)注。同時,機(jī)器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達(dá)到人類業(yè)餘選手等級的學(xué)習(xí)型機(jī)器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機(jī)器人打乒乓球什麼程度呢?大概和人類業(yè)餘選手不相上下:正手反手都會:對手採用多種打法,機(jī)器人也能招架得?。航硬煌D(zhuǎn)的發(fā)球:不過,比賽激烈程度似乎不如公園老大爺對戰(zhàn)。對機(jī)器人來說,乒乓球運(yùn)動

首配機(jī)械爪!元蘿蔔亮相2024世界機(jī)器人大會,發(fā)布首個走進(jìn)家庭的西洋棋機(jī)器人 首配機(jī)械爪!元蘿蔔亮相2024世界機(jī)器人大會,發(fā)布首個走進(jìn)家庭的西洋棋機(jī)器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機(jī)器人大會在北京隆重召開。商湯科技旗下家用機(jī)器人品牌「元蘿蔔SenseRobot」家族全系產(chǎn)品集體亮相,並最新發(fā)布元蘿蔔AI下棋機(jī)器人-國際象棋專業(yè)版(以下簡稱「元蘿蔔國象機(jī)器人」),成為全球首個走進(jìn)家庭的西洋棋機(jī)器人。作為元蘿蔔的第三款下棋機(jī)器人產(chǎn)品,全新的國象機(jī)器人在AI和工程機(jī)械方面進(jìn)行了大量專項(xiàng)技術(shù)升級和創(chuàng)新,首次在家用機(jī)器人上實(shí)現(xiàn)了透過機(jī)械爪拾取立體棋子,並進(jìn)行人機(jī)對弈、人人對弈、記譜複盤等功能,

Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學(xué)將至,該收心的不只即將開啟新學(xué)期的同學(xué),可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網(wǎng)友。 「它的水平下降了很多,經(jīng)常停頓,甚至輸出也變得很短。在發(fā)布的第一周,它可以一次性翻譯整整4頁文稿,現(xiàn)在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

李飛飛團(tuán)隊(duì)提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o 李飛飛團(tuán)隊(duì)提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機(jī)器人學(xué)習(xí)的深度融合。當(dāng)兩隻機(jī)器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機(jī)器人NEO,你可能會產(chǎn)生一種感覺:我們似乎開始進(jìn)入機(jī)器人時代了。事實(shí)上,這些絲滑動作正是先進(jìn)機(jī)器人技術(shù)+精妙框架設(shè)計(jì)+多模態(tài)大模型的產(chǎn)物。我們知道,有用的機(jī)器人往往需要與環(huán)境進(jìn)行複雜精妙的交互,而環(huán)境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機(jī)器人倒茶,那麼機(jī)器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩(wěn)移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

分散式人工智慧盛會DAI 2024徵稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報(bào)告 分散式人工智慧盛會DAI 2024徵稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報(bào)告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的快速發(fā)展,人工智慧成為了推動社會進(jìn)步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創(chuàng)新與應(yīng)用。分散式人工智慧是人工智慧領(lǐng)域的重要分支,這幾年引起了越來越多的關(guān)注。基於大型語言模型(LLM)的智能體(Agent)異軍突起,透過結(jié)合大模型的強(qiáng)大語言理解和生成能力,展現(xiàn)了在自然語言互動、知識推理、任務(wù)規(guī)劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au

鴻蒙智行享界S9全場景新品發(fā)表會,多款重磅新品齊發(fā) 鴻蒙智行享界S9全場景新品發(fā)表會,多款重磅新品齊發(fā) Aug 08, 2024 am 07:02 AM

今天下午,鴻蒙智行正式迎來了新品牌與新車。8月6日,華為舉行鴻蒙智行享界S9及華為全場景新品發(fā)布會,帶來了全景智慧旗艦轎車享界S9、問界新M7Pro和華為novaFlip、MatePadPro12.2英寸、全新MatePadAir、華為畢昇激光打印機(jī)X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全場景智慧新品,從智慧出行、智慧辦公到智能穿戴,華為全場景智慧生態(tài)持續(xù)構(gòu)建,為消費(fèi)者帶來萬物互聯(lián)的智慧體驗(yàn)。鴻蒙智行:深度賦能,推動智能汽車產(chǎn)業(yè)升級華為聯(lián)合中國汽車產(chǎn)業(yè)伙伴,為

世界機(jī)器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機(jī)器人被包圍了 世界機(jī)器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機(jī)器人被包圍了 Aug 22, 2024 pm 10:35 PM

在北京舉行的世界機(jī)器人大會上,人形機(jī)器人的展示成為了現(xiàn)場絕對的焦點(diǎn),在星塵智能的展臺上,由於AI機(jī)器人助理S1在一個展區(qū)上演揚(yáng)琴、武術(shù)、書法三臺大戲,能文能武,吸引了大量專業(yè)觀眾和媒體的駐足。在有彈性的琴弦上優(yōu)雅的演奏,讓S1展現(xiàn)出速度、力度、精準(zhǔn)度兼具的精細(xì)操作與絕對掌控。央視新聞對「書法」背後的模仿學(xué)習(xí)和智慧控制進(jìn)行了專題報(bào)道,公司創(chuàng)始人來傑解釋到,絲滑動作的背後,是硬體側(cè)追求最好力控和最仿人身體指標(biāo)(速度、負(fù)載等),而是在AI側(cè)則採集人的真實(shí)動作數(shù)據(jù),讓機(jī)器人遇強(qiáng)則強(qiáng),快速學(xué)習(xí)進(jìn)化。而敏捷

ACL 2024獎項(xiàng)發(fā)表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗(yàn)獎 ACL 2024獎項(xiàng)發(fā)表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗(yàn)獎 Aug 15, 2024 pm 04:37 PM

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計(jì)算語言學(xué)和自然語言處理領(lǐng)域的頂級國際會議,由國際計(jì)算語言學(xué)協(xié)會組織,每年舉辦一次。一直以來,ACL在NLP領(lǐng)域的學(xué)術(shù)影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領(lǐng)域的前沿工作。昨天下午,大會公佈了最佳論文等獎項(xiàng)。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

See all articles