国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 科技周邊 人工智能 DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

Aug 09, 2024 pm 04:01 PM
deepmind 產(chǎn)業(yè) 乒乓球機(jī)器人

但可能打不過公園里的老大爺?

巴黎奧運(yùn)會正在如火如荼地進(jìn)行中,乒乓球項(xiàng)目備受關(guān)注。與此同時(shí),機(jī)器人打乒乓球也取得了新突破。

剛剛,DeepMind 提出了第一個(gè)在競技乒乓球比賽中達(dá)到人類業(yè)余選手水平的學(xué)習(xí)型機(jī)器人智能體。

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

論文地址:https://arxiv.org/pdf/2408.03906

DeepMind 這個(gè)機(jī)器人打乒乓球什么水平呢?大概和人類業(yè)余選手不相上下:

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

正手反手都會:

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

對手采用多種打法,該機(jī)器人也能招架得?。?/p>

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

接不同旋轉(zhuǎn)的發(fā)球:

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

不過,比賽激烈程度似乎不如公園老大爺對戰(zhàn)。

對機(jī)器人來說,乒乓球運(yùn)動(dòng)需要掌握復(fù)雜的低水平技能和策略性玩法,需要長期訓(xùn)練。DeepMind 認(rèn)為戰(zhàn)略上次優(yōu)但可以熟練地執(zhí)行低水平技能可能是更好的選擇。這使乒乓球與國際象棋、圍棋等純粹的戰(zhàn)略游戲區(qū)分開來。

因此,乒乓球是提升機(jī)器人能力的一個(gè)有價(jià)值的基準(zhǔn),包括高速運(yùn)動(dòng)、實(shí)時(shí)精確和戰(zhàn)略決策、系統(tǒng)設(shè)計(jì)以及與人類對手直接競爭。

對于這一點(diǎn),Google DeepMind 首席科學(xué)家稱贊道:「乒乓球機(jī)器人將有助于我們解決高速控制和感知問題?!?/p>

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

該研究進(jìn)行了 29 場機(jī)器人與人類的乒乓球比賽,其中機(jī)器人獲勝 45% (13/29)。所有人類選手都是機(jī)器人未見過的玩家,從初學(xué)者到錦標(biāo)賽選手能力不等。

雖然該機(jī)器人輸?shù)袅怂信c最高級別玩家的比賽,但它贏得了 100% 的與初學(xué)者的比賽,在與中級選手的對戰(zhàn)中贏得了 55% 的比賽,展現(xiàn)出人類業(yè)余選手的水平。

總的來說,該研究的貢獻(xiàn)包括:

  1. 提出一個(gè)分層和模塊化的策略架構(gòu),其中包括:

  2. 低級控制器及其詳細(xì)的技能描述器,這些描述器對智能體的能力進(jìn)行建模并有助于彌合模擬與真實(shí)的差距;

  3. 選擇低級技能的高級控制器。

  4. 實(shí)現(xiàn)零樣本模擬到真實(shí)的技術(shù),包括定義基于現(xiàn)實(shí)世界的任務(wù)分布的迭代方法,并定義自動(dòng)課程(automatic curriculum)。

  5. 實(shí)時(shí)適應(yīng)未見過的對手。

方法介紹

該智能體由一個(gè)低級技能庫和一個(gè)高級控制器組成。低級技能庫專注于乒乓球的某個(gè)特定方面,例如正手上旋球、反手瞄準(zhǔn)或正手發(fā)球。除了包含訓(xùn)練策略,該研究還在線下和線上收集和存儲有關(guān)每個(gè)低級技能的優(yōu)勢、劣勢和局限性的信息。而負(fù)責(zé)協(xié)調(diào)低級技能的高級控制器會根據(jù)當(dāng)前游戲統(tǒng)計(jì)數(shù)據(jù)、技能描述選擇最佳技能。

此外,該研究還收集了少量的人類和人類對打的比賽數(shù)據(jù),作為初始任務(wù)條件的種子,數(shù)據(jù)集包括位置、速度和旋轉(zhuǎn)的信息。然后使用強(qiáng)化學(xué)習(xí)在模擬環(huán)境中訓(xùn)練智能體, 并采用一些現(xiàn)有技術(shù),將策略無縫部署到真實(shí)硬件中。?

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

該智能體與人類一起對打以生成更多訓(xùn)練數(shù)據(jù),隨著機(jī)器人的持續(xù)學(xué)習(xí),游戲標(biāo)準(zhǔn)變得越來越復(fù)雜,以此讓智能體學(xué)習(xí)越來越復(fù)雜的動(dòng)作。這種混合的「模擬 - 現(xiàn)實(shí)」循環(huán)創(chuàng)建了一個(gè)自動(dòng)教學(xué),使機(jī)器人的技能隨著時(shí)間的推移不斷提高。?

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

分層控制

分層控制主要包含以下部分:

  • 乒乓球打法:高級控制器(HLC,high-level controller)首先決定使用哪種打法(正手還是反手);

  • 調(diào)整:根據(jù)與對手比賽中的統(tǒng)計(jì)數(shù)據(jù),在線維護(hù)每個(gè) HLC 的偏好(H 值);

  • 選擇最有效的技能:HLC 根據(jù)調(diào)整后的 H 值對入圍的 LLC 進(jìn)行抽樣;

  • 更新:H 值和對手統(tǒng)計(jì)數(shù)據(jù)會持續(xù)更新,直至比賽結(jié)束。

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

結(jié)果

研究者將該智能體與 29 名不同水平的乒乓選手進(jìn)行了對比,選手包括初學(xué)者、中級、高級和高級 + 技能。人類選手按照標(biāo)準(zhǔn)乒乓球規(guī)則與機(jī)器人進(jìn)行了三場比賽,但由于機(jī)器人無法發(fā)球,因此規(guī)則稍作修改。

面對所有對手,機(jī)器人贏得了 45% 的比賽(match)和 46% 的單局勝利(game)。按照技能水平細(xì)分,機(jī)器人贏得了與初學(xué)者的所有比賽,輸?shù)袅伺c高級和高級 + 選手的所有比賽,贏得了 55% 與中級選手的比賽。這表明該智能體在乒乓球回合中達(dá)到了中級人類選手的水平。?

機(jī)器人打不過高級玩家的原因在于物理和技術(shù)的限制,包括反應(yīng)速度,相機(jī)感應(yīng)能力,旋轉(zhuǎn)處理等,這是很難在模擬環(huán)境中準(zhǔn)確建模的。

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

與機(jī)器人對打,也很吸引人

研究參與者表示,他們非常享受與機(jī)器人一起對打,并在「有趣」和「吸引人」方面給予了機(jī)器人很高的評價(jià)。他們也一致表示「非常愿意」再次與機(jī)器人對打。在自由時(shí)間里,他們平均在 5 分鐘的時(shí)間里與機(jī)器人玩了 4 分 06 秒。

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者
DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

機(jī)器人不擅長下旋球

技能最好的參與者提到,機(jī)器人不擅長處理下旋。為了測試這一觀察結(jié)果,研究人員根據(jù)球的旋轉(zhuǎn)繪制了機(jī)器人的著陸率,根據(jù)結(jié)果可以看到,機(jī)器人在面對更多的下旋球時(shí),著陸率大幅下降。這一缺陷部分是由于機(jī)器人在處理低球時(shí),為了避免與桌子碰撞導(dǎo)致的,其次是實(shí)時(shí)確定球的旋轉(zhuǎn)確實(shí)很難。

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者

參考鏈接:

https://sites.google.com/view/competitive-robot-table-tennis/home?utm_source&utm_medium&utm_campaign&utm_content&pli=1

以上是DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 DeepMind機(jī)器人打乒乓球,正手、反手溜到飛起,全勝人類初學(xué)者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園里的老大爺?巴黎奧運(yùn)會正在如火如荼地進(jìn)行中,乒乓球項(xiàng)目備受關(guān)注。與此同時(shí),機(jī)器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個(gè)在競技乒乓球比賽中達(dá)到人類業(yè)余選手水平的學(xué)習(xí)型機(jī)器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個(gè)機(jī)器人打乒乓球什么水平呢?大概和人類業(yè)余選手不相上下:正手反手都會:對手采用多種打法,該機(jī)器人也能招架得住:接不同旋轉(zhuǎn)的發(fā)球:不過,比賽激烈程度似乎不如公園老大爺對戰(zhàn)。對機(jī)器人來說,乒乓球運(yùn)動(dòng)

首配機(jī)械爪!元蘿卜亮相2024世界機(jī)器人大會,發(fā)布首個(gè)走進(jìn)家庭的國際象棋機(jī)器人 首配機(jī)械爪!元蘿卜亮相2024世界機(jī)器人大會,發(fā)布首個(gè)走進(jìn)家庭的國際象棋機(jī)器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機(jī)器人大會在北京隆重召開。商湯科技旗下家用機(jī)器人品牌“元蘿卜SenseRobot”家族全系產(chǎn)品集體亮相,并最新發(fā)布元蘿卜AI下棋機(jī)器人——國際象棋專業(yè)版(以下簡稱“元蘿卜國象機(jī)器人”),成為全球首個(gè)走進(jìn)家庭的國際象棋機(jī)器人。作為元蘿卜的第三款下棋機(jī)器人產(chǎn)品,全新的國象機(jī)器人在AI和工程機(jī)械方面進(jìn)行了大量專項(xiàng)技術(shù)升級和創(chuàng)新,首次在家用機(jī)器人上實(shí)現(xiàn)了通過機(jī)械爪拾取立體棋子,并進(jìn)行人機(jī)對弈、人人對弈、記譜復(fù)盤等功能,

Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Claude也變懶了!網(wǎng)友:學(xué)會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學(xué)將至,該收心的不止有即將開啟新學(xué)期的同學(xué),可能還有AI大模型。前段時(shí)間,Reddit上擠滿了吐槽Claude越來越懶的網(wǎng)友?!杆乃较陆盗撕芏?,經(jīng)常停頓,甚至輸出也變得很短。在發(fā)布的第一周,它可以一次性翻譯整整4頁文稿,現(xiàn)在連半頁都輸出不了了!」https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個(gè)名為「對Claude徹底失望了的帖子里」,滿滿地

李飛飛團(tuán)隊(duì)提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o 李飛飛團(tuán)隊(duì)提出ReKep,讓機(jī)器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機(jī)器人學(xué)習(xí)的深度融合。當(dāng)兩只機(jī)器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時(shí),加上最近老上頭條的1X人形機(jī)器人NEO,你可能會產(chǎn)生一種感覺:我們似乎開始進(jìn)入機(jī)器人時(shí)代了。事實(shí)上,這些絲滑動(dòng)作正是先進(jìn)機(jī)器人技術(shù)+精妙框架設(shè)計(jì)+多模態(tài)大模型的產(chǎn)物。我們知道,有用的機(jī)器人往往需要與環(huán)境進(jìn)行復(fù)雜精妙的交互,而環(huán)境則可被表示成空間域和時(shí)間域上的約束。舉個(gè)例子,如果要讓機(jī)器人倒茶,那么機(jī)器人首先需要抓住茶壺手柄并使之保持直立,不潑灑出茶水,然后平穩(wěn)移動(dòng),一直到讓壺口與杯口對齊,之后以一定角度傾斜茶壺。這

分布式人工智能盛會DAI 2024征稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報(bào)告 分布式人工智能盛會DAI 2024征稿:Agent Day,強(qiáng)化學(xué)習(xí)之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學(xué)家將做主旨報(bào)告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的飛速發(fā)展,人工智能已經(jīng)成為了推動(dòng)社會進(jìn)步的重要力量。在這個(gè)時(shí)代,我們有幸見證并參與到分布式人工智能(DistributedArtificialIntelligence,DAI)的創(chuàng)新與應(yīng)用中。分布式人工智能是人工智能領(lǐng)域的重要分支,這幾年引起了越來越多的關(guān)注?;诖笮驼Z言模型(LLM)的智能體(Agent)異軍突起,通過結(jié)合大模型的強(qiáng)大語言理解和生成能力,展現(xiàn)出了在自然語言交互、知識推理、任務(wù)規(guī)劃等方面的巨大潛力。AIAgent正在接棒大語言模型,成為當(dāng)前AI圈的熱點(diǎn)話題。Au

鴻蒙智行享界S9及全場景新品發(fā)布會,多款重磅新品齊發(fā) 鴻蒙智行享界S9及全場景新品發(fā)布會,多款重磅新品齊發(fā) Aug 08, 2024 am 07:02 AM

今天下午,鴻蒙智行正式迎來了新品牌與新車。 8月6日,華為舉行鴻蒙智行享界S9及華為全場景新品發(fā)布會,帶來了全景智慧旗艦轎車享界S9、問界新M7Pro和華為novaFlip、MatePadPro12.2英寸、全新MatePadAir、華為畢升激光打印機(jī)X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全場景智慧新品,從智慧出行、智慧辦公到智能穿戴,華為全場景智慧生態(tài)持續(xù)構(gòu)建,為消費(fèi)者帶來萬物互聯(lián)的智慧體驗(yàn)。鴻蒙智行:深度賦能,推動(dòng)智能汽車產(chǎn)業(yè)升級華為聯(lián)合中國汽車產(chǎn)業(yè)伙伴,為

世界機(jī)器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機(jī)器人被包圍了 世界機(jī)器人大會上,這家承載「未來養(yǎng)老希望」的國產(chǎn)機(jī)器人被包圍了 Aug 22, 2024 pm 10:35 PM

正在北京舉行的世界機(jī)器人大會上,人形機(jī)器人的展示成為了現(xiàn)場絕對的焦點(diǎn),在星塵智能的展臺上,由于AI機(jī)器人助理S1在一個(gè)展區(qū)上演揚(yáng)琴、武術(shù)、書法三臺大戲,能文能武,吸引了大量專業(yè)觀眾和媒體的駐足。在帶彈性的琴弦上的優(yōu)雅演奏,讓S1展現(xiàn)出速度、力度、精度兼具的精細(xì)操作和絕對掌控。央視新聞對「書法」背后的模仿學(xué)習(xí)和智能控制進(jìn)行了專題報(bào)道,公司創(chuàng)始人來杰解釋到,絲滑動(dòng)作的背后,是硬件側(cè)追求最好力控和最仿人身體指標(biāo)(速度、負(fù)載等),而是在AI側(cè)則采集人的真實(shí)動(dòng)作數(shù)據(jù),讓機(jī)器人遇強(qiáng)則強(qiáng),快速學(xué)習(xí)進(jìn)化。而敏捷

ACL 2024獎(jiǎng)項(xiàng)公布:華科大破譯甲骨文最佳論文之一、GloVe時(shí)間檢驗(yàn)獎(jiǎng) ACL 2024獎(jiǎng)項(xiàng)公布:華科大破譯甲骨文最佳論文之一、GloVe時(shí)間檢驗(yàn)獎(jiǎng) Aug 15, 2024 pm 04:37 PM

本屆ACL大會,投稿者「收獲滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。ACL是計(jì)算語言學(xué)和自然語言處理領(lǐng)域的頂級國際會議,由國際計(jì)算語言學(xué)協(xié)會組織,每年舉辦一次。一直以來,ACL在NLP領(lǐng)域的學(xué)術(shù)影響力都位列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400余篇NLP領(lǐng)域的前沿工作。昨天下午,大會公布了最佳論文等獎(jiǎng)項(xiàng)。此次,最佳論文獎(jiǎng)7篇(兩篇未公開)、最佳主題論文獎(jiǎng)1篇、杰出論文獎(jiǎng)35篇。大會還評出了資源論文獎(jiǎng)(ResourceAward)3篇、社會影響力獎(jiǎng)(

See all articles