Google ir izlaidusi jaunu robota modeli RT-1, kas ir līdzīgs GPT modelim, ko izmanto tā OpenAI mākslīgā intelekta programmā. Jaunais modelis ir izstrādāts, ņemot vērā citas Google robotikas programmas, tostarp bezvadītāja automašīnu programmu. Šeit parādītais RT-1 modelis ir solis pretī ģeneratīviem AI modeļiem robotikas jomā. Reālajā pasaulē RT-1 var izpildīt vairāk nekā 700 instrukcijas ar 97% panākumu līmeni.

Nesenie sasniegumi mašīnmācīšanās (ML) pētniecībā, piemēram, datorredze un dabiskās valodas apstrāde, ir nodrošināti ar kopīgu pieeju, kas izmanto lielas, dažādas datu kopas un izteiksmīgus modeļus. Lai gan ir bijuši dažādi mēģinājumi piemērot šo pieeju robotikai, roboti līdz šim nav tik daudz izmantojuši augsti spējīgus modeļus kā citas apakšjomas.
Modelis kodē rakstisku komandu un attēlu kopu kā marķierus, izmantojot iepriekš apmācītu FiLM EfficientNet modeli, pirms tie tiek saspiesti, izmantojot TokenLearner. Tāda ir RT-1 arhitektūra. Pēc tam transformators tos saņem un izveido darbības marķierus.
Izstrādātāji apkopoja lielu, daudzveidīgu robotu trajektoriju datu kopu, lai izstrādātu sistēmu, kas varētu vispārināt jaunus uzdevumus un demonstrēt noturību pret dažādiem traucējošiem faktoriem un fona. Lai savāktu 130 000 sēriju 17 mēnešu laikā, viņi izvietoja 13 EDR robotu manipulatorus, no kuriem katram ir 7 brīvības pakāpju roka, divu pirkstu satvērējs un mobilā bāze. Pētnieki izmantoja cilvēku piemērus, kas iegūti, izmantojot attālo teleoperāciju, un katru notikumu atzīmēja ar rakstisku paskaidrojumu par komandu, ko robots tikko izpildīja. Objektu paņemšana un kārtošana, atvilktņu atvēršana un aizvēršana, priekšmetu ievietošana atvilktnēs un izņemšana no tām, iegarenu priekšmetu novietošana vertikāli, priekšmetu apgāšana, salvešu vilkšana un burku atvēršana ir viena no datu kopā iekļautajām augsta līmeņa prasmēm.
Nākamajā videoklipā ir parādīti daži PaLM-SayCan-RT1 ilgtermiņa uzdevumu izpildes paraugi vairākās faktiskajās virtuvēs.
Visās četrās jomās RT-1 darbojas ievērojami labāk nekā bāzes līnijas, parādot izcilu vispārināšanas un noturības līmeni.

RT-1 Robotics Transformer ir darbības paaudzes modelis reāliem robotikas uzdevumiem, kas ir vienkāršs un mērogojams. Tas marķieri visas ievades un izvades un saspiež tās, izmantojot iepriekš apmācītu EfficientNet modeli ar agrīnu valodu saplūšanu un marķiera apguvēju. RT-1 demonstrē spēcīgu veiktspēju simtiem uzdevumu, kā arī plašu vispārināšanu un robustumu reālās pasaules iestatījumos.
Uzziniet vairāk:
GPT-3: Vai tas tiešām var paredzēt ASV nākotni nākamajiem 5 gadiem?
OpenAI atjaunināts GPT-3: augstāka rakstīšanas kvalitāte un ilgāka teksta iespēja
Sber AI ir prezentējis Kandinsky 2.0, pirmo teksta pārveides modeli, kas paredzēts ģenerēšanai vairāk nekā 100 valodās
Ziņa Google izlaiž “GPT līdzīgu” robota modeli, RT-1 vispirms parādījās vietnē Metaverse Post.

