Odprto robotsko okolje


Odprta platforma za umetno inteligenco Hugging Face začenja svoj naslednji ambiciozni projekt: odprto okolje za robotiko.

Razvil ga bo znanstvenik Remi Cadene, kot je sporočil prek X (prej Twitter). Cadene je pred tem delal pri Tesli pri razvoju avtopilota in humanoidnega vsestranskega robota Optimus. Njegovo znanstveno delo se osredotoča na mehanizme, na katerih temelji inteligenca, in zlasti na reprodukcijo človeškega vedenja s pomočjo umetnih nevronskih mrež. V ta namen raziskuje nove arhitekture, metode učenja, teoretične okvire in zlasti pristope za razlago rezultatov in procesov odločanja sistemov umetne inteligence.

Podjetje Hugging Face je že razpisalo novo delovno mesto za nov projekt: iščejo inženirje robotike, ki bodo razvili poceni robotski sistem na podlagi odprte kode in globokega učenja. Njihove naloge bodo vključevale razvoj algoritmov za načrtovanje in nadzor gibanja ter zaznavanje in navigacijo.

Od svoje ustanovitve leta 2016 je Huggingface postal platforma par excellence za razvoj, izmenjavo in primerjalno analizo odprtih sistemov strojnega učenja. Infrastrukturo upravlja istoimensko francosko-ameriško podjetje. Pomembna storitev je knjižnica Transformers, ki uporabnikom sistema Huggingface zagotavlja odprtokodne implementacije modelov za slikovne, besedilne in zvočne naloge. Leta 2021 je podjetje Huggingface sprožilo pobudo BigScience za razvoj odprtokodnega modela LLM (Large Language Model) kot protiuteži lastniškim jezikovnim umetnim inteligencam podjetij OpenAI, Meta in Google. Leto pozneje je mreža neodvisnih raziskovalcev in manjših podjetij predstavila model BLOOM s 176 milijardami parametrov.

S svojim načrtovanim projektom robotike je podjetje Hugging Face naredilo logičen naslednji korak. Strojno usposobljeni sistemi namreč postajajo vse bolj multimodalni, kar pomeni, da hkrati obdelujejo vse več vrst vhodnih podatkov in jih prikazujejo na različne načine. Trenutno večinoma združujejo slike in besedilo, vendar se v usposabljanje multimodalnih modelov vse pogosteje vključujejo tudi avdio, video in senzorski podatki. Osrednji gradniki multimodalnih umetnih inteligenc so veliki jezikovni modeli, kot sta GPT ali LLaMA, saj so že ponotranjili precej obsežno znanje o svetu in ga pogosto znajo presenetljivo dobro uporabiti. Zato se z modeli LLMA vse pogosteje eksperimentira v robotiki, na primer za prevajanje kratkih navodil uporabnikov v podrobne zaporedne načrte za robote.

Več…

Comments are closed.