Новата AI разработка е стъпка към създаване на универсален изкуствен интелект, който може да овладее задачи от всякакво ниво на сложност – от управление на роботи до анализиране на данни, използвайки един набор от правила.
DreamerV3 работи чрез „вътрешен симулатор”, или невронна мрежа, която предвижда последствията от действията така, както шахматист изчислява ходовете си. Създавайки виртуален сценарий, алгоритъмът оценява неговата стойност от втора мрежа („критик”) и избира оптималното решение от трета („актьор”).
Например, за да намери диамант в Minecraft, системата последователно се учи да изсича дърво, да създава кирка и да изследва пещери, без външни инструкции, само чрез събуждане на интерес към целта.
Основното предимство на DreamerV3 е стабилността. За разлика от класическите алгоритми като PPO, които изискват фина настройка за всяка задача, новият AI запазва едни и същи параметри за всички 150 тестови сценария, от аркадни игри до управление на роботи.
Това се постига чрез балансиране на данните: системата автоматично настройва скалата на наградите, като избягва изкривявания в обучението. Например, в среди, където наградите са рядкост (като диамантите в Minecraft), алгоритъмът увеличава „любопитството”, като изследва повече опции.
DreamerV3 е първият в Minecraft, който добива диаманти “от нулата”, преминавайки през 12 етапа – от изсичане на дървета до търсене на редки минерали. Това демонстрира способността му за дългосрочно планиране при непредвидими условия, което е важно за истинските роботи, действащи в променяща се среда.
Учените виждат бъдещето на технологиите в комбинирането на обучение с видеоклипове от интернет. Например, робот-асистент може да усвоява умения, като наблюдава хора.
DreamerV3 вече е мащабируем: колкото повече изчислителни ресурси ползва, толкова по-висока е ефективността. Това отваря пътя към системи, които не просто изпълняват задачи, а се адаптират към нови предизвикателства – от интелигентни фабрики до автономни автомобили – и могат да мислят една крачка напред.