Подписывайся! Будь в курсе последних новостей
подписаться

Автор Администратор Сайта

МОСКВА, 22 марта. /Новости науки/. Системы искусственного интеллекта (ИИ) и дата-центры в США потребили в 2024 году около 415 Террават часов электроэнергии, что превышает 10% всей годовой выработки страны, к 2030 году этот показатель, как ожидается, может удвоиться, пишет сайт Nature.

Резкий рост энергопотребления ИИ становится одной из ключевых проблем отрасли. Крупные серверные комплексы, обслуживающие современные модели, уже могут расходовать сотни мегаватт мощности — это сопоставимо с потреблением небольшого или среднего города.

Чтобы предложить более устойчивый вариант развития, группа ученых из Университета Тафтса разработала концепцию нейросимволического искусственного интеллекта, в основе которого обычные нейросети, хорошо распознающие образы и закономерности, с символьным рассуждением — более формальным уровнем обработки, при котором система использует правила, категории и логические шаги, похожие на те, что применяет человек при решении задач.

Ученые работают не с привычными чат-ботами, а с так называемыми визуально-языковыми моделями действий, или VLA. Это ИИ-системы для роботов, которые получают данные с камер и из языковых команд, а затем должны выполнять действия в реальном мире — например, перемещать колеса, руки, пальцы или складывать предметы.

При традиционном подходе такая модель, если попросить робота построить простую башню из кубиков, должна одновременно распознать положение объектов, их форму, ориентацию и смысл команды, а затем на основе этого сгенерировать действие. Но в реальности система может ошибиться — например, неправильно интерпретировать форму объекта из-за тени, неверно поставить деталь или построить неустойчивую конструкцию.

Исследователи сравнивают это с ошибками больших языковых моделей, которые иногда выдают ложные ответы, придумывают несуществующие истории или рисуют людей с шестью пальцами. По их мнению, одна из причин таких ошибок в том, что система фактически пытается предсказать следующее слово или следующее действие в последовательности, а не опирается на более строгую логическую структуру.

Нейросимволический подход, как объясняют ученые, работает иначе. Он использует более общие стратегии планирования, основанные на правилах задачи и абстрактных категориях — например, на форме объектов или центре масс. Это позволяет системе тратить меньше ресурсов на перебор и обучение.

В испытаниях на классической задаче «Ханойская башня» нейросимволическая модель показала успешность 95%, тогда как обычные VLA-системы справились лишь в 34% случаев. В более сложной версии задачи, которой робот не встречал в обучении, нейросимволическая система достигла 78% успешности, а стандартные модели не справились ни с одной попыткой.

Разница оказалась существенной и по времени обучения. Нейросимволическую систему удалось обучить за 34 минуты, тогда как стандартной модели потребовалось более полутора суток.

Еще заметнее оказался выигрыш по энергии. По данным исследователей, на обучение нейросимволической модели ушел всего 1% той энергии, которая требовалась для обучения обычной VLA-модели. При выполнении задач новая система также оказалась значительно экономичнее, используя лишь около 5% энергии, необходимой стандартному решению.

Авторы исследования отмечают, что энергозатраты привычных сервисов на базе больших языковых моделей часто оказываются несоразмерны реальной задаче. Например, ИИ-сводка в верхней части поисковой выдачи Google может потреблять до 100 раз больше энергии, чем формирование обычного списка ссылок.

На фоне стремительного роста спроса на ИИ и его внедрения в промышленность это создает все более жесткую гонку за строительство новых дата-центров и увеличение вычислительных мощностей. Исследователи считают, что одних только масштабов в этой гонке недостаточно и что нынешние большие языковые и визуально-языковые модели, несмотря на популярность, вряд ли являются оптимальной основой для энергоэффективного и надежного ИИ будущего.