BOMBA.PRESS© 2025
О насРекламаКонтактыПолитика конфиденциальностиУсловия использованияПолитика cookiesДоступность
Логотип BOMBA.Press
BOMBA.PressНовости Израиля
технологии17 декабря 2025, 14:15

Агенты ИИ терпят неудачу при выполнении сложных задач в 63% случаев. Patronus AI предлагает новый подход к обучению

Patronus AI, получивший $20 млн инвестиций, представил технологию Generative Simulators — систему обучения агентов ИИ в динамичных, постоянно меняющихся виртуальных средах. Это призвано повысить эффективность выполнения сложных, многоступенчатых задач, где традиционные методы часто терпят неудачу.

Агенты ИИ терпят неудачу при выполнении сложных задач в 63% случаев. Patronus AI предлагает новый подход к обучению

Patronus AI — израильско-американский стартап, специализирующийся на оценке и обучении искусственного интеллекта, объявил о запуске новой архитектуры обучения для агентов ИИ. Технология, названная Generative Simulators, создает адаптивные симуляции, которые генерируют задачи в реальном времени, динамически меняют правила и оценивают работу ИИ по мере его обучения.

Традиционные тесты ИИ, по мнению компании, недостаточно отражают сложность реальных условий, поскольку они базируются на статичных сценариях и не учитывают переключения контекста и многоуровневые решения. Результаты исследований показывают, что даже при 1% ошибке на каждом шаге вероятность провала в сложных задачах с сотней этапов достигает 63%, что значительно ограничивает применение автономных ИИ-систем в бизнесе и технологиях.

В основе Generative Simulators лежит метод обучения с подкреплением — система, в которой ИИ учится на ошибках, получая награды за правильные действия и штрафы за ошибки. Однако техническое новшество Patronus AI — это возможность непрерывного самосовершенствования (Open Recursive Self-Improvement), когда агент не требует полного переобучения, а адаптируется и развивается в ходе взаимодействия с постоянно меняющейся средой.

Ключевой элемент системы — «корректор учебной программы», который динамически настраивает сложность и содержание задач, подстраиваясь под уровень агента. Это аналогично тому, как опытный преподаватель адаптирует материал под ученика, добиваясь оптимального баланса между вызовом и достижимостью — так называемой зоны «Златовласки».

Кроме того, новая среда предотвращает проблему «обмана награды», когда ИИ учится использовать лазейки в тестах, а не решать задачи честно. Постоянно изменяющиеся условия заставляют модель действительно улучшать свои навыки, а не искать «короткие пути» к успеху.

Patronus AI уже демонстрирует улучшение показателей выполнения задач на 10–20% в сферах программирования, обслуживания клиентов и финансового анализа. Компания сообщает о 15-кратном росте выручки в 2024 году и сотрудничестве с крупными мировыми корпорациями, включая представителей Fortune 500.

Для израильского рынка, где развиваются стартапы в области ИИ и автоматизации, подход Patronus AI может стать значимым инструментом повышения качества и надежности интеллектуальных систем, особенно в критичных отраслях — от кибербезопасности до финансовых технологий.

Тем не менее, конкуренция на рынке платформ для обучения агентов ИИ усиливается: Microsoft, NVIDIA и Meta также развивают собственные решения с похожими функциями. Успех Patronus AI будет зависеть от способности масштабировать технологию и интегрироваться в разнообразные бизнес-среды.

В целом, инновация Patronus AI отражает важный тренд в развитии искусственного интеллекта — переход от статичных тестов к динамическим, интерактивным средам обучения, которые ближе к реальным условиям и требованиям бизнеса.

Источник:venturebeat.com

Ещё по теме «технологии»

  • 1
    Wordle сегодня: ответ и подсказки на 17 декабря 2025 года
    →
  • 2
    Компания Sierra привлекла дополнительные $400 млн, оценка достигла $9 млрд
    →
  • 3
    Израиль присоединяется к международной инициативе Pax Silica для укрепления цепочек поставок в сфере ИИ
    →
  • 4
    История рабочих отношений и конфликта Илона Маска и Сэма Альтмана на фоне конкуренции в ИИ
    →
  • 5
    Вышла iOS 26.2 с новыми функциями для подкастов, безопасным AirDrop и улучшениями в интерфейсе
    →