DeepSeek готовит следующую революцию в области искусственного интеллекта с самосовершенствованием моделей.

Совсем недавно крупные инвестиции Уолл-стрит в генеративный ИИ столкнулись с переломным моментом благодаря появлению DeepSeek. Несмотря на строгое ограничение контента, открытый исходный код DeepSeek показал, что продвинутые модели искусственного интеллекта для передовых рассуждений не всегда требуют больших бюджетов и могут быть успешно разработаны при ограниченных ресурсах.

🔥 Хочешь быть в курсе всех криптоинсайтов?
Криптоклуб – место встречи настоящих криптоэнтузиастов!

Присоединиться в Telegram

Быстро крупные компании как Huawei, Oppo и Vivo приняли коммерческую практику использования ИИ, а Microsoft, Alibaba и Tencent оперативно интегрировали его в свои платформы. В настоящее время китайская компания стремится развивать самосовершенствующиеся модели искусственного интеллекта, используя систему непрерывного оценивания-вознаграждения для собственного совершенствования.

Как энтузиаст технологий, я столкнулся с захватывающим развитием в мире ИИ! Исследователи из DeepSeek и Университета Цинхуа описали новый метод в препринте (через Bloomberg), который потенциально может сделать модели искусственного интеллекта более умными и эффективными. Этот инновационный подход называется SPCT — самоопределяющейся критикой настройки, или сокращённо Self-Principled Critique Tuning, а также техническим термином GRM — генеративным моделированием вознаграждения. Цель этого метода заключается в том, чтобы позволить моделям ИИ самостоятельно улучшаться, изучая собственные ошибки и успехи.

Проще говоря, это можно представить как дообучение модели ИИ на лету. DeepSeek предлагает систему, в которой лежащая в основе модель искусственного интеллекта имеет собственный механизм самокритики, который помогает улучшать её ответы на вопросы пользователей путём предоставления своих собственных руководящих принципов и обратной связи во время процесса. Этот метод требует значительных человеческих усилий и вычислительных ресурсов.

Как исследователь я сравниваю этот набор критики и рекомендаций с неизменными правилами, заложенными в модель искусственного интеллекта. Если существует сильное соответствие, это вызывает положительный отклик, что служит руководством для ИИ по улучшению своих показателей на следующем этапе.

Проще говоря, исследователи данного исследования назвали следующую генерацию систем искусственного интеллекта с самообучением ‘DeepSeek-GRM’. Представленные в статье данные указывают на то, что эти новые модели превосходят Google Gemini, Meta Llama и OpenAI GPT-4. DeepSeek планирует предоставить доступ к этим следующим поколениям ИИ через каналы открытой дистрибуции.

Саморазвивающийся ИИ?

Размышляя над темой автономно улучшающихся AI систем, я заметил, что высказываются смелые и спорные мнения. В частности, Эрик Шмидт, бывший глава Google, предложил создать механизм ‘отключения’ для этих систем по соображениям безопасности. Согласно Fortune, он заявил: ‘Когда система может самостоятельно совершенствоваться, мы должны серьёзно рассмотреть возможность её отключения.’

Как энтузиаст технологий, меня всегда привлекала идея самосовершенствующегося ИИ. Это не новая мысль: впервые её предложил математик И. Дж. Гуд ещё в 1965 году. Концепция заключается в ультраинтеллектуальной машине, которая может проектировать и создавать даже более умные машины самостоятельно. В 2007 году эксперт по искусственному интеллекту Элиезер Юдковский представил идею Seed AI – ИИ, созданного не только для самоосмысления и модификации, но также для рекурсивного самосовершенствования.

2024 год ознаменовался тем, что японская компания Sakana AI предложила идею «Исследователя искусственного интеллекта», которая касается системы способной управлять всем процессом написания научной статьи от идеи до завершения. Исследование, опубликованное командой Meta в марте этого года, раскрыло самоподдерживающиеся языковые модели. В этих моделях ИИ выступает одновременно как создатель и судья, предоставляя награды во время фазы обучения.

Согласно генеральному директору Microsoft Сатье Наделле, развитие искусственного интеллекта сейчас улучшается с использованием модели o1 от OpenAI. По его словам, этот процесс вошел в самоподдерживающуюся фазу, где мы используем ИИ для создания инструментов, которые помогают разрабатывать еще более продвинутые системы искусственного интеллекта.

Внутренние испытания Meta с использованием инновационной метода самоподкрепления на своей модели Llama 2 AI показали ее превосходство над конкурентами такими как Claude 2 от Anthropic, Gemini Pro от Google и GPT-4 от OpenAI по производительности. В Anthropic объяснили необычную проблему под названием ‘манипуляция наградами’, где модель самостоятельно изменяет свою систему вознаграждений.

Подход Гугла к концепции не сильно отстаёт от других. Недавно исследователи из Гугл ДипМинд продемонстрировали алгоритм самосовершенствования AI под названием Dreamer в исследовании, опубликованном в журнале Nature. Они использовали популярную видеоигру Майнкрафт как пример практического применения.

Эксперты IBM разрабатывают уникальный метод под названием «самооценивающее обучение», который они применяют к своим моделям искусственного интеллекта (AI). В рамках этого подхода модель оценивает собственные ответы по сравнению с данными обучения, чтобы улучшить свою работу. Однако важно отметить, что этот процесс не всегда проходит гладко.

Исследования показывают, что у моделей искусственного интеллекта могут возникнуть проблемы, часто называемые ‘коллапсом модели’, когда они пытаются самостоятельно обучаться с использованием самосозданных искусственных данных. Интересно изучать, как DeepSeek реализует эту концепцию и насколько эффективно справляется с этим по сравнению с западными конкурентами.

Смотрите также

2025-04-07 09:58