IPO
•••
 Поиск Новости Котировки  Эфир
18.03.26 11:43 Поделиться

Reuters, возможно, обнаружил новую мощную ИИ-модель от DeepSeek

Она имеет триллион параметров

Reuters сообщает о появлении загадочной модели искусственного интеллекта. Это может быть последний блокбастер DeepSeek. Мощная модель искусственного интеллекта, анонимно появившаяся на платформе для разработчиков на прошлой неделе, вызвала слухи о том, что китайский стартап DeepSeek, возможно, тайно тестирует свою систему следующего поколения перед официальным запуском.

Бесплатная модель под названием Hunter Alpha появилась на платформе AI gateway OpenRouter 11 марта без каких-либо указаний разработчика.

Во время тестов, проведенных Reuters, чат-бот Hunter Alpha описал себя как “китайскую модель искусственного интеллекта, в основном обученную китайскому языку”, и сообщил, что его данные об обучении были предоставлены до мая 2025 года, о чем сообщил собственный чат-бот DeepSeek. Однако, когда систему спросили о ее создателе, она отказалась назвать своего разработчика.

“Я знаю только свое имя, масштаб моих параметров и длину контекстного окна”, - сказал чат-бот.

Ни DeepSeek, ни OpenRouter не назвали создателя модели и не ответили на запросы о комментариях.

На странице профиля Hunter Alpha описывается как модель с триллионом параметров, что означает, что она была обучена с использованием примерно одного триллиона настраиваемых значений, которые определяют, как система обрабатывает язык и генерирует ответы. Модели с большим количеством параметров, как правило, требуют значительно больших вычислительных мощностей для работы.

Комментарии

Авторизуйтесь, чтобы оставить комментарий.
Загружаем...