Reuters, возможно, обнаружил новую мощную ИИ-модель от DeepSeek
Reuters сообщает о появлении загадочной модели искусственного интеллекта. Это может быть последний блокбастер DeepSeek. Мощная модель искусственного интеллекта, анонимно появившаяся на платформе для разработчиков на прошлой неделе, вызвала слухи о том, что китайский стартап DeepSeek, возможно, тайно тестирует свою систему следующего поколения перед официальным запуском.
Бесплатная модель под названием Hunter Alpha появилась на платформе AI gateway OpenRouter 11 марта без каких-либо указаний разработчика.
Во время тестов, проведенных Reuters, чат-бот Hunter Alpha описал себя как “китайскую модель искусственного интеллекта, в основном обученную китайскому языку”, и сообщил, что его данные об обучении были предоставлены до мая 2025 года, о чем сообщил собственный чат-бот DeepSeek. Однако, когда систему спросили о ее создателе, она отказалась назвать своего разработчика.
“Я знаю только свое имя, масштаб моих параметров и длину контекстного окна”, - сказал чат-бот.
Ни DeepSeek, ни OpenRouter не назвали создателя модели и не ответили на запросы о комментариях.
На странице профиля Hunter Alpha описывается как модель с триллионом параметров, что означает, что она была обучена с использованием примерно одного триллиона настраиваемых значений, которые определяют, как система обрабатывает язык и генерирует ответы. Модели с большим количеством параметров, как правило, требуют значительно больших вычислительных мощностей для работы.
Комментарии