Специалист: модель DeepSeek привлекла внимание благодаря трём важнейшим факторам

2 часа(ов) назад 1
ARTICLE AD BOX

Модель DeepSeek, разработанная китайской компанией DeepSeek AI привлекла значительное внимание благодаря сочетанию трёх важнейших факторов объяснил RT Вадим Кириллов, инженер Лаборатории ИИ в медицине научно-образовательного центра Института искусственного интеллекта РТУ МИРЭА.

По его словам, к ним относятся высокая эффективность в решении сложных задач, низкая стоимость обучения и открытости как самой модели, так и подходов к её обучению.

«Нейросеть особенно эффективна в решении математических и логических задач благодаря использованию «токенов размышления» — промежуточных рассуждений, которые позволяют ей глубже анализировать проблему и находить ключевые инсайты перед генерацией ответа на запрос», — пояснил специалист.

В отличие от продуктов OpenAI, DeepSeek доступен в России совершенно бесплатно, что делает его особенно привлекательным для российских пользователей, которые могут протестировать нейросеть в мобильном приложении или на официальном сайте, объяснил эксперт.

«DeepSeek бросает вызов таким моделям, как GPT-o1 и Claude, предлагая сопоставимые возможности без «чёрного ящика». Тем не менее, стоит учитывать, что бесплатность модели может быть временной стратегией для привлечения внимания и сбора данных, что является распространённой практикой среди разработчиков ИИ. Успех DeepSeek демонстрирует, что при наличии достаточных ресурсов аналогичные результаты можно достичь и в России. Все исследования, методологии и подходы к обучению модели находятся в открытом доступе, что значительно снижает входной барьер для создания своих решений», — считает Кириллов.

Однако, по его мнению, ключевым фактором успеха станет тщательная подготовка обучающих наборов данных, учитывающих культурные особенности нашей страны или специфику конкретных профессиональных сфер.

«Как показывает опыт Китая, адаптация моделей под локальные условия — будь то культурный контекст или отраслевые потребности (например, юридическая, медицинская или техническая специфика) — является важнейшим шагом. DeepSeek, как и многие современные ИИ-проекты, базируется на открытых исследованиях, таких как архитектура трансформеров и методы RLHF (обучение с подкреплением через обратную связь от человека). Эти наработки можно эффективно адаптировать для улучшения передовых российских нейросетей, таких как GigaChat и YandexGPT», — заключил собеседник RT.

Ранее сотрудников аппарата конгресса США предупредили, что китайский чат-бот компании DeepSeek не разрешён им для официального использования.

Читать всю статью