«Наравне с OpenAI»: Обзор нейросети DeepSeek
В сети только и разговоров, что о DeepSeek — новой китайской нейросети. Разработчики сравнили новинку с OpenAI-o1 — последней версией ChatGPT, которую называют «самой умной языковой моделью в мире». Только китайский вариант, кажется, бесплатный и работает без ограничений. Так ли это? Собрали всё, что известно, и протестировали новинку.
Мы будем говорить о последней модели DeepSeek — R1. Эту версию выпустили в конце 2024 года, и именно она теперь не дает покоя рынку. Вот несколько фактов:
-
После того как DeepSeek раскатали, акции других технологических компаний резко упали. Например, рыночная стоимость Nvidia — более чем на $300 млрд. Суммарно технологические корпорации потеряли более $1 трлн.
-
Приложение DeepSeek заняло в топе бесплатных приложений App Store первое место, обойдя ChatGPT.
-
В рейтинге чат-ботов нейросеть DeepSeek занимает четвертое место по производительности — после двух моделей Gemini от Google и ChatGPT-4o.
-
В последние дни появились жалобы на то, что DeepSeek не работает. В понедельник, 27 января, он действительно приостановил регистрацию пользователей — из-за того, что подвергся крупномасштабной кибератаке. Однако уже 28 января мы смогли зарегистрироваться — проблем не возникло.
И всё это произошло стремительно.
Когда я начал тестировать новую модель DeepSeek-R1 — еще неделю назад, в ночь на 21 января, — я был в числе первых пользователей, которым посчастливилось увидеть релиз нейросети. И тогда никто даже не предполагал, что китайская нейросеть сможет подорвать лидерство OpenAI, обрушить акции Nvidia и выйти в топ приложений по скачиванию в App Store и Google Play всего за сутки.

Узнали всё, что известно о DeepSeek. В том числе — и из первых уст.

По крайней мере, это точно скромная нейросеть. Копнем глубже:
Нейросеть DeepSeek — что это
Для начала дадим слово самой нейросети.
Короче говоря, нейросеть DeepSeek — это чат-бот с опцией поиска в интернете и открытым исходным кодом. Первую версию разработала одноименная компания из Китая еще в 2023 году. В 2024 году вышли модели DeepSeek V3 и R1. Последняя — более продвинутая. Чтобы общаться с ней, нужно выбрать опцию DeepThink в интерфейсе.

Пройдемся подробнее по особенностям решения DeepSeek R1:
-
Человекоподобное мышление. Модель разбивает решение проблемы на мелкие этапы. Ход ее мыслей можно увидеть, открыв раздел над ответом.
Ход размышлений нейросети над вопросом / Источник: диалог с DeepSeek -
Открытый исходный код. То есть любой желающий может взять базовый код, адаптировать его и даже доработать под свои нужды. Эксперимент уже опубликован на Habr.
-
Опция поиска в интернете. Вы можете включить соответствующую опцию в интерфейсе, тогда нейросеть будет искать информацию в сети. Однако у нас эта функция не сработала.
Ответа от нейросети мы не дождались / Источник: диалог с DeepSeek -
Низкие затраты на разработку. DeepSeek R1, по имеющимся данным, был создан с бюджетом в $5–6 млн — это всего 3–5% от стоимости разработки моделей OpenAI-o1. Это при том, что в команде DeepSeek 200 сотрудников против 4500 в OpenAI.
-
Производительность наравне с OpenAI-o1 — последней версией ChatGPT. По крайней мере, так говорят разработчики DeepSeek. Они ссылаются на результаты тестов DeepSeek на GitHub.

И, конечно, главное — цена и доступность.
Действительно ли нейросеть DeepSeek бесплатна
Сейчас — да. Но будет ли всегда бесплатным DeepSeek, неизвестно. Повод протестировать, пока работает!

Доступна ли нейросеть DeepSeek на русском
Во-первых, да. Как вы уже увидели, DeepSeek понимает промпты на русском языке и отвечает на них. А во-вторых, доступ к нейросети не ограничен: не нужен ни VPN, ни другие костыли, которые используют россияне для доступа неработающим в стране сервисам.

Сравнение DeepSeek и ChatGPT — отзывы пользователей
Весь функционал нейросетей сравнивать не будем — они похожи. Выделим основные отличия.
DeepSeek |
OpenAI-o1 (новая версия ChatGPT) |
|
Бесплатна |
✅ |
❌ |
Доступна в России |
✅ |
❌ |
Доступна на русском языке |
✅ |
❌ |
Открытый исходный код |
✅ |
❌ |
Работа со ссылками |
❌ |
✅ |
Работа с голосовыми промптами |
❌ |
✅ |
Государственная цензура |
✅ Нейросеть игнорирует чувствительные для Китая темы (например, об автономии Тайваня) |
❌ |
Специалисты также обращают внимание на детали. При этом их опыт отличается, в том числе в вопросе скорости ответа нейросетей и качества генераций.
Ответы, полученные от DeepSeek и ChatGPT, не отличимы на первый взгляд — вы получаете примерно одинаковые результаты генерации. Однако технически есть различия. В одном токене ChatGPT содержится 5–7 символов, а в DeepSeek — 3–4, за счет чего скорость генерации у ChatGPT выше. При той же скорости генерации токенов он может создать более емкий ответ.
Из минусов стоит отметить контекстное окно в 64 000 токенов. Но, как показывает практика, 90% пользователей не достигают этого лимита в рамках разговора.
Время ответов у них плюс-минус одинаковое. Но от ChatGPT можно добиться более глубоких ответов. Это делает DeepSeek удобным для точечных задач, а ChatGPT — для глубокого анализа и проработки сложных тем.
Обратите внимание, что ChatGPT сразу добавил эмодзи в текст, так как уловил контекст — понял, что нужен пост для соцсетей.
Еще важно, что ChatGPT на платной версии можно полностью настроить как своего личного ассистента: погрузить в контекст, а далее все задачи он будет решать исходя из этого. У DeepSeek такого нет
Что умеет DeepSeek — кейсы
То же, что и все чат-боты: генерировать идеи, писать тексты, решать математические задачи, писать код и пр.
Специалисты из онлайн-университета Zerocoder протестировали, как нейросеть решает математические задачи работает в Поиске. Вышло вполне удачно.
Нейросеть по бенчмаркам опережает модель OpenAI-o1. Но одно дело — цифры в сравнительной таблице, другое — результаты генераций. Я решил протестировать нейросеть на нескольких задачах.
Решение математических задач. Я предложил нейросети решить самую сложную задачу из демоверсии профильного варианта ЕГЭ по математике за 2024 год. И DeepSeek, и OpenAI-o1 справились с задачей верно. Однако китайская нейросеть оказалась быстрее, потратив на решение две минуты, а американская — более 8 минут.
Поиск информации в интернете. DeepSeek-R1 может использовать найденные в сети данные для создания ответов. Тестирование показало, что качество работы этой функции соответствует решениям OpenAI.
Многозадачность. Нейросеть работает омникально, то есть вы можете одновременно выполнять несколько задач в ней:
загрузить документ;
попросить нейросеть найти дополнительные сведения в интернете;
изучить цепочку рассуждений нейросети, которая не исчезает после получения ответа (работает по кнопке DeepThinkR1 — это аналог reasoning-модели от OpenAI-o1).
Опция «рассуждений вслух» очень важна для тех, кто много работает с текстами и сложными документами. Наконец-то появился шанс понять, почему нейросеть выдает именно такой ракурс ситуации. На основе этих рассуждений становится понятно, как скорректировать свой запрос и усилить фактуру новыми данными.
Как пользоваться DeepSeek: через сайт и приложение
Очень просто. Как мы и говорили: без костылей, сторонних аккаунтов и прочего (мы не плачем, просто 2007-й в глаз попал).
Нужно только пройти в DeepSeek регистрацию. Для этого на выбор:
-
перейдите на сайт DeepSeek;
-
установите приложение DeepSeek (есть версии DeepSeek для Android и для iOS).

Далее выберите способ регистрации. В приложении DeepSeek на iOS, например, доступны три:
-
через почту;
-
через аккаунт Google;
-
через аккаунт Apple.
Осталось только разрешить доступ к аккаунту и принять политику конфиденциальности.
Готово! Можете тестировать 🙌

С DeepSeek рынок точно получил недорогое решение для повседневных задач. Это 100% хороший игрок на рынке ИИ. Но нужно помнить, что он догоняющий, а не флагманский. Я думаю, что эта нейросеть не сможет обогнать OpenAI, Anthropic или Google, так как их вложения в ИИ колоссальные. Гораздо легче создать оптимизированное решение, когда уже существует неоптимизированное решение и понимание технологии. Идея в том, что OpenAI и другие компании улучшают саму технологию, а DeepSeek является догоняющей компанией.
Тем не менее DeepSeek точно повлияет на снижение стоимости токенов в мире — если подтвердится, что компания действительно потратила всего $5 млн на обучение модели.
Последние комментарии