Ходять чутки, що DeepSeek V4 перевершує ChatGPT і Claude в кодуванні з довгим контекстом

Ходять чутки, що DeepSeek V4 перевершує ChatGPT та Claude у роботі з довгим контекстом коду, орієнтуючись на завдання кодування елітного рівня. Інсайдери стверджують, що ШІ-ландшафт Силіконової долини повинен хвилюватися, якщо внутрішні тести натякають на його очікувану продуктивність після запуску в середині лютого.

Китайський ШІ-стартап DeepSeek, як повідомляється, планує випустити DeepSeek V4, свою найновішу велику мовну модель, 17 лютого. Обізнані особи стверджують, що модель готова затьмарити існуючі великі мовні моделі, такі як ChatGPT від OpenAI та Claude від Anthropic, при обробці завдань з довгим контекстом коду.

Розробники виражають глибоке очікування випуску DeepSeek V4

Китайська компанія не оприлюднила жодної інформації про наближений реліз або не підтвердила чутки на момент написання. Розробники в різних соціальних мережах висловили глибоке очікування щодо випуску. Yuchen Jin, ШІ-розробник та співзасновник Hyperbolic Labs, написав у X, що "ходять чутки, що DeepSeek V4 незабаром вийде з потужнішим кодуванням, ніж Claude та GPT."

Сабреддіт r/DeepSeek також нагрівся, при цьому один користувач пояснив, що його одержимість наближеною моделлю V4 від DeepSeek не є нормальною. Користувач сказав, що він часто "перевіряє новини, можливі чутки, і навіть читає документацію на веб-сайті DS, щоб знайти будь-які зміни або ознаки, що вказують на оновлення."

Попередні випуски DeepSeek мали значний вплив на глобальні ринки. Китайський ШІ-стартап випустив свою модель міркування R1 у січні 2025 року, що призвело до розпродажу на трильйон доларів. Випуск відповідав моделі 01 від OpenAI за математичними та логічними показниками, незважаючи на значно менші витрати, ніж американський ШІ-стартап витратив на свою модель 01.

Китайська компанія, як повідомляється, витратила лише 6 мільйонів доларів на випуск моделі. Тим часом глобальні конкуренти витрачають майже в 70 разів більше для того ж результату. Її модель V3 також отримала оцінку 90,2% у тесті MATH-500, порівняно з 78,3% у Claude. Більш пізнє оновлення V3 від DeepSeek (V3.2 Speciale) ще більше покращило її продуктивність.

Перевага моделі V4 еволюціонувала від акценту V3 на чистому мірку-ванні, формальних доказах та логічній математиці. Очікується, що новий реліз буде гібридною моделлю, яка поєднує як завдання міркування, так і завдання без міркування. Модель має на меті захопити ринок розробників, заповнивши існуючу прогалину, яка вимагає високої точності та генерації коду з довгим контекстом.

Claude Opus 4.5 наразі претендує на домінування в тесті SWE, досягаючи точності 80,9%. V4 повинен перевершити це, щоб обігнати Claude Opus 4.5. Виходячи з попередніх успіхів, майбутня модель може перевищити цей поріг та претендувати на домінування в тесті.

DeepSeek піонер mHC для навчання великих мовних моделей

Успіх DeepSeek залишив багатьох у глибокому професійному недовір'ї. Як така невелика компанія могла досягти таких віх? Секрет може бути глибоко закоріненим у її дослідницькій статті, опублікованій 1 січня. Компанія визначила новий метод навчання, який дозволяє розробникам легко масштабувати великі мовні моделі. Liang Wenfeng, засновник і генеральний директор DeepSeek, написав у дослідженні, що компанія використовує Manifold-Constrained Hyper-Connections (mHC) для навчання своїх ШІ-моделей.

Керівник запропонував використовувати mHC для вирішення проблем, з якими стикаються розробники при навчанні великих мовних моделей. Згідно з Wenfeng, mHC є оновленням Hyper-Connections (HC), фреймворку, який інші ШІ-розробники використовують для навчання своїх великих мовних моделей. Він пояснив, що HC та інші традиційні ШІ-архітектури змушують усі дані проходити через єдиний, вузький канал. Водночас mHC розширює цей шлях на кілька каналів, полегшуючи передачу даних та інформації без спричинення збою навчання.

Lian Jye Su, головний аналітик Omdia, похвалив генерального директора Wenfeng за публікацію їхнього дослідження. Su підкреслив, що рішення DeepSeek опублікувати свої методи навчання свідчить про оновлену впевненість у китайському ШІ-секторі. DeepSeek домінує у світі, що розвивається. Microsoft опублікувала звіт у четвер, показавши, що DeepSeek контролює 89% китайського ШІ-ринку та набирає обертів у країнах, що розвиваються.

Хочете, щоб ваш проєкт був перед провідними розумами криптоіндустрії? Представте його в нашому наступному галузевому звіті, де дані зустрічаються з впливом.

Джерело: https://www.cryptopolitan.com/deepseek-v4-chatgpt-and-claude/