Пост Together AI заявляет о самом быстром стеке преобразования речи в текст с Parakeet v3 появился на BitcoinEthereumNews.com. Феликс Пинкстон 22:48, 29 мая 2026 г. Together AIПост Together AI заявляет о самом быстром стеке преобразования речи в текст с Parakeet v3 появился на BitcoinEthereumNews.com. Феликс Пинкстон 22:48, 29 мая 2026 г. Together AI

Together AI заявляет о самом быстром стеке преобразования речи в текст с Parakeet v3

2026/05/31 16:49
4м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com


Felix Pinkston
29 мая 2026 22:48

Together AI представляет свой самый быстрый стек ASR, использующий NVIDIA Parakeet v3 и Whisper для транскрипции в реальном времени с низкой задержкой. Подробности о технологии и её влиянии на рынок.

Together AI объявила о том, что считает самым быстрым в мире стеком преобразования речи в текст (ASR), способным транскрибировать 20 часов речи менее чем за 10 секунд. Прорыв достигнут благодаря использованию Parakeet-TDT 0.6B v3 от NVIDIA и Whisper Large v3 от OpenAI, оба оптимизированы для приложений с низкой задержкой и высокой пропускной способностью. Это достижение может существенно ускорить развитие голосовых ИИ-систем реального времени — ключевого направления развития компании по мере масштабирования её инфраструктуры.

Основа достижения Together AI заключается в подходе к ASR как к системной задаче полного пути, а не только к ускорению инференса на GPU. Этот комплексный подход устраняет узкие места на этапах предобработки, выполнения на GPU, управления памятью и сетевого взаимодействия. Например, такие инновации, как настройка профилей TensorRT, условные графы CUDA и пути данных без копирования, значительно снизили задержку на всём стеке.

Одной из выдающихся оптимизаций является цикл декодирования в Parakeet v3. Перенеся условную логику с CPU на GPU, Together AI устранила дорогостоящие задержки синхронизации, что привело к ускорению декодирования в 2–3 раза. Аналогично, использование общей памяти и событийного ввода-вывода для потоковой транскрипции минимизировало накладные расходы, обеспечивая как высокую пропускную способность, так и низкий джиттер для приложений реального времени.

Parakeet v3 — многоязычная модель ASR, обученная на 1,7 миллиона часов аудио, — представляет собой значительный скачок по сравнению с предшественником. Теперь она поддерживает 25 европейских языков, включает автоматическое определение языка и сохраняет лидирующую в отрасли производительность для транскрипции на английском языке. Платформа Together AI также интегрирует Whisper Large v3 для рабочих нагрузок производственного масштаба, создавая надёжную экосистему для разработчиков голосовых приложений.

Удовлетворение рыночных потребностей

Это объявление позиционирует Together AI как серьёзного претендента на рынке ASR, особенно для сценариев использования в реальном времени и потоковой передачи. В отличие от традиционных систем ASR, опирающихся на разрозненные конвейеры, Together AI предлагает модульный стек, в котором преобразование речи в текст (STT), понимание естественного языка (NLU) и преобразование текста в речь (TTS) могут слаженно работать на одной инфраструктуре. Это снижает задержку и позволяет разработчикам проверять и обрабатывать промежуточные результаты — ключевое отличие для голосовых агентов реального времени.

Недавние партнёрства подчёркивают стратегию компании по созданию открытой, компонуемой экосистемы. В апреле 2026 года Deepgram интегрировал свои модели ASR непосредственно на платформу Together AI, позволив разработчикам комбинировать специализированные речевые модели с инфраструктурой Together AI. Эта гибкость становится всё более ценной по мере того, как рабочие нагрузки ИИ движутся к единым архитектурам, объединяющим речевые, языковые и мультимодальные возможности.

Влияние на отрасль и инвесторов

Достижения Together AI приходятся на то время, когда компания, по имеющимся данным, стремится привлечь капитал при оценке в 7,5 миллиарда $, согласно отчётам марта 2026 года. Интерес инвесторов отражает растущий спрос на высокопроизводительную инфраструктуру инференса, особенно для голосовых и мультимодальных ИИ-систем. Располагая более чем 450 000 разработчиков и 200 моделями с открытым исходным кодом, уже поддерживаемыми на платформе, Together AI хорошо позиционирована для использования этого импульса.

Конкуренты, такие как Deepgram и Google, по-прежнему доминируют в отдельных сегментах рынка ASR, однако акцент Together AI на хостинге открытых моделей и производительности в реальном времени может обеспечить ей значительную долю рынка. Интеграция технологии ASR от NVIDIA дополнительно укрепляет техническое доверие к компании, особенно с учётом лидерства NVIDIA в области аппаратного и программного обеспечения для ИИ и оптимизации.

По мере того как голосовые интерфейсы становятся всё более неотъемлемой частью потребительских и корпоративных приложений, решения ASR с низкой задержкой и масштабируемостью, подобные решению Together AI, могут переопределить ожидания пользователей. Разработчикам, инвесторам и предприятиям следует внимательно следить за тем, как компания продолжает совершенствовать свой стек и расширять экосистему.

Источник изображения: Shutterstock

Source: https://blockchain.news/news/together-ai-fastest-speech-to-text-parakeet-v3

Возможности рынка
Логотип Gensyn
Gensyn Курс (AI)
$0.02875
$0.02875$0.02875
-1.27%
USD
График цены Gensyn (AI) в реальном времени

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Зарегистрируйтесь и получите шанс на розыгрыш

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Solana должна удержаться выше ключевого уровня $78 – аналитик объясняет почему

Solana должна удержаться выше ключевого уровня $78 – аналитик объясняет почему

Пост Solana должна удержаться выше crucial уровня $78 – аналитик объясняет почему появился на BitcoinEthereumNews.com. Данные CoinMarketCap показывают, что Solana (SOL) имеет
Поделиться
BitcoinEthereumNews2026/05/31 18:37
Dogecoin (DOGE): мем-коин, который не умирает — но стоит ли в него инвестировать?

Dogecoin (DOGE): мем-коин, который не умирает — но стоит ли в него инвестировать?

TLDR У Dogecoin нет ограничения на эмиссию — каждый год добавляется около 5 миллиардов новых DOGE. ETF 21Shares Dogecoin начал торговаться на Nasdaq в январе 2026 года. Tesla официально
Поделиться
Coincentral2026/05/31 18:01
Роман Шторм обвиняет Министерство юстиции в использовании отключения от банковских услуг для подрыва его правовой защиты

Роман Шторм обвиняет Министерство юстиции в использовании отключения от банковских услуг для подрыва его правовой защиты

Пост Roman Storm обвиняет Министерство юстиции в использовании дебанкинга как оружия для подрыва его правовой защиты появился на BitcoinEthereumNews.com. Ключевые выводы Roman Storm обвинил
Поделиться
BitcoinEthereumNews2026/05/31 18:13

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Зарегистрируйтесь и получите шанс на розыгрыш