В мобильном приложении Claude обнаружили готовящееся расширение голосового режима: к английскому добавятся 18 языков в статусе беты, включая немецкий, португальский, китайский, японский, русский и украинский. Появятся переключение языка прямо во время разговора, режим push-to-talk и обновлённый интерфейс. Часть нового кода уже видна в приложении, но официального анонса и сроков пока нет.

Что нашли в мобильном приложении Claude
Признаки крупного обновления голосового режима для приложений iOS и Android появились в приложении до каких-либо официальных заявлений. На это обратило внимание издание TestingCatalog. Текущий голосовой режим работает в бете с мая 2025 года и до сих пор поддерживал только английский.
В обновлённом интерфейсе появились анимация свечения вокруг голосового индикатора и режим push-to-talk. Правка заметная: сейчас разговор с Claude идёт по очереди реплик, без потоковой полнодуплексной передачи, которая используется в ChatGPT Advanced Voice и Gemini Live.
Push-to-talk — режим, в котором микрофон активен только при удержании кнопки: пользователь удерживает её, говорит, отпускает — реплика отправляется. Снижает число случайных срабатываний по сравнению с постоянным прослушиванием.
18 новых языков и русский среди них
Более значимое изменение — новый раздел «Язык» с пометкой беты. Сегодня в меню активен только английский, но список уже включает немецкий, португальский, китайский, японский, русский, украинский и ряд других языков. У большинства новых языков по два голоса, у части — по одному. Для сравнения, в английском доступны пять голосовых персон: Mellow, Airy, Buttery, Glassy и Rounded.
Переключаться между языками можно двумя способами. Помимо ручного выбора в меню, язык меняется прямо во время разговора: достаточно попросить Claude об этом, и переключение произойдёт на лету. В текущей сборке такой возможности нет.
Слой оркестрации поверх внешнего синтеза речи
Голос по-прежнему сохраняет интонацию синтеза речи (TTS), а не модели прямого преобразования речь-в-речь. Отсюда вывод о новом слое оркестрации, который управляет несколькими голосами и языковыми профилями, — а не о полном переходе на собственный звуковой стек.
Деталь важна, потому что для голосовой части Claude в Anthropic до сих пор опирались на внешних поставщиков: ElevenLabs указана как субподрядчик по синтезу речи, а на более широком партнёрстве с Amazon построена работа Alexa+. Многоязычный слой поверх такого стека позволил бы закрыть один из заметных пробелов перед конкурентами: у ChatGPT и Gemini многоязычный голос есть уже давно.
TTS (text-to-speech) — преобразование текста в синтезированную речь. В отличие от моделей речь-в-речь, такой подход сначала формирует текстовый ответ, а затем озвучивает его, из-за чего интонация отличается от живой речи носителя.
Голосовое общение на русском и нерешённые сроки
Для русскоязычной аудитории это означает голосовое общение с Claude на родном языке — в официальном приложении такой возможности раньше не было. Сроков выхода пока нет, а перечень языков ещё может измениться до публичного запуска. Пометка беты указывает на то, что функция дорабатывается.