Google расширила функциональность приложения Gemini, добавив инструмент для генерации музыки. За создание композиций отвечает нейросеть Lyria 3, разработанная подразделением Google DeepMind. Ранее сервис поддерживал работу исключительно с текстом, аудио, изображениями и видео. Модель позиционируется разработчиками как наиболее продвинутый инструмент компании для создания музыки.
Пользователям больше не нужно самостоятельно писать тексты песен. Алгоритм автоматически генерирует слова на основе запроса, предоставляя контроль над стилем, вокалом, темпом и другими элементами. По заявлению компании, обновление дает возможность создавать более реалистичные и сложные в музыкальном плане композиции.
Генерация запускается через раздел Создание музыки в меню инструментов. Запрос может содержать описание конкретного жанра, настроения, внутренней шутки или воспоминания для создания уникальных треков с вокалом или инструментальным звучанием. Система поддерживает мультимодальность: пользователь может загрузить фотографию или видеоклип, чтобы алгоритм смог «сочинить трек с текстом, идеально подходящим под настроение». Результатом работы становится 30-секундный аудиофайл. Обложку для трека генерирует встроенная модель Nano Banana. Готовую композицию можно скачать на устройство или поделиться ссылкой.
Защита авторских прав
Google подчеркивает, что нейросеть «создана для оригинального самовыражения, а не для имитации существующих артистов». Во время обучения разработчики строго соблюдали нормы авторского права и партнерские соглашения. При указании имени конкретного артиста в текстовом запросе алгоритм «воспримет запрос как широкое творческое вдохновение и создаст трек с похожим стилем или настроением». Встроенные программные фильтры автоматически проверяют результаты на предмет совпадений с существующим лицензионным контентом.
Компания уточняет: «Мы признаем, что наш подход может быть не идеальным, поэтому вы можете пожаловаться на контент, который нарушает ваши права или права других лиц».
Для обеспечения безопасности все сгенерированные аудиозаписи содержат встроенный водяной знак SynthID. Пользователям доступна загрузка любого аудиофайла в Gemini для проверки его происхождения с помощью инструментов проверки Google AI. Данная функция дополняет аналогичную систему верификации для сгенерированных изображений и видео.
Доступность и ограничения
Функция генерации музыки на базе Lyria 3 доступна пользователям старше 18 лет. Поддерживается русский язык. Для подписчиков платных тарифов Google AI Plus, Pro и Ultra предусмотрены увеличенные лимиты на количество обращений к нейросети. В будущем компания планирует расширить языковую поддержку и повысить общее качество генерации.
Обновления программ, что нового
• Google выпустила Android 17 Beta 4 с лимитами памяти для приложений
• Anthropic выпустила Claude Opus 4.7 с режимом усилий xhigh
• Intel представила процессоры Core (Wildcat Lake) для доступных ноутбуков – конкурентов MacBook Neo
• Обновление Intel NPU Driver (AI Boost) 32.0.100.4724 WHQL. Поддержка Wildcat Lake и новые ИИ-модели для Core Ultra
• В Opera One и Opera GX появился Browser Connector – ChatGPT и Claude могут управлять вкладками и анализировать страницы
• Mozilla представила Thunderbolt – открытый ИИ-клиент с возможностью развёртывания на собственной инфраструктуре

