
Фильтр
Новый стандарт озвучки в Gemini 3.1 Flash TTS
Google выпустила Gemini 3.1 Flash TTS — модель преобразования текста в речь, которая избавляет ИИ от «роботизированного» звучания. Главные фишки: — Управление эмоциями: Теперь можно вставлять в текст теги на естественном языке, чтобы ИИ сменил тон, темп или добавил нужную эмоцию в конкретном месте. — Диалоги: Модель поддерживает естественную беседу нескольких персонажей в рамках одного аудиофайла. — 70+ языков: Масштабное покрытие с высокой плавностью речи. — SynthID: Автоматическое вшивание невидимых водяных знаков для защиты от дипфейков и подтверждения того, что звук создан нейросетью. Это быстрое и бюджетное решение для качественной озвучки видео, приложений и подкастов прямо через API или Google AI Studio. @bykorolev
Показать еще
- Класс
Создаем стильные открытки в Nano Banana
Создаем стильные открытки в Nano Banana Укажите БАНГКОК только в одном месте ниже. БАНГКОК Создавайте современные иллюстрированные туристические плакаты в яркой и оживленной атмосфере. Что касается темы входных данных БАНГКОК, представьте характерные достопримечательности и пейзажи в виде широкой панорамной композиции, которая естественным образом разворачивается на одном экране. Стиль - высококачественные редакторские иллюстрации, сложные и изысканные детали, четкие и свежие цвета, четкая композиция, чувственный современный графический дизайн. На переднем плане разместите культурные элементы, символизирующие регион: традиционные блюда, флаги, растения, символические предметы и т.д. Вверху разместите крупный, современный, переосмысленный типографский заголовок, а под ним - элегантный подзаголовок. Все тексты, декоративные элементы, угловые детали и ботанические элементы гармонично вписываются в общий дизайн с современной чувственностью. Условия: - Общая атмосфера: Яркая и
Показать еще
- Класс
Seedance 2 доступна российским пользователям
Seedance 2 доступна российским пользователям Поддержку нашумевшей нейросети для видео добавил сервис Utopy.ai, разработанный IT-командой из России. То есть доступна оплата картами РФ и доступ без VPN. Для большего удобства работы с Seedance 2 сразу встроено много функций: — мультипромпты и мультисцены; — автоматическое создание раскадровок для обхода блокировки Seedance 2 на генерацию людей и персонажей; — режим первого и последнего кадра; — высокая скорость генерации — около 2 минут на ролик против 2 часов, которые встречаются на рынке. Цены приятно порадовали. Сделал для вас реферальную ссылку. Для новых пользователей по ней доступна скидка 30% на все тарифы (от 518 ₽ в месяц вместо 740 ₽/мес). Сервис выглядит достойно, интерфейс удобный. Будем наблюдать за их развитием.
Показать еще
- Класс
ERNIE-Image от Baidu: компактная модель генерации изображений
ERNIE-Image от Baidu: компактная модель генерации изображений Baidu выпустили открытую модель на 8B параметров, которая заняла 1-е место среди open-source решений в тестах GenEval и LongTextBench. Главные фишки: — Текст без ошибок: Идеально пишет на английском и китайском. С русским проблемки. — Сложная верстка: Делает постеры, мангу и многосекционные макеты. — Послушность: Четко управляет несколькими объектами и сложными сценами. — Доступность: Работает на 24 ГБ VRAM (RTX 3090/4090). Выпустили две основные модели: 1. Standard (SFT): Максимальное качество за 50 шагов. 2. Turbo: Ультра-скорость всего за 8 шагов. Конечно модель не конкурирует с гигантами, но получилась мощная, легкая и бесплатная альтернатива тяжелым нейросетям. Детали Демо @dayliprompts
Показать еще
- Класс
Claude Routines: автопилот для ваших задач
Claude Routines: автопилот для ваших задач Anthropic выпустила Routins — это способ заставить Claude работать над вашим кодом и задачами автоматически, даже когда вы спите. Если раньше вам нужно было лично общаться с нейросетью, то теперь вы можете один раз дать ей инструкцию и установить расписание. Система работает в облаке и сама заходит в нужные папки на GitHub. Вы можете настроить Claude так, чтобы она проверяла ошибки в коде при каждом обновлении, присылала отчеты в Slack или каждое утро наводила порядок в рабочих задачах. Это означает, что у вас появляется виртуальный стажер, который сам знает, когда пора приниматься за дело. Это экономит время на рутине и позволяет Claude быть полезной без вашего постоянного контроля. Инструмент уже открыт для пользователей платных тарифов в меню Claude Code. @dayliprompts
Показать еще
- Класс
Вышла новая версия Midjourney V8.1
Вышла новая версия Midjourney V8.1 Midjourney после некоторого разочарования пользователей провела некоторые работы над ошибками. Вернули свою узнаваемую эстетику и нативную генерацию в 2К. Работает в 3 раза быстрее и обходится в 3 раза дешевле, чем обычная восьмая версия. Уменьшили скорость генерации, теперь режим 1K в полном качестве обгоняет решим черновик V7. Снова доступны промпты для изображений, а новый Describe открывает крутые возможности для работы с мудбордами и srefs. Тестить тут @bykorolev
Показать еще
- Класс
Google Chrome внедряет Skills для Gemini
Google Chrome внедряет Skills для Gemini Google интегрировал в боковую панель Chrome функцию Skills (Навыки). Это инструмент для автоматизации повторяющихся задач с помощью ИИ, который работает в контексте открытых вкладок. Пользователь может создавать собственные шаблоны запросов или использовать готовые из библиотеки Google. Навыки вызываются через символ / в чате с Gemini. Основные возможности: — Сравнение данных: Составление сравнительных таблиц товаров или услуг на основе содержимого нескольких открытых вкладок. — Анализ контента: Мгновенный разбор состава продуктов, расчет КБЖУ рецептов или проверка фактов на веб-страницах. — Работа с документами: Автоматическое создание кратких сводок для длинных статей и PDF-файлов. — Персонализация: Возможность сохранить сложную инструкцию один раз и применять ее к любой странице в клик. Функция внедряется в десктопную версию браузера Chrome. Для использования необходимо активировать боковую панель Gemini. На текущем этапе приоритет от
Показать еще
- Класс
Брендовая реклама в социальных сетях
Брендовая реклама в социальных сетях Сверхширокоугольная гиперреалистичная съемка в режиме "сверху вниз". Группа из 4 реальных людей, сидящих за квадратным обеденным столом. Камера отодвинута далеко назад, создавая значительное негативное пространство (пустую площадь пола) вокруг людей и стола, что обеспечивает четкую минималистичную композицию. Сцена [АТМОСФЕРА И ОДЕЖДА]: Четыре человека одеты в [СТИЛЬ ОДЕЖДЫ]. Их взаимодействие специфично: [ОПИШИТЕ ДЕЙСТВИЯ КАЖДОГО ЧЕЛОВЕКА]. Стол представляет собой изготовленный на заказ физический реквизит, оформленный в виде поста в Instagram: он имеет сплошную белую полосу ТОЛЬКО по верхнему и нижнему краям (никаких белых рамок слева или справа). - На верхней белой полосе изображена нарисованная фотография профиля с [ОПИСАНИЕМ ЛОГОТИПА], имя пользователя "[USERNAME]", за которым следует маленький синий значок с подтвержденной галочкой, и "..." справа. - На нижней белой полосе слева нарисованы красные сердечки, значки комментариев и обмена, а спр
Показать еще
- Класс
Вайбкодинг для новичков: Lovable запустил свою академию
Вайбкодинг для новичков: Lovable запустил свою академию Lovable представили новый обучающий проект, где собраны все ресурсы для создания веб-приложений с помощью ИИ. Там вы найдете готовые шаблоны, подробные инструкции, советы по промтам и даже видеолекции, а специальный конструктор промтов поможет превратить вашу идею в рабочий промт, задавая нужные уточняющие вопросы. Учиться тут @bykorolev
Показать еще
- Класс
VoxCPM2: нейросеть, которая повторяет голос до последней интонации
VoxCPM2: нейросеть, которая повторяет голос до последней интонации Команда Tsinghua OpenBMB представила VoxCPM2: модель с 20 миллиардами параметров, обученная на 2 миллионах часов многоязычных данных. Качество звука — студийное, 48 kHz. Что умеет модель: — Поддержка 30 языков (в том числе русский) — На RTX 4090 выдаёт практически реальное время (real-time rate 0.13) с потоковым выводом — Генерация голоса из текстового описания без референсного аудио — Клонирование голоса с настройкой эмоций, скорости речи и интонации — Ultimate cloning: копирует даже дыхание и индивидуальные речевые привычки по референсному аудио + тексту — Лицензия Apache 2.0, пригодна для коммерческого использования На GitHub уже более 10 000 звёзд, ранее лидировала в трендах GitHub и HuggingFace. Подкасты, аудиокниги, озвучка игр, закадровый голос для шортсов — открытые решения теперь реально конкурентоспособны. Модель на Гитхаб @bykorolev
Показать еще
- Класс
загрузка
Показать ещёНапишите, что Вы ищете, и мы постараемся это найти!