Свое начало нейросеть от СБЕР берет еще в 2021 году — тогда была представлена модель ruDall-E вместе с сервисом по генерации изображений.
Полноценная версия под названием Kandinsky 2.0 появилась на свет позже, в конце 2022 года. Теперь, после версий 2.1 и 2.2, СБЕР создал новую — Kandinsky 3.0.
В новой версии нейросеть стала лучше понимать детальные текстовые запросы. Например, появилась возможность указывать позитивные и негативные запросы (промпты) для генерации изображений с обширным выбором стилей. Генерацию можно получить в трех размерах: 9:16, 16:9, 1:1.
Одна из главных новинок — генерация коротких видеороликов Kandinsky Video. С помощью детального запроса можно создать видео длительностью до 8 секунд с частотой около 30 кадров в секунду. Размер можно выбрать среди таких же, как и у анимации: 1:1, 9:16, 16:9.
Для работы в сервисе нужна регистрация.
Регистрация
Заходим на сайт сервиса и в правом верхнем углу нажимаем на кнопку «Начать».
Дальше нажимаем «Зарегистрироваться».
Для регистрации указываем адрес электронной почты, придумываем пароль, соглашаемся с условиями сервиса. Нажимаем «Зарегистрироваться».
На электронную почту приходит письмо для завершения регистрации. Нажимаем на «Подтвердить почту».
Генерируем картинки
Мы снова попадаем на стартовую страницу сервиса. Тольео теперь нажимаем на кнопку в правом нижнем углу — «Открыть редактор».
И вот теперь мы видим рабочее поле для генерации изображений.
Здесь всё достаточно несложно: есть окно для запросов, выбор размера и границы будущего изображения. В верхнем левом углу есть меню функций, среди которых ластик, отмена действия и многое другое.
Нейросеть принимает запросы (промпты) двух типов: позитивные и негативные.
В окне позитивного запроса мы детально прописываем то, что хотим получить на изображении и выбираем стиль будущего изображения (вкладка «Стиль»). Негативный промпт используем, чтобы указать те вещи, которых на генерации, наоборот, быть не должно.
При составлении запроса лучше не использовать слова, выражающие отрицание, например «не», «кроме», «без», «за исключением», «никакой», и деепричастные обороты, так как нейросеть их не поймет. Чем проще, но при этом четче и детальнее будет промпт, тем лучше справится нейросеть.
Итак, вписываем в поле запросов нужный вариант и выбираем стиль картинки, вверху выбираем формат изображения. А дальше нажимаем на кнопку генерации с изображением звёздочек.
Это результат генерации в стиле «цифровая живопись».
Чтобы загрузить изображение на ПК, нажимаем на кнопку «Скачать всё».
Если вы хотите сравнить несколько промптов или просто недовольны результатом, то можно создать новое поле для генерации. Для этого нужно мышкой перетащить его со старого изображения на свободное место. При этом сохранять картинки можно как все вместе, так и по отдельности.
Вот результат второй генерации, стиль — «мультфильм».
Кстати, так можно продолжать и дальше, создав новую генерацию в этом же поле и совершенствуя свое изображение.
А это третья генерация с тем же запросом. Стиль — «киберпанк».
Генерируем анимацию
Для создания анимации и видео переходим на вкладку «Видео» в левом столбце меню. Нам открывается новая рабочая область, в которой можно изменить модель генерации, указать размер, прописать сцены и выбрать направление камеры.
Размер анимации доступен в трех вариантах: 1:1, 9:16 и 16:9.
Нейросеть позволяет создать до 4 прописанных блоков видео по запросу длительностью до 4 секунд. Чтобы добавить новый блок, нажимаем на кнопку «Добавить сцену», чтобы удалить — на значок с изображением «корзинки».
В каждой сцене есть окно для описания и выбор определенного направления камеры. Движение и ракурс можно увидеть, если задержать на курсор на каком-либо эффекте.
Для каждой сцены прописываем подробный запрос. Я запланировала изобразить открытое море, солнце, облака, легкий ветер и парусник, который появляется издалека и постепенно приближается к зрителю.
После этого нажимаем на кнопку «Создать анимацию».
И вот что в итоге получилось.
Генерируем видео
Чтобы создать видеоролик, выбираем в разделе «Модель» опцию «Видео», а в поле «Размер» устанавливаем формат видеоролика (1:1, 9:16 или 16:9).
При создании видео нет подразделения на сцены и выбора направления камеры. Просто вписываем свой сценарий видеоролика в предложенное поле и нажимаем кнопку для генерации — «Создать видео». Ждём результат.
Я просила создать кошку на окне, которая ходит по подоконнику. Вот что вышло в итоге. Почему-то кошка не ходит, а сидит. Но в целом вышло интересно.
Марина Анатольевна, добрый день. Испытала Kandinsky 2.0. Ввела названия кривых и поверхностей (изучаются в высшей математике) в надежде получить абстрактную картину. Долго не поддавался сервис. Что-то ему не нравилось. Либо текст математических выражений, а может и капча была плохо мною введена. Упростила набор слов, получила картину не очень красивую. Но всё равно такую не придумаешь. Спасибо большое, ваши разработки в помощь всем
Спасибо большое за отзыв! Да, с Кандинским не всегда получаешь то, что хочешь. Всё-таки искусственный интеллект. 🙂 Но всё равно подспорье в работе.