Andrey Suslov/Shutterstock/FOTODOM

Задачи для ИИ: дизайн

Подборка полезных нейросетей для работы с визуальным контентом
Искусственный интеллект все чаще используется в медиа и коммуникациях. По данным платформы HubSpot, 20% маркетологов применяют нейросети для создания текстов, 20% – изображений, 18% составляют план материала. ИИ-технологии становятся частью ежедневной работы и контент-стратегии. Мы тоже поручаем нейросетям креативные и рутинные задачи. Сделали подборку полезных сервисов для разных целей. Начнем с визуального контента.

1. Сгенерировать, а не рисовать

Нейросети генерируют изображения по текстовому описанию (промту). Как это сделать поэтапно, писали тут.

Мы в работе чаще используем Stable Diffusion. Это функциональная нейросеть с открытым исходным кодом. Подходит для создания иллюстраций и модификации уже загруженных картинок. Система основана на методе диффузии, что позволяет создавать проекты высокого качества с хорошей детализацией, что очень важно для печатных изданий. Работы этой нейронки можно смело вешать на билборды.

Любимица многих брендов, нейросеть Midjourney также генерирует изображения по промту через аккаунт в Discord. Раньше ее визуалы годились только для соцсетей и ТГ-каналов. Сейчас качество заметно выше: можно создавать изображения для полиграфии до формата А4.

Эти платформы, в частности, помогли нам в оформлении корпоративного журнала ВТБ «Энергия команды», посвященного технологической трансформации банка, и обложки журнала «Вестник цифровой трансформации РЖД».
Однако хороший результат с любой нейросетью возможен только при участии человека.

3 совета, как создать картинку мечты:

  • грамотно формулируйте запросы на создание изображения. Чем подробнее, тем лучше: реальность окажется близка к ожиданиям;
  • удаляйте из сгенерированной картинки артефакты, то есть заметные искажения изображения, вызванные сжатием. Сделать это можно с помощью графического редактора с дополнительными модулями шумоподавления или другой нейросети, например Topaz Labs (устанавливается на ПК и имеет бесплатную демоверсию).
  • не бойтесь дополнить изображение красивыми деталями.

Пример: мы задали Midjourney запрос: russian epic hero with shield and sword, bogatyr, binary computer code on background, fantasy, russian fairy tale, highly detailed, ultrarealistic.
Также реалистичные изображения объектов по промту можно создать в DALL-E 2. Система создана на базе GPT-3 и CLIP, а свое название берет от сочетания имен художников Salvador Dali и Ettore Bugatti.

Результат c разрешением до 1024 пикселей по текстовому запросу выдает нейросеть Kandinsky 2.2. Можно выбрать стиль, размер изображения и немного подредактировать его после генерации. Плюс: платформа хорошо понимает по-русски.

Сгенерировано в StarryAI
Сервис StarryAI на базе нейросетей Argo и Altair поддерживает более 30 стилей разных digital-художников, создавая свои картины. Ее неоспоримый плюс: реалистичные лица людей.

Lexica Aperture неплохо справляется с арт-иллюстрациями. В промт добавляются слова-исключения. В онлайн-библиотеке сервиса много изображений других пользователей, которые можно отредактировать под себя.
Еще есть нейросеть Playground AI, работающая на базе Stable Diffusion, с полноценным редактором. После генерации картинки ее можно довести до совершенства прямо тут. Сервис напоминает социальную сеть. Есть публичная лента, где можно подписаться на автора, взять его дизайн на доработку или использовать готовый промт.

2. Копировать стиль

Нейронки обучены передаче стиля. Они создают новые вариации существующих дизайнов, используя заложенные художественные стили или опираясь на другое изображение.
Текстовый запрос: a man in a black suit and a woman in a red dress beautifully dance tango in the desert
Текстовый запрос: a man in black suit and a woman in red dress beautifully dance tango in the desert, by Claude Monet
Изображения сгенерированы в нейросети Stable Diffusion

3. Подобрать цвета

ColorSpace по указанному цвету создаст целую палитру оттенков. Здесь можно быстро сгенерировать красивую комбинацию. Это удобно, когда с нуля разрабатывается колористика нового сайта или визуальная концепция бренда.

Вот, например, сколько вариантов можно подобрать для небесно-голубого цвета.
Khroma – еще одна нейросеть для поиска цветовых решений. Она не только подберет основную палитру, но и поможет с типографикой (цвет шрифта + цвет фона), предложит оригинальные градиенты и даже выберет фильтр для иллюстраций.

Подобными функционалом обладает и Uizard Design Assitant, однако у системы есть и другие полезные функции (о них – ниже).

4. Обработка фотографий

Медиа сложно представить без фотографий. Редактирование снимков с помощью ИИ может быть гораздо быстрее, чем с помощью графического редактора.

Например, Bigjpg увеличивает фото до 16 раз. Это очень удобно, но будьте осторожны: нейронка как бы дорисовывает объекты, из-за этого детали могут слегка исказиться. Если вы заранее знаете, что картинку будут придирчиво рассматривать, стоит ее тщательно проверить после генерации.

Erase.bg позволяет за считаные секунды убрать фон с фотографии. Причем можно не только загружать изображение напрямую, но и давать ссылку на него.

А с помощью Random Face Generator можно получить вполне реалистичные изображения, похожие на снимки людей. Это, конечно, не про обработку фото, но иногда может пригодиться. Советуем зайти на сайт и оценить, насколько легко спутать реальный и поддельный кадр.

5. Дизайн сайта

Создание персонализированного дизайна сайта уже недалекое будущее для ИИ. Оформление такого ресурса будет меняться в зависимости от интересов, поведения и других характеристик пользователя.

Вероятно, в ближайшие годы конструкторы вроде Tilda будут интегрироваться с нейросетями, чтобы автоматически создавать сайты с уникальным дизайном. А сейчас упомянутая выше Midjourney может неплохо генерировать дизайны страниц. В запросе указываются формулировка professional website или site of the company, тема проекта, цветовая гамма (если она заранее известна) и формат экрана. Система может нарисовать варианты как для стандартных лендингов, так и мобильных приложений. Сам сайт создать пока не получится, но поймать вдохновение – вполне.

6. Рутина на поток

Система Uizard Design Assitant, о которой мы упоминали ранее, позволяет автоматизировать повторяющиеся задачи, оставляя время для творчества. Вот несколько примеров:

  • превращать скриншоты в редактируемые макеты по наброскам. Нужно всего лишь вставить рисунок, скриншот или любое другое изображение, и сеть выдаст готовый редактируемый макет;
  • создать стили, типографику, цвета по одному из скриншотов проекта;
  • генерировать тепловые карты, позволяя спрогнозировать зоны внимания пользователей. Полезная функция для проверки интерфейса перед юзабилити-тестированием.
Искусственный интеллект Робби помогает анализировать изображения, в частности, вычислить площадь текста на картинке (может пригодиться для прохождения модерации рекламного поста в соцсети «ВКонтакте»), определять марку автомобиля по фото и отфильтровывать контент 18+.

Сервис Watermark Remover, также основанный на нейротехнологиях, позволяет удалять с изображений водяные знаки, логотипы и текст. Сразу скажем, что мы против нелицензионного использования иллюстраций. Но, например, можно презентовать проект с картинками из фотобанка (убрав с них водяные знаки), а после утверждения – их официально выкупить.

7. Обработка и генерация видео

Если вы не хотите останавливаться на статичном изображении и разнообразить ваши коммуникации гифками и видеороликами, здесь тоже могут помочь нейросети.

Платформа D-ID позволяет создать говорящий аватар на основе фотографии. Достаточно загрузить изображение и написать текст, который нужно озвучить. Несмотря на то что основной язык системы – английский, озвучивать по-русски она тоже умеет. Подобным функционалом обладают также системы Synthesia, Visper.
Сервис Pictory хорошо подходит для создания небольших видеороликов и гиф-анимации по текстовому запросу.

Сделать стилизованную анимацию, используя готовые варианты или текстовое описание, можно с помощью нейронок Runway, Kaiber и ранее упомянутой Stable Diffusion. За основу можно взять как изображение, так и существующее видео.

Сгенерировано в Pictory
Так, с помощью ИИ на базе ранее снятого материала была сгенерирована анимация для ролика, посвященного конкурсу цифрового искусства для проекта RZD.Digital. Ведущая в кадре на несколько секунд стала роботом. Образ был создан в Stable Diffusion, а анимация головы доработана с помощью платформы EbSynth.
Tilda Publishing
Это лишь часть возможностей нейросетей-художников, которые уже сейчас используются в коммуникациях. Технологии развиваются, и новые появляются каждый месяц. А мы стараемся следить за всеми новинками и использовать их в работе. Если тоже хотите сделать ИИ своим помощником, обращайтесь!

Читайте также