Современные нейросети по генерации изображений умеют не только создавать картинки по текстовым описаниям, но и дорисовывать загруженные им изображения, создавая то, чего не было изначально. Данный метод имеет несколько названий: outpainting, generative expand, zoom out, uncrop и пр. Суть одна и та же, как её не назови: исходное изображение остается неизменным, дорисовываются только края.
Недавно мы рассматривали эффективные приемы того, как добиться классных результатов в генерации при помощи Bing Image Creative. Данная нейросеть создает картинки в пропорции 1:1. Но что делать, если вам нужно более широкое изображение, например, 3:2, 4:3 либо вовсе 16:9? Всё очень просто: вы генерируете картинку в Bing, затем дорисовываете её края до нужных пропорций при помощи одного из приведенных в данной статье онлайн сервисов на базе AI.
Важный момент: все рассмотренные сервисы требуют активной учетной записи для работы, поэтому сначала авторизуйтесь на сайте и только потом начинайте загружать изображения и выполнять дальнейшие действия. Все нейросети бесплатны, некоторые имеют лимит на количество генераций.
Fusion Brain (Kandinsky)
Первый сервис, который хочу порекомендовать вам для работы, называется Fusion Brain, он же Kandinsky. Ранее я подробно рассказывал о нем и делился своими впечатлениями. Сервис полностью русскоязычный.
Переходим в редактор Fusion Brain и в верхней части экрана нажимаем кнопку «Вставить изображение».
Для примера я возьму картинку, которая была предварительно мной создана в Bing. Она имеет квадратные пропорции и разрешение 1024х1024 px.
Важный момент при работе с нейросетью Kandinsky состоит в том, что она может расширить изображение только до 1024 px по высоте или ширине. Иными словами, если у вас исходная картинка уже имеет разрешение 1024 px по любой из сторон, то нейросеть физически не сможет расширить ей края.
Поэтому сразу после загрузки картинки в нейросеть измените её размер при помощи рамки (сделайте картинку более маленькой, чем она была) и нажмите кнопку «Сохранить».
На следующем этапе установите нужные пропорции будущего изображения (можно выбрать из предустановленных форматов). В моём случае я буду делать outpainting, то есть расширять картинку с дорисовкой краев по бокам.
Под изображением есть поле для ввода текстового ввода. Используйте его, если вы хотите добавить к изображению новые визуальные элементы. Я оставлю данное поле пустым, чтобы дать нейросети полную свободу творчества и посмотреть, насколько корректно она справится с выполнением задачи генеративного заполнения свободного места.
Как видите, результат оказался совсем неплох – AI Kandinsky прекрасно справился с дорисовкой краев картинки.
Ну что ж, дадим ему задачу посложнее и попросим его достроить не только боковые края, но также верхнее и нижнее.
Итог: Kandinsky справился, на мой взгляд, просто великолепно. Ничего не размазано, не образовалось никаких неприятных артефактов. Нейросеть хорошо распознала общую композицию и сюжет изображения, и на основе этого абсолютно корректно расширило его до нужных пропорций, заполнив имеющиеся пробелы.
Phot.ai
Следующим сервисом, который поможет выполнить достроить края изображения, является Phot.ai. Нужная нам функция у него называется AI Image Extender и воспользоваться ей можно, перейдя по ссылке.
Загрузите свою картинку в окошко путем перетаскивания или нажатием кнопки «Upload».
Измените размер загруженного изображения относительно синей рамки. Вы можете перетаскивать края картинки вручную либо воспользоваться одним из заданных шаблонов пропорций. После выставления нужных размеров нажмите кнопку «Generate», чтобы запустить процесс выполнения задачи zoom-out.
И вот как Phot.ai справился с задачей:
Итог: Получилось очень достойно. Значительных артефактов и ошибок нет.
Fotor
Следующий герой нашего обзора – популярный фоторедактор Fotor. Заходим на сайт, нажимаем кнопку «Extend Image with AI» и загружаем своё изображение.
Как и в предыдущем случае, расположите свою картинку относительно синей рамки – все пробелы между ней и краями изображения будут заполнены нейросетью. После этого нажмите кнопку «Generate».
Нейросеть генерирует сразу два варианта, из которых вы можете выбрать лучший. Если нажать кнопку «Generate more», AI создаст несколько дополнительных вариантов изображения.
Итог: Результат процесса outpainting у Fotor мне понравился значительно меньше, чем у предыдущих сервисов. AI заполняет свободное пространство с огрехами в сюжете, глазу видны грубые артефакты.
Picsart
Как и все предыдущие герои данного обзора, Picsart имеет опцию Uncrop, но его уникальной особенностью является то, что делает он это буквально налету. Вы чуть переместили границу рамки – нейросеть сразу же принялась заполнять свободное место. С одной стороны удобно тем, что не надо ждать, но с другой стороны – уж слишком всё стремительно 😊
- Переходите на сайт Picsart и нажимайте кнопку «Expand Images for Free».
- Выберите свою картинку, которую надо расширить.
- В открывшемся фоторедакторе раздвигайте края синей рамки до нужных значений. Свободное место будет заполнено новыми визуальными элементами, которые сгенерирует нейросеть.
Итог: Нейросеть работает очень быстро. Качество дорисовки краев зачастую оставляет желать лучшего, но в целом неплохо.
RunwayML
Онлайн нейросеть RunwayML имеет целый набор инструментов для работы с графикой на основе AI. Интересующий нас функционал называется «Expand Image» и находится здесь.
- Загружаете свою картинку
- Указываете нужные пропорции (только выбор из заданных шаблонов) и степень Uncrop
- Пишете текстовое описание для заполнения свободного места (необязательно)
- Нажимаете кнопку «Generate»
- Из четырех сгенерированных вариантов выбираете лучший
Итог: Если на абстрактных картинках всё выглядит более-менее сносно, то на фотографиях заметно очень много артефактов. Сгенерированные нейросетью RunwayML фрагменты картинки зачастую отличаются по качеству от оригинала и выглядят весьма инородно.
ClipDrop
Еще одним хорошим бесплатным инструментом по расширению изображения является нейросеть ClipDrop.
Работает она по уже хорошо известному нам алгоритму:
- Заходим на сайт ClipDrop
- Загружаем свою картинку
- Выставляем пропорции и размер генерации (перетаскиванием рамки либо выбором шаблона)
- Запускаем генерацию
На выходе получаем сразу 4 варианта картинки с дорисованными краями.
Сервис очень популярный, им пользуются много людей, имеет как бесплатный, так и платный тарифный план. Бесплатное использование подразумевает ожидание очереди на генерацию, которая нередко бывает под 200 пользователей. Однако даже в этом случае время ожидания у меня никогда не превышало 3-5 минут.
Итог: ClipDrop с картинками справляется отлично, с фотографиями часто бывают огрехи в понимании композиции и сюжета.
Выводы
Когда стоит задача расширить изображение методом uncrop, zoom out или outpainting, то большинство пользователей сразу вспоминают про Midjourney и Photoshop. Эти инструменты действительно хороши, но они платны.
Про онлайн нейросети для дорисовки краев без изменения содержимого исходного изображения знают буквально единицы. И уж тем более, большинство пользователей и понятия не имеют, что они могут быть бесплатны для использования и отлично справляться со своей задачей.
Из всех протестированных и описанных мной в статье сервисов больше всего понравились два: Fusion Brain от Kandinsky и Phot.ai. На моих тестовых изображениях они показали наилучшие результаты по достраиванию краев с добавлением новых визуальных элементов, продемонстрировав меньше всего огрехов в понимании исходного сюжета и отсутствию значительных артефактов на сгенерированных фрагментах картинки.
Похожие публикации: