25.01.2023, 15:39

Как пользоваться Midjourney: простая инструкция, чтобы опробовать нейросеть с картинками

В соцсетях множатся посты в духе «нейросеть представила, как выглядели бы...» — и нередко у генератора картинок получается весьма неплохо, красиво, реалистично и забавно. Попробовать создать свои изображения при помощи самой популярной нейросети Midjourney может каждый — делимся пошаговой инструкцией для начинающих.

Варя Баркалова

Теги:

интернет

Как пользоваться Midjourney: простая инструкция, чтобы опробовать нейросеть с картинками

«Правила жизни»

Как начать работу

Работать с Midjourney можно через мессенджер Discord, популярный среди любителей компьютерных игр, — скачайте его в виде приложения или откройте в браузере веб-версию. Зарегистрируйтесь, если у вас еще нет аккаунта. Затем присоединитесь к серверу Midjourney по ссылке-приглашению.

Не пугайтесь: вы сразу попадете в огромный общий чат, где ежесекундно появляются сообщения пользователей. Нейросеть публичная, все происходит в одном пространстве, и вы можете видеть изображения, «заказанные» другими, а они — ваши.

Сервер устроен следующим образом: в левой части экрана можно выбрать каналы внутри него, там есть раздел Newcomer Rooms, содержащий сотни чатов Newbies. Вам как раз и нужен один из них — выбирайте такой, где не очень много пользователей: и генерироваться картинки будут быстрее, и ваши сообщения не потонут в общей массе. Если что, вам поможет кнопка «Почта» в правом верхнем углу окна Discord: там будут храниться уведомления, касающиеся именно ваших запросов нейросети.

Так выглядит диалоговое окно Midjourney в Discord

Скриншот из Discord

Ограничения Midjourney

Первое и самое главное: нейросеть бесплатная, но количество попыток от каждого аккаунта ограничено — всего 25. Так что используйте их с умом! Платная подписка стоит $30, а за $10 вы можете получить 200 попыток. К сожалению, оплатить с российской карты не получится.

Во-вторых, у Midjourney есть запрет на ряд слов и тем: картинки с жестокостью и порнографией она генерировать не будет. Если ваш запрос «не понравится» по каким-либо критериям, выскочит соответствующее предупреждение. Но лучше сразу почитать правила сообщества (на сервере они находятся в канале Rules), чтобы избежать конфликтов и возможного бана.

Как генерировать картинки

Теперь можно приступать собственно к картинкам. Сообщение для нейросети нужно начать с формулировки /imagine — тогда появится окошко Prompt для ввода запроса. Все, что будет написано в поле Prompt, Midjourney распознает как задачу для создания изображения. Писать лучше на английском языке — пока нейросеть плохо распознает другие. Можно указать, что вы хотите видеть на картинке, добавить описание стиля (например, «фотореализм» или «как в мультфильме»).

Промпт «Счастливая корги, которая ест булочку, в мультипликационном стиле»

Скриншот из Discord

Когда запрос сформулирован, нажимайте «Отправить», и нейросеть начнет генерировать. В ответ на ваше сообщение появятся четыре расплывчатые картинки, которые постепенно начнут обретать черты. Сколько времени это займет, зависит от нагрузки на сервер — обычно нужно пару минут.

Четыре полученных варианта — не финальные. Под ними будет по четыре кнопки с буквами U и V — для улучшения качества (Upscale) и для создания вариаций (Variation) соответственно (помните про ограничение в 25 попыток: вместо формулировки нового промпта лучше поработать с уже созданными изображениями). То есть если вы нажмете U1, то получите более детализированную версию первой из четырех картинок, а V2 позволит сгенерировать еще четыре картинки, в основе которых лежит второе из изначальных четырех изображений. Кстати, это можно делать не только со своими, но и с чужими изображениями вдруг вам понравится чей-то запрос?

Как Midjourney видит мультяшную корги с булочкой

Скриншот из Discord

После создания изображения через кнопки U, у вас под картинкой появятся новые кнопки: Make Variations (получить еще четыре версии этой детализированной картинки), Light / Beta Upscale Redo (вариации увеличения — с меньшим количеством деталей и с большим разрешением соответственно), Web (ссылка на галерею на сайте Midjourney) и эмодзи, чтобы оценить результат.

Вот что может получиться в итоге

Скриншот из Discord

Если вам понравилось, нажимайте на изображение, затем «Открыть в браузере», и сохраняйте картинку в хорошем качестве.

Как настроить нейросеть

Если в поле сообщений ввести /settings, то появится меню настроек.

Меню настроек Midjourney

Скриншот из Discord

Первый блок кнопок с буквами MJ — версии «движка» (чем новее, тем лучше). MJ Test будет выдавать два экспериментальных изображения вместо четырех, MJ Test Photo специализируется на фотореализме.
Настройки Quality влияют на качество изображения (для начала Base quality, то есть базового, будет достаточно).
Style отвечает за уровень стилизации (опять же, пробуйте средний, на более высоком нейросети сложнее попасть в ваш запрос, будет слишком фантазийно).
Upscale — это алгоритм увеличения изображения. Regular upscale — стандартный; Light upscale добавляет меньше деталей при увеличении разрешения; Beta выдает размер вдвое больше Regular (но, как любая бета-версия, может сбоить).
Режимы Mode отвечают за разный доступ. Сразу предупредим: Private mode, при котором ваши запросы не видны остальным, — платный, равно как и Relax mode без счетчика попыток. А вот Remix mode позволяет «скрещивать» картинки и работать с готовым изображением — ниже покажем, как это делать.

Как объединять изображения

Пара слов про Remix mode — ту самую опцию, позволяющую превратить вашу фотографию в героя аниме или скрестить дроидов из «Звездных войн» с персонажами «Гарри Поттера». Для стилизации одного исходного изображения в поле Prompt нужно дать ссылку на него и дальше прописать параметры — например, «в стиле картины Ван Гога» или «как в "Симпсонах". Чтобы "скрещивать" изображения, в промпт вставляются ссылки на каждое из них (последовательность ссылок не особо влияет на результат). Нейросеть также выдаст четыре версии, с которыми можно дальше работать.

То, что получилось при объединении изображений R2D2 и Гарри Поттера

Midjourney

Как правильно писать промпты

Общение с Midjourney на поверку оказывается не таким уж простым. Свой запрос лучше делать максимально емким и конкретным. Чтобы нейросети было понятнее ваше обращение, можно использовать внутри промпта своеобразный синтаксис в виде двух двоеточий с пробелами с обеих сторон. В основном промпт лучше формулировать таким образом: «Описание объекта :: стилистика :: дополнительные параметры :: --короткие команды».

Команды, прописанные через двоеточия, дают более качественный результат

Скриншот Discord

Вот некоторые полезные команды, которые можно прописать при генерации картинки:

--ar — aspect ratio, то есть соотношение сторон: позволяет создать не только квадратную картинку, которая получается по умолчанию. Можно задать конкретные размеры картинки в пикселях при помощи команд -‎-w для ширины и -‎-h для высоты;

--wallpaper позволяет создать более детальное и качественное изображение для обоев рабочего стола и работает лучше, чем другие настройки качества в Midjourney;

-‎-no указывает, чего на картинке быть не должно;

-‎-chaos <от 0 до 100> изменяет «хаотичность» результатов: чем выше значение, тем более непохожими друг на друга будут варианты;

-‎-test -‎-creative добавляет результатам креативности.

-‎-video — записывает видео процесса генерации. Потом нужно будет ответить на сгенерированное изображение эмодзи конверта, и бот пришлет его вам в личные сообщения.

Если хочется более углубленной работы со стилистикой изображений, вот тут можно найти лайфхаки, как правильно формулировать запросы. А для тех, кто хочет глубже погрузиться в работу с нейросетью и написание правильных запросов, есть специальные сервисы для составления идеальных промптов — например, Phraser, Prompter, Promptomania, Noonshot.