Генераторы искусства ИИ имеют плохую репутацию из-за неточных изображений рук. Давайте сравним Midjourney v5 с Dall-E 2, чтобы увидеть, что лучше.

Генераторы искусственного интеллекта продолжают впечатлять, позволяя нам создавать практически все, что мы можем себе представить. Тем не менее, технология, кажется, уперлась в кирпичную стену, когда дело доходит до создания реалистично выглядящих рук.

Здесь мы рассмотрим два ведущих приложения для генеративного искусства и сопоставим их лицом к лицу — или из рук в руки — чтобы увидеть, какое из них может генерировать лучшие руки, Midjourney v5 или Dall-E 2. Освоили ли одно из этих приложений руки? Давай выясним!

Проблема ИИ с руками

С тех пор как искусство, созданное искусственным интеллектом, стало широко распространяться в Интернете, возникла критика по поводу качество рук, нарисованных ИИ. Несмотря на недавние обновления, как показано в наших параллельных сравнениях, результаты не были удовлетворительными.

Оба претендента улучшали свои возможности и качество результатов с каждой итерацией. Последнее обновление,

instagram viewer
Версия 5 Midjourney, продемонстрировал впечатляющий прогресс. Однако проблема с руками, нарисованными ИИ, остается нерешенной, и ее нельзя игнорировать.

Сравнение 1: Использование подсказок «Рука» и «Руки»

Наши сравнения будут содержать одни и те же подсказки как для Dall-E 2, так и для Midjourney v5. Мы разработаем подсказки для конкретных рук, а не просто создадим людей, чтобы посмотреть, как выглядят руки. Мы также даем каждому приложению только один шанс (бросок) для каждой подсказки.

Рука

Давайте начнем с самой простой и актуальной подсказки: «рука».

Середина пути v5:

Далл-Э 2:

Мы не на хорошем старте!

Midjourney выбрал необычный путь, связав раздачу с довольно творческими ситуациями. Вместо того, чтобы сосредоточиться только на руке, мы видим волшебника, перчатки, скелет и крошечную фигурку. На изображении с перчатками тоже отсутствует палец.

Dall-E 2 использует противоположный подход и предлагает нам всего одну руку на простом фоне. Но как ни странно, есть некоторые странные позы, особенно с большими пальцами, которые не выглядят естественными или удобными. Каждая рука также обрезана с одной из сторон изображения.

Кто победит в этом раунде? Мы отдадим его Dall-E 2 для общей точности.

Руки

Теперь давайте составим приглашение во множественном числе «руки» и посмотрим, что придумают ИИ.

Середина пути v5:

Далл-Э 2:

Попытка Midjourney «руками» на этот раз получается лучше. Но все четыре изображения черно-белые, и у нас не хватает нескольких пальцев. При ближайшем рассмотрении вы также можете увидеть, что некоторые цифры имеют странную форму или превращаются друг в друга.

Dall-E 2 по-прежнему имеет стрелки с простым фоном. Пропущенных цифр нет, но на третьем изображении руки обрезаны, а другие версии кажутся неуклюжими по композиции и вообще лишены творчества.

Назовем это сравнение ничьей. Dall-E 2 выиграл бы за точность, если бы это был единственный фактор, но Midjourney удается создать некоторые красивые изображения в черно-белом исполнении, даже если все четыре версии не очень реалистичный.

Вы всегда можете используйте Photoshop, чтобы исправить свое искусство Midjouney, включая руки.

Сравнение 2: жесты рук

Давайте сравним пару жестов рук, которые почти повсеместно узнаваемы.

Скрещенные пальцы

Во-первых, давайте попробуем "скрестить пальцы".

Середина пути v5:

Далл-Э 2:

Можно с уверенностью сказать, что Midjourney полностью испортил эту подсказку. Нам не хватает пальцев, и ни одна из версий не выглядит естественной.

Еще раз снимаю шляпу перед Dall-E 2 за правильное подсчет пальцев, но это единственная хорошая новость. Каждая версия выглядит так, будто пальцы принимают свои собственные позы йоги в игре Twister.

В этом сравнении нет победителя.

Недурно

Далее мы собираемся с "палец вверх".

Середина пути v5:

Далл-Э 2:

Midjourney правильно подсчитывает количество пальцев, творчески обрабатывая каждую подсказку. Заметили введение иллюстративного стиля?

Dall-E 2 также получает очки за точность, не пытаясь раскачивать лодку чем-то творческим, добавленным к каждому результату.

Здесь нет явного победителя.

Сравнение 3: Руки с предметами

Теперь мы усложним задачу, побуждая руки взаимодействовать с объектами.

Рука, держащая хрустальный шар

Давайте начнем со случайного объекта, используя подсказку «рука, держащая хрустальный шар».

Середина пути v5:

Далл-Э 2:

По мере того, как мы повышаем сложность, Midjourney начинает сиять. Если не считать пары изображений, выглядящих неестественно, руки и хрустальные шары выглядят красиво. Midjourney даже уделяет время созданию отражений в стекле, которые, безусловно, добавляют креативности.

Но впервые мы видим, что у Dall-E 2 отсутствует цифра по крайней мере в одной из рук, а четвертая рука выглядит просто странно. Хрустальные шары также выглядят не так впечатляюще, как в Midjourney.

Midjourney одерживает первую победу.

Рука, держащая воду

Давайте попробуем что-нибудь еще более сложное с подсказкой «рука держит воду».

Середина пути v5:

Далл-Э 2:

Midjourney удается свернуть только одно изображение с правильным количеством цифр. Несмотря на красивое изображение, мы снова начинаем видеть трещины в отделе правдоподобия.

Dall-E 2 также борется с получением естественных рук, но делает это намного лучше. Он также переключает цвет фона для некоторого разнообразия.

Мы отдадим этот раунд Dall-E 2.

Сравнение 4: Рабочие руки

Для этого сравнения мы создадим подсказки, в которых задействованы руки.

Руки Лепка Глина

Давайте посмотрим, как справятся модели ИИ с «ручной лепкой из глины».

Середина пути v5:

Далл-Э 2:

Midjourney пропустил палец на двух изображениях, но все остальное выглядит великолепно.

Изображения Dall-E 2 выглядят запутанными и перегруженными, в половине версий приходится добавлять руки другого человека.

Край переходит в Midjourney.

Руки, давящие тесто

Давайте попробуем аналогичное упражнение «ручное прессование теста».

Середина пути v5:

Далл-Э 2:

Изображения Midjourney в целом выглядят великолепно. Но опять же, у половины из них пропущены цифры. Но изображения нельзя обвинить в их художественном стиле.

В версиях Dall-E 2 также отсутствуют пальцы в половине исполнений и даже добавлен один на последнюю руку в наборе.

Назовем это ничьей.

Если вы хотите попробовать эти сравнения для себя, мы покажем вам как использовать Midjourney для создания ИИ-арта.

Что нам говорят результаты?

Интересно провести сравнение и определить победителя. И если бы нам пришлось выбирать, мы бы выбрали Midjourney v5. Хотя Dall-E 2 чаще создавал руки с правильным количеством пальцев, именно Midjourney создавал более художественные и привлекательные изображения.

Но у обоих приложений есть место на рынке для художников, которые используют изображения Dall-E 2 и Midjourney для своей работы. Оба способны создавать руки, которые можно использовать в качестве вырезов или в композитах для художественного, редакционного и коммерческого использования. Это просто вопрос личных предпочтений.

ИИ в конце концов победит руки

Приложения для генеративного искусства, такие как Dall-E 2 и Midjourney, прошли долгий путь в своей способности создавать реалистичное и фантастическое искусство. Они все еще борются с генерацией рук, но, учитывая ускорение генеративных технологий, мы можем ожидать улучшения только в ближайшем будущем.