Генераторы искусства ИИ имеют плохую репутацию из-за неточных изображений рук. Давайте сравним Midjourney v5 с Dall-E 2, чтобы увидеть, что лучше.
Генераторы искусственного интеллекта продолжают впечатлять, позволяя нам создавать практически все, что мы можем себе представить. Тем не менее, технология, кажется, уперлась в кирпичную стену, когда дело доходит до создания реалистично выглядящих рук.
Здесь мы рассмотрим два ведущих приложения для генеративного искусства и сопоставим их лицом к лицу — или из рук в руки — чтобы увидеть, какое из них может генерировать лучшие руки, Midjourney v5 или Dall-E 2. Освоили ли одно из этих приложений руки? Давай выясним!
Проблема ИИ с руками
С тех пор как искусство, созданное искусственным интеллектом, стало широко распространяться в Интернете, возникла критика по поводу качество рук, нарисованных ИИ. Несмотря на недавние обновления, как показано в наших параллельных сравнениях, результаты не были удовлетворительными.
Оба претендента улучшали свои возможности и качество результатов с каждой итерацией. Последнее обновление,
Версия 5 Midjourney, продемонстрировал впечатляющий прогресс. Однако проблема с руками, нарисованными ИИ, остается нерешенной, и ее нельзя игнорировать.Сравнение 1: Использование подсказок «Рука» и «Руки»
Наши сравнения будут содержать одни и те же подсказки как для Dall-E 2, так и для Midjourney v5. Мы разработаем подсказки для конкретных рук, а не просто создадим людей, чтобы посмотреть, как выглядят руки. Мы также даем каждому приложению только один шанс (бросок) для каждой подсказки.
Рука
Давайте начнем с самой простой и актуальной подсказки: «рука».
Середина пути v5:
Далл-Э 2:
Мы не на хорошем старте!
Midjourney выбрал необычный путь, связав раздачу с довольно творческими ситуациями. Вместо того, чтобы сосредоточиться только на руке, мы видим волшебника, перчатки, скелет и крошечную фигурку. На изображении с перчатками тоже отсутствует палец.
Dall-E 2 использует противоположный подход и предлагает нам всего одну руку на простом фоне. Но как ни странно, есть некоторые странные позы, особенно с большими пальцами, которые не выглядят естественными или удобными. Каждая рука также обрезана с одной из сторон изображения.
Кто победит в этом раунде? Мы отдадим его Dall-E 2 для общей точности.
Руки
Теперь давайте составим приглашение во множественном числе «руки» и посмотрим, что придумают ИИ.
Середина пути v5:
Далл-Э 2:
Попытка Midjourney «руками» на этот раз получается лучше. Но все четыре изображения черно-белые, и у нас не хватает нескольких пальцев. При ближайшем рассмотрении вы также можете увидеть, что некоторые цифры имеют странную форму или превращаются друг в друга.
Dall-E 2 по-прежнему имеет стрелки с простым фоном. Пропущенных цифр нет, но на третьем изображении руки обрезаны, а другие версии кажутся неуклюжими по композиции и вообще лишены творчества.
Назовем это сравнение ничьей. Dall-E 2 выиграл бы за точность, если бы это был единственный фактор, но Midjourney удается создать некоторые красивые изображения в черно-белом исполнении, даже если все четыре версии не очень реалистичный.
Вы всегда можете используйте Photoshop, чтобы исправить свое искусство Midjouney, включая руки.
Сравнение 2: жесты рук
Давайте сравним пару жестов рук, которые почти повсеместно узнаваемы.
Скрещенные пальцы
Во-первых, давайте попробуем "скрестить пальцы".
Середина пути v5:
Далл-Э 2:
Можно с уверенностью сказать, что Midjourney полностью испортил эту подсказку. Нам не хватает пальцев, и ни одна из версий не выглядит естественной.
Еще раз снимаю шляпу перед Dall-E 2 за правильное подсчет пальцев, но это единственная хорошая новость. Каждая версия выглядит так, будто пальцы принимают свои собственные позы йоги в игре Twister.
В этом сравнении нет победителя.
Недурно
Далее мы собираемся с "палец вверх".
Середина пути v5:
Далл-Э 2:
Midjourney правильно подсчитывает количество пальцев, творчески обрабатывая каждую подсказку. Заметили введение иллюстративного стиля?
Dall-E 2 также получает очки за точность, не пытаясь раскачивать лодку чем-то творческим, добавленным к каждому результату.
Здесь нет явного победителя.
Сравнение 3: Руки с предметами
Теперь мы усложним задачу, побуждая руки взаимодействовать с объектами.
Рука, держащая хрустальный шар
Давайте начнем со случайного объекта, используя подсказку «рука, держащая хрустальный шар».
Середина пути v5:
Далл-Э 2:
По мере того, как мы повышаем сложность, Midjourney начинает сиять. Если не считать пары изображений, выглядящих неестественно, руки и хрустальные шары выглядят красиво. Midjourney даже уделяет время созданию отражений в стекле, которые, безусловно, добавляют креативности.
Но впервые мы видим, что у Dall-E 2 отсутствует цифра по крайней мере в одной из рук, а четвертая рука выглядит просто странно. Хрустальные шары также выглядят не так впечатляюще, как в Midjourney.
Midjourney одерживает первую победу.
Рука, держащая воду
Давайте попробуем что-нибудь еще более сложное с подсказкой «рука держит воду».
Середина пути v5:
Далл-Э 2:
Midjourney удается свернуть только одно изображение с правильным количеством цифр. Несмотря на красивое изображение, мы снова начинаем видеть трещины в отделе правдоподобия.
Dall-E 2 также борется с получением естественных рук, но делает это намного лучше. Он также переключает цвет фона для некоторого разнообразия.
Мы отдадим этот раунд Dall-E 2.
Сравнение 4: Рабочие руки
Для этого сравнения мы создадим подсказки, в которых задействованы руки.
Руки Лепка Глина
Давайте посмотрим, как справятся модели ИИ с «ручной лепкой из глины».
Середина пути v5:
Далл-Э 2:
Midjourney пропустил палец на двух изображениях, но все остальное выглядит великолепно.
Изображения Dall-E 2 выглядят запутанными и перегруженными, в половине версий приходится добавлять руки другого человека.
Край переходит в Midjourney.
Руки, давящие тесто
Давайте попробуем аналогичное упражнение «ручное прессование теста».
Середина пути v5:
Далл-Э 2:
Изображения Midjourney в целом выглядят великолепно. Но опять же, у половины из них пропущены цифры. Но изображения нельзя обвинить в их художественном стиле.
В версиях Dall-E 2 также отсутствуют пальцы в половине исполнений и даже добавлен один на последнюю руку в наборе.
Назовем это ничьей.
Если вы хотите попробовать эти сравнения для себя, мы покажем вам как использовать Midjourney для создания ИИ-арта.
Что нам говорят результаты?
Интересно провести сравнение и определить победителя. И если бы нам пришлось выбирать, мы бы выбрали Midjourney v5. Хотя Dall-E 2 чаще создавал руки с правильным количеством пальцев, именно Midjourney создавал более художественные и привлекательные изображения.
Но у обоих приложений есть место на рынке для художников, которые используют изображения Dall-E 2 и Midjourney для своей работы. Оба способны создавать руки, которые можно использовать в качестве вырезов или в композитах для художественного, редакционного и коммерческого использования. Это просто вопрос личных предпочтений.
ИИ в конце концов победит руки
Приложения для генеративного искусства, такие как Dall-E 2 и Midjourney, прошли долгий путь в своей способности создавать реалистичное и фантастическое искусство. Они все еще борются с генерацией рук, но, учитывая ускорение генеративных технологий, мы можем ожидать улучшения только в ближайшем будущем.