Z-Image - это генератор изображений с открытым исходным кодом, предназначенный в первую очередь для создания фотореалистичных изображений на основе текстовых данных. Ориентированный как на разработчиков, так и на художников, он обещает простой рабочий процесс и эффективную работу без необходимости использования крупномасштабного оборудования.
Z-Image использует уникальную архитектуру, названную Scalable Single-Stream DiT (S3-DiT), которая обрабатывает текст и изображение вместе, улучшая понимание контекста и точность генерации.
Его модель с 6 миллиардами параметров, оптимизированная для обычных видеокарт с 16 ГБ VRAM, по-прежнему обеспечивает высококлассную генерацию с доступной скоростью. Отличаясь от других моделей ИИ, Z-Image демонстрирует редкую силу в двуязычном рендеринге текста, точно обрабатывая текст как на английском, так и на китайском языках.
В зависимости от конкретных потребностей пользователи могут выбрать варианты из семейства Z-Image, такие как Z-Image-Base, Z-Image-Turbo для быстрого вывода или Z-Image-Edit для задач точного редактирования.
Модель может быть установлена локально, что позволяет пользователям описывать свою идею на любом языке и генерировать или дорабатывать результат в соответствии с подсказками.
Кроме того, модель поддерживает использование команд естественного языка для редактирования внутри изображения, сохраняя его целостность. Несмотря на высокую производительность и профессиональные результаты, Z-Image находится в свободном доступе для коммерческого использования, исследований и модификации сообществом.

Отзывы