고퀄리티 이미지 생성 AI 3가지 - 미드저니, 스테이블 디퓨전, 플럭스


AI 아트디렉터가 사용하는 이미지 생성 AI 3가지






이미지 생성 AI는 최근 눈부신 발전을 이루며, 많은 사람들의 관심을 받고 있습니다. 특히, '미드저니(Midjourney)'가 출시된 이후로, 약 2년이 채 되지 않는 짧은 시간 동안  단점을 보완하며 빠르게 발전해 왔고 디지털 아트나 디자인 분야에서 중요한 도구로 자리매김하고 있습니다.


미드저니가 출시된 이후 많은 이미지 생성 AI 프로그램이 생겨나면서 이젠 AI 기능이 없는 이미지 툴이 없을 정도가 되었습니다.


그중에서도 '테이블 디퓨전(Stable Diffusion)'과 최근 떠오르고 있는 '플럭스(Flux)'는 각각 자신만의 매력을 가진 대표적인 이미지 생성 AI 툴로 글로벌 유저들에게 주목받으며 미드저니와 함께 이미지 생성 AI의 3대 강자로 여겨지고 있습니다.

 

 


'미드저니(Midjourney)'는 2021년 7월에 설립된 스타트업으로, 사용자가 입력한 텍스트 프롬프트를 바탕으로 예술적이고 창의적인 이미지를 생성하는 도구입니다. 설립 초기부터 미드저니는 디지털 아티스트, 디자이너, 그리고 크리에이티브 분야의 종사자들 사이에서 큰 관심을 받으며, 디지털 아트와 창작 활동에 혁신적인 변화를 가져왔습니다. 


미드저니는 사용자가 텍스트로 이미지를 설명하는 '프롬프트'(prompt)를 입력하여 이미지를 생성하는 (Text-to-Image) 방식으로 이루어져 있습니다. 


미드저니의 '파라미터' 기능을 사용하여 이미지를 다양하게 조절할 수 있습니다. 처음엔 조금 복잡해 보일 수 있지만 파라미터에 익숙해지고 이를 적절히 사용하면, 창의적이고 다양한  스타일의 이미지를 얻을 수 있습니다.

 


미드저니가 가진 강점


1. 모바일에서 모두 사용 가능

최근 웹 버전이 나오긴 했지만 미드저니는 기본적으로 Discord 플랫폼을 통해 운영되는 클라우드 기반 서비스입니다. 디스코드는 모바일에서도 사용이 가능하기 때문에 미드저니 유저들은 언제 어디서나 쉽게 이미지를 생성할 수 있습니다.



2. 간단한 프롬프트로 고품질 이미지 생성

사용자 친화적인 직관적인 인터페이스와 간단한 명령어로 쉽게 접근할 수 있어, 비전문가도 손쉽게 사용할 수 있습니다.


3. 예술적이고 창의적인 이미지 무한 생성

특히, 파라미터를 사용하면 다양한 조합을 통해  인간이 상상하지 못한 창의적이고 독창적인 이미지 생성이 가능하여, 창의적인 작품을 만드는 예술가나 디자이너들에게 유용합니다.


미드저니의 단점 


미드저니(Midjourney)의 단점 중 하나는 세부적인 이미지 커스터마이징 옵션이 제한적이라는 점입니다. 미드저니는 주로 텍스트 프롬프트를 기반으로 이미지를 생성하기 때문에, 사용자가 특정 요소나 세부사항을 원하는 대로 직접 조정하거나 수정하는 데 한계가 있습니다. 


결과물이 어떻게 나올지 모르기 때문에 생성된 이미지에서 특정 색상, 질감, 또는 개별 요소를 미세하게 조정하고자 할 때는 맞지 않을 수 있습니다.

이로 인해 특정 프로젝트나 목적에 따라 더 세밀한 제어가 필요한 사용자들에게는 다소 제한적으로 느껴질 수 있습니다.









스테이블 디퓨전(Stable Diffusion)은 2022년 스태빌리티 AI(Stability AI)에서 출시한 이미지 생성 AI 모델로, 오픈 소스 프로젝트로서 다양한 개발자와 연구자들의 참여를 이끌어냈습니다. 스테이블 디퓨전은 초기 버전부터 높은 해상도의 이미지 생성에 중점을 두었으며, 특히, 스테이블 디퓨전 XL과 같은 고급 모델은 업계에서 많은 주목을 받고 있습니다. 



스테이블 디퓨전이 가진 강점


1. 오픈 소스 및 무료 접근성

스테이블 디퓨전은 오픈 소스로 제공되어, 누구나 무료로 다운로드하고 사용할 수 있습니다. 이로 인해 연구자, 개발자, 아티스트 등 다양한 사용자들이 자유롭게 활용하고 커스터마이징할 수 있습니다. 오픈 소스 커뮤니티의 활발한 참여 덕분에 지속적인 업데이트와 개선이 이루어지고 있습니다.


2. 높은 이미지 생성 품질

스테이블 디퓨전은 고해상도 이미지를 생성하는 데 탁월합니다. 이는 특히 디지털 아트, 광고, 콘텐츠 생성 등에서 고품질의 시각적 자료가 필요한 경우 매우 유용합니다. 


3. 다양한 기능

스테이블 디퓨전은 텍스트-이미지 변환뿐만 아니라, 이미지-이미지 변환(img2img), 인페인팅(특정 영역 수정) 등의 다양한 기능을 지원합니다. 이러한 기능은 사용자들이 이미지를 보다 다양하게 생성하고 편집할 수 있게 해줍니다.


4. 커스터마이징의 용이성

다양한 매개변수 조정을 통해 이미지 생성 과정을 세밀하게 관리할 수 있으며,  노드를 자유롭게 배치하고 연결하여, 사용자가 원하는 대로 워크플로우를 구성할 수 있습니다. 또한 한 번 설정한 워크플로우를 다른 프로젝트에서 재사용하거나 다른 사용자와 쉽게 공유할 수 있습니다.


5. 부정 프롬프트 기능

사용자가 원하지 않는 요소를 제거하는 기능을 통해, 이미지 생성에서 특정 요소를 배제할 수 있습니다.



 

 스테이블 디퓨전 WEBUI? GUI?




스테이블 디퓨전을 사용하기 위해서는 GitHub에서 WebUI 혹은 GUI를 다운받아 설치를 완료하고 나서 스테이블 디퓨전 UI에 접속할 수 있습니다. 유저들이 주로 사용하는 WebUI와 GUI는 아래와 같습니다.


1. AUTOMATIC1111 WebUI

2.ComfyUI

3.InvokeAI


이러한 다양한 WebUI와 GUI는 사용자의 기술 수준과 필요에 따라 선택할 수 있습니다. 각 도구는 스테이블 디퓨전의 기본 기능을 쉽게 활용할 수 있게 해주며, 특히 개발자가 아닌 일반 사용자에게도 접근성을 제공합니다.




스테이블 디퓨전 단점


1. 초보자에게 어려운 접근성

미드저니 디스코드도 힘들었던 유저들은 위와 같이 Webui, GUI 등을 사용하는 것이 다소 어렵게 느껴질 수  있습니다.


2. 로컬 설치 및 고 사양 컴퓨터 필요

도구를 사용하려면 로컬에 설치해야 하며, 특히 고해상도 이미지를 빠르게 생성하기 위해서는 높은 사양의 컴퓨터가 필요할 수 있습니다. 그렇기 때문에 이미지 생성 속도는 사용자의 하드웨어 성능에 따라 크게 달라질 수 있습니다.


다양한 WebUI와 GUI는 사용자의 기술 수준과 필요에 따라 선택할 수 있습니다. 각 도구는 스테이블 디퓨전의 기본 기능을 쉽게 활용할 수 있게 해주며, 특히 개발자가 아닌 일반 사용자에게도 접근성을 제공합니다.







 




'플럭스(FLUX)'는 2024년 독일의 스타트업 '블랙 포레스트 랩스(Black Forest Labs)'에서 출시한 이미지 생성 AI 모델입니다. 이 회사는 스태빌리티 AI(Stability AI)에서 활동하던 연구원들이 설립했으며, 플럭스는 최신 기술을 기반으로 생성 AI의 최강자 모델로 자리매김하고 있습니다. 플럭스는 출시 직후부터 높은 성능과 속도로 주목받고 있으며, 다양한 사용자들에게 환영받고 있습니다.



플럭스가 가진 강점  



1. 텍스트 정확도


flux는 문자를 정확하게 표현하기 때문에 브랜드 로고, 광고, 브랜드 이미지, 맞춤형 텍스트가 포함된 축하 카드 등 상업적 용도에 특화되어 있습니다.



2. 이미지 품질


FLUX.1이 생성하는 이미지는 또한 업 스케일을 사용하지 않아도 선명하고 디테일하며, 사용자의 요청과 일관되게 일치합니다. 생성 AI의 고질적인 문제였던 손가락 개수나 AI 느낌의 이미지가 많이 자연스럽게 생성되는 걸 확인할 수 있습니다.

미드저니가 감성적이고 예술적인 이미지를 생성하는 데 강점이 있다면, FLUX.1은 더 현실적이고 상업적인 이미지 생성에 특화되어 있다고 보여지는것 같습니다.


 

플럭스.1 버전 및 사용법


FLUX.1[pro]는 가장 뛰어난 성능을 자랑하며, 복잡한 프롬프트를 정확하게 처리하고, 우수한 시각적 품질을 제공합니다. 이 모델은 특히 상업적 용도로 적합하며, 대규모 프로젝트나 전문적인 작업에 이상적입니다. 사용자는 Replicate, fal.ai 등 다양한 플랫폼에서 API를 통해 이 모델에 접근할 수 있습니다.


[dev] 버전은 [pro]보다 효율적인 버전으로, 비상업적 용도에 맞춰 설계되었습니다. 개인 프로젝트나 실험적인 작업에 이상적이며, HuggingFace에서 가중치를 다운로드할 수 있어, 개발자들이 손쉽게 활용할 수 있습니다.


[schnell] 버전은 매우 빠른 이미지 생성이 가능하도록 설계되었습니다. 무료로 사용할 수 있는 Apache 2.0 라이선스가 적용되며, GitHub를 통해 쉽게 접근할 수 있습니다. 이로 인해 개인 사용자나 소규모 개발팀이 FLUX.1 [schnell]을 활용해 신속하게 결과를 도출하고, 다양한 실험을 진행할 수 있습니다.

 







최근 이미지나 비디오 업 스케일 AI 프로그램인 'Krea.ai'는 FLUX의 강력한 기능을 자사의 사용자 친화적인 인터페이스와 결합하여, 사용자들이 쉽게 FLUX를 사용해 볼 수 있습니다~!


현재 생성 AI는 급속히 발전하며 과도기를 지나고 있기 때문에 다양한 프로그램들을 직접사용해 보는 것이 생성 AI의 잠재력을 최대한 활용하는 데 도움이 될 것입니다. 다양한 도구를 사용하면서 각각의 장단점을 파악하고, 필요에 따라 적절하게 조합하여 사용해 자신만의 창의적인 작업 흐름을 구축하시고 더욱더 풍부한 결과물을 얻을 수 있기를 바랍니다.



 




WondersLab.

(주)원더스랩 | 대표 : 한의선

이메일 : wwproject@wonderslab.kr

사업장 주소 :

(제주) 제주특별자치도 제주시 중앙로 217 3층

(판교) 경기도 성남시 분당구 성남대로 779번지 6 1층

사업장 등록번호 : 476-87-01809

직업정보제공사업 신고번호 : J151602020230001

통신판매업신고번호 : 제 2023-성남분당A-1150호

Wonderslab.

(주)원더스랩 | 대표 : 한의선

이메일 : wwproject@wonderslab.kr

사업장 주소 :

(제주) 제주특별자치도 제주시 중앙로 217 3층

(판교) 경기도 성남시 분당구 성남대로 779번지 6

사업자 등록번호 : 476-87-01809

직업정보제공사업 신고번호 : J151602020230001

통신판매업신고번호: 제2023-성남분당A-1150호

카카오톡 채널 채팅하기 버튼