이미지 출처: Artificial Analysis
이미지 생성 AI 시장은 5월에도 빠르게 변하고 있다. 다만 Artificial Analysis의 Text to Image Leaderboard는 실제 사용량이나 매출 기준의 “인기 순위”가 아니라, 같은 프롬프트로 만든 이미지를 비교해 사용자가 더 선호한 결과를 Elo 점수로 나타낸 품질 선호도 순위에 가깝다. 따라서 이 순위는 “가장 많이 쓰이는 모델”이 아니라 “비교 평가에서 더 자주 선택된 모델”로 보는 것이 정확하다.
현재 Text-to-Image 부문 상위권에는 OpenAI의 GPT Image 2 (high), GPT Image 1.5 (high), Google의 Nano Banana 2, Nano Banana Pro, Microsoft의 MAI-Image-2가 자리하고 있다. GPT Image 2는 Elo 1338로 1위에 올라 있으며, 그 뒤를 GPT Image 1.5, Nano Banana 2, Nano Banana Pro, MAI-Image-2가 잇고 있다. 이 결과만 보면 OpenAI가 텍스트 기반 이미지 생성 품질 경쟁에서 한발 앞서 있는 것은 분명해 보인다.
하지만 여기서 곧바로 “GPT Image 2가 모든 작업에서 최고의 모델”이라고 말하기는 어렵다. 이미지 생성과 이미지 편집은 다른 영역이기 때문이다. Artificial Analysis의 Image Editing Leaderboard에서는 GPT Image 1.5가 1위, GPT Image 2가 2위로 집계된다. 즉, 새 이미지를 만드는 작업과 기존 이미지를 수정하는 작업은 따로 봐야 한다. 광고 시안을 처음부터 만드는 작업자와, 기존 이미지를 정교하게 고치는 작업자는 서로 다른 모델을 선택할 수 있다.
오픈웨이트 모델의 약진도 눈에 띈다. HiDream-O1-Image-Dev-2604는 Text-to-Image 리더보드에서 오픈웨이트 모델 중 선두권으로 평가되고 있다. 이는 기업이나 개발자가 API에만 의존하지 않고, 직접 모델을 운영하거나 커스터마이징할 수 있는 가능성이 커지고 있다는 뜻이다. 다만 오픈웨이트라는 이유만으로 도입이 쉬운 것은 아니다. 실제 운영에는 GPU 비용, 라이선스, 추론 속도, 유지보수 역량이 함께 필요하다.
비용도 중요한 변수다. OpenAI의 GPT-Image-2는 공식 가격표에서 이미지 입력·출력 토큰 기준으로 과금된다. 리더보드에 보이는 1,000장당 가격은 비교를 쉽게 하기 위한 환산값으로 이해하는 편이 좋다. 작업량이 적은 개인 창작자, 대량 이미지를 생성해야 하는 마케팅팀, 내부 서버에서 모델을 돌려야 하는 기업은 비용 구조를 서로 다르게 계산해야 한다.
결국 5월 이미지 생성 AI 시장의 핵심은 단순한 순위 경쟁이 아니다. 중요한 것은 작업자가 자신의 환경에 맞는 모델을 고르고, 그 모델을 어떻게 응용하느냐다. 어떤 모델은 프롬프트 이해력이 좋고, 어떤 모델은 텍스트 표현에 강하며, 어떤 모델은 편집에 유리하고, 또 어떤 모델은 비용 대비 대량 생성에 적합하다.
리더보드는 좋은 참고 자료다. 하지만 리더보드 1위가 곧 모든 현장의 정답은 아니다. 광고, 디자인, 콘텐츠 제작, 프레젠테이션, 캐릭터 작업, 내부 보안이 필요한 기업 환경은 각각 요구 조건이 다르다. 이제 이미지 생성 AI를 잘 활용한다는 것은 “가장 유명한 모델을 쓰는 것”이 아니라, 작업 목적에 맞게 모델을 선택하고 조합하는 능력에 가까워지고 있다.
5월의 리더보드는 이 변화를 보여준다. 이미지 생성 AI는 더 이상 신기한 그림을 만드는 도구에 머물지 않는다. 실무에 투입되는 제작 도구가 되고 있으며, 그만큼 작업자에게는 모델을 읽고 선택하는 감각이 점점 더 중요해지고 있다.












