이미지 생성 AI 달리3을 오픈AI가 공개했습니다. 챗GPT를 탑재하여 짧은 명령어로도 훨씬 정확한 이미지를 생성할 수 있게된 것인데요? 이는 지난해 4월 달리2를 공개하고 1년 6개월 만입니다. 달리3은 다음 달(2023년 10월)부터 챗GPT 엔터프라이즈 가입자만 달리3을 이용할 수 있다고 합니다.
이미지 생성 AI 달리3이란?
최근에 공개된 달리3 은 오픈AI가 개발한 이미지 생성 인공지능 도구입니다. 이전 버전인 달리 2에 비해 더 정확한 이미지를 생성하며 사용자의 요구를 더 잘 이해 한다고 합니다.
챗GPT와의 통합된 버전
사람처럼 묻고 답할 수 있는 챗GPT와의 통합으로 사용자가 구체적인 프롬프트(AI 명령)를 입력하지 않아도 됩니다. 그저 문답형식으로 프롬프트를 작성해 달라고 요청을 하면 챗 GPT가 프롬프트를 생성하여 이를 바탕으로 해서 이미지를 생성하는 원리입니다.
오픈 AI의 설명에 의하면 달리3은 사용자가 명령어를 짧게만 작성해도 이해도 높게 좋은 퀄리티와 정확한 이미지를 생성할 수 있다고 합니다. 채팅을 통해 부분 수정또한 가능하다고 하네요.
기존 달리2의 몇 가지 단점 사례
- 정확성 문제
- 부정 처리 능력 부족
- 상세성이 떨어지거나 추상적인 이미지
- 사회적 위험도 노출
그렇다면 이미지 생성 AI 달리 3은 달리2의 문제점을 잘 개선했을까요? 아래 내용을 읽어보세요. ^^*
이미지 생성 AI 달리3 특징
- 세부적인 사항 추가 가능
- 생성된 이미지의 부분 수정 가능
- 프롬프트 입력하지 않고 대화하듯 이미지를 설명하고 프롬프트 작성해달라 요청
– 챗GPT가 프롬프트를 생성 -> 이를 토대로 달리3이 이미지를 생성 - 사용자의 요구를 기존보다 더 많이 잘 이해가능
- 윤리 문제 방지를 위한 안전 조치 마련
- 명령어 이해도 개선
- 달리2와 같이 달리3으로 만든 이미지
– 사용자가 자유롭게 활용가능
– 재인쇄, 판매, 상품화를 위하여 오픈AI의 허가를 받을 필요가 없음 - 언어모델이 특정 단어를 무시하도록 훈련
– 노골적이거나 폭력적인 메시지를 피할 수 있음 - 동일한 프롬프트에서도 달리3은 달리2보다 더 상당하고 개선된 이미지를 제공할 수 있음
- ChatGPT를 기반으로 구축된 달리3은 챗GPT를 브레인스토밍 파트너 및 프롬프트 개선 도구로서 사용할 수 있음
– 간단한 문장에서 자세한 문단까지 무엇이든 질문 가능
이미지 생성 AI 달리3 저작권 윤리적 문제
- 이번 달리3은 음란 및 혐오스러운 이미지가 생성되는 것을 방지하기 위하여 안전조치를 강화 했습니다.
- 오픈 AI는 이를 위해 외부 팀과 협력하여 노골적이고 폭력성 강한 메세지를 피하기 위하여 언어 모델에 특정 단어를 무시하도록 훈련했다고 밝혔습니다. 아울러 프롬프트에 이름이 구체적으로 언급된 경우에도 공인의 이미지는 생성할 수 없도록 하였습니다.
- 달리3은 현존하는 (아티스트)예술가의 스타일로 이미지 생성을 요청하는 사항을 거부하도록 설계
– 이제 예술가(아티스트)는 미래 이미지 생성 모델 교육에서 자신의 이미지를 선택 해제 가능하게 되었음 - 공인의 이름을 묻는 요청을 거부하는 기능 있음
– 공개 인물을 생성하거나 유해한 이미지가 만들어지는 것을 막을 수 있음
이미지 생성 AI 달리3 출시 정보
이 새로운 버전의 달리3은 내달(2023년 10월 예정) 유료 버전인 챗GPT 플러스와 기업용 챗GPT인 엔터프라이즈에 먼저 출시될 예정입니다. 이후 연구소및 API 고객에게도 공급예정입니다.
기존 달리2처럼 무료 웹 버전의 출시 시기는 언급이 없으며 당분간은 미정입니다.
마무리
달리3의 등장으로 비슷한 기능의 ‘미드저니’ (Midjourney) 및 ‘스태빌리티 AI’ (Stability AI)와 이미지 생성 AI간의 경쟁이 치열해질 것 같습니다.
챗GPT와 같은 대규모의 언어모델(LLM)은 텍스트를 해석하고 생성하는 능력만을 가지고 있었습니다. 그러나 달리3과의 통합 개발로 인하여 AI가 텍스트뿐만 아닌 이미지또한 해석, 분석하여 다시 이미지 생성에 사용하는 것이 보편화 될 예정입니다.
챗GPT는 달리3과의 통합으로 인해 접근성이 편하고 좋아졌으며 달리3으로 인해 챗GPT의 유료사용자까지 늘어날 전망입니다.
앞으로 AI 기술이 어디까지, 어떻게 발전하고 우리의 생활에 어떤 변화를 전해줄지도 기대가 됩니다.
<달리3 홈페이지 사이트 안내>
DALL·E 3 understands significantly more nuance and detail than our previous systems, allowing you to easily translate your ideas into exceptionally accurate images.
달리3은 이전 시스템보다 훨씬 더 정교하고 이해도가 높기때문에 사용자가 원하는 아이디어와 이미지를 달리2보다 더 정확한 이미지로 쉽게 생성 가능합니다. 달리3은 현재 연구용 프리뷰 단계에 있으며 10월부터 ChatGPT Plus및 Enterprise 고객에게 API를 통해 제공될 예정입니다.
OpenAI는 홈페이지에 “인공지능으로 이미지가 생성된 시기를 사람들이 식별할 수 있도록 돕는 최선을 방법을 연구하고 있습니다. 우리는 달리3에서 이미지가 생성되었는지 여부를 식별하는데 도움이 되는 새로운 내부 도구인 출처 분류기를 실험하고 있으며 이 도구를 사용하여 생성된 이미지가 사용되는 방식을 더 잘 이해할 수 있기를 바랍니다. 곧 더 많은 정보를 공유하겠습니다.”라고 안내글을 올려두었습니다.
이상 오늘의 포스팅을 마칩니다. 공부하며 올리는 것이니 부족한 점이 있을 수 있으나 점점 더 나아지겠습니다. 함께 정진 하며 나아갔으면 좋겠고 인공지능에 대해 더 많은 지식이 쌓이는 그날까지 쭈욱~~~ 함께 해요 ^^*
<함께 보시면 좋은 내용 소개>