본문 바로가기
스터디

프롬프트 엔지니어가 되려면? 핵심가이드 2

by na-star 2024. 3. 25.
반응형

지난편에서 다뤘던 chat GPT와 대화하는 방법이 익숙해졌다면 그 방법을 응용해 그림을 생성할 수 있다. 프롬프트는 영어로만 인식하기 때문에 영어에 익숙하지 않은 사람들에게는 표현이 많이 어렵다. 처음에는 한글로 만든 문장을 구글 번역기로 돌렸고 나중에 구글의 확장프로그램을 설치해서 자동번역해주는 기능을 썼다. 그 방법이 틀린 건 아니지만 chat GPT를 활용하면 아이디어 도움을 받을 수 있어서 더 재미있는 프롬프트를 얻을 수 있다.

22년 미드저니달리라는 이미지 생성 AI 일반인에게 오픈 된 후 수없이 많은 이미지 생성 도구가 생겨나고 있다. 어떤것은 이미 유료화를 시작하고 있고 어떤것은 무료로 기반을 다지고 있다. 오늘은 Stable Diffusion의 경량화된 서비스로 최근 발표된 forge에 GPT를 이용해 만든 프롬프트 적용해보려 한다. 

이미지 생성 프롬프트 방법

원하는 이미지를 구사하는 방법에 따라서도 퀄리티가 달라지기때문에 처음 시작하는 사람들은 매우 어렵게 느껴지기도 한다. 그렇다면 chat GPT에게 도움을 요청해 보자.


넌 그림 AI 에게 프롬프트를 주는 그림프롬프터야.
내가 키워드를 주면, 그에 맞는 명령문을 작성해야해. 출력형식을 주면 출력형식에 나온대로 만들어
줘.
한국어로 키워드를 줘도 출력은 영어로 번역하여 출력해야 해.


#제약조건
- 키워드에 없는 내용을 상상해서 만들어도 좋아.
- 한 단락으로만 설명해. 더 길게 만들지 마. 다른 설명도 하지 마.

 

#예시
thor eating taco angrily with hammer by his side at taco bell situatide in asgard
luminism, fantasy acrylic, digital painting, a close up little cute scary baby girl playing in a
cute pastel pink and blue childroom with big toy plush gremlin, red glowing eyes, close
portrait, toys, lots of strange gremlin toys, flying cute ghosts, monsters, dragons, demons,
fairytale, dynamic lighting, artstation, by Peter Mohrbacher, craola WLOP, masterpiece

 

#출력형식
메인 캐릭터, 기본 활동, 활동 중 감정, 임의의 특정 세부 정보, 활동이 진행되는 곳, 배경에
대한 임의의 특정 세부정보, 메인 캐릭터를 설명하는 형용사, 그림의 스타일, 조명, 아티스트

 

#키워드
지브리 스타일, 고양이, 장화신은 고양이


chat GPT 3.5와 제미나이(무료)의 다른 결과 값

나는 위의 글을 여러 Ai 서비스 창을 같이 볼 수 있는 구글의 확장 프로그램인 ChatHub를 설치해서 chat GPT(무료)와 제미나이의 답을 비교해보았다.

 

chat GPT 3.5는 스타일에 더 촛점을 맞춰서 출력형식을 전혀 고려하지 않고 마치 소설을 쓰듯 상황을 꾸미는 문장을 제시했다. 반대로 제미나이는 재미있는 컨셉으로 상황을 설정하는 것에 더 집중이 된 듯하고 한글 해석까지 프롬프트와 함께 보여준다. 만약 좀 더 원하는 바가 뚜렷하다면 키워드를 줄때 더 자세하게 주면 좋다. 프롬프트를 영어로만 인식하다보니 까다로울것 같지만 의외로 대문자, 소문자, 단수, 복수, 시제 등 문장의 문법에는 크게 얽메이지 않으므로 묘사하고자 하는 내용을 여러 형태로 바꿔보면서 시도하다보면 어느새 요령이 생길 것이다. 

이미지 생성

Ai 기반으로 생성하는 결과물은 텍스트나 이미지 모두 같은 요구를 해도 매 번 새로운것을 생성해 준다. 그리고 처음 생성한 이미지를 기반으로 다음 결과물도 비슷하게 변형을 하는 경향이 있어서 첫 프롬프트의 중요성이 크다. 

 

제미나이가 제시한 프롬프트로 만든 이미지

juggernautXL_v9Rdphoto2Lightning.safetensors라는 체크포인트 모델의 기본 세팅값이 적용되었고 프롬프트 자체에도 지브리스타일에 대한 언급이 빠져있어서 이미지가 키워드에 충실하진 않은 반면, 장화신은 고양이를 중세시대에 활약하는 용감한 무사로 설정하여 재미있는 이미지를 만들어 주었다.

제미나이의 똑같은 프롬프트로 생성했지만 다른 느낌

 

chat GPT 3.5가 제시한 프롬프트로 만든 이미지

chat GPT의 똑같은 프롬프트로 생성했지만 다른 느낌  

 

chat GPT가 준 프롬프트는 지브리스타일을 강조했고 풍경에 대한 묘사에 집중한 내용이다 보니 장화에 대한 언급은 있지만 누락되었다. 첫 이미지를 그렇게 생성하다보니 다음 생성도 그 다음 생성도 이미 만들어진 이미지를 기준으로 변형 하는 것을 확인할 수 있다.

 

이 글에서는 Ai를 이용해 프롬프트를 만들 수 있는 방법을 테스트를 하기 위해 간단한 키워드를 넣어서 두개의 Ai에게 답을 얻어 보았고 하나의 이미지 생성도구를 이용해 결과 값도 확인해보았다. 계속 사용해 보고 있지만 어느것이 더 좋다고 할 수는 없는 상황이다. 각 각의 Ai가 특징을 장점 단점을 가지고 있어서 자신에게 좀 더 맞는 것을 찾는 과정도 필요하다. 그리고 생각하지도 않았던 곳에서도 너무 능청스럽게 오류를 출력하기때문에 항상 검증의 시간도 꼭 가져야 한다.

그래도 재미있는 프롬프트를 위해 혼자 고민하는 것보다 훨씬 큰 도움이 되는 건 확실하다. 그렇지만 한 번의 프롬프트로 원하는 이미지를 얻을 수 있는 건 절대 아니다. 요즘도 Ai기반의 서비스가 출시될때마다 홍보영상을 보면 마치 인간은 아무것도 안해도 되는 세상이 올 것 같은 느낌이 들지만 막상 공부를 해보니 똑똑한 인공지능을 활용하려면 더 많이 알고 더 많은 시행착오를 겪어 봐야한다는 것을 알겠다. 물론 이제 시작이겠지만 말이다. ^^

반응형