최근 AI 모델 업그레이드와 함께 많은 사람들이 기대했던 GPT-5의 성능 향상에 대해 의문을 제기하고 있습니다. 특히 ‘창의성’ 영역에서, 이전 버전인 GPT-4o와의 차이가 거의 없거나 오히려 결과가 단조로워졌다는 의견이 나오고 있습니다. 이번 글에서는 동일한 프롬프트를 두 모델에 입력했을 때의 결과를 비교하고, 그 차이를 표와 이미지로 시각화하여 분석해보겠습니다. 이를 통해 독자들이 직접 판단할 수 있도록 객관적인 자료를 제공합니다.
AI가 업그레이드될수록 창의성도 함께 진화할까요?
GPT-5, 정말 더 똑똑해졌을까요?
결과 비교로 확인하는 진짜 차이
GPT-4o와 GPT-5 개요
GPT-4o는 2024년 공개 이후 다방면에서 높은 평가를 받았습니다. 특히 다양한 프롬프트 상황에서 유연하고 창의적인 답변을 제공하며, 장문·단문 작성 모두 안정적인 성능을 보였습니다. 반면 GPT-5는 2025년 상반기 출시되며 ‘정확성’과 ‘사실 검증 능력’을 강화했다고 알려졌습니다. 그러나 실제 사용자들의 체감은 다소 엇갈립니다. 창의성보다는 안정적인 정답 생성에 무게를 둔 설계로 인해, 일부 상황에서는 4o보다 덜 참신한 답변을 내놓는 경우도 있습니다.
프롬프트 선정 이유
비교를 위해 사용한 프롬프트는 ‘독창적 비유와 스토리텔링을 활용한 설명’ 유형입니다. 이 유형은 단순 정보 나열보다 모델의 창의성, 문장 유연성, 비유 능력을 종합적으로 평가할 수 있습니다. 같은 조건에서 GPT-4o와 GPT-5가 어떤 차이를 보이는지를 파악하기 위해 3개의 대표 프롬프트를 선택하였습니다.
비교 결과 표 분석
프롬프트 | GPT-4o 결과 | GPT-5 결과 | 창의성 점수 |
---|---|---|---|
비유를 활용한 우주 설명 | 별은 마치 시간의 서랍 속 반짝이는 엽서 같다... | 별은 먼 과거의 빛을 우리에게 보내는 존재이다. | 4o: 9/10, 5: 6/10 |
감정 묘사 글쓰기 | 슬픔은 창가에 맺힌 빗물처럼, 조용히 스며든다... | 슬픔은 마음을 무겁게 한다. | 4o: 8/10, 5: 5/10 |
창작 동화 첫 문장 | 달빛이 잠든 숲 속에서 토끼는 별빛 편지를 기다리고 있었다... | 토끼는 숲 속에 살았다. | 4o: 9/10, 5: 4/10 |
이미지 시각화 비교
시각화를 통해 두 모델의 차이를 직관적으로 확인할 수 있습니다. 아래 그래프는 각 프롬프트별 창의성 점수를 시각적으로 비교한 것입니다.
창의성 점수와 해석
평가 결과 GPT-4o는 세 가지 프롬프트 모두에서 높은 창의성을 보였습니다. 반면 GPT-5는 문장의 참신함과 표현의 다양성이 줄어든 모습을 보였습니다. 이는 ‘사실 기반 정확성’을 강화하면서 창의적 변주가 줄어든 영향으로 해석됩니다.
- ✅ 다양한 유형의 프롬프트로 평가하기
- ✅ 객관적 지표와 주관적 평가 병행
- ✅ 이미지와 표로 비교 시각화
FAQ
Q1: GPT-5는 모든 면에서 GPT-4o보다 뛰어난가요?
A1: 그렇지 않습니다. 일부 영역에서는 향상되었지만, 창의성 면에서는 차이가 없거나 줄었다는 평가가 있습니다.
Q2: 창의성 저하는 어떤 상황에서 두드러지나요?
A2: 비유, 스토리텔링, 시적 표현이 필요한 프롬프트에서 특히 차이가 보입니다.
Q3: GPT-5가 더 나은 경우도 있나요?
A3: 네, 사실 기반 질문, 계산, 최신 정보 제공에서는 GPT-5가 더 안정적입니다.
Q4: GPT-5의 창의성을 높일 방법이 있나요?
A4: 프롬프트에 구체적 창작 조건과 제약을 추가하면 더 창의적인 결과를 얻을 수 있습니다.
Q5: 창의성 평가는 어떻게 하나요?
A5: 표현 다양성, 참신함, 몰입도, 감정 전달력 등을 종합적으로 평가합니다.
Q6: 앞으로 GPT는 어떻게 발전할까요?
A6: 정확성과 창의성을 동시에 잡는 방향으로 발전할 가능성이 높습니다.
결론
이번 비교를 통해 GPT-5가 GPT-4o에 비해 창의성 측면에서 일부 약세를 보일 수 있다는 점을 확인했습니다. 그러나 사실 기반 질문에서는 더 안정적이고 신뢰도 높은 답변을 제공합니다. 따라서 사용 목적에 따라 두 모델을 선택적으로 활용하는 전략이 중요합니다.
여러분도 직접 동일한 프롬프트를 입력해 비교해 보세요. 실험을 통해 자신만의 판단을 내려보는 것이 가장 확실한 방법입니다.