GPT-4o 핵심 기능 5가지를 활용하여 업무 효율을 높이는 방법


Contents


이제 새 채팅창을 열지 마세요


2022말 오픈AI는 ChatGPT를 공개하며 전 세계를 놀라게 했습니다. 이후 올해 초인 2월에는 동영상 생성 AI인 '소라'를 발표하여 또 한 번 업계를 발칵 뒤집어 놓았는데요. 5월 13일에는 새로운 AI 모델 'GPT 4o'를 출시하여 또다시 전 세계를 깜짝 놀라게 했죠. 이제 사람이 사람과 대화하듯 인공지능과 사람이 실시간으로 상호작용하며 대화할 수 있는 시대가 열렸기 때문입니다.


 오픈AI에서 공개한 데모 영상 



많은 분들이 이 영상을 보고 2013년에 개봉한 영화 'her'를 떠올렸습니다. 이 영화는 개봉 당시 아카데미 각본상, 골든 글로브 각본상을 받을 정도로 빼어난 수작으로 평단에서도 호평이 가득했죠. 영화 속에는 실체가 있는 주인공이 실체가 없는 인공지능과 사랑에 빠지며 '사랑'이라는 진짜 감정에 대해 알아가게 되는 내용이 담겨 있습니다.


영화의 재미와 다르게 이런 인공지능이 등장하기까지는 상당한 시일이 걸릴 것이라는 것이 그동안 전문가의 의견이었는데요. 하지만 GPT-4o의 등장으로 어쩌면 꽤 가까운 시일 내에 영화 속 인공지능 '사만다'를 구글이나 일상에서 접하게 될 것 같네요.



| GPT-4o와 기존 모델과 차이점 5가지

Omni(모든 방식의) : 음성, 텍스트, 이미지를 하나로 통합한 멀티 모달 AI


멀티 모달이 가능한 생성형 AI


GPT는 매해 새로운 모델을 공개하며 버전을 업데이트했습니다. 처음에는 텍스트만 인식할 수 있었지만 나중에는 이미지 인식까지 가능해지며 점점 기능을 확장해 나갔죠. 이번 GPT-4o 버전이 기존 모델과 가장 큰 차이점은 음성 인식을 통해 실시간으로 답변이 가능다는 점입니다. 진정한 의미의 멀티모달이 가능해졌습니다. 


  • 멀티 모달 처리 능력: 기존 GPT-3.5와 GPT-4 모델은 텍스트와 이미지 기반의 질문과 응답에 최적화되어 있었습니다. 이와 달리 GPT-4o는 뛰어난 음성 인식 능력을 통해 사용자가 음성으로 던진 질문을 음성으로 답변할 수 있습니다. 이제는 텍스트 타이핑 없이도 다양한 작업들을 음성만으로 수행할 수 있습니다.


  • 응답 속도 개선 : GPT-4o는 기존 GPT 모델들에 비해 응답 시간이 크게 단축되었습니다. GPT-3.5의 평균 응답 시간은 2.8초, GPT-4는 5.4초입니다. GPT-4o는 최소 232밀리초, 평균 320밀리초로 거의 실시간에 가깝게 응답합니다. 딜레이 없는 반응 속도로 인해 사람과 대화하듯 자연스럽게 질문과 답변을 주고받을 수 있으며 업무에 적용 시 보다 효율적으로 일을 할 수 있습니다.


  • 자연스러운 대화 흐름 : GPT-4o는 사용자와의 대화 중간에 끼어든 질문에도 자연스럽게 응답할 수 있습니다. 이는 대화의 흐름이 끊기지 않도록 설계되었기 때문인데요. 음성도 실제 사람과 유사하게 지원하기 때문에 사용자는 마치 사람과 대화하고 있는 듯한 느낌을 받을 수 있습니다.


  • 이미지 기반의 대화 : GPT-4o는 이미지 인식 기능을 통해 사용자가 촬영한 사진을 기반이나 이미지 기반으로 대화할 수 있습니다. 가령 해외여행 시 외국어로 되어 있는 메뉴판이나 역사적 유적에 대한 소개 글을 사진으로 촬영 후 GPT에 번역을 요청합니다. 이후 번역된 내용을 바탕으로 해당 내용에 대한 역사적, 사회적, 문화적 의미에 대해 대화를 나눌 수 있습니다.


  • GPT 기억 장착 :  기존 모델에서는 답변 최적화를 위해 새로운 주제로 대화를 할 경우 채팅을 새롭게 열어야 했는데요. 이제는 사용자와 나눈 대화를 기억하기 때문에 새 채팅을 하지 않아도 기존 대화를 바탕으로 맞춤형 대화가 가능해졌습니다.



| GPT-4o가 할 수 있는 일은?

사람처럼 대화할 수 있습니다.


타이핑에서 자유로워지세요.


앞서 소개한 것처럼 GPT-4o는 텍스트, 음성, 이미지 등의 다양한 데이터를 실시간으로 처리하여 사용자 경험을 대폭 향상시킵니다. 이러한 기능들은 직장인, 콘텐츠 크리에이터, 프리랜서, 강사 등 다양한 직업군에서 업무 효율을 높이는데 큰 도움이 될 수 있습니다.


예를 들어 직장에서 회의 동안 발표 자료를 촬영합니다. 그 이미지를 GPT-4o에 업로드하면 AI가 즉시 해당 이미지를 분석하여 주요 내용을 사용자에게 설명해 줄 수 있습니다. 여기에 음성 인식 기능을 활용한다면 해당 내용에 대한 인공지능의 답변을 실시간으로 들을 수 있습니다.


타이핑을 할 필요 없이 음성으로 질문을 던지고 직접 답변을 들을 수 있기 때문에 업무 효율이 매우 높아질 수밖에 없는데요. 손이 자유롭게 되어 다른 작업을 병행할 수 있으며 특히 운전 중이나 손을 사용할 수 없는 상황에서 매우 유용하게 활용할 수 있습니다.


이와 함께 GPT-4o는 복잡한 상호작용을 지원하여 사용자 맞춤형 피드백을 실시간으로 제공할 수 있습니다. 예를 들어 프로젝트 관리나 고객 대응에서 발생할 수 있는 다양한 상황을 즉시 인식하고 이에 맞는 솔루션을 제시하며 더욱 심층적인 논의도 가능하게 합니다.



| GPT-4o로 업데이트한 원더스랩 AI 어시스턴트

더욱 똑똑해진 AI 어시스턴트 : 더블유닷, 아이닷, 에스닷



GPT-4o로 업데이트한 원더스랩 AI 어시스턴트


원더스랩의 AI 어시스턴트 더블유닷, 아이닷, 에스닷에도 13일 GPT-4o 발표와 함께 새 모델로 바로 업데이트 되었습니다. 오픈AI에서 발표한 내용에 따르면 기존 모델인 터보 버전보다 2배 빨라졌다고 하지만 실제 체감 속도는 더 빨라진 것 같은 느낌을 받았는데요. 한국어 토큰 효율도 1.7배가량 높아졌기 때문에 한국어 질문에 대한 답변이 더 빨라진 것으로 보입니다.


GPT-4o가 탑재된 원더스랩 AI 어시스턴트를 활용하면, 업무에 최적화된 생성형 AI 기능을 통해 더 스마트하고 효율적인 업무 환경을 만들 수 있습니다. 원더스랩 AI 어시스턴트와 함께 미래의 일하는 방식을 경험해 보세요!



AI를 업무에 어떻게 적용할지 고민이신가요?

원더스랩의 AI 전문팀의 도움을 받아보세요!

지금 바로 문의하기



WondersLab.

(주)원더스랩 | 대표 : 한의선

이메일 : wwproject@wonderslab.kr

사업장 주소 :

(제주) 제주특별자치도 제주시 중앙로 217 3층

(판교) 경기도 성남시 분당구 성남대로 779번지 6 1층

사업장 등록번호 : 476-87-01809

직업정보제공사업 신고번호 : J151602020230001

통신판매업신고번호 : 제 2023-성남분당A-1150호

Wonderslab.

(주)원더스랩 | 대표 : 한의선

이메일 : wwproject@wonderslab.kr

사업장 주소 :

(제주) 제주특별자치도 제주시 중앙로 217 3층

(판교) 경기도 성남시 분당구 성남대로 779번지 6

사업자 등록번호 : 476-87-01809

직업정보제공사업 신고번호 : J151602020230001

통신판매업신고번호: 제2023-성남분당A-1150호

카카오톡 채널 채팅하기 버튼