본문으로 바로가기
반응형

<발췌: 과학기술&ICT 정책·기술 동향 263호>


1. 오픈AI, ‘보고 듣고 말하는’ 새로운 AI 모델 ‘GPT-4o’ 출시


□ 챗GPT 선도자 오픈AI는 텍스트는 물론, 청각과 시각으로도 추론하고 이를 말할 수 있는 새로운 AI 모델 ‘GPT-4o’를 발표하며 다양한 시연 모습 공개(5.13.)

※ GPT-4o의 ‘o’는 하나의 통합된 AI 모델을 의미하는 ‘옴니모델(Omni model)’ 의미

- GPT-4o는 음성 인식, 스피치-투-텍스트(Speech to text), 이미지 인식 기능 등이 통합된 대화형 인터페이스 형태로 자연스러운 실시간 상호작용이 가능한 멀티모달(Multimodal) 모델

- 기존 GPT 모델이 글자(텍스트)를 통해 명령하는 방식이라면, GPT-4o는 음성, 텍스트, 시각물을 입력하면 AI가 추론하고 그 결과를 도출

※ GPT-4 응답시간은 평균 5.4초, GPT-4o는 최소 232밀리초, 평균 320ms

- 오픈AI는 복잡한 기술 향상보다는 AI가 실제 우리 삶을 어떻게 바꿀 수 있는지 구현하는 데 집중하며 사용 편의성을 극대화하는 등 시연에서는 지금까지 AI음성 챗봇에는 없었던 사실적인 대화가 진행

- 현재 출시된 타사의 음성 비서와 달리 사용자와 실시간으로 상호 작용을 하며 사용자의 요청에 따라 목소리 톤을 높이고 대화 속도를 빠르게 할 수 있는 점이 특징

< GPT-4o 주요 특징 >

출처 : 오픈AI, 언론 보도자료 정리

 

2. 구글 I/O 2024, Gemini(제미나이) 앞세워 AI 생태계 확장


□ 구글 I/O 2024(구글 연례 개발자 컨퍼런스)가 미국 캘리포니아에 위치한 ‘쇼어라인 앰피시어터(Shoreline Amphitheatre)’에서 개최(5.14.)

- 구글 CEO 순다르 피차이는 121번이나 AI를 언급하며 모든 구글 생태계에 AI를 접목해 25년 구글의 검색 역사를 AI로 탈바꿈한다는 포부 구체화

- 구글 검색엔진・구글 포토・워크스페이・스마트기기 등 사업 부문 전반에 자체 AI모델인 제미나이를 접목시키며 거대한 ‘제미나이 생태계’를 구축한다는 목표

- AI모델 개발이나 서비스 구축에 항상 한발 앞서가는 오픈AI에 대항하기 위해 구글이 기존에 구축해 놓은 거대 생태계를 활용해 ‘AI중심 회사’로의 변신 강화

< 구글 I/O 2024 주요내용 >

제미나이를 장착한
AI 기반 검색엔진
⦁AI오버뷰(AI Overview) 기능 도입해 검색 속도, 정확성 제고
- 생성형 AI 제미나이가 요약한 검색 결과 제시, 관련 링크 제공
- 사진・동영상 검색 가능, 이메일 요약 기능 등
구글 클라우드 워크스페이스 앱
전반에 제미나이 적용
⦁지메일, 캘린더, 드라이브 내 문서, 안드로이드 스마트폰 내 데이터를 유기적으로 연계해 ‘AI 비서’로서 작동・지원

제미나이 업데이트
⦁(제미나이 1.5 프로) 최대 토큰 수를 200만으로 2배 늘려 멀티턴 대화와 오디오 및 이미지 인식 기능 등을 향상, 더욱 고차원 작업을 수행할 수 있도록 업데이트
⦁(제미나이 1.5 플래시) 경량화 AI 모델로 최대 100만 토큰에 달하는 데이터를 한 번에 처리, 응답속도는 더욱 빠른 것이 강점
동영상 생성모델 ‘비오’,
텍스트-이미지 변환 모델 ‘이마젠3
⦁비오(Veo): 자연어와 시각적 의미에 대한 이해도 높고 긴 프롬프트의 내용을 정확하게 렌더링
⦁이마젠3: 사실적이고 생생한 이미지를 생성하며 이전 모델 대비 시각적 결함도 훨씬 적은 편
프로젝트 아스트라 ⦁인류에게 도움이 되는 책임감 있는 AI 구축을 지향하는 범용인공지능 (AGI) 개발 비전 제시
- 텍스트, 이미지, 영상, 음성 등 다양한 정보를 이해하고 처리하는 능력을 갖춘 AI 에이전트 개발
TPU 6세대 모델 ‘트릴리움 ⦁기존 모델 TPU v5e 대비 칩당 최대 컴퓨팅 성능 4.7배 향상, HBM 용량과 대역폭 2배 증가, ICI(Interchip Interconnect) 대역폭 2배 증가

출처 : 오픈AI, 언론 보도자료 정리


3. 글로벌 주요 기업 및 스타트업은 검색엔진에 AI 기능 개발 및 탑재 가속


< 구글 I/O 2024 주요내용 >

출처 : 중앙일보, 2024.4.5.


출처 : OpenAI 외 (2024.5.) 

https://openai.com/index/hello-gpt-4o/

https://www.edaily.co.kr/news/read?newsId=01325126638888920&mediaCodeNo= 257&OutLnkChk=Y

 

이데일리

대한민국 No.1 종합 경제지 이데일리 - 국내외 증권·기업 등 경제 및 종합 뉴스를 빠르고, 정확하게 전달합니다.

www.edaily.co.kr

https://www.joongang.co.kr/article/25240488#home

 

챗GPT에 235조 검색광고 날아갈 판…구글 "AI 검색 돈 내야" [팩플] | 중앙일보

FT는 "구글의 AI 검색이 유료화 되면 지금까지 광고로 자금을 조달해 무료 검색 서비스를 제공해 온 구글이 이용자에게 비용을 지불하게 하는 첫 사례가 될 것"이라고 짚었다. 구글이 검색 서비스

www.joongang.co.kr

 

https://io.google/2024/intl/ko/

 

Google I/O 2024

Don't miss our biggest developer conference, featuring product news and innovations from Google. Tune in to I/O for livestreamed keynotes and technical sessions on demand.

io.google

https://www.aitimes.com/news/articleView.html?idxno=159673

 

구글의 반격 "AI 검색 전격 도입"...AI 에이전트·비디오 모델도 공개  - AI타임스

구글이 검색에 생성 인공지능(AI)을 전격 도입한다. 또 \'AI 에이전트\'의 기반이 될 AI 어시스턴트와 1분짜리 영상을 생성하는 비디오 모델도 공개했다. 이 외에도 개선된 \'제미나이\' 경량 모델을

www.aitimes.com

 

#GPT-4o, #GPT, #오픈AI, #구글, #제미나이, #Gemini, #비오, #이마젠3, #트릴리움, #마이크로소프트, #퍼플렉시티, #큐, #Cue, #네이버, #바이두, #어니봇, #코파일럿, #Copilot, #옴니모델