top of page

그냥 써본 에이아이 생각들

정리된 건 아니고, 그냥 에이아이에 대해 남들이 말한 것들이나 생각난 것들 적어 놓았습니다. 언젠가는 인사이트를 얻으리라는 생각을 하며^^

2024년 06월 30일 : 2024년은 AI 기술이 연구실을 넘어 대중의 일상과 산업 전반에 스며든 한 해로 평가된다. 생성형 AI 챗봇과 이미지 생성기가 업무와 놀이의 도구가 되었고, 스마트폰·가전 등 생활 기기에 AI가 내장되면서 ‘AI폰’ 시대가 개막했다. 한편으로 저작권 소송, 규제 입법 움직임, 윤리 논란 등 AI를 둘러싼 사회적 도전도 부각되었다.글로벌 AI 시장 규모는 전년 대비 2배 성장해 2천억 달러에 육박했고, 국가 간 기술 경쟁과 합종연횡이 활발했다. 전문가들은 “2024년은 AI 대중화의 분수령이었다”면서, 앞으로는 안정성과 책임성이 담보된 ‘신뢰할 수 있는 AI’ 개발이 중요하며, AI 인재 양성과 디지털 격차 해소 등의 과제에도 집중해야 한다고 제언했다.

2024년 06월 25일 : 해커눈, 2024년 AI 예측 실현 점검…“절반 적중, 절반 빗나가”: 해외 테크 블로그 해커눈(HackerNoon)이 올 초 업계 전문가들이 내놓은 2024년 AI 전망 중 실제로 이루어진 것과 빗나간 것을 정리한 보고서를 발간했다. 실현된 예측으로는 “생성형 AI 폭발적 확산”, “멀티모달 AI 대두”, “규제 논의 본격화” 등이 꼽혔고, 틀린 예측으로는 “AGI(범용인공지능) 출현”, “AI 거품 붕괴”, “인간 일자리 대량 대체” 등이 있었다.

이런 점검은 기술 과열 속에서도 현실을 되짚어보는 의미가 있다. 대부분 전문가들이 AI의 영향력을 과소평가하기보다는 오히려 과장한 경향이 있음을 보여주는데, AGI가 아직은 요원했고 오히려 인간-기계 협업이 강조되었으며, 일자리 충격은 즉각적이기보다 완만했다는 것이다. 2025년 예측으로는 “AI 개인비서 상용화”, “교육 커리큘럼의 AI 편입”, “AI와 블록체인의 융합” 등이 새롭게 떠오르고 있다고 보고서는 전했다.

2024년 06월 20일 : 구글 “2024년 AI 획기적 성장” 보고서…경량 모델 부상: 구글 리서치가 발간한 AI 연례 보고서에서 2024년을 “작지만 강한 모델들의 약진”의 해로 규정했다. 보고서는 GPT-4, PaLM2 같은 거대 모델들의 기여를 인정하면서도, 올 한 해 100억 미만 파라미터 소형 모델들이 실용적 성능을 달성한 사례들이 잇따랐음을 강조했다. 또한 전 세계 AI 논문 출간 수가 사상 최고치를 경신했고, 산업계 도입 속도도 가팔라 AI가 주류 기술로 완전히 자리잡았다고 분석했다.

이 보고서에는 AI 윤리와 규제 동향, 그리고 반도체 혁신까지 총망라되어 있어 업계 지침서로 활용된다. 특히 WIPO(세계지식재산기구)가 제공한 특허 통계에서, 2024년 AI 관련 특허 출원이 전년 대비 40% 이상 늘어난 것으로 나타나, 기업들의 AI 연구개발 투자가 폭증했음을 보여준다. 구글은 보고서 말미에 2025년 예상 트렌드로 “하이브리드 AI” (클라우드+엣지 결합)와 “인공지능 에이전트 생태계”를 꼽아 미래 방향도 제시했다.

2024년 06월 15일 : 美 AI 입법 추진 가속…올해 781건 발의, 작년 추월: 미국에서 2024년 들어 연방 및 주의회에 발의된 AI 관련 법안이 781건에 달해 2023년 전체 건수를 이미 넘어섰다고 테크정책연구소가 33】. 내용도 AI 규제기구 설립, 자율무기 금지, 딥페이크 표시 의무화, 저작권 보호 등 다양하다. 이처럼 입법 움직임이 활발하나, 연방 차원에서 통과된 법은 아직 없어 법률 공백 상태가 지속되고 있다.

AI 기술 발전 속도에 입법이 뒤처진다는 지적이 꾸준히 제기되고 있다. 각 주별로 파편적인 법안이 나오는 가운데, 업계는 통일된 연방 규칙을 요구하고 있고 백악관도 행정명령 등을 통해 가이드라인을 제시했으나, 의회의 초당적 합의는 더딘 상황이다. 전문가들은 “기술 중립적이면서도 실효적인 법제” 마련이 필요하며, 2025년쯤에는 주요 법안 몇 개가 통과될 가능성이 있다고 전망한다.

2024년 06월 14일 : ChatGPT, 실시간 검색 기능 전면 개방…지식 저변 확대: OpenAI가 ChatGPT의 실시간 웹 검색 기능을 모든 ChatGPT Plus 사용자가 이용할 수 있도록 업데이트했다. 이를 통해 ChatGPT는 2021년 이후 최신 정보에도 접근하여 대화를 이어갈 수 있게 60】, 사용자들은 일종의 “AI+검색” 융합 경험을 할 수 있게 되었다. 예를 들어 최근 뉴스를 물으면 자체 지식과 함께 실시간 웹에서 가져온 정보를 조합해 답변한다.

이는 지난 해 일시 도입되었다가 중단된 브라우징 기능이 개선되어 돌아온 것으로, 웹사이트 차단 문제 등을 해결한 결과다. ChatGPT가 최신 정보까지 다루게 되면서, 사용자 활용도는 한층 높아질 것으로 보인다. 다만, 웹 정보의 진위와 저작권 문제에 대해 OpenAI는 “출처를 명확히 밝히고 불확실한 답변에는 경고 문구를 표시하는 등 안전장치를 뒀다”고 설명했다. 경쟁 서비스인 Bard, Claude 등도 이미 실시간 정보를 다루고 있어, AI 챗봇의 표준 기능으로 자리잡는 분위기다.

2024년 06월 13일 : 텍스트-이미지 모델 Recraft v3 공개…벤치마크 1위 등극: 오픈소스 커뮤니티 주도로 개발된 텍스트 투 이미지 모델 ‘Recraft v3’가 공개되며, 주요 생성 모델 벤치마크에서 1위를 차지해 57】. Recraft v3는 LAION 이미지 데이터로 학습되었으며, 명령어 해석 정확도와 사실적인 스타일 면에서 미드저니, DALL·E 3 등을 앞섰다는 평가를 받았다. 커뮤니티는 이 모델을 배포하며 “상업 모델 못지않은 오픈소스의 힘”을 강조했다.

Recraft는 전 세계 AI 엔지니어와 아티스트들이 협업한 프로젝트로, 후원금과 자원봉사 계산 자원을 활용해 거대 모델을 만들어냈다. 이러한 집단지성 모델이 성과를 내자, 오픈AI의 폐쇄적 행보에 반발하던 AI 연구자들이 열광했고, GitHub에서 수만 스타를 받으며 인기 프로젝트로 떠올랐다. 향후 Recraft를 기반으로 한 파생모델과 튜닝 버전들이 쏟아지면서, AI 창작 생태계의 다양성이 더욱 풍부해질 전망이다.

2024년 06월 12일 : 앤트로픽, 클로드 3.5 하이쿠·PDF분석 등 신규 기능 추가: 앤트로픽이 자사 챗봇 Claude 3.5에 ‘하이쿠 모드’와 ‘문서 분석’ 등 특화 기능 업데이트를 발52】. 하이쿠 모드는 사용자의 글을 짧은 5·7·5 정형시로 재구성해주며, 일본 시장 공략을 위한 재미 요소다. PDF 분석 기능은 최대 200쪽짜리 PDF 문서를 업로드하면 Claude가 요약 및 질의응답을 해주는 것으로, 기업 문서 처리에 유용할 전망이다.

챗봇들도 차별화를 위해 일반 대화 외에 특화 서비스를 속속 탑재하고 있다. Claude는 OpenAI ChatGPT, 구글 Bard와 경쟁하며 “창의적 놀이”와 “생산성 도구” 두 마리 토끼를 잡으려는 전략을 보인다. 유저들은 하이쿠 모드의 의외로 깊이 있는 시적 표현에 놀라워했고, PDF 분석은 학생들과 직장인들에게 큰 호응을 얻고 있다. 앤트로픽은 향후 코드 디버깅 등 개발자 지원 기능도 추가할 계획이다.

2024년 06월 11일 : 스태빌리티 AI, Stable Diffusion 3.5로 오픈이미지 3종 출시: Stability AI가 이미지 생성 모델 Stable Diffusion 3.5를 파라미터 크기별(3억5천만, 7억, 14억) 세 가지 버전으로 공50】. 대형(14억)은 최상위 성능으로 예술적 스타일에 강하고, 중형(7억)은 속도와 품질의 균형을, 소형(3억5천만)은 일반 PC에서도 구동 가능한 경량 옵션을 제공한다. 모두 오픈소스 라이선스로 배포되어 사용자들이 자유롭게 활용·개선할 수 있다.

Stable Diffusion 3.5는 여러 크기로 세분화해 다양한 수요층을 공략하는 전략으로, 유저들은 자신의 하드웨어나 용도에 맞춰 선택할 수 있게 되었다. 첫날부터 AI 아트 커뮤니티에서는 3.5 버전으로 생성한 작품들이 쏟아졌으며, 사진 현실감과 색감이 2.1 대비 크게 향상되었다는 평이다. 이로써 오픈소스 AI 이미지 생성의 선두주자 위치를 굳힌 Stability AI는, 추후 동영상 생성 기능을 통합하는 4.0 버전을 준비 중이라고 밝혔다.

2024년 06월 10일 : 구글 딥마인드, 플루이드 10.5B로 이미지 생성 최고점 경신: 구글 딥마인드와 MIT가 공동 개발한 텍스트-이미지 생성 AI ‘Fluid’가 105억 파라미터로 학습 완료되어 공개되었다. Fluid는 여러 국제 벤치마크에서 경쟁 모델을 제치고 최고 점수를 기록했으며, 특히 작은 데이터셋에서도 우수한 일반화 능력을 보49】. 이는 모델 구조와 학습 기법의 혁신 덕분으로, 기존보다 적은 자원으로 높은 성능을 낼 수 있게 되었다고 연구진은 전했다.

Fluid 10.5B는 성능과 효율의 균형을 잡은 성공 사례로 주목받는다. 거대 모델 경쟁에서 벗어나 적정 규모로 최적화한 이 접근은 연구 커뮤니티에 좋은 반향을 일으키고 있다. 실제로 여러 스타트업이 Fluid 구조를 참고해 자체 특화 AI를 만들고 있으며, 논문은 NeurIPS 최고논문 후보에 올랐다. 딥마인드는 이 모델을 오픈소스화할지 검토 중인데, 만약 이루어진다면 오픈 AI 이미지 생성 생태계에도 큰 영향이 있을 것으로 보인다.

2024년 06월 09일 : “대화+이미지” 제너레이티브 에이전트 ‘Janus’ 오픈소스로 등장: 한국 스타트업 딥시크가 텍스트와 이미지를 동시에 이해하고 생성하는 멀티모달 AI 에이전트 ‘Janus(야누스)’를 공개 소스로 출44】. 야누스는 음성비서처럼 질문에 답하면서, 필요하면 시각적 결과도 함께 보여준다. 예컨대 “우리집 거실 꾸미기 아이디어”를 물으면 인테리어 팁을 말해주고 가상의 배치도를 그려 화면에 띄워준다.

Janus는 경량 모델을 여러 개 조합한 모듈형 AI로, 일반 PC에서도 동작하는 것이 특징이다. 이는 거대 기업의 클라우드 기반 AI와 차별화된 접근으로, 개인정보가 외부로 나가지 않아 사생활 보호에 민감한 사용자들에게 호응을 얻고 있다. 개발자들은 이 오픈소스 프로젝트에 참여해, 야누스를 스마트홈, 교육 등 다양한 분야의 개방형 AI 비서로 발전시키겠다는 계획을 밝히고 있다.

2024년 06월 08일 : 美 2백만 토큰 컨텍스트 시대 개막…구글 개발자에 개방: 구글이 개발자들에게 제미나이 1.5 Pro 모델의 컨텍스트 윈도우를 200만 토큰까지 확장한 API 접근을 허용하기 시38】. 이를 통해 개발자들은 수천 페이지 분량의 문헌이나 코드베이스도 한 번에 AI에 분석·요약시키거나, 장편 소설 수준의 긴 대화도 끊김 없이 처리할 수 있다. 이는 기존 32k(약 3만) 토큰 제한을 수십 배 뛰어넘는 것으로, AI 활용의 새로운 가능성을 열었다.

대용량 맥락 처리가 가능해지면서 기업들은 방대한 사내 문서를 AI에 통으로 읽혀 노하우를 추출하거나, 복잡한 소프트웨어 프로젝트 전체를 맥락으로 이해하는 AI 코더를 기대할 수 있게 됐다. 다만 토큰 수가 늘어날수록 응답 시간이 길어지고 비용이 증가하는 문제도 있어, 구글은 효율적 압축 알고리즘과 과금 정책을 함께 마련하고 있다고 밝혔다.

2024년 06월 07일 : 구글, 오픈소스 LLM ‘Gemma 2’ 9B·27B 모델 발표: 구글이 개발자 콘퍼런스에서 자사 첫 오픈소스 대형언어모델 LLM인 ‘Gemma 2’를 공38】. 이 모델은 90억 및 270억 파라미터 두 가지 버전으로 배포되며, 허깅페이스 등을 통해 누구나 무료로 다운로드해 사용 가능하다. 구글은 Gemma 2가 최신 챗봇에 필적하는 성능을 보여주며, 최대 200만 토큰의 긴 문맥도 처리할 수 있다고 소개했다.

구글이 자사 LLM을 오픈소스로 내놓은 것은 이례적이며, 이는 오픈AI, 메타 등에 대응해 AI 커뮤니티와의 교감 및 표준 주도권 확보를 노린 것으로 풀이된다. Gemma 2는 연구 목적뿐 아니라 상업적으로도 사용 가능한 라이선스로 제공되어, 스타트업들이 구글 기술을 바탕으로 혁신적인 서비스를 개발할 수 있을 것으로 기대된다. 다만 경쟁력 있는 대형모델을 공개함으로써 자사 Bard 서비스와 Kannibalization 가능성도 있어, 구글이 어떻게 균형을 잡을지 주목된다.

2024년 06월 06일 : MS, 이미지 인식 ‘Florence 2’ 모델 공개…오픈소스로 기여: 마이크로소프트가 컴퓨터비전 분야 대형 AI 모델 ‘Florence 2’를 오픈소스로 발33】. Florence 2는 10억 장이 넘는 이미지로 학습되어 객체 인식, 이미지 캡션, 행동 탐지 등 다양한 시각 과제에서 최고 수준의 성능을 보인다. MS는 이를 공개함으로써 AI 연구 커뮤니티 발전에 기여하고, 개발자들이 Azure 플랫폼에서 활용할 수 있는 비전 AI 생태계를 확장한다는 계획이다.

MS는 언어모델 부문에서는 오픈AI와 협력하고 있으나, 비전 부문은 자체 연구를 강화하며 오픈소스 전략을 취하고 있다. Florence 2는 구글의 ViT, 메타의 DINO 등과 경쟁 구도에 놓이며, 특히 멀티태스크 능력이 뛰어나 한 모델로 다양한 시각 임무를 수행할 수 있다는 장점이 있다. 연구자들은 이러한 오픈 모델들이 AI 분야의 투명성과 협업을 촉진해, 결과적으로 더 안전하고 공정한 AI 발전에 도움을 줄 것이라고 환영했다.

2024년 06월 05일 : 앤트로픽, ‘Claude Sonnet 3.5’ 출시…경량으로 성능↑: AI 기업 앤트로픽(Anthropic)이 자사 챗봇 Claude의 경량화 버전인 ‘Claude Sonnet 3.5’를 선33】. Sonnet 3.5는 이전보다 매개변수 수를 30% 줄였음에도, 고효율 훈련 기법 덕에 실제 언어 이해 및 생성 능력은 향상되었다. 회사 측은 “작은 모델로도 큰 모델 뺨치는 성능을 보여준다”면서, 저사양 환경이나 모바일에도 적합한 AI라 강조했다.

최근 거대 모델 경쟁 속에서 경량 모델 연구도 활발하다. Claude Sonnet 3.5는 전기 소모와 지연 시간을 줄여 탄소 발자국도 개선했다는 점에서 친환경 AI로 관심을 끌었다. Anthropic은 Sonnet 시리즈를 통해 클라우드 연산 자원 여력이 부족한 중소기업이나 연구기관도 고품질 AI를 활용할 수 있도록 하겠다는 전략이며, 이는 AI 기술의 저변 확대에 기여할 것으로 기대된다.

2024년 06월 04일 : Runway, AI 비디오 생성 모델 ‘Gen-3’ 알파 버전 공개: AI 영상 편집 플랫폼 Runway가 세번째 세대 비디오 생성 모델 ‘Gen-3’의 알파 버전을 발31】. Gen-3는 전작보다 해상도와 프레임율이 개선되어 1분 길이의 HD 영상을 끊김 없이 만들어낼 수 있으며, 사용자 업로드 영상의 스타일을 학습해 유사한 영상을 확장하거나 새로운 장면을 창작하는 능력이 뛰어나다고 회사는 설명했다.

Runway는 2022년부터 AI 비디오 합성 기술을 선도해온 스타트업으로, 이번 Gen-3 발표는 영상 제작 도구로서 AI의 실용성을 한층 높였다. 다큐멘터리 감독 등 소규모 영상 제작자들이 가상 B-roll 영상을 생성하거나 특수효과를 손쉽게 입히는 데 활용하기 시작했고, 광고업계에서도 빠른 프로토타이핑용으로 관심을 보이고 있다. 정식 버전은 연말에 출시될 예정이다.

2024년 06월 03일 : 딥러닝 스타트업 딥시크, 코딩 특화 AI ‘DeepSeekCoder V2’ 공개: 한국 스타트업 딥시크(DeepSeekAI)가 2세대 코드 전문 AI 모델 ‘DeepSeekCoder V2’를 오픈소스로 출26】. 이 모델은 GPT-4 수준의 코딩 문제 해결 능력을 목표로 개발되었으며, 파이썬부터 자바스크립트까지 폭넓은 언어를 지원한다. 특히 문맥 파악 능력이 뛰어나, 장황한 사양 설명서를 입력하면 알아서 코드 구조를 잡아주는 기능이 눈길을 끌었다.

국내에서 국제 경쟁력을 갖춘 오픈소스 AI 모델이 나온 것은 이례적이다. 딥시크는 연구자 출신들이 모여 만든 소규모 기업이지만, 커뮤니티 기여와 공개 데이터를 적극 활용해 고성능 모델을 저비용으로 개발할 수 있었다고 밝혔다. 이 모델은 GitHub 등 개발자 플랫폼에서도 호응을 얻고 있으며, 정부의 오픈소스 AI 지원 정책 덕분에 빠르게 성장한 사례로 꼽히고 있다.

2024년 06월 02일 : 애플, WWDC에서 ‘Apple Intelligence’로 AI 대공세: 애플이 세계개발자회의(WWDC)에서 발표한 새 AI 플랫폼 ‘Apple Intelligence’가 화제다. 아이폰 iOS18, 맥OS 신규버전에 통합되는 이 플랫폼은 기기 내에서 다양한 AI 모델을 조합해 동70】. 예를 들어 사용자가 메시지로 약속을 잡으면 캘린더 일정 생성과 교통 알림을 AI가 자동 처리해주고, 시리도 인터넷 검색 없이 오프라인 질의응답이 가능해진다.

프라이버시를 내세우며 클라우드 AI보다 한발 느렸던 애플이 본격적으로 온디바이스 AI 장점을 살려 반격에 나섰다는 평가다. 특히 맥북 등에 탑재된 신형 칩의 신경엔진 성능을 극대화하여, 전력 소모를 최소화하면서도 실시간 번역, 사진에서 오브젝트 따기 등의 복잡한 연산을 거뜬히 해낸다. 개발자들도 Apple Intelligence API를 통해 앱에 AI 기능을 추가할 수 있어, 향후 애플 생태계에 특화된 AI 앱 붐이 예상된다.

2024년 06월 01일 : Stability AI, Stable Diffusion 3 정식 공개…창작영역 확장: Stability AI가 이미지 생성 모델 Stable Diffusion 3를 오픈소스로 정식 공18】. 이번 버전은 중간 정도 크기인 20억 개 파라미터 모델로, 경량화에도 불구하고 전작 대비 더 풍부한 디테일과 사실감을 자랑한다. 특히 동일 인물이나 캐릭터를 일관되게 여러 장면에 등장시키는 기능이 개선되어, 간단한 만화나 스토리보드도 AI로 제작할 수 있게 되었다.

Stable Diffusion 3의 출시는 오픈소스 예술 창작 커뮤니티에 큰 환영을 받고 있다. 이미 출시 며칠 만에 새로운 사용자 인터페이스와 애니메이션 확장 플러그인 등 수백 개의 파생 프로젝트가 등장했다. 한편, Stability AI는 상업용 사용자 대상의 유료 멤버십을 도입해 수익화도 꾀하고 있는데, 이는 오픈소스 생태계를 지키면서도 지속 가능한 사업 모델을 찾기 위한 실험으로 주목된다.

2024년 05월 31일 : “ChatGPT 금지”했던 학교들, 뒤늦게 AI 활용 교육 채택: 올해 초 ChatGPT 사용을 금지했던 미국·영국의 일부 명문 고등학교들이 정책을 선회해 AI 활용법을 가르치는 교육과정을 도입했다. 학생들이 어차피 외부에서 AI를 접하기 때문에 차라리 책임감 있게 쓰는 법을 가르치는 게 낫다는 판단에서다. 예컨대 AI가 작성한 글을 비판적으로 편집하는 과제를 내거나, AI 도움을 받았음을 명시하고 그 기여도를 분석하도록 하는 등의 수업이 이뤄지고 있다.

교육계의 AI 수용이 확산되는 추세다. 우리나라에서도 교육부가 “AI 리터러시”를 정규 수업에 포함시키겠다고 밝히고, EBS 등이 AI 활용 학습자료를 개발 중이다. 전문가들은 AI 시대에 학생들에게 완전 금지보다는 올바른 사용법과 한계를 인식시키는 교육이 필수라고 조언하며, 교사 연수와 가이드라인 마련이 시급하다고 지적한다.

2024년 05월 30일 : 미 국방부, AI 드론 훈련 중 오작동 논란…윤리 규정 강화: 미국 공군의 AI 탑재 드론이 훈련 비행 중 통제 센터 명령을 오인식하여 예기치 않은 경로로 이동하는 사건이 발생했다. 인명 피해나 사고는 없었으나, 이에 국방부는 AI 무기 운용에 관한 윤리 규정을 재점검하고 모든 AI 시스템에 “인간 권한 우선(Human-in-the-loop)” 제어를 의무화하는 조치를 내놨다. 해당 드론의 알고리즘 결함은 수정되었으며 추가 안전장치가 탑재될 예정이다.

군사용 AI의 신뢰성 문제를 보여준 사례로, 국제사회에서도 큰 관심을 가졌다. 특히 완전 자율무기(LAWS)에 대한 금지 논의가 한층 탄력을 받을 것으로 보인다. 미국 국방부는 공개 브리핑에서 “인공지능은 보조 수단일 뿐, 인간 통제를 벗어난 치명적 결정을 내리는 일은 없어야 한다”고 강조했으며, NATO 차원에서도 유사 사건 방지를 위한 데이터 공유와 협력을 강화하기로 했다.

2024년 05월 29일 : 메타버스 회의에 AI 아바타 참석…생산성 실험: 글로벌 컨설팅 회사 PwC가 일부 내부 회의에 직원 대신 AI 아바타를 참여시키는 실험을 시작했다. 직원이 미리 회의 안건 관련 자료와 자신의 의견을 AI에 학습시키면, 회의 시간에 VR 속 아바타가 그 직원처럼 질문하고 발언하는 식이다. 파일럿 시행 결과 회의 후에 AI가 생성한 요약본과 결정사항 정리가 매우 유용해, 실제 참석하지 않은 직원도 회의를 효과적으로 따라잡을 수 있었다고 PwC는 밝혔다.

원격근무와 메타버스 기술이 발전하면서, AI를 통해 “분신”을 보내는 개념의 업무 방식이 등장하고 있다. 이는 시간대가 다른 글로벌 팀 협업이나, 한 사람이 여러 회의에 중복되는 상황에서 유용할 것으로 보인다. 하지만 AI 아바타가 실제 인간의 창의적 기여를 완전히 대체할 수는 없으며, 윤리적 책임 소재나 개인정보 보호 등 해결해야 할 과제도 많아, 당분간은 보조적 실험 단계에 머물 전망이다.

2024년 05월 28일 : 앤트로픽, ‘Constitutional AI’ 윤리 툴 공개…AI 스스로 반성: AI 스타트업 앤트로픽(Anthropic)이 자사 모델에 적용한 독특한 윤리 훈련 기법인 “헌법적 AI”를 외부 개발자들에게 개방했다. 이 기법은 AI가 스스로 몇 가지 윤리 조항(헌법)을 참조하여 답변의 문제점을 점검·교정하도록 하는 것으로, 예를 들면 “거짓 정보를 퍼뜨리지 않는다”는 조항에 비추어 답변을 재검토하고 수정한다. 이를 통해 추가 인간 피드백 없이도 모델의 유해 발언이 크게 감소했다고 앤트로픽은 설명했다.

AI 윤리 훈련을 시스템적으로 구현한 사례로, 연구 커뮤니티의 관심이 크다. 개발자들은 이 툴을 활용해 자신들만의 AI 윤리 규칙을 설정할 수 있으며, 향후 특수 분야(의료, 교육 등)에 맞는 AI 거버넌스 체계를 구성하는 데 도움이 될 것으로 보인다. 다만 AI가 “자기 검열”을 하다가 오히려 창의성이나 풍부한 답변을 잃지는 않을지에 대한 토론도 이어지고 있다.

2024년 05월 27일 : 국내 대형 은행, AI 상담원 24시간 가동 시작: 국민·신한·하나 등 국내 4대 시중은행이 일제히 AI 콜센터 상담원을 도입해 24시간 고객 응대를 시작했다. 음성 합성 기술로 실제 상담사 목소리와 거의 유사하게 통화 품질을 제공하며, 예금 잔액 조회부터 분실신고 같은 단순 업무는 바로 처리하고, 복잡한 문의는 인간 상담사에게 연결해준다. 은행들은 초기 반응이 좋아 향후 대출 상담 등으로 AI 업무 범위를 넓힐 계획이다.

금융권은 고객서비스에 AI를 빠르게 적용하는 분야 중 하나다. 챗봇은 이미 자리를 잡았고, 이제 음성 상담까지 확장되며 연간 수백만 통의 상담 수요를 AI로 흡수할 것으로 기대된다. 다만, AI 상담사가 금융상품을 권유하거나 중요한 결정을 내리는 것은 규제와 신뢰 이슈로 제한되어 있다. 향후 AI에게 어느 정도 권한을 부여할지는 금융당국과 업계의 지속적인 논의가 필요한 부분이다.

2024년 05월 26일 : 전 세계 500대 슈퍼컴퓨터 중 30%가 AI 전용으로: 최신 톱500 슈퍼컴퓨터 순위가 발표됐는데, 500대 중 150여 대가 AI 연산에 최적화된 시스템으로 확인되었다. 3년 전만 해도 5% 미만이던 것이 폭발적으로 증가한 것으로, 특히 미국과 중국이 AI 슈퍼컴퓨터 보유량에서 선두를 달렸다. 이번 1위는 일본의 “후가쿠 AI”로, 초당 3엑사플롭스 이상의 연산 성능을 기록하여 기존 일반 목적 1위 시스템을 압도했다.

AI 모델 학습에 특화된 슈퍼컴퓨터는 대량의 GPU와 고속 네트워크로 구성되며, 국가의 AI 경쟁력을 좌우하는 전략 자산으로 떠올랐다. 한국도 처음으로 톱10에 AI 슈퍼컴퓨터 “크라운AI”를 올려 주목받았다. 전문가들은 “AI 슈퍼컴퓨터가 기후 모델링, 신약 개발 등에도 활용되면서 과학 발전을 견인할 것”이라고 전망하지만, 높은 에너지 소비와 투자 비용은 해결 과제로 남는다.

2024년 05월 25일 : 세계 최대 해커톤, “AI로 인류 문제 해결” 주제 성황: 미 실리콘밸리에서 열린 세계 최대 규모의 해커톤 대회에서 “AI for Good(인류를 위한 AI)”을 주제로 수천 명의 개발자가 48시간 동안 치열한 경쟁을 벌였다. 우승팀은 위성사진을 AI로 분석해 빈곤 지역에 적합한 식수 공급 위치를 추천하는 프로젝트를 선보여 심사위원들의 찬사를 받았다. 그 외에도 난민 교육, 기후 데이터 시각화 등 AI를 접목한 다양한 사회문제 해결 아이디어가 쏟아졌다.

AI 기술이 상업적 성공뿐 아니라 사회공헌에도 쓰일 수 있다는 것을 보여준 대회로, 구글, 마이크로소프트 등 후원 기업들도 우수 아이디어에 대해 추가 개발 지원을 약속했다. 이번 해커톤을 지켜본 관계자들은 “개발자들이 열정을 가지고 선의를 구현하는 모습이 인상적”이라며, AI 분야 인재들이 건설적인 방향으로 역량을 펼칠 수 있도록 생태계를 조성하는 것이 중요하다고 입을 모았다.

2024년 05월 24일 : 노벨상 수상자 모임 “AI, 과학 연구 촉진” 성명: 독일에서 열린 노벨상 수상자 모임에서 참석 과학자 30여 명이 AI의 긍정적 활용을 촉구하는 공동 성명을 발표했다. 이들은 AI가 새로운 가설 도출, 방대한 데이터 처리, 협업 네트워크 형성에 기여하여 과학 연구의 속도를 높일 수 있다고 평가하면서, 각국 정부에 오픈 사이언스 정책 지원과 AI 연구 인력 양성을 당부했다.

보수적인 학계 원로들도 AI를 적극 받아들이자는 메시지를 낸 것은 이례적이다. 특히 생물학, 물리학 분야 석학들이 AI를 통해 학문 간 장벽이 낮아지고 융합 연구가 활성화될 것이라 전망했는데, 이는 최근 AlphaFold2 사례 등 AI가 실질적 연구 도구로 쓰인 성과를 높이 산 결과다. 이 성명은 AI에 대한 사회적 인식 제고에도 영향을 미쳐, 대중에게 공포보다 기대감을 심어주는 효과를 낼 것으로 보인다.

2024년 05월 23일 : 구글 딥마인드, “AlphaFold2” 후속 신약발견 AI 공개: 단백질 구조 예측 AI로 유명한 구글 딥마인드가 이번엔 신약 개발을 돕는 AI 시스템 ‘AlphaDrug(알파드럭)’을 발표했다. 이 모델은 질병 표적 단백질에 결합할 수 있는 최적의 화합물 구조를 생성해주며, 초기 실험에서 인간 연구자가 1년 걸릴 후보물질 도출을 단 1주일 만에 수행해냈다. 연구진은 “신약 파이프라인을 혁신적으로 단축할 수 있을 것”이라고 전망했다.

AlphaFold2가 기초연구에서 단백질 구조를 밝혀냈다면, AlphaDrug은 응용연구에서 치료제를 찾는 역할을 한다. 제약업계는 이 기술에 큰 관심을 보이며, 이미 화이자 등 다국적 제약사가 딥마인드와 협력 논의를 시작했다. 다만 AI가 제시한 후보물질도 최종 임상시험까지는 갈 길이 멀어, AI의 도움으로도 막대한 비용과 시간이 드는 신약 개발 프로세스를 얼마나 효율화할 수 있을지 주목된다.

2024년 05월 22일 : 글로벌 ICT 표준회의, AI 윤리 국제표준 착수: 국제전기통신연합(ITU) 등 3대 표준화 기구가 공동으로 AI 윤리 프레임워크에 대한 국제 표준화 작업을 시작한다고 발표했다. 이는 AI 개발 단계별 윤리 점검 리스트, 투명성·책임성 원칙, AI 시스템 인증 지침 등을 담은 종합 가이드로, 2년 내 초안을 완성해 회원국들에게 권고할 예정이다. 이 표준은 강제성은 없지만 글로벌 기업들의 가이드라인 역할을 할 것으로 기대된다.

표준화 기구들이 발벗고 나선 것은 각국 규제와 기업 자율기준이 제각각이어서 통일된 원칙을 만들 필요성이 제기되었기 때문이다. 특히 자율주행, 의료, 금융 등 안전이 중요한 분야에서 표준 가이드가 있으면 AI 신뢰성 확보에 도움이 될 전망이다. 한국도 이번 작업에 적극 참여해 ‘휴먼 센터드 AI’ 개념을 반영하도록 의견을 낼 계획이라고 전했다.

2024년 05월 21일 : 홍콩 증권거래소, AI 규제기업에 상장 가산점 검토: 홍콩 증권거래소(HKEX)가 AI 관련 규제를 준수하고 윤리 프로그램을 운영하는 기업에게 IPO(기업공개) 시 인센티브를 주는 방안을 논의 중이라고 밝혔다. 최근 AI 붐으로 거버넌스가 미비한 채 성장한 스타트업들이 우후죽순 상장을 추진하는 가운데, 투자자 보호 차원에서 윤리·안전 체계를 갖춘 기업을 우대하겠다는 취지다.

이는 전 세계 주요 거래소 중 최초로 AI 윤리 경영을 평가에 반영하려는 시도로, 실제 도입되면 상장심사 항목에 AI 리스크 관리 등이 포함될 수 있다. 일각에서는 규제가 과하면 혁신기업이 홍콩 대신 다른 시장으로 갈 수 있다는 우려도 있지만, HKEX는 중장기적으로 신뢰 받는 AI 기업 생태계를 조성하는 것이 금융시장 안정에 도움이 될 것이라고 보고 있다.

2024년 05월 20일 : 지식인 챗봇 ‘네이버 지식i’ 출시…국산 AI로 Q&A 도전: 네이버가 국내 포털 최초로 대화형 지식 챗봇 ‘지식i(아이)’ 베타 서비스를 시작했다. 이 챗봇은 2천억 개 웹문서를 학습한 하이퍼클로바X 모델을 기반으로, 사용자의 질문에 한글로 자세한 설명과 관련 링크를 제시한다. 특히 한국의 문화나 시사 이슈에 강점이 있어, “어제 프로야구 결과 알려줘” 같은 질문에도 토박한 정보를 잘 제공하는 것이 특징이다.

네이버는 방대한 국내 웹 데이터 자산을 바탕으로, ChatGPT 등 글로벌 서비스에 맞서 로컬 지식 상담 특화 전략을 취하고 있다. 초반엔 부정확한 답변도 있었으나 유저들의 실제 Q&A 데이터로 빠르게 개선되고 있고, 연말 정식 서비스 때는 전문 상담(법률, 세무 등) 플러그인도 붙일 계획이다. 국내 사용자들은 익숙한 플랫폼에서 AI 혜택을 받을 수 있어 호응하는 분위기다.

2024년 05월 19일 : ‘AI 반도체 동맹’ 결성…인텔·삼성·AMD 뭉쳤다: 엔비디아 독주 체제를 견제하기 위해 인텔, 삼성전자, AMD 등 주요 반도체 업체들이 AI 칩 기술 협력 연합을 전격 결성했다. 이들 업체는 AI 가속기 칩의 공통 인터페이스 표준과 소프트웨어 플랫폼을 공동 개발하여, 고객들이 보다 쉽게 엔비디아 대안을 채택하도록 할 계획이라고 밝혔다. 이를 통해 AI 인프라 시장에서 건강한 경쟁과 혁신을 촉진한다는 목표다.

한 회사가 시장을 80% 이상 점유한 현 상황에 대한 위기감이 작용한 것으로 보인다. 특히 데이터센터용 GPU 가격이 폭등하면서, 구글·아마존 등 수요기업들도 대안 부품을 원하고 있어 이 연합에 지원 사격을 보내고 있다. 향후 몇 년 내 이 연합의 표준을 따르는 AI 칩이 출시되면, 엔비디아의 기술 독점이 완화되고 인공지능 연산 비용이 다소 낮아질 것으로 기대된다.

2024년 05월 18일 : 캐나다, “AI 일자리 충격 대응” 10억 불 투자 발표: 캐나다 정부가 AI 도입으로 인해 전환이 필요한 노동자들을 지원하기 위해 향후 5년간 10억 캐나다 달러(약 1조 원)를 투자하는 계획을 발표했다. 이 예산은 AI로 대체 위험이 큰 직종 종사자들의 재훈련 프로그램, 일자리 이동을 위한 생활비 지원, 새로운 AI 분야 일자리 창출 보조금 등에 사용될 예정이다.

한 연구에 따르면 캐나다 전체 일자리의 약 20%가 향후 10년 내 AI 영향권에 들 수 있다고 분석됐다. 캐나다는 인구 대비 AI 인재 비중이 높은 국가지만, 동시에 자연자원·제조업 등 전통산업 종사자 보호에도 신경을 쓰고 있다. 이번 대책은 선제적으로 사회안전망을 갖추어 AI로 인한 사회불안을 최소화하려는 모범적 정책으로 평가받고 있다.

2024년 05월 17일 : 이탈리아, AI 개인정보 침해 논란 일단락…챗GPT 재개: 지난 2023년 한때 ChatGPT를 차단했던 이탈리아가 오픈AI와의 협의를 거쳐 개인정보 보호 대책을 마련한 후 서비스를 재개했다. 오픈AI는 이탈리아 이용자에게 데이터 수집 여부를 명시적으로 묻고 거부 옵션을 제공하며, 삭제 요청을 처리하는 지역 담당 창구도 설치하기로 했다. 이탈리아 정부는 “AI 혁신과 개인정보 보호의 균형점을 찾았다”고 평가했다.

유럽에서 처음 ChatGPT를 제재했던 이탈리아 사례는 각국 규제 당국에 큰 참고가 되었다. 이후 OpenAI는 유럽 전체에 유사한 프라이버시 옵션을 도입했고, 독일, 프랑스 등도 이 조치를 긍정적으로 받아들여 별도 차단 움직임을 보이지 않고 있다. 이는 글로벌 AI 기업이 현지 법규에 맞춰 정책을 신속히 조율한 사례로 남았으며, 향후 다른 서비스들도 선제적으로 개인 정보 보호 강화에 나설 것으로 보인다.

2024년 05월 16일 : 중국, AI 연구논문 수 미국 앞질러…질적 경쟁 돌입: 2024년 상반기 AI 분야 주요 학회(NeurIPS, ICML 등)에서 중국 기관 소속 저자 논문 수가 처음으로 미국을 넘어섰다고 네이처지가 보도했다. 중국은 특히 딥러닝 이론과 컴퓨터비전 분야에서 강세를 보였으며, 미국은 생성형 AI 응용과 강화학습에서 우위를 보였다. 연구자들은 “이제 양국이 양적 경쟁에서 질적 성취 경쟁으로 접어들었다”고 평가했다.

중국 정부와 기업의 대규모 투자로 AI 인재와 논문 수가 급증한 지 몇 년 만에 일궈낸 성과다. 다만 일부에서는 중국 논문의 영향력(피인용 수)이 아직 미국에 못 미친다는 지적도 있다. 양국 경쟁이 심화되면서, 국제 공동연구가 줄고 지적 재산 보호를 둘러싼 긴장도 높아지고 있어, 학술계의 협력 구조가 변화하고 있다.

2024년 05월 15일 : 디즈니, AI로 고전 애니메이션 리마스터링 착수: 월트 디즈니 스튜디오가 AI 기술을 활용해 자사 고전 애니메이션 영화들을 4K 화질로 복원·재편집하는 대규모 프로젝트를 발표했다. AI가 필름 원본의 손상된 프레임을 복구하고, 인물들의 움직임을 현대적 고주사율로 보정하며, 필요시 배경을 새로 생성해 이질감을 줄이는 방식이다. 첫 작품으로 <백설공주>가 선정되어 복원 작업 중이며, 내년에 디즈니+를 통해 공개될 예정이다.

영화 복원 분야에 AI를 적극 활용하는 사례가 늘고 있는데, 디즈니의 프로젝트는 규모 면에서 단연 최대이다. 일부 팬들은 “추억의 장면이 바뀔까 우려된다”는 반응을 보이지만, 디즈니는 원본의 예술적 의도를 존중하면서 기술적으로 향상하는 데 주력하겠다고 밝혔다. 이번 성과에 따라 다른 영화사들도 AI 리마스터링에 뛰어들 것으로 전망된다.

2024년 05월 14일 : 애플, Apple Intelligence로 AI폰 대중화 선언: 애플이 연례 개발자회의(WWDC)에서 아이폰, 아이패드, 맥 전반에 적용될 ‘Apple Intelligence’ 플랫폼을 공69】. 이는 기기 내에서 실행되는 온디바이스 AI 시스템으로, 시리와 메시지, 메일 등 기본 앱에 강력한 AI 기능을 부여한다. 강조점은 프라이버시로, 모든 AI 연산이 로컬에서 이뤄져 사용자의 데이터가 클라우드로 보내지지 않는다는 것이다.

아이폰15부터 적용될 예정인 Apple Intelligence는 예를 들어 사용자의 사진을 분석해 자동 앨범 분류, 오프라인 상태에서도 가능한 시리의 복잡한 질의 응답 등을 가능케 한다. 이는 삼성 갤럭시 S24의 Gauss AI 탑재와 함께 스마트폰에 AI를 내장하는 트렌드를 주도하며, 모바일 컴퓨팅의 지형을 바꾸고 있다. 다른 안드로이드 제조사들도 곧 유사한 AI폰 기능을 선보일 것으로 예상된다.

2024년 05월 13일 : 스테이블 디퓨전 3, 대기자에게 초기 공개…개선점 증명: 대중적 이미지 생성 AI인 Stable Diffusion의 3.0 버전이 제한된 얼리 액세스로 대기자 명단 사용자들에게 공개되었다. 초반 피드백에 따르면 이미지 해상도와 디테일 면에서 2.x 버전에 비해 크게 향상되었고, 글자 표현 등 고질적 문제도 상당 부분 개선된 것으로 보인다. Stability AI 측은 “커뮤니티 의견을 반영해 정식버전에 반영할 것”이라고 밝혔다.

Stable Diffusion 3는 디퓨전 모델에 트랜스포머 요소를 결합한 새로운 아키텍처로 주목받았다. 초기 테스트에서 경쟁 모델인 미드저니 v6와 비등한 품질이라는 평가를 받으며 기대감을 높였다. 오픈소스 진영의 대표 주자인 만큼, 출시 후에도 전 세계 개발자들이 추가 모델 개선과 기능 확장에 참여할 것으로 보여, 향후 발전 속도가 더욱 빨라질 전망이다.

2024년 05월 12일 : 국내 AI 반도체 첫 수출…“삼성 NPU, 美 데이터센터 입성”: 삼성전자가 개발한 AI 가속 반도체(NPU)가 미국 대형 클라우드 데이터센터에 처음으로 대량 공급되기 시작했다. 이 칩은 소비전력 대비 연산 효율이 업계 최고 수준으로, 데이터센터의 초거대 AI 학습·추론 비용을 20% 이상 절감시켜주는 것이 강점이다. 그동안 엔비디아가 독점해온 시장에 국내 업체가 진출했다는 점에서 의의가 크다.

한국 정부와 업계는 AI 반도체를 미래 먹거리로 집중 육성해왔으며, 이번 성과로 국산 기술력을 입증한 셈이다. 고객사는 해당 칩으로 구축한 AI 클러스터의 성능이 만족스럽다고 전했고, 삼성은 향후 3나노미터 공정 신제품으로 점유율을 끌어올릴 계획이다. 다만 아직 소프트웨어 생태계나 최적화 툴 측면에서 개선 과제가 있어, 지속 투자와 파트너십이 필요하다.

2024년 05월 11일 : 워런 버핏 “AI, 인류 복지 향상시킬 것” 긍정론 피력: ‘투자의 귀재’ 워런 버핏 버크셔해서웨이 회장이 연례 주주총회에서 AI에 대해 낙관적 견해를 밝혔다. 그는 “AI는 산업혁명과 비슷한 생산성 혁신을 가져올 것”이라며, 단기적 일자리 변화는 있겠지만 장기적으로 인류의 부를 증대시키고 생활 수준을 높일 것으로 믿는다고 언급했다. 이는 기존에 기술에 신중한 입장을 보인 버핏답지 않은 발언으로 주목을 끌었다.

버핏은 한때 암호화폐 등을 강하게 비판했지만 AI에 대해서는 비교적 긍정적 시각을 드러낸 것이다. 이는 그의 주요 투자 종목인 애플 등 기업들이 AI로 이익을 볼 것으로 판단한 것과 맥을 같이 한다. 동시에 그는 AI 투자과열에 대해서는 경계하며, “본질적 가치에 집중하라”는 투자 원칙을 재확인했다. 그의 발언은 보수적 투자자층에도 영향을 미쳐, AI 관련 주식에 대한 신뢰를 높이는 계기가 되었다.

2024년 05월 10일 : 시스코, AI 네트워크 보안 스위트 출시…위협 실시간 대응: 글로벌 네트워크 기업 시스코(Cisco)가 AI를 활용한 차세대 네트워크 보안 솔루션 “Cisco AI Shield”를 발표했다. 이 스위트는 회사 내 모든 장비에서 발생하는 로그를 AI가 모니터링해 이상 징후를 탐지하고, 실시간으로 침입 차단 규칙을 생성·적용한다. 시스코는 최근 유행하는 AI 기반 지능형 해킹에 대항하려면 방어 측도 AI의 민첩성이 필요하다고 강조했다.

사이버보안 업계에서 AI 도입은 공격과 방어 모두 가속화하는 추세다. Cisco AI Shield는 과거 수동으로 설정하던 방화벽 정책을 AI가 자동 관리해주므로 보안 인력의 부담을 크게 줄이며, 알려지지 않은 제로데이 공격에도 어느 정도 선제 대응이 가능할 것으로 기대된다. 다만 오경보(false positive)를 줄이는 정교함과, AI 시스템 자체의 취약점 노출 방지가 관건이다.

2024년 05월 09일 : 테슬라, 완전자율주행 AI “도조 v2” 칩 발표: 전기차 업체 테슬라가 완전자율주행(FSD) 컴퓨터의 핵심인 AI 칩 ‘Dojo(도조) v2’를 공개했다. 이번 칩은 이전 세대보다 연산능력이 4배 향상되어 자율주행 차량이 복잡한 도심 상황도 실시간으로 판단·대응할 수 있게 한다. 테슬라는 이 칩을 신형 모델부터 순차 탑재하고, 기존 차량도 소프트웨어 업데이트로 성능 향상을 체감할 수 있을 것이라고 밝혔다.

테슬라는 차량용 AI 연산에 특화된 자체 칩 개발로 유명하며, 도조 v2는 AI 하드웨어 내재화 전략의 성과로 볼 수 있다. 경쟁사들이 외부 칩 공급망에 의존하는 것과 달리, 테슬라는 칩-소프트웨어를 일체 설계해 최적화 효율을 극대화하고 있다. 이 발표 이후 주가는 상승했고, 완전자율주행 목표 시점에 대한 기대감도 높아졌지만, 안전성 검증과 규제 승인이라는 현실 과제는 여전히 남아 있다.

2024년 05월 08일 : MS “이미지 보는 Bing” 출시…검색에 비전 AI 결합: 마이크로소프트가 Bing 검색 엔진에 이미지를 이해하고 생성하는 AI 기능을 추가한 새로운 버전 “비주얼 Bing”을 공개했다. 사용자는 사진을 올려 “이 장소는 어디?”라고 물으면 Bing이 이미지를 분석해 위치를 추론해주고, “이 스타일로 사진 찍어줘”라고 하면 유사한 이미지를 생성해 제시해준다. 검색엔진이 텍스트뿐 아니라 시각적 질문에도 답하는 시대가 열린 셈이다.

이는 챗GPT 기반 Bing 챗봇에 DALL-E 3 등 비전 모델을 통합한 결과물로, MS가 구글과의 검색 경쟁에서 AI 혁신으로 승부를 보려는 전략이다. 비주얼 Bing은 출시 초 일부 엉뚱한 결과도 있었지만 빠르게 개선 중이며, MS는 이를 AR 안경 등과 연계해 현실 세계의 정보 검색까지 확장할 계획을 시사했다.

2024년 05월 07일 : 미스트랄 AI, 코딩 특화 ‘Codestral 22B’ 공개…개발자 도우미: 프랑스 스타트업 미스트랄 AI가 파라미터 220억 규모의 코딩 특화 언어모델 ‘Codestral(코드스트럴) 22B’를 오픈소스로 출14】. 이 모델은 주석을 입력하면 코드 구현을 제안하거나, 에러 로그를 보고 버그 원인을 찾아주는 등 개발 업무를 돕도록 튜닝되었다. 미스트랄은 “오픈소스 커뮤니티의 피드백으로 모델을 지속 개선할 것”이라고 밝혔다.

Codestral 22B는 파이썬, 자바, C++ 등 주요 언어에 능통하며, 휴먼이발(HumanEval) 벤치마크에서 70%에 육박하는 점수를 기록해 GPT-4 수준에 근접했다는 평가를 받는다. 이 모델의 공개로 기업들도 라이선스 걱정 없이 고성능 코딩 AI를 활용할 수 있게 되어, 자체 개발자 지원 도구에 통합하는 사례가 늘어날 전망이다.

2024년 05월 06일 : Suno AI, 음악 생성 모델 v3.5 업데이트…더 자연스러운 곡: 음악 생성 AI 스타트업 Suno가 자사 모델 v3.5를 공개하며 음악 AI 품질을 한층 끌어12】. 새로운 버전은 기존보다 2배 이상 길고 복잡한 멜로디도 일관성 있게 생성하고, 보컬 스타일도 장르별로 섬세하게 컨트롤할 수 있는 것이 특징이다. Suno는 유명 뮤지션들과 협업해 모델을 튜닝했다고 밝혔다.

AI 음악은 초창기엔 단조롭다는 평이 많았으나, Suno v3.5는 초기 데모에서 “인간 작곡가와 거의 구분 어렵다”는 호평을 받았다. 음악 AI는 게임, 광고 배경음 등에서 상업 활용이 늘고 있으며, 향후 개인 맞춤 테마곡 제작 등의 서비스로도 발전할 수 있다. 다만 창작자 권리 침해나 감성 부족 등의 지적도 있어, 인간 음악가와 AI의 공존 방안이 모색되고 있다.

2024년 05월 05일 : 구글 검색, AI 통합 ‘AI 오버뷰’ 기능 도입: 구글이 검색 서비스에 키워드에 대한 요약 정리를 상단에 보여주는 “AI 오버뷰” 기능을 도10】. 이제 복잡한 질문을 하면 AI가 관련 핵심 정보를 몇 문장으로 정리해주고, 그 아래에 세부 링크를 표시한다. 예를 들어 “피라미드 건설 방법”을 찾으면 간략한 설명과 함께 위키백과 등 출처가 나오는 식이다.

이는 검색 이용자의 편의성을 높이는 동시에, 챗GPT 등에 빼앗긴 사용자를 되찾으려는 구글의 전략이다. 다만 AI 답변의 정확성 문제가 있어, 구글은 현재 이 기능을 베타로 두고 틀린 답변에 대한 피드백을 받고 있다. 향후 AI 오버뷰가 정식화되면 검색 엔진과 AI 챗봇의 경계가 희미해지며, 정보 탐색 경험이 크게 변모할 것으로 예상된다.

2024년 05월 04일 : 메타, AI로 ‘텍스트+이미지 동시에’ 멀티모달 모델 공개: 메타가 새로운 멀티모달 AI 모델 ‘Chameleon(카멜레온)’을 발표했다. 카멜레온은 텍스트와 이미지를 동시에 생성할 수 있어, 예를 들어 “봄 날씨에 어울리는 시와 삽화”라고 입력하면 AI가 짧은 시를 쓰고 그 분위기에 맞는 그림까지 만들어준다. 이는 텍스트 출력과 이미지 출력을 하나의 맥락에서 연결한 혁신으로 평04】.

메타는 소셜미디어에서 글과 사진을 함께 공유하는 사용 패턴에 착안해 이런 모델을 개발했다고 밝혔다. 카멜레온은 인스타그램 등 플랫폼에 적용되어, 사용자가 추억을 올릴 때 AI가 글과 콜라주 이미지를 자동 생성해주는 기능으로 이어질 전망이다. 멀티모달 AI 경쟁이 뜨거워지면서, 각사가 서비스에 특화된 창의적 활용법을 내놓고 있다.

2024년 05월 03일 : MS, Copilot+ PC 발표…개인 기록도 AI 검색: 마이크로소프트가 개인용 PC에 특화된 ‘Copilot+’ 기능을 새 윈도우 업데이트에서 공97】. 이 기능은 사용자의 작업 스크린샷을 AI가 자동으로 수집·분류해 기억하고 있다가, 사용자가 “작년 예산안 그 그래프 찾아줘”라고 물으면 관련 자료를 바로 띄워주는 식이다. 즉, PC 내 과거 모든 작업 히스토리를 AI로 검색할 수 있게 된 것이다.

Copilot+는 개인의 디지털 기억을 관리해주는 개념으로, 생산성 향상에는 크게 도움이 될 것으로 보인다. 하지만 민감한 개인정보가 AI에 저장·처리되는 만큼, MS는 데이터가 로컬 PC 내에서만 암호화되어 처리되고 외부 전송은 없다고 강조했다. 이 기능은 우선 기업용으로 도입되고, 향후 일반 사용자에게도 확대될 예정이다.

2024년 05월 02일 : 구글 I/O, 제미나이 1.5 등 AI 신기능 대거 공개: 구글 연례 개발자회의 I/O에서 차세대 언어모델 ‘Gemini 1.5 Pro’와 경량 버전 ‘Gemini Flash’가 처음 소개됐다. Gemini 1.5 Pro는 최대 200만 토큰의 긴 문맥도 처리하고 이미지·음성까지 이해하는 능력을 선보여 개발자들의 찬사를 받았다. 또한 지메일에 자동 요약, 포토 앱에 AI 이미지 생성 등 구글 전 제품군에 AI 기능이 확대 적용되는 청사진도 제시되었다.

작년 발표된 PaLM 2의 후속작으로 볼 수 있는 Gemini 1.5는 구글이 AI 주도권을 지키기 위한 핵심 무기로 평30】. 구글은 특히 멀티모달 통합과 초장문맥 처리에서 경쟁사를 앞섰다고 강조했으며, I/O 이후 바로 일부 개발자들에게 API 접근을 허용했다. 업계에서는 구글의 AI 생태계가 본격 개화하는 신호탄으로 받아들이고 있다.

2024년 05월 01일 : OpenAI, 차세대 GPT-4o 모델 발표…멀티모달 능력 강화!: 오픈AI가 GPT-4의 업그레이드 버전인 ‘GPT-4o’를 공개했다. 이 모델은 텍스트, 이미지, 음성까지 동시에 입력받아 처리하는 완전한 멀티모달 기능을 갖추었으며, 응답 속도가 GPT-4 터보 대비 2배 빨86】. 또한 영어 외 50개 언어에서 성능 향상이 이루어져 글로벌 활용도가 높아질 전망이다.

GPT-4o는 ‘GPT-4 옴니(Omni)’를 의미하며, 사람처럼 다양한 감각 정보를 통합 이해하는 방향으로 진화한 것이다. 시연에서 사진을 보여주며 질문하자 상황을 파악해 대답하는 모습이 인상적이었으며, OpenAI는 추후 개발자들에게 API를 제공해 창작, 교육, 로봇 제어 등 폭넓은 분야에 응용될 것이라고 밝혔다.

2024년 04월 30일 : 전세계 AI 스타트업 투자 2배 급증…한국계 약진: 시장조사업체 CB인사이츠에 따르면 2024년 1분기 글로벌 AI 스타트업 투자액이 전년 동기 대비 2배 이상 늘어난 300억 달러에 달했다. 특히 생성형 AI 열풍으로 미국·유럽 뿐 아니라 한국과 동남아 스타트업들도 대형 투자 라운드를 잇달아 성사시켰다. 한국계로는 ‘픽셀AI’가 1억 달러를 유치해 가장 규모가 컸고, 이는 이 분야에서 아시아의 존재감이 커지고 있음을 보여준다.

거시경제 불확실성에도 불구하고 AI 부문의 투자 쏠림 현상은 두드러지고 있다. 전문가들은 2023년 OpenAI 성공 이후 “두 번째 챗GPT”를 찾는 투자가들이 늘었으며, 클라우드 인프라부터 응용서비스까지 AI 가치사슬 전반에 골고루 투자가 이뤄졌다고 분석했다. 다만 너무 과열된 밸류에이션에 대한 우려도 있어, 옥석 가리기가 진행될 것으로 전망된다.

2024년 04월 29일 : 국내 병원들, AI “의료영상 어시스턴트” 속속 도입: 서울대병원 등 상급종합병원 다섯 곳이 공동으로 AI 의료영상 판독 보조 시스템을 도입했다고 밝혔다. 이 AI는 CT나 MRI 영상을 분석해 미세한 종양이나 출혈 징후를 사람보다 빠르고 정확하게 표시해주며, 실제 테스트에서 놓치기 쉬운 초기 병변을 15% 더 발견해냈다. 의료진은 “진단 정확도를 높여줘 든든한 조수”라고 평했다.

의료영상 분야는 AI 활용이 가장 앞선 영역 중 하나로, 국내 식약처도 다수의 AI 진단 보조기를 허가한 바 있다. 다만 AI 오진에 대한 책임소재와 데이터 프라이버시 문제 등은 여전히 숙제로 남아 있다. 의료계는 AI를 도입하되 최종 판단은 의사가 하는 “의사-AI 협진” 체계를 유지하며, 임상경험과 머신러닝의 장점을 결합해 환자 안전을 도모하고 있다.

2024년 04월 28일 : AWS, 기업용 생성형 AI 지원 대폭 확대: 아마존 클라우드(AWS)가 기업 고객들이 손쉽게 자체 챗봇과 텍스트 생성 모델을 구축할 수 있는 “Bedrock(베드록)” 서비스를 공식 출시했다. 이 플랫폼에는 AI 스타트업 앤트로픽의 클로드와 Stability AI의 StableLM 등 여러 모델이 통합돼, 고객사가 필요에 따라 선택해 활용할 수 있다. AWS는 데이터 보안과 확장성 면에서 경쟁 서비스보다 우위가 있다고 강조했다.

Azure OpenAI, 구글 클라우드 등에 맞서 AWS도 생성형 AI PaaS(Platform as a Service)에 본격 뛰어든 것이다. 아마존은 전자상거래, 금융 등 자사 빅데이터와 결합한 AI 솔루션을 제시하며 차별화를 꾀하고 있다. 클라우드 시장 1위인 AWS의 행보로, 올해 기업용 AI 인프라 경쟁이 더욱 치열해질 전망이다.

2024년 04월 27일 : ‘AI 변호사’ 꿈꾸는 스타트업들, 법정 문턱 절감 도전: 미국과 영국의 몇몇 법률테크 스타트업들이 경미한 소송에서 AI가 자동으로 법률 서류 작성과 절차 진행을 돕는 서비스를 내놓아 주목받고 있다. 예컨대 교통위반 항소 시 AI가 판례를 인용한 탄원서를 작성해주거나, 소액 청구 소송의 서류를 대행하는 식이다. 초창기 성과로 일부 지역에서 벌금 취소율이 20% 향상되었다고 업체들은 주장한다.

일반인이 법률 서비스를 저렴하게 이용하도록 돕는 “리걸테크(LegalTech)” 분야에 AI가 속속 도입되고 있다. 다만, 정확한 법률 해석과 책임 문제로 인해 완전한 자동화에는 제약이 많아, 당분간은 인간 변호사를 보조하는 수준에서 혁신이 이뤄질 것으로 보인다. 규제 당국도 이들 서비스가 변호사법을 위반하지 않는지 예의주시하고 있다.

2024년 04월 26일 : 애플 비밀 연구소 공개…“Siri에 GPT-4 수준 탑재 목표”: 애플이 사내 AI 연구 시설 “애플LABS”의 일부를 이례적으로 공개하며, 향후 시리에 생생한 대화 능력을 입히는 것이 목표라고 밝혔다. 이 연구소에서는 대규모 대화형 모델과 음성 합성 기술을 결합하는 프로젝트가 진행되고 있고, 내부 성능 테스트에서 시제품이 이미 GPT-4에 버금가는 대화품질을 보였다고 전해진다.

애플은 그동안 AI 행보를 외부에 잘 드러내지 않았으나, 경쟁이 치열해지자 전략적 홍보에 나선 것으로 풀이된다. Siri는 현재 제한된 기능 때문에 경쟁사 대비 뒤처졌다는 평가를 받았는데, 애플LABS 공개로 이미지 쇄신과 함께 AI 인재 확보 효과도 노리는 것으로 보인다. 사용자들의 기대감이 높아진 만큼 실제 제품 적용 시점과 완성도가 관건이 될 전망이다.

2024년 04월 25일 : 美 백악관, 초거대AI 검증 협력 발표…AI안전 추진: 미국 백악관이 구글, MS, 오픈AI 등 주요 AI 기업과 손잡고 차세대 초거대 AI 모델의 안전성 검증을 공동으로 진행하기로 했다고 발표했다. 기업들이 새로운 모델을 출시하기 전 정부 시설에서 잠재 위험을 테스트하고 결과를 공유하는 내용으로, 이는 자율 규제와 정책 개입의 절충 사례로 주목된다.

지난 해 GPT-4 공개 후 AI 안전성 우려가 급증하자 나온 대응으로, 미국 행정부는 AI 분야의 “안전한 혁신”을 기치로 내걸고 있다. 업계도 과도한 규제를 피하는 대신 자발적 협력을 선택한 셈이며, 이 모델이 성공하면 다른 나라에도 유사한 민관협력 틀이 확산될 것으로 보인다.

2024년 04월 24일 : 스타트업들이 뽑은 ‘AI 쓰나미’ 10대 트렌드 발표: 글로벌 스타트업 엑셀러레이터 Y콤비네이터가 2024년 주목해야 할 AI 기술 10가지를 선정해 발표했다. 리스트에는 초소형 엣지 AI 칩, 합성 데이터 자동 생성, AI로 제약 실험 자동화, 개개인 맞춤 AI 아바타 등 다양한 분야가 포함되었고, Y콤비네이터는 해당 분야 스타트업에 집중 투자할 계획을 밝혔다.

이 리스트는 향후 스타트업계의 AI 투자 풍향계로 여겨진다. 특히 합성 데이터(Synthetic Data)와 디지털 휴먼 아바타 등은 2023년부터 가능성이 제기된 영역으로, 2024년에 실제 비즈니스로 꽃피울 것으로 기대된다. 반면 자율 AGI(범용인공지능)같이 지나치게 이른 주제는 제외되어, 현실적으로 시장성 있는 기술 위주로 전망이 이루어졌다는 평가다.

2024년 04월 23일 : 파이썬 3.12, AI 친화 기능 추가 출시: 프로그래밍 언어 파이썬(Python)의 3.12 버전이 출시되면서 AI 개발자를 위한 편의 기능이 다수 추가되었다. 예를 들어 대형 언어모델 훈련시 메모리 관리 효율을 높이는 기능과, GPU 가속 매트릭스 연산을 직접 지원하는 모듈이 포함되었다. 이에 딥러닝 연구자들은 “별도 라이브러리 의존도를 낮출 수 있게 됐다”며 환영했다.

파이썬은 AI 연구 커뮤니티의 사실상 표준 언어로, 이번 업데이트는 AI 붐을 적극 반영한 것이다. 특히 성능 면에서 파이썬의 느리다는 단점을 개선하려는 시도가 계속되고 있어, PyPy나 Cython 등 대안 기술 없이도 고성능 AI 코드를 작성하는 방향으로 진화하고 있다. 이는 AI 개발의 진입장벽을 낮춰 개발자 생태계를 더욱 확장시킬 것으로 기대된다.

2024년 04월 22일 : 지구의 날, AI로 기후위기 대응 박차: 지구의 날을 맞아 전 세계 환경 단체들이 AI를 활용한 기후 대응 프로젝트를 발표했다. 위성 데이터와 AI 분석으로 불법 산림 벌채를 실시간 감시하거나, 해수면 상승을 예측해 위험 지역을 경고하는 시스템 등이 소개됐다. 또한 탄소 배출권 거래에 AI 예측을 도입해 기업들의 감축 노력을 투명하게 추적하는 새로운 시범사업도 눈길을 끌었다.

기후위기는 방대한 데이터와 복잡한 변수로 인해 AI의 도움을 받기에 적합한 분야다. 실제로 호주에서는 AI가 밤중 위성 열영상으로 산불을 조기에 발견해 큰 피해를 막은 사례가 있고, 각국 기상청도 기후 모델 개선에 AI를 접목하고 있다. 다만 AI 학습 자체의 전력 소모도 무시할 수 없어, 친환경 데이터센터와 그린 AI 기술 개발의 중요성도 함께 부각되고 있다.

2024년 04월 21일 : 작가 vs AI 저작권 소송 본격화…美 12건 뉴욕서 병합: 미국 뉴욕 남부지방법원이 작가들과 뉴스매체들이 오픈AI·마이크로소프트를 상대로 제기한 12건의 저작권 소송을 하나로 통합해 심리하기로 결24】. 소송인단은 AI 훈련에 자신들의 글을 무단 사용했다며 피해를 주장하는 반면, 피고 측은 기계학습 훈련은 공정 이용(fair use)에 해당한다며 맞서고 있다.

이 거대 집단소송은 AI 시대 저작권 법리가 어떻게 정립될지 가늠할 분수령이 될 전망이다. 법원은 우선 ChatGPT 출력이 원저작물과 얼마나 유사한지, 학습 자체가 저작권 침해인지 등 쟁점을 다룰 예정이며, 2024년 하반기쯤 예비 판결이 나올 것으로 보인다. 판결 결과에 따라 AI 산업 전반의 데이터 수급 방식이 크게 영향을 받을 수 있다.

2024년 04월 20일 : EU AI법 공식 채택…세계 첫 포괄적 규제 탄생: 유럽의회가 세계 최초의 포괄적 AI 규제인 ‘AI Act’를 최종 승인했다. 2024년 8월부터 발효되는 이 법은 AI 시스템을 위험도에 따라 구분해 고위험 AI(예: 신용평가, 채용 AI)에 대한 엄격한 사전 승인과 투명성 의무를 부25】. 딥페이크에는 식별 표시가 의무화되고, 사회적 감시용 AI는 원칙적으로 금지된다.

AI Act는 2021년 초안 제시 후 2년여 논의를 거쳐 나온 결실로, 글로벌 AI 산업에 상당한 파급효과를 가질 전망이다. 기업들은 EU 시장 진출을 위해 제품을 재설계하거나 인증 절차를 거쳐야 하며, 다른 국가들도 이 법을 벤치마킹해 자국 규제를 마련할 것으로 보여 국제적인 AI 규범 확산이 예상된다.

2024년 04월 19일 : GPT-5 발표 임박설 일축…“안전 먼저” 오픈AI: 최근 커뮤니티를 통해 퍼진 “GPT-5 출시” 루머에 대해 오픈AI의 그레그 브록만 회장이 “올해 GPT-5는 없다”고 못 박았다. 그는 GPT-4.5 단계도 한참 남았다며, 현재는 GPT-4 개선과 모델의 안전성 향상에 집중하고 있다고 설명했다. 이로써 GPT-5를 둘러싼 근거 없는 소문은 일단락되었지만, 업계의 차세대 모델에 대한 기대와 관심은 여전히 뜨겁다.

ChatGPT 성공 이후 AI 신모델 관련 루머가 끊이지 않는 상황에서, 오픈AI가 느긋한 행보를 보이는 건 규제와 윤리적 검증 압박도 작용한 것으로 보인다. 경쟁사인 Anthropic, 구글 등이 차기 모델을 내놓고 있지만, 오픈AI는 “급할수록 돌아가라”는 전략으로 신뢰도와 품질 확보를 우선시하는 모양새다.

2024년 04월 18일 : 딥마인드-MIT, ‘Fluid’ AI로 AI이미지 새 경지: 구글 딥마인드와 MIT 연구진이 매끄러운 화풍 전환으로 유명한 AI 이미지 모델 ‘Fluid(플루이드)’를 공52】. 이 105억 파라미터 모델은 텍스트 입력만으로도 예술적 감성의 이미지를 생성하는 데 있어 동급 최고 성능을 보이며, 하나의 그림에서 자유자재로 스타일을 변주하는 능력까지 선보였다.

Fluid는 작은 크기로도 뛰어난 성능을 낼 수 있음을 보여줘 주목받는다. 연구진은 학습 데이터 다양성과 새로운 아키텍처 덕분이라고 밝혔으며, 특히 10억 단어 이하 매개변수로도 초현실적 이미지 생성이 가능한 점은 경량화된 모델의 가능성을 입증한 결과로 평가된다.

2024년 04월 17일 : 日 정부 “AI 윤리 기본법” 추진…세계 첫 입법화 나서: 일본 내각이 인공지능의 윤리적 개발 및 활용을 촉진하기 위한 기본법 제정을 준비 중이다. 이 법안에는 AI 차별 금지, 투명성 확보, 해석 가능성 보장 등의 원칙이 담길 예정이며, 기업들에게 AI 영향 평가보고서를 제출하도록 요구하는 조항도 검토되고 있다. 일본은 이를 통해 기술 혁신과 윤리적 책임의 균형을 잡아 AI 강국으로 도약하겠다는 구상이다.

일본의 이런 움직임은 EU의 AI법, 미국의 AI 권고안과 함께 글로벌 AI 규범 형성에 영향을 미칠 것으로 보인다. 업계에서는 법 제정이 혁신을 저해하지 않도록 유연한 프레임워크가 되어야 한다는 의견과, 법적 강제가 있어야 기업들이 책임성을 담보할 수 있다는 의견이 맞서고 있다.

2024년 04월 16일 : 인도 IT 대기업, 사내 AI 챗봇 “우리GPT” 도입…생산성↑: 인도의 대형 아웃소싱 기업 타타 컨설턴시가 사내 직원 60만 명을 위해 자체 개발한 대화형 AI “우리GPT”를 도입했다. 직원들은 이 AI에게 코딩 문제 해결, 보고서 요약, 고객 응대 제안 등을 요청할 수 있는데, 도입 한 달 만에 업무 처리 속도가 평균 15% 향상되었다는 내부 평가가 나왔다.

글로벌 기업들이 보안 이슈로 외부 ChatGPT 사용을 제한하는 대신 사내 전용 AI를 구축하는 사례가 늘고 있다. 우리GPT는 사내 데이터로 추가 훈련되어 기밀 유지와 맞춤화 측면에서 강점을 가지며, 해당 기업은 AI와 인간의 협업으로 대규모 조직의 효율을 높인 모범 사례로 주목받고 있다.

2024년 04월 15일 : 미국 대선 앞두고 AI 딥페이크 대응팀 가동: 미국 정보당국과 IT 기업들이 함께 모의상황실을 꾸려 선거 관련 AI 조작 콘텐츠를 실시간 모니터링하는 프로젝트를 시작했다. 가짜 폭발 영상이나 허위 연설 클립이 퍼지면 즉시 경보를 울리고 차단·경고하는 시스템으로, 작년 소셜미디어를 떠들썩하게 했던 “펜타곤 폭발 가짜사진” 사건 재발을 막는 것이 목표다.

이러한 민관 합동 AI 워룸은 선거의 신뢰성을 지키기 위한 선제 대응으로, 실제 4년 전 캐나다 총선에서도 유사한 시도가 있었다. 기술 측면에서는 딥페이크 탐지 AI와 콘텐츠 추적 툴이 활용되며, 법적·윤리적 측면에서 어디까지 개입할지에 대한 사회적 합의도 함께 논의되고 있다.

2024년 04월 13일 : 메타, 음성-음성 번역 모델 ‘Meta Spirit LM’ 공개…오픈소스화: 메타가 사람 목소리의 억양과 감정까지 보존하며 다른 언어로 실시간 번역해주는 음성-음성 AI ‘Meta Spirit LM(스피릿 LM)’을 오픈소스로 공개했다. 영어로 말하면 똑같은 목소리 톤으로 한국어로 말해주는 식인데, 이 모델은 희귀 2024년 04월 14일 : 빅테크 연합, AI로 허위정보 차단 나선다!: 메타와 구글이 다가오는 미국 선거를 앞두고 AI 기반 가짜뉴스 검출 협력 체계를 구축하기로 했다. 양사는 합동 태스크포스를 통해 딥페이크 영상과 조작된 이미지를 식별하고, 팩트체크 기관들과 공유해 플랫폼 상 허위정보 확산을 신속히 억제한다는 계획이다. 소셜미디어에서 AI 생성 허위콘텐츠가 선거에 악영향을 미칠 우려가 커지자 나온 조치로, AI 기술을 문제 해결에도 활용하는 “AI 대 AI” 대결 구도가 형성되고 있다. 각국 정부도 선거 기간 플랫폼의 AI 모니터링 강화를 요구하며, 기술과 정책의 협력이 중요해지고 있다.

2024년 04월 12일 : 오픈소스 AI, 멀티모달 모델 ‘아리아’ 출시…이미지·텍스트 자유자재: 비영리 AI 그룹 Rhymes(라임즈) AI가 파라미터 130억 규모의 멀티모달 AI 모델 ‘Aria(아리아)’를 공개했다. Aria는 사진이나 그림을 입력하면 장면을 자세히 묘사하는 문장을 생성하고, 반대로 문장을 주면 해당 내용을 표현한 이미지를 제시할 수 있는 능력을 갖췄다. 오픈소스로 공개된 이 모델은 상용 모델 못지않은 멀티모달 기능으로 개발자들의 관심을 끌고 있다.

Aria는 공개 이미지-텍스트 데이터셋으로 학습되었으며, 모델 경량화 기법을 통해 일반 GPU에서도 실행 가능하다. 이는 오픈소스 진영이 비전+언어 통합 모델까지 범위를 넓혔음을 의미하며, 접근 가능한 멀티모달 AI 도구로서 교육·연구 분야에서 다양하게 활용될 것으로 기대된다.

2024년 04월 11일 : 어도비, 동영상용 ‘파이어플라이 비디오’ 공개…영상 생성 경쟁 가열: 어도비가 생성형 AI 툴 파이어플라이(Firefly)의 기능을 이미지에서 동영상으로 확장한 ‘Firefly Video’를 발표했다. 사용자가 “노을 지는 바닷가에 파도 치는 10초 영상”이라고 입력하면 배경음악까지 어우러진 짧은 영상을 자동 생성해주는 등, 영상 제작 시간을 혁신적으로 단축시킬 솔루션으로 소개되었다.

Firefly Video는 프리미어 프로 등 어도비의 기존 영상 편집 소프트웨어와도 긴밀히 연동되어, 편집자가 문장 한 줄로 장면 전환 효과이나 애니메이션 삽입을 지시할 수 있다. 미드저니, 구글 등의 영상 생성 AI 시범에 이어 어도비까지 가세하면서, 콘텐츠 제작에서 AI의 역할이 이미지 편집을 넘어 영상 제작까지 본격 확대되는 추세다.

2024년 04월 10일 : AI 간 협업 대화 프로토콜 ‘A2A’ 등장…에이전트 시대 개막?: 구글 딥마인드가 자사 로봇 및 소프트웨어 에이전트들이 서로 소통하며 공동 작업할 수 있는 통신 프로토콜 “A2A(Agent-to-Agent)”를 공개했다. 인간 언어와 유사한 형식으로 설계된 이 프로토콜을 통해 하나의 AI가 다른 AI에게 메시지를 보내 역할 분담이나 데이터 요청을 할 수 있어, 복잡한 문제를 여러 AI가 분산 협력해 푸는 환경이 실현될 전망이다.

A2A 프로토콜은 인터넷의 TCP/IP처럼 AI들 사이의 표준 대화 언어를 만들려는 개념으로, 상호 운용성과 확장성을 높이는 데 목적이 있다. 실제 시연에서, 시뮬레이션된 창고 로봇 두 대가 A2A를 사용해 서로 작업 순서를 협의하여 물건 정리를 더 효율적으로 수행했다. 이는 미래 AI 에이전트들이 인간 개입 없이도 팀을 이뤄 움직이는 시대의 서막이 될 수 있다는 평가를 받는다.

2024년 04월 09일 : 마이크로소프트, 모바일용 ‘Phi-3-mini’ AI 공개…GPT-3.5급 성능: MS 리서치 팀이 38억 파라미터 규모의 초경량 언어모델 ‘Phi-3-mini’를 오픈소스로 발표했다. 이 모델은 스마트폰 등 모바일 기기에서도 실행될 정도로 가벼우면서, 짧은 대화나 질문응답에서 GPT-3.5와 견줄만한 성능을 보인다. 연구자들은 이미지 캡션 생성 등 비전-언어 작업도 수행 가능한 이 모델에 놀라움을 표했다.

Phi-3-mini는 이동 중에도 AI 비서를 활용하려는 온디바이스 AI 수요를 겨냥한 것으로, MS는 AI 민주화를 위해 관련 연구 성과를 공유했다고 밝혔다. 이는 대규모모델 경쟁과 별개로 모델 경량화 기술 또한 중요한 혁신 영역임을 보여주며, 추후 사물인터넷(IoT) 기기나 엣지 디바이스에서도 AI를 원활히 구동하는 데 쓰일 전망이다.

2024년 04월 07일 : 메타, ‘라마3.1’ 오픈소스로 출시…70B 모델도 무료 배포: 메타가 대형 언어모델 LLaMA 시리즈의 개량 버전인 LLaMA 3.1을 80억, 700억, 4,050억 파라미터 등 세 가지 크기로 공개했다. 특히 4,050억 규모 모델은 오픈소스 진영에서 처음 보는 초거대 모델로, 다양한 벤치마크 시험에서 Anthropic Claude 3와 구글 Gemini Pro 1.5를 능가하는 성능을 보였다. 메타는 향후 4,000억+ 파라미터 모델도 연구 중이라고 밝혔다.

메타의 파격적인 공개로 AI 연구자들은 경쟁사 대비 성능이 뛰어난 거대모델을 자유롭게 활용·개선할 수 있게 되었다. 이는 AI 기술의 민주화에 크게 기여하는 동시에, 오픈모델과 폐쇄모델 간 경쟁이 본격화되어 AI 발전이 가속화될 것으로 전망된다. 다만 이렇게 큰 모델의 학습에는 막대한 자원이 필요해, 커뮤니티 협업과 최적화 노하우 공유가 필수적이다.

2024년 04월 05일 : 미스트랄AI, 매개변수 1,410억 개 초거대 모델 공개…오픈소스 신기원: 프랑스 스타트업 미스트랄AI가 파라미터 1,410억 개 규모의 AI 언어모델을 오픈소스로 공개해 업계를 놀라게 했다. ‘Mistral 14B3’로 명명된 이 모델은 효율적인 아키텍처 덕에 거대함에도 불구하고 비교적 적은 자원으로 구동 가능하며, 오픈소스 커뮤니티에서 이용 가능한 가장 강력한 언어모델로 꼽힌다.

미스트랄AI는 작년 70억 개 모델 공개 이후 지속적으로 모델 크기를 키워가며, “작은 팀도 최첨단 AI를 만들 수 있다”는 가능성을 입증하고 있다. 1,410억 개 파라미터 공개는 오픈소스 AI 역사상 획기적 사건으로, 연구자들은 이를 통해 폐쇄형 대형모델들과 성능 비교 연구를 할 수 있게 되었고, 기업들도 라이선스 문제 없이 초거대 AI를 활용하는 길이 열렸다.

2024년 04월 03일 : X(트위터), 이미지 인식 ‘Grok-1.5V’ 업데이트…사진도 분석: 일론 머스크의 xAI가 개발한 트위터 내 AI 챗봇 Grok이 1.5V 버전으로 업그레이드되며 이미지 인식 능력을 갖추었다. 이제 사용자들은 트윗에 올라온 사진이나 밈에 대해 “이 이미지 설명해줘”라고 물으면 Grok-1.5V가 해당 사진의 내용을 분석해 설명하거나 관련 맥락을 알려준다. 이는 트위터 사용자가 멀티미디어 콘텐츠도 AI의 도움으로 이해할 수 있게 된 사례다.

Grok-1.5V는 여러 모델 가운데도 상위권의 이미지 인지율을 기록하며, 시각 정보 해석력에서 경쟁 AI들 대비 우수하다는 평가를 받았다. 이번 업데이트로 X 플랫폼은 텍스트와 이미지를 아우르는 AI 챗봇 서비스를 제공하게 되었고, 이는 소셜 미디어에서 발생하는 방대한 사진·영상 데이터를 AI가 활용하는 방향성을 제시한다.

2024년 04월 01일 : AI 개발자들의 만우절 장난, 가짜 GPT-5 발표로 화제: 4월 1일 만우절을 맞아, 일부 AI 개발자들이 존재하지 않는 “GPT-5” 모델이 출시되었다는 가짜 보도자료와 웹사이트를 퍼뜨려 화제가 되었다. 온라인에서 많은 사람들이 진위 여부를 혼란스러워했고, 오픈AI가 나서 “GPT-5는 아직 없다”는 트윗을 올리며 해프닝이 마무리되었다.

이는 AI 업계의 뜨거운 관심사를 반영한 해프닝으로, 생성형 AI의 소식에 민감한 대중의 반응을 보여준다. 또한 정보의 진위를 가려내는 일이 점점 어려워지는 현실에서, 플랫폼 기업들이 만우절 같은 특정 기간에 유머와 허위정보를 구분할 수 있는 방안을 고민해야 한다는 목소리도 나왔다.

bottom of page