top of page

그냥 써본 에이아이 생각들

정리된 건 아니고, 그냥 에이아이에 대해 남들이 말한 것들이나 생각난 것들 적어 놓았습니다. 언젠가는 인사이트를 얻으리라는 생각을 하며^^

2025년 4월 30일: Cohere는 100개 이상의 언어를 지원하는 멀티모달 임베딩 모델 Embed 4를 출시했다. / Meta CEO 마크 저커버그는 AI 기술 심화를 위해 올해 AI 데이터 센터에 대한 지출을 늘릴 계획이라고 밝혔다.

2025년 4월 29일: Adobe는 Firefly의 주요 업데이트를 통해 이미지, 비디오, 오디오 및 벡터 생성을 하나의 플랫폼에 통합하고 모바일 및 Creative Cloud와의 연계를 강화했다.

2025년 4월 28일: 최태원 SK 회장은 “AI를 하지 못하면 우리나라 경제모델 자체가 부서질 수 있다”고 경고하며, AI 개발에는 많은 자원과 에너지가 필요한데, 이를 감당할 수 있는 국가만 경쟁에서 살아남을 것이라는 지적했다. / 워싱턴 포스트는 자폐인들이 AI를 통해 어색하거나 혼란스러운 사회적 상호작용을 극복한다는 내용을 소개했다. '오티스틱 번역기(Autistic Translator)'라는 AI 도구를 활용하여 사회적 상황에서 잘 드러나지 않는 미묘한 뉘앙스를 해석하고 자신감을 얻는 사례가 소개되었다.

2025년 04월 27일 :  AI 검열·통제 가능 인재 교육 방법 / 지엽적인 코딩 기술이 아닌 문제 발굴, 알고리즘적 사고, 창의적 해결 중심의 교육 필요성 / AI 리터러시가 낮은 상태에서 AI를 사용하는 경우 잘못된 결과와 의존도가 높아지는 문제

2025년 04월 26일 : Server-Sent Events(SSE)를 활용한 구현 방법/ 한국 SI 산업의 노동집약적 구조 문제 / AI가 인간을 대부분의 기술적 작업에서 추월 중 / AI가 발전할수록 인간의 검토 및 통제 능력이 급격히 낮아지는 문제 / ‘Stop treating AGI as the north-star goal of AI research’ 논문 / LLM 의존도가 높은 바이브코딩 교육 / 학생들이 코드를 직접 읽고 수정하는 훈련 부족 문제 / 협업을 위한 기능 분할, 요구사항 정의, 하청 모델 문제점 및 개선 방안

2025년 04월 25일 :  GPT를 활용한 대진표 자동 생성 사례/ LLM을 활용한 메시지 요약·분석 자동화/ GPT 및 Gemini 사용 시 메모리 공유, 컨텍스트 사이즈 문제/ 딥리서치(Deep Research) 기능의 강점과 불편함, 작업 시 분할 접근 필요 / 챗GPT의 과도한 긍정적 반응 문제와 OpenAI 내부 가이드라인(아첨 금지) / 일본 게이오대학에서 프롬프트 숨기기(화이트 텍스트 삽입) 기법으로 AI 감별 사례 / Outlines 라이브러리(구조화된 출력 강제 도구) / 

2025년 04월 24일 : macOS CleanShotX와 Obsidian Smart Composer 연계 활용 / HyperCLOVA X, CloverX 오픈소스 공개/Gemini에서 PLC 래더 생성 기능 추가 / Social Network Analysis(SNA)와 Language Network Analysis(LNA) 차이

2025년 04월 23일 : Gemini Advanced 사용자 대상 VEO2 기능 공개 여부와 시동 상황 / 생성형 AI가 미디어 산업에 미치는 영향에 대한 KDI 보고서 / KT의 AI 개발자 급여 상한 폐지 관련 기사 - 급여 상한선이란 것이 있었구나... / 보고서 작성 시 인포그래픽 자동화 도구 (예: Napkin AI) 

2025년 04월 22일 :  한국계 콜롬비아 학생의 AI 부정행위 도구 제작 사례 /과학적 초지능(Scientific Superintelligence) 스타트업 아스테로모프/ GPU 1만장 확보 계획의 한계와 인재 확보의 중요성 강조/ 한국 공공데이터의 낮은 품질과 AI 학습 데이터 부족/ 일라이 릴리의 AI 활용 신약개발/ 오픈AI 윈드서프 인수와 소셜미디어 진출을 통한 생태계 확장 가능성 / AMD의 엣지 디바이스에서의 AI 추론 전략/ NVIDIA의 학습 독점에 대한 AMD의 경쟁 전략/ 반복업무 자동화 기준 제안: 규칙성·반복성 있는 작업부터 적용

2025년 04월 21일 : 사진 한 장으로 위치를 파악하는 o3 모델의 기능과 위치 정보 노출 우려 / Power BI에 AI 기능 적용? / 이족보행 로봇의 속도, 배터리 문제, 내구성, 에너지 효율성 - 마라톤을 시키는 것이 기술적인 것 외에 의미가 있나? 기술 발전에는 기여 하겠으나, 진짜 같이 뛸 로봇이 필요할까? 드론이 더 나을 듯. / Gemini 시리즈의 높은 토큰 처리 속도와 가성비 우수함/ 실무자가 AI 도입을 적극적으로 활용하기 위해 조직적 설득과 저항 관리 필요

2025년 04월 20일 :  Zotero, ARIA 등과 SciSpace의 citation 기능/ ScholarCopilot, AI Research Assistant 등 RAG 기반 오픈소스 도구/ 구글 드라이브, Colab에서 Gemini 연동 기능 /PDF 문서 요약, Q&A 지원 등 구글드라이브 내 Gemini 기능 활용 /Gmail 이메일 작성 지원 기능 / Gemini 무료 제공(미국 학생 대상) 소식 / GPT-4.1과 GPT-4o, Gemini 2.5 Pro 성능 비교/ 기록·회고 방법, 옵시디언과 노션 연계 사용법/ 

MCP (Memory-Context Persistence) 활용 및 Deepseek - Function calling과 MCP의 역할, Deepseek와의 관계 - MCP 활용 시 컨텍스트 관리 전략 및 문서화 방식 - Deep Research 기능과 multi-turn 처리 한계.

2025년 04월 19일 : AI로 대체 가능한 직군의 신규 채용 축소 논의 / 개발자 중심에서 기획자 중심으로의 역할 변화 가능성/ 중국의 에너지 및 배터리 분야 논문 생산량 급증과 영향력 확대

2025년 04월 18일: GPT 음성 대화 사용 시 발열 문제 발생 여부 / ​Gemini가 다양한 서비스와 연동되어 점점 생태계 확장 중/ 개발자 친화적 생태계로 안드로이드가 매력적이 될 수도 있다/ 스마트홈과 Google Home, AI 연동 기대감 /  앞으로 에이전트 경쟁에서 생태계 경쟁으로 이동할 것이라는 예측 / Android Auto가 Apple CarPlay 수준까지 올라오기를 바람  - 음성인식 기능은 잘 작동하나 UX 측면에서는 개선 필요 / ChatGPT가 OCR 결과를 엑셀로 내보내는 과정에서 정확도가 낮다/ Gemini의 OCR 성능이 우수하다는 의견 / GPT-4o와 o4 모델 간 이미지 품질 차이 ? / ​하루 평균 2만 곡 이상의 AI 생성 음악이 업로드되고 있다는 기사 - 나도 SUNO로 몇 곡 만들어 보았는데 정말 노력 바짝하면 진짜 히트곡 만들 수 있겠다 ??? 라는 생각도 듬

2025년 04월 17일: 최근 GPT-4.1이 등장하면서 많은 사람들의 관심이 쏠리고 있습니다. 흥미로운 점은, 4.5보다 가격이 저렴하면서도 속도와 품질 모두에서 우수? Obsidian Smart Composer 같은 실사용 환경에서는 기존 Claude-3.7이나 GPT-4o-mini 대신 4.1과 4.1-mini 조합이 더 나은 선택. AI 모델링을 이야기할 때마다 느끼는 점은 결국 '데이터가 없으면 아무것도 못 한다'는 사실입니다. 파이토치나 텐서플로우로 모델을 만든다, 분류나 예측, 군집화나 패턴탐지, LLM 기반 QA를 한다고 해도, 그 밑바탕은 결국 데이터 확보. GPT-4.1에 맞춰 새롭게 프롬프트 엔지니어링 가이드가 나온다는 소식도 들려왔습니다. 그리고 Google에서는 ADK(Agent Development Kit)를 발표했는데, LangGraph와 비슷하면서도 더 빠른 설정과 toolkit 기반 개발을 지원하는 점이 눈길을 끌었습니다. AI를 현장에서 적용할 때 느끼는 어려움 중 하나가 설정과 환경 구성인데, 이런 부분을 얼마나 쉽게 만들어주느냐가 앞으로 경쟁력이 될 것 같습니다. Google 포토와 Gemini의 연동이 시작되었다는 뉴스도 있었습니다. 이제 사진 검색과 AI가 더 긴밀하게 연결되겠다는 예고편 같은 느낌입니다. 이런 흐름을 보면, 앞으로 ‘기억하는 AI’가 본격적으로 시작되지 않을까 하는 생각도 듭니다. - Google의 AI 경쟁력 강화

2025년 04월 16일 : 결국 이 에이아이 게임의 승리자는 누구일까? 구글이 아닐까? 모두 제미나이가 당장은 쳐져 보이지만 더 빨리 성장하고 있고, 결국 이길 것이라 이야기. 옵시디언으로 나만의 지식 그래프를 만들어 보려고 했는데, 이것이 엔지니어들이 만들어서 그런지 정말 사용법이 복잡하고 절 정리가 안 되어있다. Customer Enablement에 대한 생각이 전혀 안 되어 있는 것이 아닐까 하는 생각이 들게 만드는 전혀 친절하지 않는 인스트럭션으로 가득찬 매뉴얼들 

2025년 04월 15일 :AI 관련 주요 뉴스에 따르면, Imperva의 2025년 보고서에서 AI 기반 봇 트래픽이 전체 인터넷 트래픽의 절반을 넘어서며 사이버 공격의 정교화와 증가가 우려되고 있다. 이에 따라 기업과 서비스 제공자들은 고도화된 보안 대책 마련이 요구된다. 기술 개발 측면에서는 ETRI가 사진 한 장으로 실사 AI 아바타를 생성하는 기술을 개발했고, 유인촌 문체부 장관은 AI 시대의 저작권 보호와 가짜 뉴스 방지의 중요성을 강조했다. 또한 알테어는 육군사관학교와 국방 AI 인재 양성을 위한 협약을 체결했으며, NetCom Learning은 AWS 생성형 AI 교육 과정을 할인 제공 중이다. 서비스 분야에서는 삼성전자가 사용자 맞춤형 '원 UI 7'을 통해 AI 운영체제를 선보이며 애플에 도전장을 내밀었고, 오픈AI는 인터넷 없이도 전화로 챗GPT에 접속할 수 있는 기능을 미국에서 시작했다. 이외에도 LG유플러스는 AI 통화 에이전트 '익시오'의 적용 대상을 아이폰12 이상 모델로 확대했고, UNIST는 로봇 간 협업을 위한 인공 지문 기술을 개발하는 성과를 이뤘다.

 

2025년 04월 14일 : OpenAI가 A-SWE 즉 인공지능 소프트웨어 엔지니어를 공개. 과연 소프트웨어 엔지니어는 모두 replace가 되는것인가? 코드 리뷰부터 테스트까지 자동으로 처리하는 시대가 열리며, 개발자들의 미래에 대한 고민? 엔비디아는 향후 4년간 파트너사들과 미국에서 최대 5천억 달러(약 700조 원) 규모의 AI 인프라를 생산할 계획

2025년 04월 13일 : 지드래곤은 AI 기술을 활용하여 제작한 새로운 뮤직비디오를 공개하며, AI와 예술의 융합 가능성을 보여.  AI뮤직 비디오는 나도 만들 줄 아는데 지드래곤이라 다른 것인가, 아님 역시 유명해져야 뭐가 되는 것일까? Perplexity, 구글의 프롬프트 엔지니어링 비법 요약해줌: Perplexity가 구글의 프롬프트 엔지니어링 노하우를 깔끔하게 정리. 실전 적용 가능한 프롬프트 작성 팁이 담겨 있지만, 사실 프롬프트 엔지니어들은 다 아는 내용. 일반인들에게 도움이 될 듯. https://www.perplexity.ai/page/google-shares-viral-prompt-eng-TEzNkJMNSm2kdu.xiZ8YWQ

2025년 04월 12일 : 클로드 2.5 플래시 등장, Gemini 2.0 플래시와의 경쟁은?: Claude도 ‘2.5 플래시’로 속도전 참여, 제미나이도 업데이트 중. 점진적 배포라 아직 못 받은 유저도 있고, 실제 성능 비교는 당분간 이어질 듯 https://cm.asiae.co.kr/article/2025041008231148838?hl=ko-KR

Claude 3 Opus는 복잡한 작업에서 거의 인간 수준의 이해력과 유창함을 보인다고 했는데 플래쉬는 리즈닝이 강해진 것일까? 구글처럼 응답지연 시간을 줄이고 연산비용을 절약? Apple은 Siri의 대대적인 업그레이드를 예고하며, 오는 2025년 가을에 더 정교하고 개인화된 명령 수행이 가능해질 것이라 함

2025년 04월 11일 : OpenAI, '참조 메모리' 기능 강화!: 쓰레드 내 대화 흐름을 더 잘 기억하게 하는 업데이트가 적용되며, 이제 더 일관성 있는 챗봇 대화가 가능해진다.그런데, ‘강화’이니 나아질 것이지만 완전 해결은 아닐 듯. 얼마나 강화될까? 시퀀셜데이터에서 완전히 과거 대화 기억을 다 해내면 끝판왕이 되겠지만. 

2025년 04월 10일 : AI 간의 대화, A2A 프로토콜 등장!: 구글이 에이전트 간 협업을 위한 A2A 프로토콜을 발표. 단순한 챗봇이 아닌 상호작용형 에이전트 생태계 구축을 향한 진지한 움직임. MCP는 **앤트로픽(Anthropic)**이 설계한 에이전트 아키텍처 개념. 다양한 기능적 컴포넌트를 조합해 하나의 지능적 시스템을 구성.LLM이 단일 주체가 아닌, 여러 프로세스 또는 툴킷을 조직화해서 사용. A2A는 **구글 딥마인드(DeepMind)**에서 제안한 상호운용 가능한 에이전트 통신 프로토콜. 여러 AI 에이전트가 서로 메시지를 주고받으며 협업할 수 있도록 함. 서로 다른 회사나 구조의 에이전트 간 통신이 가능하게 함.(예: Claude와 Gemini가 A2A 기반이면 서로 메시지를 교환해 공동 작업 가능)

 

2025년 04월 09일 : OpenAI가 머스크에게 반격. 반소송을 제기했고, 텍스트-음악 생성 모델인 Lyria도 공개. Google DeepMind의 음악 생성 AI 모델 Lyria: Google DeepMind에서 개발한 최첨단 AI 음악 생성 모델/텍스트 프롬프트를 기반으로 고품질의 악기 및 보컬 음악을 생성/YouTube Shorts에서 아티스트와 팬 간의 연결을 심화시키는 데 사용될 수 있는 "Dream Track" 실험에 활용/YouTube의 Music AI Incubator를 통해 아티스트, 작곡가 및 프로듀서와 협력하여 창작 과정을 지원하는 도구 세트를 설계하는 데 사용/ Vertex AI에서 사용할 수 있으며, 이를 통해 기업은 브랜드 경험을 향상시키고 콘텐츠 제작을 간소화/생성된 오디오는 SynthID를 사용하여 워터마크 처리되어 AI 생성 콘텐츠임을 식별/경쟁 모델로는 Amazon Bedrock이 있습니다.Google은 Vertex AI 플랫폼을 통해 Veo 2와 Chirp 3를 확장/  Veo 2는 고품질 비디오 생성 모델이며, Chirp 3는 HD 음성 모델입니다. Veo 2는 최대 4K 해상도의 비디오를 생성할 수 있으며, 현실적인 움직임과 고품질 결과물을 제공합니다. 또한 다양한 영화 스타일과 카메라 컨트롤을 지원/ Chirp 3는 31개 언어로 248개의 고유한 음성을 제공하는 HD 음성 모델

 

2025년 04월 08일 : 삼성, 제미나이 업그레이드를 적용한 볼리 홈 로봇 출시,삼성전자는 AI 기반 홈 로봇인 볼리(Ballie)를 2025년 여름 한국과 미국 시장에 출시할 예정이다. 볼리는 2020년 CES에서 처음 공개된 이후, 수년간의 연구 개발을 거쳐 다양한 기능과 새로운 기술을 탑재하여 출시를 앞두고 있음.가정용 로봇 /  AI 회사 Deep Cogito, 오픈소스 모델 발표 후 성능 차트에서 빠르게 상위권 도달/ Deep Cogito는 2024년 6월, 구글 DeepMind와 구글 출신의 Dhruv Malhotra와 Drishan Arora에 의해 샌프란시스코에 설립된 AI 연구 스타트업이다. South Park Commons의 초기 투자를 받았으며, "일반 초지능(general superintelligence)" 구축을 목표

2025년 04월 07일 : Claude, Max Plan 출시로 협업 기능 강화: Anthropic이 Claude의 Max Plan을 출시했다. 사용자별 사용 한도가 넓어지고 협업 기능이 강화되어 기업 고객 타깃이 명확. 모두가 점점 비싼 것을 내고 있다.

2025년 04월 06일 : 포토샵도 AI 에이전트 탑재: Adobe가 Photoshop에 첫 AI 에이전트를 도입했다. 창작 과정이 더욱 스마트하게 자동화되며 워크플로우가 크게 개선될 것으로 기대

 

2025년 04월 05일 : 오즈의 마법사, Sphere에서 AI로 부활: 구글이 라스베이거스 Sphere의 대형 스크린을 위해 AI로 강화된 '오즈의 마법사'를 선보였다. 대화형 시각 효과와 몰입형 경험이 강조

 

2025년 04월 04일 :WordPress AI 빌더와 GitHub Copilot Pro+: WordPress.com이 무료 AI 웹사이트 빌더를 공개하고, GitHub는 MCP와 Agent 모드를 포함한 새로운 Pro+ 플랜을 발표했다. 한편, OpenAI는 GPT-5 발표를 연기하고 o3, o4-mini 모델을 예고

 

2025년 04월 03일 : KREA AI, 원본 움직임을 유지하면서 비디오 변환하는 Video Re-style 도구 출시/ 이 도구는 사용자가 비디오의 스타일을 변경하면서도 원래 움직임을 일관되게 유지할 수 있도록 설계/Krea AI는 수백 가지 스타일 중에서 선택할 수 있는 옵션을 제공합니다. 사용자는 다양한 필터와 효과를 사용하여 비디오의 느낌을 완전히 바꿀 수 있음. 이것이 Ideogram.ai 흉내내서 나온 것이 아니었나? 이디어그램은 내가 초반에 아주 기대했던 것이었는데 갑자기 성장을 멈추어 버린 것 같은 느낌

 

2025년 04월 02일 : OpenAI, ChatGPT Plus를 미국과 캐나다 대학생들에게 무료 제공. 베수비오 화산 폭발로 타버린 두루마리 문서를 AI로 해독하는 기술이 개발되었습니다. 옥스퍼드대 도서관은 AI를 사용해 고대 로마 두루마리 문서의 첫 번째 텍스트 이미지를 만들었음

 

2025년 04월 01일 : Gemini 2.5가 Mensa 기준인 130을 찍었다. 실제로 아이큐랑 비교하는 것이 의미가 있을까?

bottom of page