5월 넷째 주 AI 흐름을 12장으로 정리했다. 이번 주의 핵심은 Google I/O 2026을 계기로 에이전트형 AI가 검색, 쇼핑, 개발자 API, 개인 비서로 넓어졌고, 동시에 콘텐츠 출처 검증과 AI 인프라 같은 신뢰·운영 기반도 함께 전면으로 올라온 점이다.
AI 이미지, 출처 확인이 기본값이 된다
OpenAI는 C2PA와 SynthID를 결합한 콘텐츠 출처 검증 방식을 강화했다
OpenAI는 생성 이미지의 출처를 더 쉽게 확인할 수 있도록 C2PA conforming generator 지위를 확보하고, Google SynthID 워터마킹을 이미지에 적용하며, 일반 사용자가 OpenAI 생성 여부를 확인할 수 있는 공개 검증 도구 프리뷰를 내놨다.
- AI 콘텐츠 신뢰 문제는 “생성했는가”보다 출처 신호가 플랫폼을 넘어 살아남는가의 문제로 바뀌고 있다.
- 메타데이터와 워터마킹을 함께 쓰는 다층 접근은 조작·재업로드·포맷 변환에 더 강한 검증 구조를 만든다.
AI가 80년 수학 난제를 밀어냈다
OpenAI 모델은 이산기하학의 중심 추측을 반증하는 증명을 냈다
OpenAI는 내부 범용 추론 모델이 Erdős의 unit distance 문제와 관련된 오랜 추측을 반증했다고 발표했다. 증명은 외부 수학자들의 검토를 거쳤고, 특정 수학 문제에 맞춘 특화 시스템이 아니라 범용 추론 모델에서 나온 결과라는 점을 강조했다.
- AI의 연구 역할은 문헌 요약이나 계산 보조를 넘어 새로운 증명 아이디어를 제안하는 단계로 이동하고 있다.
- 수학은 답의 검증 가능성이 높아, 고급 추론 모델의 실제 발견 능력을 평가하기 좋은 시험대가 된다.
OpenAI, 싱가포르를 아시아 AI 허브로
OpenAI for Singapore는 국가 AI 전략과 현장 배포 인력을 묶는다
OpenAI는 싱가포르 디지털개발정보부와 협력해 OpenAI for Singapore를 출범했다. S$300 million 이상을 투입해 기업의 frontier AI 배포, 현지 AI 인재 육성, 대중 접근 확대를 추진하고, 미국 밖 첫 Applied AI Lab과 200개 이상의 기술 직무를 싱가포르에 둔다.
- AI 기업의 글로벌 전략은 모델 판매를 넘어 국가별 산업 적용, 인재, 공공 전략과 결합되는 방향으로 간다.
- Forward-deployed engineering은 프론티어 모델을 실제 조직 문제에 붙이는 핵심 운영 역량이 되고 있다.
항공 앱 출시도 Codex로 빨라졌다
Virgin Atlantic은 Codex로 앱 출시, 테스트, 레거시 리팩터링 속도를 끌어올렸다
OpenAI는 Virgin Atlantic이 Codex를 이용해 모바일 앱 출시 품질을 높이고, 신규 앱의 unit test coverage를 거의 100%까지 끌어올렸으며, 일부 레거시 리팩터링 시간을 2주에서 30분 수준으로 줄였다고 소개했다.
- 코딩 에이전트의 가치는 데모 코드 생성보다 출시 전 테스트, 리팩터링, 내부 도구 제작 같은 운영 업무에서 드러난다.
- 엔터프라이즈 개발 조직에서는 AI가 빨라질수록 백로그, QA, 릴리즈 승인 흐름도 함께 재설계해야 한다.
Claude는 API 연결성을 사들였다
Anthropic은 SDK와 MCP 서버 도구 기업 Stainless를 인수했다
Anthropic은 공식 Claude SDK 생성에 관여해온 Stainless를 인수했다. Stainless는 API 스펙에서 TypeScript, Python, Go, Java 등 SDK와 CLI, MCP 서버를 생성하는 도구를 제공하며, Claude가 더 많은 데이터와 도구에 연결되는 기반을 강화한다.
- 에이전트는 모델만으로는 부족하고, 실제 API와 시스템에 안정적으로 연결될 때 업무를 실행할 수 있다.
- MCP와 SDK 품질은 개발자 경험을 넘어 에이전트 생태계의 연결 표준으로 중요해지고 있다.
KPMG 27만 명이 Claude를 쓴다
KPMG는 Claude를 전 세계 핵심 업무와 고객 플랫폼에 통합한다
Anthropic과 KPMG는 276,000명 이상의 KPMG 직원에게 Claude 접근을 제공하고, Digital Gateway 플랫폼 안에 Claude Cowork와 managed agents를 넣는 전략적 제휴를 발표했다. 세무, 법무, private equity, 사이버보안이 주요 적용 영역이다.
- 전문서비스 기업은 AI를 내부 생산성 도구이자 고객용 산업 솔루션으로 동시에 쓰기 시작했다.
- 정확성, 책임성, 신뢰가 중요한 업무에서는 모델 접근보다 조직 표준과 업무 플랫폼 통합이 더 중요해진다.
Gemini 3.5는 에이전트를 위한 모델이다
Google은 frontier intelligence와 action을 결합한 Gemini 3.5를 공개했다
Google은 I/O 2026에서 복잡한 에이전트형 워크플로 실행을 겨냥한 Gemini 3.5를 발표했다. Gemini 3.5 Flash는 빠른 응답과 고급 추론을 결합해 코딩, 장기 작업, 도구 사용, 검색의 AI Mode 같은 실행형 경험의 기본 엔진으로 쓰인다.
- 모델 경쟁의 초점은 답변 품질에서 실제 작업을 끝까지 수행하는 action capability로 이동하고 있다.
- 빠른 Flash 모델이 에이전트의 기본 엔진이 되면 비용, 속도, 반복 실행 가능성이 제품 경쟁력을 좌우한다.
Gemini 앱은 24시간 에이전트로 간다
Gemini 앱은 Daily Brief, Spark, Omni로 능동형 비서 경험을 확장했다
Google은 Gemini 앱이 월 9억 명 이상에게 쓰이고 있다며, Gemini 3.5 Flash, Neural Expressive UI, Gemini Omni, Daily Brief, Gemini Spark를 공개했다. Spark는 Gmail, Docs, Slides 같은 Workspace 도구와 연결되어 사용자의 지시 아래 백그라운드 작업을 수행하는 개인 에이전트다.
- 개인 AI는 질문에 답하는 assistant에서 아침 브리핑, 반복 업무, 문서 작성까지 맡는 agent로 확장된다.
- 이 흐름에서는 앱 연결 권한, 고위험 행동 전 확인, 사용자 피드백으로 학습하는 UX가 핵심 통제 장치가 된다.
검색은 답변에서 에이전트로 넘어간다
Google Search는 AI Mode, 정보 에이전트, agentic booking을 결합한다
Google은 Search에 Gemini 3.5 Flash를 AI Mode 기본 모델로 적용하고, 25년 만의 큰 검색창 개편과 정보 에이전트, agentic booking, Search 안의 generative UI와 mini app 기능을 발표했다. 검색이 링크 탐색보다 목적 달성에 가까워지는 발표다.
- 검색의 미래는 키워드 입력보다 사용자의 목표를 이해하고 계속 추적하는 개인화된 작업 에이전트에 가까워진다.
- 정보 에이전트가 상시 모니터링을 맡으면 뉴스, 쇼핑, 부동산, 예약 같은 반복 검색이 제품 안으로 흡수된다.
Gemini API에 관리형 에이전트가 들어왔다
Managed Agents는 API 한 번으로 격리된 실행 환경의 에이전트를 띄운다
Google은 Gemini API에 Managed Agents를 도입했다. 개발자는 단일 API 호출로 Antigravity agent를 실행해 reasoning, tool use, code execution을 격리된 ephemeral Linux 환경에서 수행하게 할 수 있고, AGENTS.md와 SKILL.md 같은 파일로 에이전트 지시와 능력을 버전 관리할 수 있다.
- 에이전트 개발은 모델 호출을 넘어 샌드박스, 상태, 도구, 파일 기반 설정까지 포함하는 플랫폼 문제가 됐다.
- 관리형 실행 환경은 개발자가 보안과 인프라를 직접 조립하지 않고도 에이전트 제품을 실험하게 해준다.
Google은 장바구니도 에이전트화한다
Universal Cart는 Search, Gemini, YouTube, Gmail 쇼핑 흐름을 한 장바구니로 묶는다
Google은 I/O 2026에서 Universal Cart와 agentic shopping 업데이트를 공개했다. Shopping Graph의 600억 개 이상 상품 목록을 기반으로, 사용자가 Search, Gemini, YouTube, Gmail 어디서든 상품을 담고 AI가 비교·추천·구매 흐름을 돕는 방향이다.
- 커머스 AI는 상품 검색 추천을 넘어 장바구니, 결제, 재고, 가격 추적까지 이어지는 실행형 경험으로 진화한다.
- 에이전트 쇼핑은 편리하지만, 최종 구매 승인과 결제 권한을 어떻게 설계하느냐가 신뢰의 기준이 된다.
AI 에이전트에는 CPU도 새로 필요하다
NVIDIA Vera CPU는 에이전트 시대의 orchestration과 tool calling을 겨냥한다
NVIDIA는 첫 Vera CPU 시스템을 Anthropic, OpenAI, SpaceXAI, Oracle Cloud Infrastructure에 전달했다고 밝혔다. Vera는 agentic AI의 orchestration, tool calling, RL workload, data analytics, sandboxing, long-context state management를 처리하도록 설계된 NVIDIA의 첫 custom CPU다.
- AI 인프라는 GPU만의 문제가 아니라 에이전트가 호출하는 코드, 도구, 데이터 이동, 상태 관리까지 포함한다.
- 모델이 답변에서 행동으로 이동할수록 CPU와 네트워크, 메모리 대역폭이 AI factory의 병목이 된다.
Community
Comments
Comments appear immediately. Use report if something needs review.
No comments yet.