LLM 5

GPT-5.5 출시! 개발자 관점에서 진짜 써볼 만한지 뜯어봤습니다

4월 23일에 OpenAI가 GPT-5.5를 깜짝 발표했습니다. 코드네임은 무려 "Spud" (감자ㅋㅋ).GPT-5.4 나온 지 6주밖에 안 됐는데 또... AI 업계 진짜 정신 없네요 🌀안녕하세요! 오늘은 따끈따끈하게 막 나온 OpenAI의 새 플래그십 모델, GPT-5.5를 개발자 관점에서 살펴보려고 합니다. 단순히 "와 새 모델 나왔다~" 가 아니라, 실제로 우리가 코드에 박아 넣을 때 뭐가 달라지는지, 그리고 돈은 얼마나 더 깨지는지 위주로 정리해봤어요.📅 한눈에 보는 출시 정보항목내용출시일2026년 4월 23일코드네임Spud 🥔변형 모델GPT-5.5 / GPT-5.5 Thinking / GPT-5.5 ProKnowledge cutoff2025년 12월 1일API 사용 가능 시점4월 24일부..

AI News 2026.04.27

Gemini Enterprise Agent Platform 해부: Google이 그리는 AgentOps 시대

요약Google이 2026년 4월 22일 라스베이거스에서 열린 Google Cloud Next 2026 행사에서 Gemini Enterprise Agent Platform을 공개했습니다. 기존 Vertex AI를 확장해 에이전트 개발·배포·거버넌스를 하나의 허브에 묶은 통합 플랫폼이며, Agent Studio, Agent Development Kit(ADK), Agent-to-Agent Orchestration, Agent Registry, Agent Identity, Agent Gateway, Agent Observability 등 일곱 개의 구성 요소가 핵심입니다. 같은 자리에서 Google은 8세대 TPU 두 종, Agentic Data Cloud, 그리고 파트너 생태계에 7억 5천만 달러를 투자하..

AI News 2026.04.23

Gemini 3.1 Flash TTS 출시: 오디오 태그로 "감정까지" 제어하는 새 TTS 시대

Google가 2026년 4월 15일 공개한 Gemini 3.1 Flash TTS는 단순한 "읽어주는" 엔진을 넘어, 개발자가 문장 중간에 감정·호흡·속도를 직접 지시할 수 있는 차세대 음성 합성 모델입니다. Artificial Analysis의 TTS 블라인드 선호도 리더보드에서 Elo 1211점으로 전체 2위를 차지했고, OpenAI와 Amazon Polly 등 주요 상용 모델을 모두 앞섰습니다. 이번 글에서는 어떤 점이 달라졌고, 개발자가 실제로 어떻게 활용해야 하는지 정리합니다.1. 무엇이 새로워졌나Gemini 3.1 Flash TTS의 핵심은 크게 세 가지입니다. 첫째, 오디오 태그(audio tag)입니다. 기존 TTS가 "프롬프트 → 고정된 톤의 음성"을 만들었다면, 이번 모델은 대사 안에 ..

AI News 2026.04.21

OpenAI Agents SDK 대규모 업데이트 해부: 모델 네이티브 하네스·샌드박스·매니페스트까지

도입OpenAI가 2026년 4월 15일 Agents SDK의 차세대 업데이트를 정식 공개했습니다. 이번 릴리스의 핵심은 "모델이 도구를 잘 쓰는 방법"을 외부에서 짜 맞추는 게 아니라, SDK 안에 모델 네이티브 하네스와 샌드박스 실행을 1급 시민으로 넣었다는 점입니다. 파일 읽기·셸 실행·코드 편집·장시간 실행을 코덱스 계열과 같은 결로 다룰 수 있게 되었고, Blaxel·Cloudflare·Daytona·E2B·Modal·Runloop·Vercel 등 샌드박스 공급자와 표준화된 통합을 제공합니다. 이 글에서는 새 하네스가 어떤 구조인지, 개발자 관점에서 어떻게 접근해야 하는지 정리합니다.📌 한 줄 요약공개일: 2026년 4월 15일핵심 변화: 모델 네이티브 하네스(Harness)와 네이티브 샌드박..

AI News 2026.04.19

LLM Wiki: RAG를 넘어서는 지식 관리 패턴

Andrej Karpathy가 2026년 4월 공개한 아이디어 파일 분석문제 정의: RAG의 근본적 한계대부분의 LLM + 문서 시스템은 RAG(Retrieval-Augmented Generation)로 구현된다. 문서를 업로드하면 청크로 나눠 임베딩하고, 쿼리 시점에 유사도 검색으로 컨텍스트를 꺼내 답변을 생성한다. NotebookLM, ChatGPT file upload, 대다수 RAG 파이프라인이 이 방식이다.문제는 지식이 축적되지 않는다는 것이다. 다섯 개 문서를 종합해야 하는 복잡한 질문을 던지면, LLM은 매번 처음부터 관련 조각들을 찾아 연결해야 한다. 이전에 비슷한 질문을 했어도 그 합성 결과는 채팅 히스토리 속으로 사라진다.Karpathy의 핵심 통찰: 지식을 쿼리 시점에 재발견하지 말고..

AI News 2026.04.12