1년 전과 지금의 가격표저는 작년 이맘때 GPT-4 토큰 가격을 처음 정리해 봤습니다. 1M 입력 토큰에 30달러 정도였어요. 그게 지금은 같은 등급 모델 기준 2~3달러 선까지 내려왔습니다. 같은 모델이 더 싸진 게 아니라, 새 세대 모델이 한 자릿수 가격으로 등장한 결과입니다.여러분도 비슷한 변화 느끼셨을 거예요. 작년에는 한 번 호출에 부담이 컸는데, 올해는 에이전트 한 세션 안에서 수십 번 호출해도 비용이 감당 가능한 수준입니다.모델 자체가 아니라 서빙 구조가 바뀐 결과가격 인하의 핵심은 단순한 GPU 가격 하락이 아닙니다. 추론 인프라 쪽에서 일어난 두세 가지 큰 변화가 누적된 효과입니다.KV 캐시 효율화 — 같은 시스템 프롬프트를 쓰는 요청이 많으면, 그 prefix의 KV 상태를 캐시해서 다..
리뷰어 부족이 만든 새 풍경저는 요즘 여러 팀의 GitHub PR을 들여다볼 일이 있었는데, 한 가지 공통된 변화가 눈에 띄었습니다. 사람이 첫 번째 리뷰어로 들어가기 전에 AI가 먼저 코멘트를 달고 있다는 점입니다. 어떤 팀은 Claude Code, 어떤 팀은 자체 만든 봇, 어떤 팀은 GitHub Copilot Review를 씁니다. 도구는 다른데 형태는 비슷합니다.이런 흐름은 갑자기 생긴 게 아니에요. 시니어 리뷰어가 만성적으로 부족하고, PR은 갈수록 커지고, 풀스택 변경을 한 명이 다 이해하기 어려운 상황이 누적되면서 어느 시점에 자연스럽게 끼어든 결과입니다.실제로 무엇이 바뀌나여러분이 AI 리뷰를 도입했다고 가정해 봅시다. 첫 주는 신기합니다. 사소한 네이밍, 누락된 null 체크, 테스트 케..
포켓몬이 출시된 지 벌써 30년에 가까워졌습니다. 게임 역사에서 30년이라는 시간은 정말 길다고 할 수 있는데요, 저는 항상 이런 의문이 들었습니다. 왜 포켓몬의 배틀 시스템은 지금까지도 플레이어들을 매료시킬까요? 요즘 게임들은 훨씬 화려한 그래픽과 복잡한 메커니즘을 가졌는데 말입니다. 이 질문은 제가 최근 HTML5로 포켓몬 스타일의 로그라이크 게임을 개발하면서 더욱 절실해졌습니다. 직접 배틀 시스템을 구현해보니, 그 단순함 뒤에 얼마나 정교한 게임 디자인이 숨어있는지 깨달았거든요. 오늘 그 깨달음을 나누고 싶습니다. 같이 고민해볼 수 있는 글이 되었으면 합니다 😊 출처: Unsplash / 포켓몬처럼 간단하지만 깊이 있는 게임들의 매력 ..
GoScrapy - Go 기반 초고속 웹 스크래핑 프레임워크 소개웹 스크래핑 이야기가 나올 때마다 저는 한 가지 고민에 빠집니다. Python의 BeautifulSoup, Scrapy는 편하지만 속도가 부족하고, C++은 빠르지만 진입장벽이 높다는 것이죠. 그런데 최근 Go로 만들어진 GoScrapy를 만나면서 솔직히 "오, 이게 바로 찾던 것인가" 하는 생각이 들었습니다.왜 GoScrapy인가?GoScrapy는 Go의 동시성(Concurrency) 강점을 최대한 활용한 웹 스크래핑 프레임워크입니다. Goroutine 기반의 병렬 처리로 Python 기반 도구 대비 10배 이상의 성능을 낼 수 있습니다. 그리고 무엇보다 싱글 바이너리로 배포된다는 점이 클라우드 환경에서 얼마나 강력한지 아십니까?실무 활용..
AI 코딩 도구를 위한 디자인 시스템 단일 파일 포맷, DESIGN.md의 의미와 활용법DESIGN.md는 Google Labs가 제안한 AI 코딩 도구를 위한 디자인 시스템 단일 파일 포맷입니다. 이 포맷은 다양한 모델, 특히 LLM 최신 기술을 활용하여 효율적인 코드 생성을 가능하게 합니다.💡 Google이 제안한 DESIGN.md는 AI 코딩 도구에 디자인 시스템을 통합하는 새로운 접근 방식입니다.출처: Unsplash / Google이 제안한 DESIGN.md의 기본 구조DESIGN.md는 주로 LLM 최신 기술, 예를 들어 Claude AI 2026과 ChatGPT 업데이트를 활용하여, 코드 생성 과정에서 필요한 다양한 정보를 모델에게 제공합니다. 이를 통해 디자인 지침과 브랜딩 요소가 통합되..
Kumo - Go로 작성된 경량 AWS 서비스 에뮬레이터의 실용적인 활용법AWS를 사용하는 개발자라면 아마도 로컬에서 AWS 서비스를 테스트하거나 CI/CD 파이프라인을 구축하는데 고민한 적이 있을 것이다. 최근에 발표된 Kumo는 Go로 작성된 경량 AWS 서비스 에뮬레이터로, 이 기술의 의미와 실제 활용법에 대해 살펴보려고 한다.Kumo의 개요와 주요 특징Kumo는 AWS 서비스의 로컬 테스트를 위한 경량 에뮬레이터다. 단일 바이너리로 빠르게 테스트 환경을 꾸밀 수 있으며, Docker 기반으로 가볍고 쉽게 설정할 수 있다.💡 인사이트 박스Kumo는 개발자가 AWS 서비스를 로컬에서 테스트하거나 CI/CD 파이프라인을 구축하는데 필요한 시간과 리소스를 크게 줄일 수 있다.Kumo의 의미와 실용적인 ..
솔직히 말씀드리면, 처음 이 소식을 봤을 때 반응이 "또 AI 디자인 툴이야?"였습니다. 요즘은 하루가 멀다 하고 새로운 AI 도구들이 쏟아지니까요. Midjourney, DALL-E, Stable Diffusion... 이제는 텍스트 입력 한 번에 이미지 뚝딱 나오는 게 전혀 신기하지 않은 세상이 됐잖아요. 그런데 앤트로픽이 2026년 4월 17일에 공개한 Claude Design은 좀 달랐습니다. 단순히 "이미지 생성해줘"가 아니라, 대화를 나누면서 디자인을 만들고, 브랜드 가이드를 학습하고, 완성된 결과물을 코드로 전환하는 하나의 파이프라인이었거든요. 마치 디자이너와 함께 회의실에 앉아서 화이트보드에 이것저것 그려가며 이야기 나누는 느낌이랄까요. 여러분도 혹시 이런 경험 있..
시니어 엔지니어로서 배운 것들 (2021) 저는 이미 여러 년간 프로젝트에 참여하면서 다양한 경험을 쌓았습니다. 그러나 이런 경험이 저에게 많은 것을 가르쳐주었습니다. 오늘은 그 중 몇 가지를 여러분과 나누어 보겠습니다. 💡 인사이트 박스 오래 남아 있는 코드는 깊은 이해를 필요로 합니다. LLM의 최신 동향 최근 여러 기술 트렌드가 주목받고 있습니다. 그 중 하나는 대형 언어 모델 (LLM)입니다. LLM은 고급 AI 시스템으로, 자연어 처리와 텍스트 생성 분야에서 뛰어난 능력을 보여주고 있습니다. 최근에는 여러 회사들이 이 기술을 활용하여 다양한 서비스를 개선하고 있습니다. 출처: Picsum / LLM과 대형 언어 모델의 기능 LLM ..