개인용 AI 에이전트의 두 가지 목표: 한 사람에게 극강의 유용함을 제공하는 것, 그리고 시간이 흐를수록 그 능력을 스스로 진화시키는 것.
그 바탕이 되는 LLM은 급격히 발전하고 있으며 점차 대중화되고 있다. 이는 순풍일 뿐, 그 자체로 해자가 되지는 않는다.
진정한 레버리지는 모델을 둘러싼 인프라에 있다: 기억, 기술, 자가 수정. 같은 모델을 쓰더라도 특정 한 사람에게 맞춘 전용 프레임워크는 범용 프레임워크를 압도할 수밖에 없다. 또한 에이전트가 스스로의 아키텍처를 이해하기 때문에 반복 개선 속도도 훨씬 빠르다.
각 단계는 이전 단계를 기반으로 구축된다. 기억은 토대이고, 기술은 메커니즘이며, 자가 수정은 그 결과로 나타나는 현상이다.
기억
중요한 정보를 놓치지 않는 것. 기억은 인간과 유사한 방식으로 쌓인다. 최근의 일은 토씨 하나 틀리지 않게 기억하고, 오래된 일은 압축하되 필요할 때 드릴다운할 수 있다. 갑작스러운 '기억의 단절'이 있어서는 안 된다.
코드 네이티브 기술
단순한 텍스트 묘사보다 코드와 프롬프트의 조합이 능력을 더 확실하게 고정한다. 에이전트가 새로운 것을 배우면, 단순히 노트를 남기거나 프롬프트를 수정하는 게 아니라 직접 '기술(Skill)'을 코드로 작성한다.
인프라로서의 기억
학습된 능력은 기록에 머물지 않고 시스템 자체를 수정함으로써 고착화된다. 코드베이스 자체가 곧 기억이 되는 셈이다.
인간의 직관, 기계의 본성
설계는 인간의 사고 방식에서 시작하되, 기계의 본질을 놓치지 않는다. LLM은 컨텍스트 제한이 있지만 필요한 것은 무엇이든 즉시 불러올 수 있고, 언어만큼이나 코드에도 능숙하다. 또한 자신의 아키텍처를 스스로 인지할 수 있다. 한쪽이 아니라 양쪽의 특성을 모두 고려해 설계해야 한다.
자가 개선을 위한 구조
시스템 전체가 이해하기 쉽고 수정하기 쉬운 구조로 설계되었다. 이를 만드는 사람뿐만 아니라, 에이전트 스스로도 자신을 수정할 수 있도록.
대화 사이의 간극에서 생각하는 에이전트
에이전트는 주기적으로 '내적 독백'을 거친다. 진행 중인 작업을 되돌아보고, 약속했던 일을 팔로업하며, 할 말이 있을 때 먼저 말을 건넨다. 기계적인 스케줄러가 아니라, 매 순간의 '판단'에 따른 움직임이다.
자가 강화
에이전트가 똑똑해지는 과정과 개발 속도가 빨라지는 과정은 결국 하나로 수렴한다.