AI 에이전트란?

AI 에이전트는 인공 지능으로 구동되는 컴퓨터 프로그램으로, 인간 사용자를 대신하여 자율적으로 복잡한 작업을 수행할 수 있습니다.

학습 목표

이 글을 읽은 후에 다음을 할 수 있습니다:

  • 에이전틱 AI 정의
  • AI 에이전트의 작동 방식 설명
  • AI 에이전트가 조치를 취하는 방법 이해하기

글 링크 복사

AI 에이전트란?

AI 에이전트는 인공 지능(AI)으로 구동되는 컴퓨터 프로그램으로, 명확한 지침 없이도 인간 사용자를 지원하기 위해 자율적으로 작업을 수행할 수 있습니다. 챗봇과 같은 다른 AI 기반 소프트웨어와는 달리 AI 에이전트는 특정 프롬프트 기반 컨텍스트 외부에서 작동할 수 있습니다. AI 에이전트는 학습 데이터에서 벗어나 세상을 둘러보며 정보를 찾을 수 있습니다. 그런 다음, 독자적으로 더 큰 목표를 추구하기 위해 해당 정보를 기반으로 조치를 취할 수 있습니다.

AI 에이전트는 의사 결정을 하고, 과거 경험을 통해 학습하며, 그에 따라 행동을 조정할 수 있습니다. 다른 AI 에이전트와 상담하여 관련 정보를 얻을 수도 있습니다. 인간은 AI 에이전트에게 목표를 정해주지만, 이러한 목표를 달성하는 방법을 파악하는 것은 에이전트의 몫입니다. AI 에이전트는 독립적으로 작동하거나 인간의 개입 없이도 작동할 수 있습니다.

AI 에이전트는 하드웨어를 구동하거나(로봇 공학에서와 같이) 소프트웨어에서만 작동할 수 있습니다.

에이전틱 AI와 AI 에이전트의 비교

AI 에이전트는 앞서 설명한 소프트웨어 프로그램입니다. 스스로 결정을 하고 작업을 처리합니다. 에이전틱 AI는 AI 에이전트를 구축할 수 있는 AI 개발 분야입니다. (생성형 AI와 Microsoft Copilot 등의 개별 대규모 언어 모델의 차이점, 또는 '조리'와 특정 식사의 차이점을 생각해 보세요.)

에이전틱 AI와 생성형 AI의 비교

생성형 AI(GenAI)는 프롬프트에 응답하여 콘텐츠를 생성할 수 있는 딥러닝 모델의 한 유형을 말합니다. ChatGPT와 같은 LLM이 속하는 AI의 범주입니다. 에이전틱 AI는 생성형 AI를 기반으로 구축됩니다. 그러나 LLM은 특정 사용자 인터페이스나 API를 통해서만 프롬프트에 응답할 수 있는 반면, AI 에이전트는 프롬프트가 없어도 정의된 컨텍스트에서 벗어나 작업을 수행할 수 있습니다.

대기업의 영업 임원은 "우리의 가장 큰 고객 10명을 저녁 식사에 초대할 수 있도록 이메일을 작성해 줘"라고 말함으로써 대규모 언어 모델(LLM)에게 프롬프트할 수 있습니다. 하지만 에이전틱 AI를 이용하면 그 임원이 대신 "우리의 가장 큰 고객 10명을 저녁 식사에 초대해"라고 말하여 AI 에이전트를 프롬프트할 수 있습니다. 즉, LLM은 텍스트를 생성할 수 있지만, AI 에이전트는 이메일 텍스트를 생성하고, CRM에서 10대 고객을 찾으며, 개인화된 이벤트 이메일 초대를 보낼 수 있어야 합니다(이를 수행할 수 있는 충분한 권한이 있는 경우).

AI 에이전트는 어떻게 작동할까요?

대규모 언어 모델(LLM)

AI 에이전트는 LLM을 기반으로 구축됩니다. LLM은 대규모 샘플 데이터 세트를 학습하여 사람이 만든 콘텐츠를 이해하고 자체적으로 콘텐츠를 생성할 수 있는 일종의 AI 모델입니다. LLM은 부정확한 인간의 프롬프트와 요청을 이해합니다.

AI 에이전트는 LLM을 기반으로 구축되었으므로 사용자의 대화형 요청부터 웹 호스팅 동영상 콘텐츠에 이르기까지 광범위한 데이터와 콘텐츠를 처리하고 해석할 수 있습니다. AI 에이전트는 코드, 텍스트, 오디오, 동영상 등 다양한 유형의 미디어에서 콘텐츠를 해석할 수 있습니다. 그런 다음 해당 콘텐츠에서 학습한 내용을 사용하여 행동을 개선할 수 있습니다.

외부 통합 및 상호 작용

또한 AI 에이전트는 세상과 상호 작용할 방법이 있습니다. 로봇의 경우 여기에는 물리적 센서와 카메라가 포함될 수 있습니다. 소프트웨어 전용 AI 에이전트의 경우 이는 여러 가지 형태를 취할 수 있습니다.

  • 에이전트는 API를 통해 외부 애플리케이션에 직접 연결할 수 있습니다
  • 일부 AI 에이전트는 인간 사용자와 마찬가지로 웹 애플리케이션과 상호 작용하여 양식을 작성하고 웹 페이지를 읽는 등의 작업을 수행할 수 있습니다(이 목적으로 헤드리스 브라우저를 사용할 수 있음)
  • 모델 컨텍스트 프로토콜(MCP)이라는 새롭게 떠오르는 표준은 에이전트에게 허용된 적절한 인증 및 권한 부여를 통해 AI 에이전트를 다양한 도구(이메일 클라이언트, CRM, 청구 시스템 등)에 연결합니다

AI 에이전트의 환경 컨텍스트 외부의 세계와 상호 작용하는 이러한 방식을 통해 AI 에이전트는 조치를 취할 수 있습니다. 인간 사용자가 IT 환경 내에서 제한된 권한을 가질 수 있는 것처럼 조직에서는 AI 에이전트에 대한 보호 장치를 설정하여 AI 에이전트가 취하는 조치가 올바른지 확인할 수 있습니다. AI 에이전트에 정책을 프로그래밍하는 것 외에도 조직에서는 인간이 AI 에이전트 응답의 정확성을 확인하거나 에이전트 작업을 승인하는 휴먼인더루프(human-in-the-loop) 접근 방식을 사용할 수도 있습니다.

데이터 플라이휠을 통한 학습

AI 에이전트도 과거 행동의 결과와 인간 사용자의 입력을 사용하여 미래에 자체의 행동을 개선하는 방식으로 학습할 수 있습니다. 이들은 RAM의 계산적 의미뿐만 아니라 과거의 상호 작용과 결과를 기억한다는 의미에서 '메모리'를 가지고 있습니다. 이 학습은 데이터 플라이휠이라는 피드백 루프를 통해 이루어집니다. 상담원의 상호 작용 레코드는 기본 모델에서 향후 성과를 개선하는 데 사용됩니다.

AI 에이전트의 유형은?

AI 에이전트에는 두 가지 주요 유형이 있습니다.

  • 백그라운드 에이전트: 사용자와의 상호 작용이 거의 없는 백그라운드에서 작업, 특히 일상적인 작업을 수행합니다. 백그라운드 에이전트는 사무실을 깨끗하게 유지하고 불을 켜는 미화원이나 유지보수 작업자와 같습니다.
  • 표면 에이전트: 인간 사용자와 보다 직접적으로 상호 작용합니다. 챗봇, 고객 서비스, AI 어시스턴트가 이 범주에 속합니다. 표면 에이전트는 사무실 건물의 프런트 데스크 직원과 같으며, 들어오는 사람과 상호 작용하고 필요에 따라 특정 작업을 수행합니다.

단일 에이전트 및 멀티 에이전트 시스템도 있습니다. 단일 에이전트 AI 시스템은 단 하나의 모델을 기반으로 구축됩니다. 멀티 에이전트 AI 시스템은 문제를 해결하기 위해 서로 협의하는 여러 에이전트의 기능을 결합합니다.

에이전틱 AI 챗봇이란?

에이전틱 AI 챗봇은 기존 챗봇과 마찬가지로 사람들과 대화를 할 수 있습니다. 그러나 에이전틱 AI 챗봇은 챗봇 컨텍스트에서 벗어나 채팅을 떠나서 대화 중인 사람을 대신하여 조치를 취할 수 있습니다. 기존 챗봇은 지원 티켓 제출에 대한 지침을 제공할 수 있습니다. 에이전틱 AI 챗봇은 티켓을 직접 접수할 수 있습니다.

에이전틱 AI 챗봇과 비에이전틱 AI 챗봇

비에이전틱 AI 챗봇은 학습 데이터에 따라 사용자 프롬프트에 반응합니다. 이러한 챗봇은 여전히 LLM으로 구동될 수는 있지만, 사용자를 대신하여 작업을 수행하는 것보다 사용자에게 유용한 콘텐츠나 지침을 제공하는 데 더 적합합니다. 에이전틱 AI 챗봇은 사용자와의 상호 작용 컨텍스트 외부에서 조치를 취할 수 있습니다. 에이전틱 AI 챗봇은 학습 데이터 외에도 다양한 소스로부터 학습할 수 있습니다.

Cloudflare에서는 에이전틱 AI를 어떻게 지원할까요?

Cloudflare 개발자 플랫폼은 다음을 수행할 수 있는 AI 기반 에이전트를 구축하고 배포하는 데 필요한 모든 도구를 제공합니다.

  • 자율적으로 작업 수행
  • 클라이언트와 실시간으로 소통
  • AI 모델 호출
  • 웹 브라우징
  • 데이터베이스 쿼리
  • 휴먼인더루프(human-in-the-loop) 상호작용 지원

또한, 개발자는 Cloudflare의 전역 네트워크를 통해 전 세계 어디에서나 실행되는 코드로 AI 에이전트를 최종 사용자와 최대한 가까운 곳에서 구축할 수 있습니다. Cloudflare에서 AI 에이전트 구축을 시작하는 방법을 알아보세요.