Что такое AI-агент: определение для начинающих
Слово «агент» в контексте искусственного интеллекта летает везде — в статьях про AI, в обсуждениях инструментов типа Claude, в рекламе GPTs. Но что это на самом деле? Не просто ассистент, который отвечает на вопросы, а именно агент?
Начнём с простого определения. AI-агент — это не просто программа или модель, а сущность, которая проявляет агентское поведение, то есть самостоятельно решает, какие инструменты использовать, какие действия предпринять и как достичь поставленной цели. Ключевое слово — самостоятельно.
Триада: задача, ресурсы, полномочия
Вот самое важное определение, которое помогает всё понять. Агент проявляет агентское поведение, когда у него есть три вещи:
- Задача — что нужно сделать
- Ресурсы — что нужно для решения
- Полномочия — что разрешено делать
Давай разберём каждую.
Задача
Задача обычно формулируется в промпте — текстовой инструкции, которую ты даёшь агенту. Это может быть что угодно: «Найди в моих файлах цитату про ML», «Подготовь бриф для клиента», «Распланируй мою неделю».
Чем точнее задача, тем лучше результат. Вместо размытого «помоги с работой» напиши: «Возьми контекст клиента из папки /clients/ivan_ivanov, посмотри в календаре его встречи и напиши краткий бриф на 500 слов».
Ресурсы
Ресурсы — это вся информация и инструменты, которые нужны агенту, чтобы выполнить задачу. Это не просто статичный контекст (текст, который ты загрузил), а динамичный контекст — данные, которые обновляются в реальном времени.
Примеры ресурсов:
- Файлы и папки на компьютере или в облаке
- Доступ к сервисам: Linear, Notion, Todoist, Gmail, Telegram
- Поиск в интернете через Exa или Google
- Календарь с расписанием встреч
- Базы данных и API
Вот ключевая идея: ресурсы предоставляются через протоколы типа MCP [VERIFY] (Model Context Protocol) — они позволяют агенту автоматически обращаться к сервисам, не требуя от тебя постоянно копировать-вставлять данные.
Например, когда ты говоришь Claude Code или Cursor: «Посмотри мои задачи в Todoist», агент не просит тебя вывести список. Он просто идёт в Todoist и забирает данные сам — если у него есть доступ.
Полномочия
Полномочия определяют, что разрешено делать агенту. Они варьируются от минимальных до максимальных.
Минимальные полномочия:
- Только чтение информации
- Подсказки и анализ
Расширенные полномочия:
- Создание файлов и папок
- Отправка сообщений (в Telegram, email)
- Изменение существующих документов
Максимальные полномочия:
- Полный доступ к компьютеру или серверу
- Установка программ
- Удаление файлов
Например, Claude Code может получить все полномочия на твой компьютер — тогда он сможет установить библиотеки, создавать скрипты, запускать команды. Это мощно, но требует осторожности.
Агент vs Ассистент: в чём разница?
Часто путают агентов с обычными ассистентами. Вот главное отличие:
Ассистент — это инструмент, который ждёт от тебя указания. Ты пишешь: «Напиши текст», он пишет текст. Он не решает самостоятельно, нужна ли ему дополнительная информация, какие инструменты применить.
Агент — это система, которая сама решает, что делать. Ты говоришь: «Подготовь меня к встрече с Иваном Ивановым». Агент самостоятельно:
- Поищет в твоих файлах информацию об Иване
- Заглянет в календарь, когда встреча
- Может запросить дополнительные ресурсы (документы, письма)
- Выберет инструменты для анализа
- Решит, в каком порядке действовать
Вот почему это называется агентностью или субъектностью — агент проявляет признаки самостоятельного субъекта, а не просто исполняет команды.
Где живут агенты: облако vs локально
Существует два основных типа агентских сред:
1. Агент в облаке (мы идём к нему)
Примеры: GPTs (ChatGPT), Make/n8n, облачные версии инструментов.
Как это работает: ты идёшь в облачный сервис, загружаешь контекст, указываешь инструкции, и агент там что-то делает.
Плюсы:
- Стабильно работает
- Хорошо для повторяющихся задач
- Не требует установки
Минусы:
- Лимитированный доступ к твоим локальным файлам
- Часто детерминированные (узкие) задачи
- Зависит от интернета
2. Агент локально (он приходит к нам)
Примеры: Claude Code, Cursor, Windsurf.
Как это работает: агент запускается на твоём компьютере и имеет доступ ко всем локальным файлам, облачным сервисам (если ты предоставил API-ключи).
Плюсы:
- Полный доступ к твоим файлам и системе
- Может решать сложные, нестандартные задачи
- Очень гибкий
Минусы:
- Нужно контролировать действия (он может удалить файлы)
- Требует внимательности при выдаче полномочий
Практический пример: Claude Code в действии
Представь, что ты хочешь найти конкретную цитату в сотне файлов транскриптов. Ты говоришь Claude Code:
«Найди фразу про машинное обучение во всех файлах в папке
/transcripts. Покажи контекст — три строки до и после».
Claude Code самостоятельно:
- Открывает папку
- Читает все файлы
- Ищет по разным вариантам (может быть опечатка)
- Создаёт отчёт с результатами
- Может даже параллелизировать поиск для скорости
Вот это агентское поведение — ты не указываешь каждый шаг, агент сам решает, как лучше выполнить задачу.
Скиллы и правила
Когда ты успешно решил задачу с агентом, её можно упаковать в скилл — переиспользуемый набор инструкций. Скилл включает:
- Промпт (описание задачи)
- Доступ к ресурсам
- Полномочия
- Правила выполнения
Например, скилл «Поиск по синонимам в транскриптах» можно сохранить и потом просто запускать заново.
Правила (rules) — это файлы вроде claude.md или agent.md, которые описывают конвенции для проекта. Агент их читает и понимает, как нужно называть файлы, структурировать папки, какие принципы соблюдать.
Безопасность: когда агент опасен
Если ты даёшь агенту широкие полномочия (особенно локальному), есть риск. Например, если агент неправильно поймёт задачу и удалит важный файл.
Как защитить себя:
- Работай в отдельных папках для изоляции
- Проси агента создавать копии файлов перед изменениями
- Используй системы разрешений (permissions)
- Регулярно делай бэкапы в Git
- Сначала проверь, что делает агент, прежде чем давать полные права
Что дальше?
Если хочешь начать работать с агентами:
- Выбери среду: Cursor или Claude Code для локального агента, либо ChatGPT/GPTs для облака
- Выбери задачу: Что-то повторяющееся или сложное
- Разберись по триаде: Какая задача? Какие ресурсы нужны? Какие полномочия?
- Настрой ресурсы: Если нужно, подключи MCP-серверы (Linear, Notion, Telegram)
- Протестируй: Дай агенту промпт и смотри, как он работает
Агент — это не волшебство, это система, которая нужно правильно настроить. Но когда ты её настроишь, экономия времени огромная.
FAQ
Q1: Чем агент отличается от ChatGPT?
ChatGPT в базовом режиме — это ассистент. Он отвечает на твои вопросы, но не решает самостоятельно, какие инструменты использовать. Когда ты включаешь in ChatGPT web search или прикрепляешь файлы, это начинает напоминать агентское поведение — он сам решает, нужно ли ему искать в интернете или смотреть в файлах. Claude Code — уже полноценный локальный агент с полными полномочиями.
Q2: Нужны ли мне технические навыки, чтобы работать с агентами?
Нет. Основное — правильно сформулировать задачу в промпте и предоставить ресурсы (файлы, доступ к сервисам). Программировать не нужно. Инструменты вроде Cursor и Claude Code спроектированы так, чтобы им мог пользоваться любой человек.
Q3: Может ли агент забыть контекст во время выполнения?
Да, это проблема, особенно если задача большая. Решение: разбивай большую задачу на части, требуй промежуточные отчёты, выноси списки задач в отдельные артефакты. Некоторые агенты (вроде Gemini) страдают от этого больше, чем другие.
Q4: Что такое MCP и зачем это нужно?
MCP (Model Context Protocol) — это стандарт, который позволяет агенту подключаться к внешним сервисам (Linear, Notion, Telegram и др.) и забирать данные в реальном времени. Вместо того чтобы ты каждый раз вручную копировал информацию, агент сам идёт туда и берёт нужное. Настройка часто делегируется самому агенту.
Q5: Безопасно ли давать агенту полные полномочия?
Не совсем. Агент может неправильно понять и удалить важное. Лучше начинать с минимальных полномочий (только чтение), потом расширять по мере того, как ты понимаешь, как он работает. Обязательно делай бэкапы и работай в отдельных папках.