Основная идея
Облачная инфраструктура, изначально созданная для работы с пользовательским трафиком (когда люди ищут информацию, кликают, прокручивают страницы), плохо справляется с нагрузками от ИИ‑агентов. Последние создают резкие всплески активности: запускают множество субагентов, запрашивают сотни баз данных, вызывают API — а затем быстро исчезают.
Компании начинают адаптировать свои облачные сервисы под такие «пульсирующие» нагрузки. Яркий пример — новое поколение OpenSearch Serverless от AWS.
Ключевые факты и цифры
- По данным Cloudflare, за последние 6 месяцев 31 % HTTP‑трафика приходилось на ботов.
- Из этого трафика примерно четверть запросов от ботов генерировали:
- поисковые роботы;
- поисковые системы;
- голосовые помощники с ИИ.
- Прогнозируется, что в первой половине 2027 года трафик, не связанный с людьми, превысит человеческий трафик (по заявлению Лай И Олсен, старшего менеджера по продуктам Cloudflare).
Что такое OpenSearch Serverless (новое поколение)
Это полностью управляемая поисковая и векторная база данных от AWS, разработанная специально для агентных рабочих нагрузок.
Главные особенности:
- Мгновенное масштабирование. Система быстро наращивает вычислительные мощности при всплесках активности агентов и уменьшает их до нуля, когда агенты неактивны.
- Оплата только за фактическое использование. Клиенты не платят за простаивающие ресурсы — в отличие от предыдущих решений, где нужно было резервировать хотя бы один работающий экземпляр.
- Разделение вычислительных ресурсов и хранилища. Это ключевое техническое изменение, позволяющее гибко и быстро масштабировать вычисления.
- Интеграция с платформами для разработки ИИ. При запуске OpenSearch Serverless будет интегрирован с Vercel и Kiro. Разработчики смогут развёртывать готовые поисковые и векторные серверные части для агентов без управления инфраструктурой.
Аналогия от AWS
Раньше оплата облачных ресурсов напоминала аренду постоянного парковочного места — вы платите за него всегда, даже когда не пользуетесь.
OpenSearch Serverless работает по принципу паркинга с почасовой оплатой — платите только за то время, когда реально используете место.
Тенденция в отрасли
AWS — не единственная компания, адаптирующая инфраструктуру под ИИ‑агентов:
- Databricks и Snowflake позиционируют себя как системы хранения и извлечения данных для ИИ.
- Microsoft выпустила обновления для Azure, оптимизированные для всплесков активности ИИ‑агентов и совместного использования памяти несколькими агентами.
- Cloudflare представила инфраструктуру с мгновенной масштабируемостью для агентов — по аналогии с решением Amazon.
Выводы
- Рост машинного трафика. Доля ИИ‑агентов пока невелика, но машинный трафик уже значителен (31 % HTTP‑трафика по данным Cloudflare) и продолжает расти.
- Неприспособленность старой инфраструктуры. Системы, созданные для предсказуемого человеческого трафика, неэффективны для резких всплесков активности от агентов.
- Адаптация облачных провайдеров. AWS, Microsoft, Cloudflare и другие компании перестраивают свои сервисы под новые модели нагрузки.
- Экономический эффект. Новые решения (как OpenSearch Serverless) снижают затраты: клиенты платят только за реально использованные ресурсы.
- Упрощение развёртывания агентов. Гибкая инфраструктура делает внедрение ИИ‑агентов дешевле и проще в больших масштабах.