news 2026/6/16

Amazon Bedrock AgentCore とは — エージェントを本番化するモジュール式の運用基盤

2025年10月にGAしたAmazon Bedrock AgentCoreを、AWSフリーランス実務の視点で解説。Runtime・Memory・Gatewayなどモジュール式サービスの役割、従量課金の料金構造、LangGraph等で作ったエージェントを本番化する流れまで整理します。

#Amazon Bedrock
#AgentCore
#AIエージェント
#AWS
#MCP
#本番運用

「Amazon Bedrock AgentCore」という名前は耳にしたものの、結局それが何なのかは曖昧なまま――そんな方は多いのではないでしょうか。AgentCore は、2025年10月にGA（一般提供開始）した、AIエージェントを「本番運用」するための基盤です。LangGraph などでプロトタイプ（PoC）までは作れても、いざAWS上で認証・記憶・監視・スケールまで持っていく段で詰まる。AgentCore はまさにその「本番化のギャップ」を埋めるサービス群です。

この記事では、AgentCore とは何か（Bedrock 本体との違い）、各モジュールの役割、料金の考え方、そして「自分のエージェントをどこからどう本番化するか」の判断軸まで、AWS実務の目線で整理してみましょう。

AgentCore とは何か — Bedrock 本体と何が違うか

最初に、ここだけは押さえておきたい、という最重要ポイントからいきます。それは「Bedrock 本体と AgentCore は別レイヤだ」ということです。

Bedrock 本体 = Claude や Amazon Nova などの「基盤モデルを提供する」レイヤ。
AgentCore = そのモデルで作ったエージェントを「安全・大規模に動かす運用基盤」レイヤ。

AgentCore の特徴は、フレームワーク非依存・モデル非依存である点です。CrewAI / LangGraph / LlamaIndex / Strands Agents など任意のOSSフレームワークで作ったエージェントを乗せられますし、モデルも Bedrock 内外を問いません（Claude / Nova / Gemini / Llama / Mistral など）。つまり「Bedrock 専用の機能」ではない、というのが比較で迷いやすい一番のポイントですね。

解決しようとしているのは、ひとことで言えば「プロトタイプ→本番のギャップ」です。エージェントのロジック（推論やツール呼び出し）は手元で動かせても、本番ではインフラ運用・IdP（社内の認証基盤、ID Provider）連携・記憶の永続化・可観測性・スケール時のセキュリティといった「地味だが必須の周辺基盤」を自前で作り込む必要があります。この差別化につながらない重労働をマネージドで肩代わりするのが AgentCore だ、というわけです。

AgentCoreの3層レイヤ図。上からアプリ/エージェントロジック層、運用基盤層(AgentCore)、モデル層(Bedrock/外部モデル) — 図1: AgentCore の位置づけ（3層レイヤ）

主要モジュール — 7つのサービス（+ガバナンス2つ）

AgentCore は「ひとつの大きなサービス」ではなく、モジュール式です。重要なのは、各サービスが単独でも、組み合わせても使えること。この性質が、後半の「部分採用」の判断軸につながります。主要な7サービスを役割で整理すると、次のとおりです。

サービス	役割（要点）	主な連携先
Runtime	エージェント／ツール専用のサーバーレス実行環境。高速コールドスタート、セッション分離、最大8時間の実行に対応（長時間・非同期エージェント向き）	LangGraph, CrewAI, Strands, Google ADK, OpenAI Agents SDK ／ MCP・A2A 対応
Memory	短期（マルチターン会話）と長期（セッション跨ぎで永続）の記憶。記憶内容を制御でき、エージェント間で共有も可能	LangGraph, LangChain, Strands, LlamaIndex
Gateway	既存のAPI・Lambda・サービスを数行のコードで「MCP互換ツール」に変換。既存MCPサーバーにも接続	任意のAPI/Lambda、Salesforce, JIRA, Slack 等
Identity	エージェントのID・アクセス・認証管理。既存IdPと互換でユーザー移行不要。トークンVaultを提供	Cognito, Okta, Microsoft Entra ID, Auth0 等
Code Interpreter	コード実行用の隔離サンドボックス。精度向上と複雑タスク対応	Python, JavaScript, TypeScript
Browser	クラウド上のセキュアなブラウザ実行環境。Web操作・フォーム入力・情報抽出をマネージドで	Playwright, BrowserUse 等
Observability	本番でのトレース・デバッグ・監視を一元化。実行パスの可視化、ボトルネック分析	OTEL（OpenTelemetry：監視データの標準規格）互換／CloudWatch

用語を噛み砕いておくと、MCP（Model Context Protocol） はエージェントに外部ツールをつなぐ標準プロトコル、A2A（Agent-to-Agent） はエージェント同士が連携するプロトコルです。Gateway が「既存APIをMCPツール化する」とは、手持ちのLambdaや社内APIを、エージェントから呼べる道具として手早く公開できる、という意味ですね。

すべてを一度に覚える必要はありません。まず注目すべきは Runtime（実行環境） と Gateway（既存API/LambdaのMCPツール化） の2つ。「作ったエージェントを動かし、手持ちの資産につなぐ」入口になります。

【補足：ガバナンス／品質系（表外）】 GA後に2つのサービスが追加されています。Policy（2026年3月GA）はツール呼び出しを実行前に毎回チェックする決定論的な制御で、自然言語または Cedar（AWSのOSSポリシー言語）でルールを書け、Gatewayと統合します。Evaluations（同2026年3月GA）はエージェント／ツールの品質を自動評価し、結果は Observability に統合されます。提供状況は流動的なので、採用時は公式の最新情報を確認してください。

GA時点で押さえる事実 — 提供状況と料金

事実関係を、現時点で確認できる範囲で整理します。

GA日: 2025年10月13日に一般提供を開始。
リージョン: 東京を含む9リージョンで利用可能（米国東部バージニア北部／オハイオ、米国西部オレゴン、欧州フランクフルト／アイルランド、アジアパシフィックの東京／ムンバイ／シンガポール／シドニー）。
エンタープライズ対応: GA時点で全サービスが VPC / AWS PrivateLink / CloudFormation / リソースタグ付けに対応。つまり、社内ネットワーク要件やIaC（コードによるインフラ管理）の自動化にそのまま乗せられます。

料金は 前払い・最低額なしの従量課金 です。設計の感覚として、Runtime・Browser・Code Interpreter は「秒課金」、Gateway・Identity・Memory は「呼び出し回数やレコード単位」と覚えておくと見積もりの当たりがつけやすいです。

サービス	課金単位（2026年6月時点・参考値）
Runtime / Browser / Code Interpreter	CPU $0.0895 / vCPU-hour、メモリ $0.00945 / GB-hour（秒課金・最低1秒、最小128MB）。I/O待機中にCPU消費がなければCPU課金は発生しない
Gateway	API呼び出し $0.005 / 1,000回、Search API $0.025 / 1,000回、ツールインデックス $0.02 / 100ツール・月
Identity	非AWSリソースのトークン/APIキー要求 $0.010 / 1,000回（Runtime/Gateway経由では追加課金なし）
Memory	短期 $0.25 / 1,000イベント、長期（ビルトイン）$0.75 / 1,000レコード・月、長期（自己管理）$0.25 / 1,000レコード・月、取得 $0.50 / 1,000回
Observability	CloudWatch の公表レート（スパン・ログ・メトリクスの取り込み／保存）に準拠

数値は正直にお伝えしておくと、上記はあくまで 2026年6月時点の参考値 です。AWSの料金は改定されうるので、見積もり時は必ず公式の料金ページで最新情報を確認してください。とくに Observability は CloudWatch のレート依存のため固定額を断定しません。Browser profiles の S3 保存に関する課金も、開始日・適用条件は公式で要確認です。

実務で使うときの注意点 — 本番化フローと部分採用の判断軸

ここからが、機能一覧では終わらせたくない実務の話です。

既存エージェントを本番化する流れ

LangGraph や Strands で作ったエージェントをAgentCoreで本番に乗せる場合、おおまかには次の順序で考えると整理しやすいです。

Runtime にデプロイ — まずは実行環境に乗せる。セッション分離と最大8時間実行で、長時間タスクや非同期処理にも対応。
Memory で記憶を外出し — 会話履歴やセッション跨ぎの記憶をエージェント本体から切り離し、永続化する。
Gateway で既存API/LambdaをMCPツール化 — 手持ちの社内API・Lambdaを、エージェントから呼べる道具として公開する。
Identity で認証 — Cognito / Okta / Entra ID など既存IdPと連携。ユーザー移行は不要。
Observability で監視 — トレースと性能監視を一元化し、本番の挙動を可視化する。

本番化フロー図。PoC(LangGraph/Strands)を起点に、①Runtimeデプロイ→②Memory/③Gateway/④Identity/⑤Observabilityを段階的に追加する積み上げ図 — 図2: 既存エージェントの本番化フロー（必要なものから段階的に積み上げる）

「全部入り」にしない — 部分採用の判断軸

ここで効いてくるのが、各モジュールを単独で使えるという性質です。最初からフルセットを導入する必要はありません。実務では「どこから入れるか」を見極めるほうが現実的です。

まず既存APIをエージェントから使いたい → Gateway から。手持ちのLambda・APIのMCP化が最短の価値になりやすい。
会話の記憶を永続化したい／セッション跨ぎで保持したい → Memory から。
認証・ID管理がボトルネック → Identity から。既存IdPと互換なので移行コストが低い。

このように「課題ドリブンで1モジュールずつ」入れていける設計は、導入リスクを下げる意味でも実務的です。

コストは「設計」で変わる

料金が秒課金・従量である以上、コストは断定額より「考え方」で捉えるのが妥当です。たとえば Runtime は I/O待機中にCPUを消費しなければCPU課金が発生しません。常時起動を前提にするのか、必要なときだけ動かすのかで、コスト感は大きく変わります。具体額は実際のワークロードと公式の最新料金で算出してみましょう。

まとめ

最後に、ポイントを3つに絞ります。

AgentCore は Bedrock 本体（モデル提供）とは別レイヤの「運用基盤」。フレームワーク非依存・モデル非依存で、Bedrock 専用ではありません。
モジュール式で単独採用が可能。全部入りにせず、まずは Runtime / Gateway あたりから課題ドリブンで入れていけます。
料金は前払いなしの従量課金（参考値・公式要確認）。本番化に必要な実行・記憶・認証・監視を、モジュール単位で必要なものから段階的に導入できます。

なお、AgentCore を含む最近のAWSアップデートは AWS最新サービスの解説ハブに横断的にまとめています。あわせてご覧ください。