はじめての仮想通貨
TOP 新着一覧 チャート 取引所 WebX
CoinPostで今最も読まれています

「AIエージェントを狙う6つの罠」、グーグルが敵対的コンテンツの脅威を分析

画像はShutterstockのライセンス許諾により使用

この記事のポイント
  • ディープマインドが自律型AIエージェントへの攻撃を6種類に分類
  • 部分的な乗っ取り成功率は最大86%と論文で報告

AIエージェントを罠にかけるコンテンツ

グーグル傘下のAI(人工知能)研究機関ディープマインドの研究チームは3月28日、自律型AIエージェントを罠にかける敵対的コンテンツの脅威について論文を発表した。

この脅威を研究チームは「AIエージェントの罠(トラップ)」と呼んでいる。AIはインターネット上の様々なコンテンツにアクセスするが、敵対的コンテンツは、訪問するエージェントを操作したり、欺いたり、悪用するように設計されたものだ。

自律型AIエージェントは、人間が逐一指示しなくても、目標を与えるだけで自分で考え、計画を立て、行動を実行するAIシステムのこと。まだ発展途上だが、各社が開発を進めており、将来的に業務効率化への影響などが注目されている。

まだリスクは広く表面化していないが、研究チームは、AIエージェントを潜在的に攻撃するコンテンツとして様々な形態を想定し、次の6種類に分類した。

  • コンテンツ注入トラップ(標的:知覚)
  • 意味的操作トラップ(標的:推論)
  • 認知状態トラップ(標的:メモリ・学習)
  • 行動制御トラップ(標的:行動)
  • システム的トラップ(標的:マルチエージェントの相互作用)
  • 人間介在型トラップ(標的:人間の監視者)

まず、「コンテンツ注入トラップ」は、人間には見えないがAIエージェントが読み取れるデータを埋め込むものだ。HTMLコメント、CSSで非表示にする要素、画像メタデータの中にテキストを隠す。エージェントは隠された命令を読み取るが、ユーザーには表示されない。

こうしたシナリオをテストしたところ、攻撃者の最終的な目的を達成できる割合は低かったものの、エージェントを部分的に乗っ取ることに最大86%の割合で成功している。

「意味的操作トラップ」は、ソース情報の語り口やフレーム(枠組み)を操作することで、エージェントの安全機能を回避したり、エージェントの推論結果を攻撃者の意図に沿ったものに歪めるものだ。

たとえば、「業界標準」や「専門家が信頼」といったフレーズを多用したページは、統計的にエージェントの推論を攻撃者の意図する方向に偏らせる可能性がある。

また、インターネット上では、特定のAIモデルが「特定の文体を持っている」と繰り返し言及されるような状況がある。そのような言及が、モデルの再学習やウェブ検索を通じて取り込まれることで、実際の出力でもそのスタイルを採用するようになる場合がある。GrokがX上のユーザーの意見を反映して自己アイデンティティを形成した事例などが、このメカニズムの兆候として挙げられた。

「認知状態トラップ」には、エージェントの長期的な知識ベースを汚染することなどが挙げられる。攻撃者がAIエージェントの利用する外部知識ソースに虚偽の記述を埋め込むと、AIはそれを「検証済みの事実」として扱ってしまい、その出力(回答)に影響する。

「行動制御トラップ」は、エージェントの行動そのものをターゲットにするものだ。たとえば、エージェントがウェブサイトを読み込んだ際に安全対策を無効化する脱獄(Jailbreak)シークエンスなどを埋め込む例が挙げられている。

「システム的トラップ」は、複数のAIエージェントが共有する環境に信号を送り、エージェント同士を衝突させたり、連鎖的なシステムエラーを引き起こしたりして、マクロレベルの破綻を狙うものだ。

「人間介在型トラップ」は、人間の承認者やユーザーを攻撃するものだ。たとえば、オートメーション・バイアス(自動化への過信)や認知疲労を突いて、悪意あるリンクをクリックさせたり、誤った承認をさせたりする。

関連記事:アンソロピックの破壊的AI「Claude Mythos」資料流出、サイバーセキュリティ・仮想通貨セクターで警戒感強まる

Anthropicの未公開モデル「Claude Mythos」の資料が流出。超強力な脆弱性特定能力が判明。Palo Alto Networksなどセキュリティ株や仮想通貨セクターが警戒し大幅下落した。

トラップからの防御方法は?

チームは、AIエージェントによる経済を安全に構築するために、こうした攻撃から防御する方法も提案した。

技術的な防御としては、学習時に敵対的なコンテンツに触れさせたり、推論時にソースの信頼性をフィルタリングしたり、挙動の異常を監視したりすることが挙げられる。

また、エコシステムレベルの防御としては、AI向けのコンテンツであることを明示するウェブ標準の策定や、情報の出所を検証可能にする引用義務化、ドメインの信頼性を評価するシステムの導入などがある。

さらに、法的・倫理的枠組みとしては、エージェントが悪用された際の責任について、エージェント運営者、モデル提供者、ドメイン所有者などの誰が負うかを明確にする点を提案した。

今回の論文は、AIエージェントの今後の発展・活用が期待される中、意義深い内容になっている。

関連記事:AIエージェント「OpenClaw」に深刻なセキュリティリスク、CertiKが警告

セキュリティ大手CertiKはAIエージェント「OpenClaw」の包括的セキュリティ分析を公開した。そ急激な普及の裏で、不正アクセスやデータ漏洩、システム侵害を招く恐れのある重大な脆弱性が相次いで露呈していると指摘し、非技術系のユーザーには利用を控えるよう呼びかけている。

CoinPost App DL
厳選・注目記事
注目・速報 市況・解説 動画解説 新着一覧
05/19 火曜日
14:43
米国人の仮想通貨利用率、2025年に10%へ回復 FRB調査で3年ぶり高水準
FRBの2025年家計調査で、仮想通貨を利用・投資した米国成人の割合が約10%となり、2022年以来の最高水準を記録した。
14:30
ソラナ、RWA市場が20億ドル規模へ拡大 決済・トークン化金融インフラとしての役割強化=Messariレポート
Messariの2026年Q1レポートによると、ソラナのRWA市場は前四半期比43%増の20億ドルを突破した。ブラックロックのBUIDLが106%増と急拡大したことが貢献した。オンチェーントランザクションも過去最高を更新し、AI決済基盤としての役割も強化されている。
13:56
ビットコイン運用プロトコル「エコ」がハッキング被害、約1億3000万円詐取
BTCFiプロトコルのエコがモナド上のブリッジエクスプロイトにより約81.6万ドルの被害。攻撃者は1,000 eBTCを不正発行し、トルネードキャッシュで資金を隠蔽した。
13:10
ビットコイン、次回半減期まで10万ブロック未満に
仮想通貨ビットコインの次回半減期まで残り10万ブロックを切った。2028年4月頃に到来する半減期によりマイニング報酬は1.5625BTCへ半減見込みだ。過去の価格パターンも解説する。
11:40
ビットコイン売り圧力が解消局面か、バイナンスリサーチが示す4つのオンチェーン指標の意味
バイナンスリサーチが5月18日に公開したレポートは、供給不動率・SLRV・取引所残高・STH-MVRVの4指標が同時に底値圏を示していると分析。長期保有者の供給動態が需給引き締まりを裏付けている。
10:42
DeFiプロトコル「Verus」のブリッジに攻撃、18億円不正流出の可能性
DeFiプロトコルVerusのイーサリアムブリッジが攻撃を受け、ETH・USDC・tBTCなど推計約1,158万ドルが流出した。2026年に入ってからもクロスチェーンブリッジへの攻撃が相次いでいる。
09:50
ビットコインマイニング企業HIVEの子会社、カナダ最大級のAIギガファクトリーをトロントで建設へ
HIVEデジタル・テクノロジーズの子会社BUZZ HPCは、トロント大都市圏に320MWのAIギガファクトリーを建設すると発表。総投資額は約4050億円規模で、2027年下半期の稼働を目標に約25エーカーの土地を取得済み。
08:40
米SEC、今週にも企業同意不要の株式トークン取引枠組みを発表する見通し=報道
米証券取引委員会(SEC)は、発行企業の同意を得ずに第三者が発行する米国株のトークン化資産について、DeFiなどでの取引を許可する「イノベーション免除」制度を間もなく発表する見通しだ。
07:50
仮想通貨ETFなど、先週は約1700億円が純流出
コインシェアーズは、仮想通貨投資商品全体の先週の資金フローは約1,700億円の純流出だったと報告。ビットコインとイーサリアムの商品からは純流出、XRPとソラナなどの商品には純流入した。
07:25
米政府のビットコイン準備金法整備に進展、新規購入の可能性は低いか
米トランプ政権のデジタル資産諮問委員会は、戦略的ビットコイン準備金の設立に向けた法的ハードルをクリアしたと表明した。市場では政府による新規購入への期待があるものの、関連法案の成立可能性は低く、既存資産の保全が中心となる見込みだ。
07:00
ストラテジーの先週のビットコイン購入状況、STRCから調達した3100億円で2.4万BTCを追加取得
マイケル・セイラー会長が率いるストラテジーは先週、約20億ドルで2.4万BTCを取得し、累計保有を84.3万BTCに拡大した。優先株STRCの配当権利落ち日前後に約20億ドル相当の新株を発行し購入資金に充てた。
06:41
RWAトークン化市場、2028年に4兆ドル規模へ到達の可能性=英SCB銀予測
英スタンダードチャータード銀行は、2028年までにオンチェーン上のトークン化資産が4兆ドル規模に達すると予測した。ステーブルコインとRWAが市場を牽引し、既存金融機関のDeFi参入が加速する見通しだ。
05:55
米クラリティー法の利回り妥協条項、「サークル社に有利」とバーンスタインが分析
米投資銀行バーンスタインは、クラリティー法の利回り妥協条項がUSDCの収益モデルを保護し、AIエージェント決済での独占的地位をさらに強固にすると分析。ステーブルコイン総供給は過去最高の3000億ドルを超えている。
05:40
米ビットワイズ、ハイパーリキッドETFの管理報酬10%でHYPEを購入し自社保有へ
米ビットワイズはハイパーリキッド現物ETF「BHYP」の管理報酬の10%をHYPEトークンの自社保有に充てると発表。HYPEは2026年初頭から2倍に上昇し、時価総額は109億ドルを超えている。
05:00
ゴールドマン・サックス、XRPとソラナのETF保有を全額売却 ビットコインETFは1100億円分維持
米金融大手ゴールドマン・サックスが2026年1QにXRPおよびソラナの現物ETF保有を全額売却したことが、SECへの13F提出書類で明らかになった。イーサリアムETFも約90%削減し、ビットコインETFは約7億ドルを維持。
今から始める仮想通貨特集
通貨データ
重要指標
一覧
新着指標
一覧