Adversarial Attack

敵対的攻撃

敵対的攻撃とは

AIモデルを誤動作させるための意図的な攻撃をさします。例えば、画像認識モデルに人間には知覚できない程度の微細なノイズを加えることで、全く異なる物体として認識させたり、自然言語処理モデルに特定の単語を挿入することで、誤った結論を導かせたりします。その目的は、AIシステムの信頼性を損なうことや、特定の意図を持った出力を行わせることなどが挙げられます。

関連サービス

Rakuten AI for Business

法人のお客様の様々な企業活動を支援する生成AIサービス。法人向け生成AIチャット機能では、職種別のプロンプトテンプレートや社内のドキュメント連携(RAG)機能など、ビジネス利用に便利な機能を多数実装し、業務の効率化に貢献します。AIに無断でデータを学習されないセキュアな環境の下、使いやすさを重視したUIにより、どなたでも安心してご利用いただけます。

詳細を見る

この用語をシェアする