はじめに
ダートマス大学の研究チームがサイバーセキュリティのためのカナリアトラップを向上させるAIを開発しました。
『Cybersecurity Researchers Build a Better ‘Canary Trap’』
https://news.dartmouth.edu/news/2021/03/cybersecurity-researchers-build-better-canary-trap
論文
Using Word Embeddings to Deter Intellectual Property Theft through Automated Generation of Fake Documents
https://dl.acm.org/doi/10.1145/3418289
概要
セキュリティ技術のひとつに、大量の偽ファイルを生成することで本当に重要なファイルを隠す方法として「カナリアトラップ」とよばれるものがあります。今回、ダートマス大学の研究チームがAIを用いてサイバーセキュリティ上でより良いカナリアトラップとして「WE-FORGE」を開発しました。
詳細
ダートマス大学のコンピュータサイエンス学科で設計された新しいデータ保護システムであるWE-FORGEは、AIを利用して大量の偽造文章を作成します。(FORGEというシステムを改良したものです。)現在、薬物設計や軍事技術などの知的財産を保護するために使われています。
WE-FORGE
WE-FORGEは、オリジナルの文章に非常に類似していながら、核となる部分では正しくないドキュメントを生成することができます。
自然言語処理を使用して、信頼できるものと正しくないものの両方で複数の偽のファイルを自動的に生成します。また、システムにはランダム性の要素を挿入して、攻撃者が実際のドキュメントを簡単に識別できないようにしています。
WE-FORGEアルゴリズムは、ドキュメント内の概念間の類似性を計算し、各単語がドキュメントにどの程度関連しているかを分析することで機能します。システムは概念を「ビン」に分類し、各グループの実行可能な候補を計算することで、偽の文章を生成します。
FORGEの欠点とWE-FORGEの改良
FORGEと比べ、以下の点で改良がおこなわれました。
①単語の距離メトリックの使用
FORGEでは偽のドキュメントを生成するために、オントロジーを利用していました。しかし、現実の世界では、特に優れたオントロジーが利用できることはめったにないため、代わりに距離メトリックを利用することでオントロジーの必要性を排除しました。
②ターゲット概念と置換する概念を同時に選択する
FORGEでは、変化させる概念を選択してから、置換する概念を決定していました。そのため、全体としては質の良くない偽文章が生成されることがありました。今回は、ターゲット概念と置換する概念を同時に決めることで、文章としての質を上げることに成功しました。
まとめ
WE-FORGEなどのサイバーセキュリティ用のAIの開発が進んでいます。今回開発されたAIは、人間の専門家を擁しても見破ることが難しいものができたとしており、一定程度の効果が期待できます。ただし、人間が判断できなくてもAIなら判断できるようになってきており、今後AI同士のイタチごっごが始まることが予想されます。