アノテーション (annotation) は、データセットに対して、画像やテキストなどに関連する情報を付与することを指します。これにより、機械学習アルゴリズムがデータを理解し、学習することができるようになります。
画像アノテーションにおいては、画像中に存在する物体や人物などを検出し、それぞれに対応するバウンディングボックスを付与します。テキストアノテーションにおいては、文章中に含まれる意味や情報を抽出し、タグ付けを行います。
アノテーションは、大量のデータを手作業で行うため時間がかかりますが、機械学習アルゴリズムを適切に学習させるためには必要な作業です。
現在は、人手によるアノテーションだけでなく、自動アノテーションの方法も開発されており、大量のデータを効率よくアノテーションすることができるようになってきています。