“Linear evaluation”は、深層学習モデル、特に教師なし学習や自己教師あり学習で生成された特徴表現の品質を評価する手法です。
具体的な手順は以下の通りです。
1.教師なし学習や自己教師あり学習を使用して、モデル(通常はニューラルネットワーク)を訓練します。この訓練フェーズでは、モデルはデータセットの隠れた構造やパターンを学習し、それを表現する特徴量を生成します。
2.その後、この学習済みモデルの出力層を除いて固定し(つまり、そのパラメータを更新しない)、その上に新たに線形層を追加します。この線形層のパラメータだけが学習フェーズで更新されます。
3.この新たに追加した線形層を訓練データで学習し、その結果を元にテストデータで評価を行います。
“Linear evaluation”の目的は、教師なし学習や自己教師あり学習が生成した特徴表現が有用であるかどうかを判断することです。もし線形分類器が高い精度で分類を行えるなら、その特徴表現は有効であると考えられます。一方、精度が低ければ、特徴表現が問題の解決に必要な情報を捉えていない可能性があります。
なお、この評価法は一般的にある種のバイアスが存在するとされています。それは、線形分類器が適切に分類できなくても、より複雑なモデル(例えば深層ニューラルネットワーク)ならその特徴表現を利用して良い結果を出す可能性があるからです。したがって、”Linear evaluation”は特徴表現の一面的な評価手法と捉えられます。