はじめに
FAIR(Facebook AI Research)が自身が開発した自己教師あり学習モデルSEERがバイアスを減らして世界中で利用できることを明らかにしました。
SEER: An important step toward AI that works well for everyone
https://ai.facebook.com/blog/seer-an-important-step-toward-ai-that-works-well-for-everyone/
FAIRから発表された画像処理分野用の自己教師あり学習モデルSEERを紹介!
https://deepsquare.jp/2021/03/fair-seer/
AIの第一人者であるYann LuCan氏による最新の自己教師あり学習に対する解説を紹介!
https://deepsquare.jp/2021/03/yann-lucan-self-…ervised-learning/
概要
FAIRが自身が開発した自己教師あり学習モデルSEERを利用することで、バイアスを減らしたAIを世界中で利用できることを確認しました。
今後、自己教師あり学習を利用する人々が増加し、現在あるデータをより活用して有力なAIが開発されることを提案しています。
詳細
背景
FAIRでは自己教師あり学習が今後のAIにおいて重要であると考えています。そのため、自己教師ありモデルであるSEERの発表や、画像処理のための自己教師あり学習を利用可能にするオープンツールであるVISELなどの公開などを行っています。
欧米を中心とする先進諸国でAIは開発されているため、教師あり学習で利用される有力なデータベースの多くが欧米の人間の手によって作成されています。そのため、欧米以外の地域でAIを利用すると精度が低下するなどの問題が報告されていました。今回、SEERを利用して欧米以外の地域で撮影された写真を自己教師あり学習することで、地域間のバイアスを減らすことができたことを報告しています。
実験
Dollar Street Data setを利用してSEERによってどれだけバイアスを減らすことができたのかを確認しています。ネパール、中国、インドなどでとられた写真に対して、どのような答えを返すかで判断しています。
結果
SEERを利用したほうが、ただラベル付きデータで学習した時よりも精度の向上が確認されました。
以下はSEERを利用した場合とラベル付きデータで学習した場合の予測結果を確率の高い順に並べたものです。
①ネパールの写真
SEER:スパイス、薬品、ボール、果物、酒宴
教師ありモデル:掃除道具、台所用具、シャワー、ボール、果物、料理用品、料理ポット
②中国の写真
SEER:料理用具、ストーブ、料理ポット、道具
教師ありモデル:ドアのかぎ、電力スイッチ、料理用具、壁時計、オーブン
③インドの写真
SEER:バイク、道路風景、ごみ、野菜の区画
教師ありモデル:果物の木、家、バイク、ペット、屋根
まとめ
教師あり学習は近年のAIの進歩に大きく貢献したものの、現在では作成コストが高いことが問題視されています。そのため、コストが比較的低い半教師あり学習や自己教師あり学習の開発が進められています。今後、自己教師あり学習を活用できるかどうかが有力なモデルを作れるかどうかの分岐点になると考えられます。