脳とAIに共通する「物体の見方」があることをジョンホプキンス大学の研究チームが報告しました。今回は、発表された論文をご紹介します。
概要
これまでの研究で、脳は物体を捉えるときに2D情報だけでなく、はやい段階で3D形状の断片情報(盛り上がり、くぼみ、軸など)も検出して利用していることが明らかになりました。今回、ジョンズホプキンス大学の研究チームは、物体を検出するように学習された人工知能も同様の動きをしていることを明らかにしました。今後、現実世界での立体的な物体の解釈に役立つことが期待されています。
詳細に興味がある方は、論文をご参照ください。
Early Emergence of Solid Shape Coding in Natural and Deep Network Vision
https://www.cell.com/current-biology/fulltext/S0960-9822(20)31446-9?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0960982220314469%3Fshowall%3Dtrue
研究内容
ジョンズホプキンス大学の研究チームは、AlexNetの初期段階(第三層まで)で、脳のエリアV4と同様の形で3D形状を検出していることを明らかにしました。
脳のエリアMTが背側皮質視覚路(視覚対象が空間のどこにあるのかを理解する空間認識にかかわる経路=→通称where経路)における最初の運動固有の処理段階であるのと同様に、エリアV4は腹側皮質視覚路(色や形の継承理解に関する経路→通称、what経路)の最初の物体固有の処理段階であることがしられています。ほぼ50年間、V4での物体形状のコーディングは、2D視覚画像の変換における初期段階であることを考慮して、フラットパターン処理の観点から研究がされてきました。
しかし、今回の研究では、覚醒しているサルの記録実験で、V4ニューロンの約半分が、画像の陰影、鏡面反射、反射、屈折、または視差の手がかりによって伝えられるように、より調整され、立体的な3D形状の深さに反応することがわかりました。2光子機能顕微鏡を使用して、フラットおよびソリッド優先ニューロンがV4の表面全体で別々のモジュールに分離されていることを発見しました。
これらの発見は、初期の形状処理理論とモデルに影響を与えると考えられます。実際、AlexNetでの初期オブジェクト処理の分析により、レイヤー3のフラット形状とソリッド形状に対する感度で、同様の分布を示していることが明らかになりました。このフラット形状と並行したソリッド形状の初期処理は、計算上の利点を表す可能性があることが論文では指摘されています。