「アフォーダンス」理論で強化学習を効率化、ディープマインドほか【AI最新ニュース】

1. DeepMindの最新AIは、適切な決定を下すために自身をもプログラムする
2. AIセンサーで密回避混雑状況、スマホ通知熱海「古屋旅館」
3. 「アフォーダンス」理論で強化学習を効率化、ディープマインド

DeepMindの最新AIは、適切な決定を下すために自身をもプログラムする

DeepMind’s Newest AI Programs Itself to Make All the Right Decisions

DeepMind’s Newest AI Programs Itself to Make All the Right Decisions

(Singularity Hub 2020/07/26)
・DeepMindの研究チームが、まだ査読待ちであるものの、強化学習において重要なプログラミングルールである独自の価値関数を発見できる新たなアルゴリズムを掲載した論文を発表した。
・深層強化学習では優れた価値関数を開発することが重要なポイントとなるが、DeepMindが発表したあらたな学習済み方針勾配アルゴリズム (LPG algorithm）では独自の価値関数を環境ごとにゼロから発見し、訓練を超えて一般化することができるとしている。
・LPGの強化学習環境が多様であればあるほど、一般化が成功すると考えられており、最終的にはエンジニアはアルゴリズムを開発するのではなく、学習環境を構築することにシフトするかもしれないとされている。

AIセンサーで密回避混雑状況、スマホ通知熱海「古屋旅館」

https://www.at-s.com/news/article/economy/shizuoka/790755.html
（静岡新聞 2020/07/26）
・熱海市の老舗旅館「古屋旅館」は、新型コロナウイルス感染対策として、大浴場やフロントなどの混雑状況をAIで判断し、宿泊客が無料で即時に把握することができるシステムを導入した。
・時間帯によって混みやすい男女の大浴場、フロント、コーヒーコーナーの計4カ所にAIセンサーを設置し、入退出をカウントして「空き」「やや混雑」「混雑」の3段階で評価する。
・客はスマートフォンで専用のQRコードを読み取ると、客室にいながら各所の状況を知ることができる。

「アフォーダンス」理論で強化学習を効率化、ディープマインド

https://www.technologyreview.jp/s/213907/a-concept-in-psychology-is-helping-ai-to-better-navigate-our-world/
（MIT Technology Review 2020/07/26）
・アフォーダンス理論とは、例えば人間は椅子をみたら、形状や色に関係なく座ることができると知ることができるなど、知的な存在が世界を見るとき、単に物体とその関係性だけでなく、その可能性にも気づくとする理論のこと。
・DeepMind社がアフォーダンス理論に基づいて、最初にアフォーダンスを教えれば、かなりの部分の試行を除外でき、学習プロセスをより効率化することができるうえ、一般化もできるはずであると考えた。
・実験はまだ初期段階なものの、シンプルなバーチャル環境を用いて、最初に環境に関するアフォーダンスを教えることで、アフォーダンスを学習していない場合よりも効率的に目的を達成するように学習することができることがわかった。