ヘルシンキ大学による生態系に関する新たなモデルをAIで見つける手法を紹介!

ヘルシンキ大学による生態系に関する新たなモデルをAIで見つける手法を紹介!

はじめに
 ヘルシンキ大学がAIを用いて、生態系に関する新たなモデルを見つける手法としての記号回帰の有用性を提起する論文を発表しました。今後、生態学とAIの協同による新しい発見が期待されています。

ヘルシンキ大学公式HP(2020/12/11)
『Ar­ti­fi­cial in­tel­li­gence helps sci­ent­ists de­ve­lop new gen­eral mod­els in eco­logy』
https://www.helsinki.fi/en/news/life-science-news/artificial-intelligence-helps-scientists-develop-new-general-models-in-ecology
論文
Automated Discovery of Relationships, Models, and Principles in Ecology
https://www.frontiersin.org/articles/10.3389/fevo.2020.530135/full

 

現状の課題

 生態系は、何百万もの種と環境が複雑に相互作用して形成されています。そのため、人間が各要素同士の関係性をシュミレートして生態系を予測しようとすることは、非常に困難であることが知られています。近年では、データセットから人間が見いだせないモデルをAIによって探索することが模索されていました。

論文概要

 ヘルシンキ大学の研究チームは、記号回帰 symbolic regression(与えられたデータセットに対して正確かつ単純な最もふさわしいモデルをみつける問題・手法)を用いました。関数同定問題では、アルゴリズムの開始点として与えられる特定のモデルがなく、代わりに初期の数式は演算子、解析関数、定数、状態変数をランダムに組み合わせて与えられます。そのため、人間の先入観やドメイン知識との隔たりによる影響を受けないというメリットがあります。
 今回、研究チームの主眼は、記号回帰の生態学における可能性を探索することにありました。まず、種と面積の関係を検索するときに、極端なレベルのノイズに対する記号回帰の堅牢性をテストしています。次に、記号回帰が種の豊富さと空間分布をモデル化する方法を示します。最後に、記号回帰を使用して、生態学の一般的なモデル、つまり種の豊富さの推定量の新しい式と海洋島の生物地理学の一般的な動的モデルを見つける方法を説明します。
 純粋にデータから進化する自由形式の方程式は、多くの場合、事前の人間の推論や仮説なしに、生態学者や生物地理学者が気づかない一般的な理論モデルと原理を提案するための非常に強力なツールとなる可能性があることを提案しています。

記号回帰による生態系モデルの図(上記論文より引用)

結果

 一部の種がある地域には存在しながら他の地域には存在しない理由、および一部の地域がほかの地域よりも多くの種が存在する理由を説明するモデルを構築することに成功しました。
 例えば、海洋島には自然のライフサイクルがあり、火山から出現し、数百万年後に侵食によって水没します。今回のアルゴリズムによって、侵食がまだ少ないときに、島の種の数が島の年齢とともに増加し、中間の年齢でピークに達することを見つけることができました。