細胞認知科学の構築に向けて―概念的基盤の整備と科学的検証システムの開発
細胞現象を認知科学的観点から解明する「細胞認知科学」を構築するため、認知科学の概念的枠組みを拡張しながら、科学的に検証可能なシステムを開発する。
目的
細胞現象を「細胞の認知」という切り口から解明する「細胞認知科学」の構想をまとめあげ、実現に向けた準備をおこなう。この目的のために、以下の2つの下位目標を立てる。
(1)認知科学における理論的アプローチの多様な展開や生命科学・情報科学などの諸分野の発展に伴い生じている認知現象の候補の増大に対して、「認知」の概念整備は追いついていない。これが、「細胞の認知」という表現が多くの研究者にとって奇異に感じられる理由の一つである。本研究プロジェクトでは、認知科学における「認知」の用法を再検討し、近年認められつつある多様な認知現象の一種として細胞現象を理解するための概念的基盤を整備する。
(2)そうした概念的基盤の上に「細胞認知科学」を打ち立てるためには、科学的に検証可能な方法論が欠かせない。必要なのは新規データの創出ではなく、多様な表現形態で散在する既存データの接続方式の確立である。本研究プロジェクトの前身となる研究プロジェクトで構築・活用してきた「細胞行動データベース(CBDB)」は、あくまでも自然言語で記述された細胞現象に関する知識集積体だが、これを計算機が扱える形式に変換することで、多様な細胞現象の客観的かつスムーズな比較・検証が可能となるシステムを開発したい。
内容
上記の2つの下位目標に分けて記述する。
(1)本研究プロジェクトは「認知」という表現を軸に整理しているが、それはあくまでも暫定的な措置であり、この表現法自体の是非が問われてしかるべきである。このほかにも「心」、「精神」、「意思」、「意志」、「意識」、「意思決定」などの様々な表現の候補が(日本語でも英語でも)存在する。こうした様々な表現の違いや諸科学分野における用法を確認することは、本研究プロジェクトの一部を成す。とはいえ、看板にとりあえず「認知」を掲げたのには理由があり、それは多様な研究アプローチを許容する、間口の広い研究分野として認知科学が確立しているからである。しかし、認知科学における「認知」の用法もじつは一枚岩ではなく、多様な研究の進展に応じて歴史的に変化し続けている。それゆえ、認知科学や関連分野における表現や概念の再検討も本研究の射程内にある。
(2)上記の「細胞行動データベース(CBDB)」の内容を計算機で処理可能な実行可能規則へと変換する。まずはCBDBの既存構造を活用し、英語による中間表現(IR)を記載することで、日本語→IR→英語規則文の変換を可能にする。IRへの変換には自然言語処理技術を補助的に活用し、その品質保証についてはCBDBの一部データを用いてLLM翻訳精度を評価し課題を抽出した申請者らの先行研究(宮田―佐藤ほか 2022)の知見を基に設計する。具体的には、①必須スロットの充足、②語彙のオントロジー照合、③不自然な矛盾の検出を機械的にチェックし、不確実な記録にのみ人手を介入させる。さらに全体の5%を無作為抽出して監査し、自動処理の精度を統計的に評価する。また、IRから得た規則をPhysiCell(オープンソースの多細胞システム解析ツール)に接続し、既知現象を小規模に再現して利用イメージを提示する。