京都大学iPS細胞研究所などの研究グループは、目的の機能と構造をもつ人工RNA設計を支援する世界初の深層生成モデル「RfamGen」を開発しました。
RfamGenは、変分オートエンコーダ(VAE)と共分散モデルを組み合わせたモデルです。
VAEは深層生成モデルで広く用いられる手法の一つで、入力データの特徴を分布として学習し、その分布から新しいデータを生成することができます。
共分散モデルは、RNA配列と二次構造の情報から機能性RNAを分類することのできるモデルです。
研究グループは、RfamGenを用いて特定の機能と構造の特徴をもつRNA群の特徴を学習し、人工配列を生成しました。
コンピュータ上の解析と生化学実験の結果、RfamGenによって生成されたRNA配列は学習したRNA群と相同な構造と機能をもつことが確認されました。
また、RfamGenによる生成配列のRNAを大規模に合成して網羅的にその活性を検証したところ、生成配列のRNAは天然のRNAよりも高い活性を示す傾向もみられました。
RfamGenの学習結果を調べたところ、入力データのRNA群の二次構造や機能性のモチーフなどのバリエーションを、入力データの特徴の分布として効果的に集約していました。
これにより、研究者が利用したいRNAの特徴をカスタマイズして、配列を生成することが容易になります。
RfamGenにより、人工知能支援型のRNA設計が可能となります。
これにより、従来のRNA設計と比較して開発コスト削減と高速化が実現し、核酸医薬や遺伝子治療などのRNA創薬の研究開発に貢献することが期待されます。
機能性RNAの配列設計を支援する深層生成モデル”RfamGen”の開発