Deep Learning
Bioinformatics
口頭発表
マウス版Geneformer の構築と転移学習による細胞解析への応用
- Author
- 伊藤啓太, 平川翼, 山下隆義, 藤吉弘亘
- Publication
- データ工学と情報マネジメントに関するフォーラム(DEIM),2024
Download: PDF (Japanese)
Single-cell RNA-sequence 解析は,細胞1 つ1 つの遺伝子発現量を次元圧縮やクラスタリングなどの数理的な手法を利用して解析する手法である.この解析により,新規の細胞種や異常な遺伝子の特定が可能となった.Single-cell RNA-sequence 解析手法には,機械学習や深層学習の技術を用いた手法も存在し,深層学習の技術を利用した解析手法としてAttention ベースの事前学習モデルGeneformer がある.しかし,Geneformer は,人のSingle-cell RNA-sequence データを用いて事前学習を行っているため,ファインチューニング時に,マウスのSingle-cellRNA-sequence データを用いることはできない.そこで,本研究では,マウスのSingle-cell RNA-sequence データを用いて事前学習したモデルとしてマウス版Geneformer を構築する.これにより,従来解析手法よりも高精度に細胞型の分類を行うことが可能であることを示す.また,in silico 摂動実験により病気の原因遺伝子を同定することが可能であることを示す.