因子分析という手法を使ってみた経緯ははっきり覚えていません。多変量解析の方法を調べていて見つけたのだと思います。因子分析と似た手法に主成分分析という方法があります。計算結果は似たものになるのですが、元になる考え方は異なります。
因子分析は 「何らかの因子」(原因)→「観測されるデータ」(結果)ですが、主成分分析は「観測されるデータ」(原因)→「主成分」(結果)であって、因果関係は全く逆です。今回の解析は、原因=因子=Th1/Th2/Th17という培養条件 であり、結果がmRNAの量 なので、行うべき解析は因子分析ということになる、と私は考えました。しかし当時、私が目にするような生物系の論文で因子分析はあまり使われていなかったのです。元々は心理学の分野で開発された手法のようです。因子分析をやってみようと思っても、どこから手をつけたものか、よく分かりません。
ここで見つけた本が ①「マンガでわかる統計学[因子分析編]」(オーム社)でした。この本は分かりやすかった・・・(マンガである必要があったのかは疑問ですが、マンガを抜いたらペラペラのパンフレットみたいなものになって、書籍として成立しなかったかもしれません)。特に、主成分分析の例にあがっていた、「人気ラーメン店のレビュー(麺・スープ・具)の分析」は出色でした。それぞれの店を分類することもできて、またラーメンの要素(麺・スープ・具)も分類することができるのです。まあ単に私がラーメン好きなだけかもしれませんが・・・。今回の解析では(因子分析ですが)、店の名前がたとえばTh1 day1とかTh17 day3になります。要素は転写因子のmRNA量ということになります。
この本の弱点は私にとっては2点ありました。1つはマンガの絵柄が、何というか秋葉原系な印象で、電車などでは読めないことです。いや、読んでもよいのでしょうが、相当恥ずかしいことは請け合いです。もう1つは、英語の論文を書こうとしたらこの本だけでは無理(日本語で書かれているので対応する英語がよく分からない)だということです。この本だけで書こうとしていたのか!と言われそうですが、それは不可能であることはすぐに分かりましたので②An easy guide to factor analysis (Paul Kline)という本も読みました。この本がどれほど良い本なのかは判断できませんが、①の後で読むと本当に分かりやすいと感じました。
(図) 因子分析の結果。Maf(青)がRorc(赤)の近傍に位置することが分かる。Mafに対応するプローブがこのGeneChipには複数搭載されていた。そのため青丸も複数になる。Rora(黄)も同様。
佐藤 浩二郎
私的免疫学ことはじめ (40)← Prev Next →私的免疫学ことはじめ (42)