種別 シンポジウム 提案者 長谷川英祐(北大院・農・生物生態体系)、 三中信宏(農環研・地球環境・環境統計)minaka@affrc.go.jp 趣旨 塩基配列データが系統解析に普通に用いられるようになり、様々な配列データとその挙動に関する情報の蓄積が進みつつある現在、ベイズ法など新たな解析法の出現や、既存の主要な方法が抱える問題点もあらわになるといった、系統推定をめぐる様々な話題には事欠かない。一方、形態形質からいかにより合理的な系統推定を行うかについての検討も不十分なまま残されている。このシンポジウムでは、塩基配列・形態データから系統推定を実行するにあたり、研究者が頻繁に直面するいくつかの問題とその対応、より正確な系統推定のための新たなアプローチについて、最新の話題を提供し、進化学の研究上不可欠になりつつある系統推定を、いかに早く、正確に行うかについて議論したい。 講演予定者と講演タイトル
- 「マルチスケールブートストラップ法による系統推定の信頼性評価」
○下平英寿(東京工業大学)
最尤法,距離行列法,最節約法などさまざまな系統推定法が用いられているが,配列データに含まれる情報量は有限であり,データのバラツキが影響して,どのような推定法も100%正しいとは言えない.そこで推定の信頼性を確率値で数値的に評価することが一般に行われている.特に最尤法ではKH検定やSH検定が用いられ,またMCMC法によるベイズ事後確率の計算も最尤法の信頼性評価とみなせる.より一般的な評価法としてはブートストラップ法が広く用いられている.本講演ではこれら信頼性評価法の互いの関連を数理的および実際のデータ解析を通して明らかにする.さらに近似的に不偏な確率値を計算するために最近開発されたマルチスケールブートストラップ法を紹介する.本手法は,従来のブートストラップ法が適用できる問題には直ちに利用可能である.- 「巨大系統樹の推定のために:最節約法に基づくスタイナー樹の高速計算アルゴリズム」
○三中信宏(農環研)
系統推定に用いられる形質データのサイズがますます巨大化する傾向が強まってきた.形質数だけでなく,端点(OTU)の数が増大するとともに,最節約法や最尤法のような最適性基準(目的関数)による系統樹の離散最適化を行なう手法では,いかにして効率的にかつ高速に最適系統樹を計算するかという問題がつねに直面することになる.とりわけ,計算複雑性の点でもはや完全探索が不可能である以上,発見的探索のためのアルゴリズムを高速化する必要がある.いま開発を進めている系統スタイナー樹アルゴリズム〈Bogen〉は,端点数1万個に達するケースにも対応できるように,許容し得る計算時間内で最節約系統樹を探索するアルゴリズムである.今回は,このアルゴリズムを紹介し,巨大系統樹計算について論じる.- 「データの価値を最高に! -最高法:新たな樹形推定アルゴリズム-」
○長谷川英祐・吉澤和徳(北海道大学大学院農学研究科生物生態学体系学講座)
現在用いられている系統推定法は、データセットが持つ系統情報を限界まで取り出すことができているのだろうか?もちろん答えは「否」だ。今回の講演では、データセット内の各座位が系統樹のどの深さの分岐に関する情報をもつのかを、「ステップ数」と呼ぶ新たな概念を用いて推定し、それに基づくデータ分割から推定精度の高い末端部分木から順次固定し、従来収斂としてしか扱えなかった情報をその両側の樹形推定に用いる、という新たな樹形推定アルゴリズム(最高法)を提案する。この方法は、樹形全体の最適化を行う従来法が苦手とする、収斂を多く含むような「汚いデータ」で効果が高いと考えられ、また、部分木の固定により探索空間を劇的に減らせるため、最尤法等で問題となる探索時間の短縮化が可能である。講演では、最高法の原理を説明し、塩基・形態形質双方について、シミュレーションと実データを用い、その有効性を検討する。