人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

多重配列アラインメントについてです。

情報科学を専攻しているものです。
最近ひょんなことから多重配列アラインメント(multiple sequence alignment)の研究をすることになったのですが、
バイオ系のことをさっぱり知らないので、どんなデータに対して、どういう評価値に基づいて
実験、解析を行えばいいのかがさっぱりわかりません。
とりあえず線形的なコストの最適化問題として解こうとは思っているのですが。。。

そこで、多重配列アラインメントを実験するときにはどのようなデータに対して、
どのように実験すればいいのかが分かる情報があれば教えていただきたいです。
この分野の教科書か、先行研究のサーベイなんかもあれば教えていただけると助かります。

●質問者: kabisuke
●カテゴリ:コンピュータ 学習・教育
✍キーワード:コスト サーベイ データ バイオ 価値
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● km1967
●20ポイント

バイオインフォマティクス基礎講義―一歩進んだ発想をみがくために

バイオインフォマティクス基礎講義―一歩進んだ発想をみがくために

  • 作者: アーサー・M. レスク
  • 出版社/メーカー: メディカルサイエンスインターナショナル
  • メディア: 単行本

◎質問者からの返答

わかりやすそうですね。探してみることにします。ありがとうございます。


2 ● tak
●50ポイント ベストアンサー

ClustalW

たぶん後で実際に実験することになるので、

local-multiple-alignmentのアルゴリズムを実際に見てみるべきです。

バイオ系のことをさっぱり知らないので

多重配列アラインメントの研究をするだけ、であるとするなら

対象はバイオインフォマティクスには限らないのですが

こう言っている以上、多分そのようなことをやるのだと思います。



どのようなデータに対して、どのように実験すればいいのか

様々な人が様々なデータに対して先行研究を行って実験用コーパスもたくさん作られていたので、その中には自由に使用できるコーパスがあったはずです。

local multiple alignment corpus

◎質問者からの返答

詳しい回答ありがとうございます。

すみません、説明不足でした。

「多重配列アラインメント」という問題自体に興味があって行うので、

バイオインフォマティクスに限るつもりではないのですが、

実験にあたっては実用上のインパクトを考えて研究者で

良く用いられるコーパスを用いた方が良いのではないかと考えています。

このClustalWというのは実際にアラインメントをつくってくれるツール(?)みたいですね。

この業界では評価関数でよく用いられるものというのがあるんでしょうか。

見た感じヒューリスティックで近似解を求めているように見えますが。。。

(まずは厳密アルゴリズムから考えてみたいと思っていたのですが)

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ