

【IT】情報では、情報通信技術に関する最新情報などをタイムリーに紹介していきます。
|
ご意見・ご感想をお寄せください。サイトの改善に役立てようと思います。心よりお待ちしています。
>> メールはこちら
|
|
|
国内外生命科学分野、約30万の分散データベース群から高速検索
【IT】発信:2008/04/30(水) 09:17:32
|
理化学研究所ゲノム科学総合研究センター・オミックス情報統合化研究チームの豊田哲郎チームリーダーらは、国内外の生命科学分野の公開データベースをもとに約30万個に細分化した分散データベース群を高速に統合検索できる検索エンジン『GRASE』を開発した。この技術を用いたウェブ検索サイト『PosMed』(URL)は、無料で利用できる。英国科学雑誌『Bioinformatics(3月28日付け・オンライン版)』に掲載された。
現在、ゲノム解読技術の向上などから、解読される遺伝子情報の蓄積量は急激に増加している。生命科学分野の遺伝子情報は、今後も増加傾向が続くと予想されており、それら情報資源を適切に保全し、有効利用することが求められている。
理研では、国内外の文献情報やゲノム情報、生体内分子ネットワーク情報等の公開データベース群を収集。これらを遺伝子や代謝物、薬物などのトピックに細分類化した個別データベース約30万個を試験的に構築した。
さらに、必要な情報を含んだデータベースを簡単に探すことができる『GRASE』を開発。これは、数十万個の各データベースについて2次元集計表を高速で算出して、各集計表を統計検定することで、各データベースが検索キーワードを有意に含んでいるかを調べ、検定結果に基づき関連性の高いデータベース群を瞬時にランキングするもの。年代を区切って2次元集計表を作成できることから、時代毎のトレンドを解析することも可能だ。
この技術を使った『PosMed』は、入力したキーワードから関連性の高い遺伝子を順番に表示したリストを作成できる。検索条件で染色体領域を指定した場合は、その中に含まれる遺伝子だけでランキングを行うことができる。さらに、代謝物―遺伝子、薬物―遺伝子など様々な生体内相互作用情報が登録されていることから、キーワードから“機能”と“遺伝子”を網羅的に結びつけることができる。キーワードは基本的に英語入力で、日本語の場合は医学用語のみ検索可。
すでに同センターでは、この検索サイトを用いて、エチルニトロソウレア(ENU)変異マウスの研究で、60以上の遺伝子変異を同定している。今後は、検索対象となる個別データベースが数千万個以上に増加しても高速検索ができるように、GRASEの拡張を行っていくという。(科学、4月11日号2面)
|
| |
知財情報局または情報提供各社による記事の無断転用を禁じます。
|
|
|
| Copyright 2002 Braina Co., Ltd. All Rights Reserved.
|
|