配列を有効利用するために

簡易アノテーション付与サービス
Simple annotation services

種々のアノテーションを付与、エクセルや簡易DBのファイルで提供します。

Genome配列

•ゲノム配列に対する遺伝子予測

RNA-seq配列

•リード配列からContig配列を作成
•Contig配列からORF予測

既知蛋白質配列(NCBI-nr)へのBLASTによるアノテーション付与

•対象のTaxonomyノードを指定
•出力フォーマットを指定
•TOPHITリストを作成
•説明が付いている配列のTOPHITリストを作成

モチーフドメインによる機能予測データの提供

•Interproscanによるモチーフ・ドメインの網羅的アノテーションデータベース作
•COG,eggNOGによるOrtholog検索

Genome配列から遺伝子領域を予測する

真核生物の遺伝子予測
Genome配列から遺伝子領域を予測する

•エクソン、イントロンを予測し、遺伝子モデルの情報を出力します。
•予測転写配列(mRNA配列)と蛋白質配列を得ることができます。
•既知の転写配列情報やRNA-seqのリード配列があれば、予測精度を上げることができます。
•予測プログラムは、augustus(http://bioinf.uni-greifswald.de/augustus/)をパイプラインを作成していますが、ご希望の予測プログラムをご指定いただければ、できる範囲で対応いたします。

原核生物の遺伝子予測

•予測転写配列(mRNA、tRNA、rRNA)と蛋白質配列を得ることができます。
•予測プログラムは、Prokka(https://vicbioinformatics.com/software.prokka.shtml)とDFAST(https://dfast.nig.ac.jp/)を使用して2セット納品いたします。両プログラムとも、Webで配列を投入して予測データを得ることができますので、ご自分で予測データを手にいれていただくことは可能です。

RNA-seq コンティグ配列を作成する

二段階アセンブルで、できる限り長いContigを作成します。

BLASTによるアノテーション付与

•Taxonomyのノードを指定して、NCBI-nrの配列を絞り込みます。
•出力フォーマットは、2種類
•TAB区切り出力について、TOPHIT配列のリスト、および、説明文が付いている配列の中で類似性がもっとも高い配列のリストを作成します。

モチーフドメインによる機能予測データの提供

•STEP1: 検索対象となるProtein配列すべてを、1配列づつInterproscanに入力し、配列が持っているドメイン情報を出力します。
•STEP2: 全配列のドメイン情報を簡易DB(sqlite3)に格納します。
•STEP3: 特定のドメインを指定し、簡易DBを検索し、指定したドメインを持つProtein配列を抽出します。

※ドメインの指定方法
  複数のドメインIDを指定可能
  ドメインの位置関係を指定可能
  ゲノム配列がある場合は、ゲノム上の位置関係も指定可能

※本サービスは、岡山県農林水産総合センター 生物科学研究所 鳴坂義弘先生と共同開発したプログラム Ex-Domain を利用しています。