推奨ブラウザ: Firefox 63.0以降、Google Chrome 70.0以降。android版ブラウザでは一部表示に問題が出る可能性があります。

GOエンリッチメント解析

遺伝子リストの性格を概観する

logo

ある特定の条件下で(たとえば、ガンの患者においてのみ)顕著に発現している遺伝子が幾つか見つかったとします。

こうした遺伝子がどのようなことに関連しているのか? 当該の遺伝子リストの中にどのようなタイプの遺伝子が多く含まれているのか? これらを調べ、遺伝子リストの性格を概観することは、発ガンのメカニズムを解明したり治療法を見出したりするための重要な参考となることでしょう。

オントロジーを利用したエンリッチメント解析は、このような目的に有効です。

GOエンリッチメント解析の背景

Gene Ontology

Gene Ontology(GO) とは、遺伝子の機能に関する概念を定型的に整理したものです。

まず、それぞれの概念を明確に定義され、その概念の一つ一つについて正式な「用語(GO term)」と番号(GO ID)が対応付けられています。対象とする概念には、「metabolic process」のような包括的な概念から「negative regulation of TORC2 signaling」のようなより細かい概念までが含まれます。

さらに、GO term同士の関連性にもとづき両者の間に「親子関係」が定義されています。すなわち、包括的概念に相当するGO Termには、より細かい概念に相当する多くの「子」に相当するGO Termが存在し、それらは更に細かい概念に相当するGO Termの「親」となっています。全体として約45000のGo termからなるネットワークが構築されています。

遺伝子アノテーション

主要な生物種に関しては、遺伝子IDがGO termと関連付けられています。遺伝子の一つ一つに「注釈付け(annotation)」が行われ、当該の遺伝子がどのような遺伝子産物をコードし、どのような機能に関与しているかの情報が付け加えられ、その情報に対応するGO termが付与されているのです。この成果はデータベース化されて公開され、研究者が自由に使えるようになっています。

解析手法・お渡しできるデータ

弊社では、統計処理用言語Rとエンリッチメント解析用パッケージGOstatsを組み合わせ、Ensemble Gene IDとGO IDを紐づけしたアノテーションデータを用いてGOエンリッチメント解析を実行する環境を整えております。

現時点ではヒト・マウスに対応しています。これ以外の生物種についても承れますが、納品までに相当のお時間を戴く場合や、限定的な解析しか出来ない可能性があります。詳しくはご相談ください。

お客様から頂いた遺伝子リスト(任意の方法で得られたEnsembl Gene IDのリスト。発現変動解析のご依頼を頂いた場合はその結果をそのまま利用できます)をもとに解析し、結果は2種類のファイルの形でお渡しできます。

結果をどうみるのか

まずはページ冒頭の図をご覧ください。数字の入った丸が矢印で繋がっていて、矢印はだいたい下へ下へと伸びていますね。この図は、エンリッチメント解析の結果として抽出されたGene Term同士の関係性を概観するためのものです。

まず、丸の中に入った数字は、以下のようにGO Termと対応しています。図の頂上に位置するのはGO:0000790=nuclear chromatinというわけです。黄色に塗りつぶされた番号が、エンリッチメント解析の結果としてリストアップされたGO termに対応しています。矢印の先にある番号は、元にあるGO Termの「親」にあたるGO Termに対応しています。GO termの親子関係の連鎖を辿れるように、解析で出てこなかったGO Termをも含めたグラフが描かれています。

グラフと表を見比べてみると、どうやらここで例示した研究では、筋収縮に関連する遺伝子をピックアップできたようですね。

No.GOIDTerm
1GO:0000790nuclear chromatin
2GO:0033017sarcoplasmic reticulum membrane
3GO:0005743mitochondrial inner membrane
4GO:0000785chromatin
5GO:0044454nuclear chromosome part
6GO:0035976transcription factor AP-1 complex
7GO:0005861troponin complex
8GO:0031430M band
9GO:0030018Z disc
10GO:0005859muscle myosin complex
11GO:0005789endoplasmic reticulum membrane
12GO:0014802terminal cisterna
13GO:0031966mitochondrial membrane
14GO:0044427chromosomal part
15GO:0000228nuclear chromosome
中略
76GO:0097458neuron part
77GO:0042995cell projection
78GO:0031975envelope
79GO:0005622intracellular
80GO:0005911cell-cell junction
81GO:0044464cell part
82GO:0099080supramolecular complex
83GO:0030054cell junction
84GO:0005623cell
85GO:0031974membrane-enclosed lumen
86GO:0005575cellular_component
logo