遺伝子の発現量を調べる方法として、DNAチップ(or マイクロアレイ)やSAGE(セイジ)という方法があります。前者はチップ上でDNAを化学的に合成するか(DNAチップ)、抽出したcDNA断片(マイクロアレイ)をチップ上に貼り付けて、cDNAを蛍光ラベルしたものをそれとハイブリダイズさせるという、hybridization-basedな方法です。
 それに対してSAGEというのはcDNAの数十bp程度の短い断片を連結させてコンカテマーを作り、それをシーケンサで解読するというsequencing-basedな方法です。シーケンスできる塩基長はこの手法が開発された当時は数百bpくらいで、数十bpというcDNA断片の長さとは開きがあったので、またクローニングにも手間と労力がかかったので、一度に複数のcDNA配列を読むためにこのようなコンカテマーを作製しましたが、今ならシーケンシング能力も上がっているのでそのような複雑な作業をする必要はないと思います。以前分子生物学的研究を行ったことがある方にお伝えしますが、次世代シーケンシング以降の機械ではDNAを大腸菌でクローニングする必要はありません!方法はいくつかあるとは思いますが、例えば454というシーケンサでは油滴に1分子の鋳型のみが取り込まれるような濃度にDNAを希釈してPCR増幅を行い、1つの油滴には1種類の鋳型DNAのみが大量に含まれるようにします。

 SAGE法は15年以上の歴史があるいささか古い方法なのですが、決定的ないくつかの点でsequencing-basedなSAGE解析はhybridization-basedなDNAチップ解析よりも優れていると思います。
 1つはノイズの問題です。ハイブリダイゼーションを行った場合は本来のシグナルに加えて、別の良く似た配列が誤ってハイブリダイズしてしまったことによるノイズが必ず生じます。シグナルとノイズを画像上で見分けることは通常不可能ですが、シーケンスデータであれば、1塩基の違いを区別することが可能です。
 もう1つは結果のサイズの問題です。sequencing-basedな方法によって得られた結果は例えばExcelのスプレッドシートのような形で容易に持ち運ぶことが可能で、結果のコンピュータ処理も簡単です。しかしながらhybridization-basedな方法によって得られた結果は巨大な画像データでそのままではコンピュータ処理することができません。
 これは私が理解できないだけかも知れませんが、DNAチップの結果データの1つにクラスタリング解析というものがあります。これは消長のパターンが似通った遺伝子同士を系統樹などにまとめたもので、論文の図にするのにちょうど良いサイズとなっています。でも、私にはこの図は「実験をやったぞ」という以上の意味は乏しいのではないかな、消長のパターンが似ているからと言ってそこから何か新たに導き出されたものはあったのか?と思えてしまうのです。

 統合TV(http://togotv.dbcls.jp/)というwebページがあります。主催している坊農先生は巨額の科研費を投じて得られたデータなのだから、DNAチップの画像データを統合してwebサーバに保管しようと呼びかけています。その志は非常に高いと思うのですが、私は今後hybridization-basedの発現解析のデータを大学院生やポスドクが使うことはまずないと思います。webサーバの維持や管理にかかる労力を考えるとどうもお金の無駄遣いになるように憂慮しています。しかしながら、坊農先生が推し進めているもう1つのプロジェクトの「大学の講義をネット配信する」という試みは素晴らしいと思います。将来的にbioinformaticsの講義のみではなく、すべての分野で大学の講義がネットで聴けるようになったら素晴らしいなと思います。
 坊農先生は以前バイオインフォマティクスの入門書を書かれ、その中で例えばblastというシーケンシングアラインメントソフトウェアのインストール法と立ち上げ方を解説しておられました。私が思うにこれも素晴らしい活動で、全ての生物学研究者がオフラインで、自分自身でアレンジしたデータベースに対するローカルのblast検索ができるようになれば良いのになあと思います。blastというプログラムをご存知でない方もおられると思うので簡単に解説すると、非常に高速な(Google検索を思い浮かべてくれたら良いです)配列検索プログラムです。私はこのプログラムを開発したアルツールやリップマンという人はノーベル医学生理学賞の受賞対象となってもおかしくないのでは、と何度も言っているのですが私の知る限りではそういうことを言っておられる方は誰もいません。。

 

←発生と遺伝   →「発生と遺伝」の補足

ホームページへ