スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

ヒトプロテオームのドラフト版が公開

1995年に始まったヒトゲノムプロジェクト以降、大規模なデータを生み出し、データベースを作って他の研究者に役立ててもらうというタイプの研究が増えました。ヒトゲノムプロジェクトのほかにもヒトエピゲノム、ヒトマイクロバイオームプロジェクトをはじめ、アメリカのENCODEや理研のFANTOMなどビッグデータを生み出した(出している)プロジェクトがあります。今回、ヒトプロテオームに取り組んだ2つのグループの成果のドラフト版が発表されました。

方法はどちらも基本的には同じ。様々な組織、培養細胞からタンパク質を抽出し、トリプシン(タンパク質分解酵素)でペプチドにし、質量分析装置でペプチドの配列を決定していくというもの。ここでは2つのグループのうち1つに注目したいと思います。今回の研究では19,629個と考えられているタンパク質のうち92%に相当する18,097個、アイソフォームでは86,771個中19,376個を検出できました。染色体ごとにみてみると、Y染色体と21番染色体のタンパク質はあまり検出できませんでした。これはトリプシンが効かないタンパク質が多いためと考えられます。以前からタンパク質として存在することが確認できた遺伝子の97%はタンパク質として検出できました。しかし、予測のみとか不明なものは半分程度にとどまり、予想される長さよりも短いものでした。これを調べていくと翻訳されないlincRNAと思われていたところに由来しており、lincRNAが転写されペプチドが作られているものと思われます。
プロテインシーケンスをしていくと、だいたい16,000-17,000個ぐらいで飽和してきます(ユニークなタンパク質が検出されにくくなるという意味)。そのうち10,000-12,000個は様々な細胞でみられ、細胞維持等に使われるもので、残りが細胞特異的な制御をおこなうものでした。今回検出できなかったタンパク質は偽遺伝子であった可能性や、サイトカインのように細胞外に排出されたものであると考えられます。今回は様々なサンプルがあるため、その発現比較を行いました。当然ながらGAPDHのようなハウスキーピング遺伝子はほぼすべての細胞で発現しており、組織特異的なものは特定の組織でしか見られませんでした。PCAを行うと、組織ごとに分類できました。
さらに他のデータとも比較していきました。RNA-Seqと比較すると、mRNA量とタンパク質の量は遺伝子ごとに違いましたが、どの組織でも遺伝子ごとにmRNAとタンパク質との比率はほぼ一定であり、その係数さえ分かればmRNA量からタンパク質の量を予測するのは可能みたい。がん細胞における抗がん剤に対する感受性と耐性を調べていくと、S100A4やANXA6の発現が高いとEGRF阻害剤に対する耐性がある傾向がありました。タンパク質は他のタンパク質と複合体を作って機能を発揮することも多いため、複合体の構成を調べることができるかproteasomeを例に調べてみました。この例ではb1-b7という7種のタンパク質のうち、b1i,b2i,b5iに置き換わる場合があります。発現相関解析を行うと、通常のものとそうでないものがどのくらいあるか知ることもできました。

今回紹介しなかった論文でも似たような結果が示されています。個人的にはペプチドを作るlincRNAの存在、mRNAに遺伝子ごとの定数をかければタンパク質量が見積もれると言うのは興味深い。この論文では翻訳後修飾のデータは不十分のようですが、今後増えていくでしょうから期待したいですね。

元の論文
Mass-spectrometry-based draft of the human proteome(今回紹介した論文)
A draft map of the human proteome
スポンサーサイト

コメントの投稿

非公開コメント

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。