syn-evo(-devo)

合成生物学、進化生物学、発生生物学に興味があります。(プロフィール写真は架空の人物です。)

定例会 2022/1/22(ITAI YANAI FANCLUB)

新年3回目の輪読会はAとCが紹介を担当しました。

今回Aが紹介した論文は、最近A~Dが揃って注目しているNew York UniversityのYanaiラボによる精子形成過程での遺伝子発現の役割に関する研究で、タイトルは"

Widespread Transcriptional Scanning in the Testis Modulates Gene Evolution Rates

"です。

www.sciencedirect.com

精巣は他の臓器に比べて非常に多くの遺伝子が転写されていることが知られており、例えばヒトの精巣では全タンパク質コード遺伝子の80%以上が転写されていると報告されています。しかし、多くの精巣特異的に発現する遺伝子をノックアウトしても生殖能に影響がないことや、そもそも転写量と翻訳量が必ずしも相関しないことなどから、なぜこのような発現が起きるのかは謎のままでした。この研究では、この精巣での転写の進化的意義を解析するため、精子形成過程で転写されている遺伝子とそうでない遺伝子の変異速度の網羅比較しました。これにより、転写によってDNA修復が誘導されて変異速度が減少する現象、"transcriptional scanning"を発見しました。興味深いことに、精子形成過程での転写が起きない遺伝子には高速に進化することが知られる環境応答や生体防御のための遺伝子が多く、transcriptional scanningが遺伝子ごとの進化速度の調節に寄与する可能性が見出されました。

 

主な結果の要約

  • Fig. 1 ヒト精巣のシングルセルトランスクリプトーム解析により、精子形成過程の各ステージで発現する遺伝子を網羅的に同定した
  • Fig. 2 1000 genome projectのデータを用いてヒト集団内でのSNV (single nucleotide variants)を解析することにより、精子形成過程で発現する遺伝子は発現ステージや遺伝子機能に依らず、発現しない遺伝子よりもSNVの数が少ないことを発見した。これはDNA修復メカニズムの一つであるTCR (Transcription-coupled repair)が誘導されるためだと考えられた。
  • Fig. 3 もしTCRが関与しているならば、変異速度はDNAのストランドごとに異なるはずである(TCRはtemplate strandにおいて高頻度で起きるため)。そこで遺伝子ごとにtemplate strandとcoding strandに分けてSNV頻度を解析したところ、予想通りにSNV頻度がストランド間で偏っていることが示された。この結果からTCRが関与しているという仮説が強く支持された。
  • Fig. 5 精子形成過程で発現する遺伝子の発現量は遺伝子ごとに異なる。そこで遺伝子の発現量とSNV頻度の関係を調べたところ、興味深いことに発現量が上位1%程度の遺伝子ではSNV頻度が発現しない遺伝子と同程度であることがわかった。これはTCD (transcription-coupled damage)によると考えられた。Coding strandとtemplate strandに分けて解析すると、確かにTCRが働きにくいcoding strandでは発現量が高いほどSNV頻度が高い傾向が見出された。
  • Fig. 7 精子形成の過程で発現しない遺伝子がどのような機能の遺伝子に多いのか調べるためGene Ontology解析を行ったところ、detection of stimulus, defence response, immune responce, response to bioticstimulusなどにエンリッチしていることがわかった。これらの遺伝子は環境変動や軍拡競争の過程で高速に進化すると考えられる遺伝子であり、transcriptional scanningが起こらないことが高速な進化を助けていると考えられた。

遺伝子発現が進化に影響を与えるという大胆なアイデアと、それを裏付ける緻密な実験データで一同面白い!となりました。上述しませんでしたが、自然選択が今回の結果に影響する可能性を排除するためにde novo mutationの解析を行ったり、他の生物でも共通であることをマウスで検証したりなど、丁寧な研究で唸らされました。ヒトとマウスだけでなく脊椎動物全体などで比較した時にどうなるのか気になります(現状SNVデータが限られますが。。)。

 

CもYanaiラボからAlternative polyA siteをスクリーニングした研究"Gene expression dynamics are a proxy for selective pressures on alternatively polyadenylated isoforms"を紹介しました。

academic.oup.com

シングルセルRNA-seqに代表されるポリAキャプチャ型のRNA-seqではRNAの本当の3'末端が捕捉できる一方、そこをシーケンシングで読み取る際ポリA(T)領域を通過しなければならないため、シーケンシングクオリティが担保できない問題がありました。今回彼らが提唱したAPA-seq法ではそこを解決し、Poly Aサイトの使い分けと発生との関係性を議論しました。

 

要約

  • 今回開発したAPA-seq法(正確にはシーケンシング手法ではなく解析アルゴリズム)では、リードごとに5'末端から読まれたcDNAリードの下流配列を抽出し、その配列をリファレンスとして逆側から読まれた同じリードのバーコード+polyT下流配列をマッピングした。本来PolyT以降の配列はクオリティが低く使い物にならないが、カスタムリファレンス配列を設定することでマッピングが可能になった。
  • この解析パイプラインを用いて既存の発生段階別のC. elegans RNA-seqデータのポリAサイトを遺伝子ごとに予測した。この結果、発生の進行とともに短い3'UTRアイソフォームが長いアイソフォームに比べ多く使われるようになる傾向が認められた。
  • 更に詳細に発現プロファイルを見ると、アイソフォーム間の発現量の時間変動が相関し、それが全体の発現量の変動とも相関するタイプの遺伝子highly correlated isoforms (HCI)と、アイソフォーム感で発現パターンが相関せず、全体の発現量は時間とともに変動しないように見えるタイプの遺伝子lowly correlated isoforms (LCI)が検出された。
  • LCIでは時間とともにアイソフォームが使い分けられていることが示唆されるため、その意義を検討した。3'UTRはmiRNAのターゲットを多く含み調節を受けることが知られており、LCIはmiRNAによる調節を受けている可能性がある。そこで配列解析を行ったところ、LCIはHCIやAlternative polyA siteを持たない遺伝子よりもUTR長が長く、その分miRNAのターゲットを多く含むことが分かった。
  • さらに時系列のmiRNA発現データを参照すると、miRNAの発現と連動してそのターゲットである遺伝子の長い方の3'UTRアイソフォームが抑制され、短いアイソフォームの発現が活発になる傾向が観察された。

先のCellの論文と比較するとインパクトには劣るかもしれませんが、一工夫すると3’末端が読めそうだという発想から時系列でのアイソフォームの使い分けの検討、配列解析に基づくmiRNA調節仮説の提唱と、力強い話の展開で非常に楽しめました。Itai Yanai氏は自身のポッドキャストで大胆な仮説の提唱と多角的な検討の意義ついて様々な研究者と議論しており、論文からも研究者としてのカラーが垣間見えます。

open.spotify.com

ちなみに自分が最も衝撃を受けたItai Yanaiの論文はこれです。普通の時系列RNA-seqの論文だと思って読んでいたら超絶展開に腰を抜かしました。

www.nature.com

研究者の中にはこういったスタイルを好まない人もいそうですが、読んでいて刺激的なので我々は大ファンです。