記事ID ： 34696

SIRVs ‐ Spike-In RNA Variant Controls

カテゴリから探す > 分子生物 > DNAシーケンシング > 次世代シーケンシングキット

メーカー名：Lexogen GmbH

RNA シーケンス解析（RNA-Seq）は様々な研究プロジェクトにおいて、非常に効果的なトランスクリプトーム解析ツールのひとつであり、近年では、臨床診断や治療への応用が期待されています。このようなアプリケーションでは、再現性・信頼性の高い結果を得て、適切な情報提供が求められます。マーカーやコントロールの使用は、データの信頼性を正確に判断するための重要な要素です。Lexogen 社のSpike-In RNA Variants（SIRVs）はRNA シーケンス解析の質およびコンパラビリティの評価に有用です。

特長

RNA シーケンス解析の質とコンパラビリティを評価するためのユニバーサルマーカーとして使用可能
RNA シーケンス解析のワークフローの評価、エラーの原因やバイアスの同定、ライブラリ作製からデータ解析までのワークフローの最適化にお勧め
様々なシークエンスプラットフォームや様々な生物種の解析に対応
アイソフォーム、濃度、RNA 鎖長の複雑性を表現（アイソフォームモジュール、ERCC モジュール、 Long SIRV モジュール）
用途によって、4 種類のセットをご用意

ワークフロー

Spike-In RNA Variant（SIRV）Control は、トランスクリプトームの複雑性を模した人工的な転写産物のセットで、試料（組織や細胞の溶解液、精製RNA）に添加し使用します。SIRVsは最終的なシーケンスリードのうち1-2% を占めます。SIRVsを使用することで、RNA シーケンス解析パイプラインや、サンプル調製毎の手技的ノイズを評価するための正確性や精度といった値が得られます（図1、Evaluation）。実験間での整合性はこれらの値や変動係数（CoD）によって算出されます（図1、Comparison）。

図.1 RNAシーケンス解析におけるSpike-In RNA Variant（SIRV）Control の利用
Spike-In RNA Variants（SIRVs）を試料に少量添加し、ライブラリ作製を行う。用いた試料のゲノムとSIRV にリードをマッピングした後、SIRV コントロールのデータを基準として、解析データを評価する。RNA-Seqワークフローの評価により、バイアスや盲点が明らかになります。また、このコントロールのデータは、作製したライブラリが様々な解析に使用可能な精度か否かの判断基準となります。

デザイン

モジュールコンセプト

RNA spike-in control として、アイソフォームモジュール、 ERCC モジュール、long SIRV モジュールを利用可能です（図2）。

図.2 各 SIRV モジュールのアイソフォーム、転写産物量、鎖長
SIRV アイソフォーム Mix E0 は SIRV 転写産物が等モルで混合されており、アイソフォームの複雑性を表現しているが、ERCC とlong SIRVは1遺伝子について1アイソフォームのみ含まれ、転写産物量や鎖長の複雑性を表現している。
（注）SIRV-Set1には、SIRVアイソフォームが異なるモル比率で混合されている。 Mix E1（～ 8 倍）、Mix E2（～ 128 倍）

アイソフォームモジュール

SIRV アイソフォームモジュールは、ヒトの7つのモデル遺伝子に由来する69種類の転写バリアントから成り、トランスクリプトームの複雑性を模しています（図 3）。このモジュールは選択的スプライシング、選択的な転写開始 / 転写終結、重複遺伝子、アンチセンス転写産物等を反映しています。 6 種類または 18 種類の転写バリアントを用いることで十分なアイソフォームの複雑性を生み出し、厳密な RNA シークエンスワークフローを可能にします¹。また、SIRV アイソフォームは、異なるシークエンサーや解析パイプラインを用いて作成したデータの整合性の評価にも利用されています²。 SIRV アイソフォームは SIRV 転写産物が等モルで混合されている Mix E0、異なるモル比率で混合されている Mix E1（～8倍）、Mix E2（～ 128 倍）で構成されています。

図.3 SIRVs のデザイン
SIRV1 から SIRV7 はヒトモデル遺伝子を模倣しており、主要な選択的スプライシングや転写を表している。7 種類の SIRV アイソフォーム遺伝子と 92 種類の ERCC遺伝子を人工的な染色体“SIRVome”として示す。SIRV3 を拡大し、11 種類の転写バリアントを緑色で示す。灰色で示した転写バリアントは他の評価法のための追加アノテーションである。ERCC モジュールは、1 遺伝子 1 転写産物のコンセプトで 106 のダイナミックレンジをカバーする。long SIRV には 5 つの長さのカテゴリ（4 kb, 6 kb, 8 kb, 10 kb, 12 kb）それぞれに 3 つの異なる転写産物が含まれる。

ERCC モジュール

ERCC モジュールは、外部 RNA 標準コンソーシアム（ERCC）により開発された重複のない 92 種類の人工的な転写産物です。ユニークな配列特性から、ERCC コントロールはアイソフォームに関わりなく各種パラメーターの評価に最適です。 ERCC Mix 1 は 220（106）のダイナミックレンジをカバーしており、幅広い転写産物濃度に対応しています^{3, 4}。濃度既知のリードを比較することでダイナミックレンジ、用量反応、検出限界、ワークフローの効率を評価することが可能です。

Long SIRV モジュール

ロングリードシークエンス解析プラットフォームの導入により、リード長は著しく上昇し、現在では転写産物の平均の長さを超えるリード長となっています。Lexogen社では、「Long SIRV」を開発しました。5 つの長さのカテゴリ（4 kb, 6 kb, 8 kb, 10 kb, 12 kb）それぞれに 3 つの異なる転写産物が含まれます。これら 15 種類の RNA の配列はユニークであり、他の spike-in control または内在性転写産物とも重複しておらず、RNA-Seq ワークフローで転写産物長を評価するための最適なツールとなっています。

パフォーマンス

図 4 に、locus SIRV6 におけるアイソフォーム Mix E0（18 転写産物）の予想リードカバレッジを例として示しました。予測リードと測定リードの差異は変動係数（CoD）として RNA-Seq のパフォーマンスとバイアスの目安となります¹。

図.4 SIRV6 のカバレッジ
locus SIRV6 における 18 転写産物のエキソン - イントロン構造を下パネルに示す（アンチセンス転写産物は青色で示す）。 CORALL RNA-Seq Library Preparation Kit で作製したライブラリについてリードを SIRVome にマップし、locus レベルで可視化した。

ERCC モジュールは、input-output 濃度相関測定や、検出限界（LLoD）の算出に最適です（図 5A）。ある遺伝子について複数のアイソフォームが広い濃度範囲で分布しているより複雑な設定の input-output 相関は、アイソフォーム Mix E0、E1、および E2 を用いて評価可能です。さらに、転写産物レベルで発現変化を見る際、RNA-Seq パイプラインを評価することが可能です（図 5B）。

図.5 ERCC および SIRV アイソフォームモジュールを用いた input-output 相関測定
A) SIRV3 セットに含まれる ERCC Mix 1（1遺伝子 1転写産物）を QuantSeq 3' mRNA-Seq で評価した。 R2 は 0.972 で相関が高かった。
B) SIRV Mix E0，E1，E2 に含まれる転写産物濃度の概要。結果は既知のインプットを参照して示しており、色付きのバーは SIRV サブミックス 1:1（E0），1:8（E1）， 1:128（E2）の濃度比率を示す。黒丸は平均値、灰色は中央値を示す。四角はデータポイントの 25 ～ 75%の領域におよび、連結線のある黒い線は最小値と最大値で、グラフの外れ値も示す。

データ解析

スパイクインRNA シーケンス実験のデータは、リードがゲノムDNA のリファレンス配列やSIRVome にマッピングされる段階まで一様に処理されます。バイオインフォマティックツールは、リードマッピング（いわゆる生データ）から転写産物を同定、定量するまでの各段階において、検出されたリード分布と予想リード分布を比較するものです。

データ解析ワークフローとして、無料で利用可能なSIRV Suite がおすすめです。SIRV Suite はデータ解析プラットフォームGalaxyのツールやアルゴリズムを利用しており、実験間の比較を行うだけでなく、SIRV 実験のデザインや評価が可能です。ERCC リードの評価には、NIST が提供している“ERCC dashboard”⁵ と呼ばれるソフトウェアパッケージやSEQC/MAQC-III コンソーシアムが紹介している評価法⁶ が利用可能です。

算出されたクオリティ値は、正確性や精度、測定されたカバレッジと予想カバレッジ間の変動係数（Coeffi cient of Deviation；CoD）を含みます（図2）。データ比較において、決定的なパラメーターはバイアスの程度よりもバイアスの一貫性であり、実験間の差は一貫して蓄積されたSIRVs を基に同定されます。このように、データセットが比較可能かは情報に基づき判断ができ、実験固有の変動に対してベースラインを設定することが可能です。

SIRV セット

用途によって 4 種類の SIRV セットをご用意しています。
詳細なアイソフォーム解析には SIRV-Set 1、データセットの比較には SIRV-Set 2、濃度の検証には SIRV-Set 3、long spike-in RNA を利用した全体的な評価には SIRV-Set 4 を利用可能です。

表.1 SIRVセットのセレクションガイド
SIRV-Set 1（品番：025.03）はアイソフォームモジュールのアイソフォーム Mix E0、E1 および E2 を含みます。SIRV-Set 2（品番：050.0）はアイソフォーム Mix E0 のみです。SIRV-Set 3（品番：051.0）はアイソフォーム Mix E0 と ERCC との混合物です。SIRV-Set 4（品番：141.0）は long SIRV、SIRV アイソフォーム Mix E0、ERCC の混合物です。
^* バイアル数、1 または 3
✓：適用あり、-：適用なしまたは部分的に適用可

SIRVセット 1

SIRVセット 1はアイソフォームモジュールの混合物を3種類含みます（E0、E1、E2）。また、各混合物は7つのSIRV遺伝子に由来する69種類のSIRVアイソフォーム転写産物から構成され、異なる比率で混合されています。E0は、69種類の転写産物が等モルで混合されており、これらの検出はリード深度と相関しないため、検出能の検証に最適です。E1は緩やかな濃度分布でバリアントを含みますが、E2はより自然に近いかたちを表現しているため、ドミナントなバリアントや量が豊富なバリアントが他の低い発現レベル（<1%）のバリアントともに転写されます。このような自然に近い濃度分布は、短いリードアセンブリを基にした転写産物の定量にはあまり向きませんが、リード深度に制限があるロングリードシーケンス解析においては直線性や感度を評価することが可能です。

品名	メーカー	品番	包装	希望販売価格
SIRV-Set 1 (Iso Mix E0, E1, E2)	LEX	025.03	3 RXN	お問い合わせ

SIRV セット2

7つのSIRV遺伝子に由来する69種類のSIRVアイソフォーム転写産物が等モル濃度で含まれるアイソフォームモジュールE0です。RNA-Seqにおいてリード深度より、転写量の異なる多様な転写産物の検出を重視する際にお勧めです。また、実験のフィンガープリントはインプット濃度ではなく単にSIRVアイソフォームの複雑性に依存するため、SIRVセット2はデータの整合性の評価に最適です。

品名	メーカー	品番	包装	希望販売価格
SIRV-Set 2 (Iso Mix E0)	LEX	050.01	1 VIAL	￥165,000
SIRV-Set 2 (Iso Mix E0)	LEX	050.03	3 VIAL	￥359,000

SIRV セット3

SIRVセット3は、アイソフォームミックスE0およびERCCミックスを等量含みます。69種類のSIRVアイソフォーム転写産物と92種類のオーバーラップのないERCC RNAを含むことにより、高度な複雑性を有し、幅広い濃度レンジをカバーします。また、手技的な詳細情報を得ることにより個々の試料や実験を比較するフィンガープリントを引き出すことができ、RNAシーケンスのワークフロー全体において、より包括的な品質評価とモニタリングが可能です。各ERCCアイソフォームは2¹⁰（10⁶）の濃度幅をカバーし、さらに等モルのSIRV アイソフォームを加える事で補完しています。

品名	メーカー	品番	包装	希望販売価格
SIRV-Set 3 (Iso Mix E0 / ERCC)	LEX	051.01	1 VIAL	￥193,000
SIRV-Set 3 (Iso Mix E0 / ERCC)	LEX	051.03	3 VIAL	お問い合わせ

SIRV セット4

SIRVセットは、69種類のSIRVアイソフォーム転写産物と92種類のERCC RNAに加え、4 - 12 kb長の15種類のRNA (long SIRVs) が含まれています。long SIRVsはSIRVアイソフォームと同じ濃度で含まれているため、定量はアイソフォームの複雑性に左右されません。SIRVセット4では、アイソフォームの複雑性、存在比、長さをカバーしています。

品名	メーカー	品番	包装	希望販売価格
SIRV-Set 4 (Iso Mix E0 / ERCC / long SIRVs)	LEX	141.01	1 VIAL	￥282,000
SIRV-Set 4 (Iso Mix E0 / ERCC / long SIRVs)	LEX	141.03	3 VIAL	お問い合わせ

【関連情報】

参考文献

Paul, L., et al. (2016) SIRVs: Spike-In RNA Variants as External Isoform Controls in RNA-Sequencing. bioRxiv. DOI:10.1101/080747
Weirather, J. L., et al. (2017) Comprehensive comparison of Pacific Biosciences and Oxford Nanopore Technologies and their applications to transcriptome analysis. F1000Res 6, 100. DOI: 10.12688/f1000research.10571.1
Baker, S. C., et al. (2005) The External RNA Controls Consortium: a progress report. Nature Methods 2, 731-734. DOI:10.1038/nmeth1005-731
The External RNA Controls Consortium. (2005) Proposed methods for testing and selecting the ERCC external RNA controls. BMC Genomics 6, 150. DOI:10.1186/1471-2164-6-150
Munro, S. A., et al. (2014) Assessing technical performance in differential gene expression experiments with external spike-in RNA control ratio mixtures. Nature Communications 5, 5125. DOI:10.1038/ncomms6125
SEQC/MAQC-III Consortium. (2014) A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control Consortium. Nature Biotechnology 32, 903-914. DOI:10.1038/nbt.2957