Biology/Genomics

RNA sequencing (RNA-seq)의 원리와 역사

수의과학자 2025. 7. 25. 19:00

 

📘 RNA Sequencing(RNA-seq)의 원리와 역사

1️⃣ RNA-seq이란 무엇인가?

RNA sequencing, 줄여서 RNA-seq은 세포 내에서 발현되고 있는 모든 RNA, 특히 전령 RNA(mRNA)를 고속으로 읽어들이고 정량화하는 차세대염기서열분석(Next-Generation Sequencing, NGS) 기반의 기술이다. 이 기술을 통해 생물학자는 특정 세포나 조직에서 어떤 유전자가 언제, 얼마나 발현되는지를 정밀하게 파악할 수 있다. 유전자 기능 연구, 질병의 원인 규명, 신약 개발, 진단 바이오마커 탐색 등 다양한 분야에서 핵심 도구로 활용되고 있다.

2️⃣ RNA-seq의 등장 배경과 역사

🔹 전사체 분석의 시작: 마이크로어레이

RNA-seq 이전에는 주로 마이크로어레이(microarray) 기술이 RNA 발현 분석에 사용되었다. 이 방법은 고정된 프로브에 형광표지된 cDNA를 혼성화시켜 발현량을 추정하는 방식이지만, 미리 정해진 유전자만 분석할 수 있고, 민감도나 정확도 측면에서 한계가 있었다.

🔹 RNA-seq의 태동: NGS와의 결합

2005년 이후, Illumina, 454, SOLiD와 같은 NGS 플랫폼이 등장하면서 생물학 데이터의 처리량과 정확도가 비약적으로 향상되었다. 이를 전사체 분석에 응용한 것이 RNA-seq의 출발점이었다.

RNA-seq의 개념은 2008년 Mortazavi et al. (Nature Methods)Nagalakshmi et al. (Science)의 논문을 통해 본격적으로 소개되었으며, 이를 통해 단일 유전자 수준의 발현량은 물론, 스플라이싱 변이, 신규 전사체, fusion transcript 탐색 등이 가능해졌다. 이때부터 RNA-seq은 단순한 정량 분석을 넘어 전사체 전체의 지도를 그리는 도구로 자리잡게 된다.

3️⃣ RNA-seq의 핵심 원리: 단계별 기술 설명

RNA-seq은 다음과 같은 일련의 과정을 통해 RNA 정보를 고속으로 해독하고 분석한다.

RNA-seq의 일반적인 workflow

📌 Step 1: RNA 추출 (RNA isolation)

분석 대상인 세포나 조직에서 총 RNA(total RNA)를 추출한다. 연구 목적에 따라 mRNA에만 집중하거나, non-coding RNA, miRNA 등을 포함한 전체 RNA를 분석할 수도 있다.

  • mRNA 선택: 보통 poly-A tail(폴리아데닐화 꼬리)을 가진 mRNA만 분리하기 위해 oligo-dT 비드를 사용한다.
  • 또는, rRNA 제거(rRNA depletion) 후 모든 non-rRNA를 대상으로 분석할 수도 있다.

📌 Step 2: cDNA 합성 (Reverse Transcription)

추출된 RNA는 효소 reverse transcriptase를 이용하여 cDNA (complementary DNA)로 변환된다. DNA는 RNA보다 안정적이고, 차세대 염기서열분석에서도 DNA 기반 분석이 가능하므로 이 과정이 필수적이다.

  • 이 과정에서 RNA의 정보가 DNA로 ‘복사’되며, 유전자의 발현 정보를 담은 라이브러리를 만드는 첫 단계가 된다.

📌 Step 3: 라이브러리 제작 (Library preparation)

cDNA는 단편화(fragmentation)되고, 어댑터(adapter)가 양쪽 말단에 부착된다. 이 adapter는 시퀀싱 플랫폼이 인식할 수 있는 고리 역할을 하며, PCR 증폭 시 프라이머 역할도 한다.

  • 이 단계에서 세포의 개별 정보를 추적할 수 있도록 UMI(Unique Molecular Identifier) 또는 샘플 바코드가 삽입되기도 한다.
  • 이후 PCR 증폭을 통해 충분한 양의 라이브러리를 확보한다.

📌 Step 4: 시퀀싱 (High-throughput sequencing)

NGS 플랫폼(Illumina 등이 대표적)을 이용해 수백만~수억 개의 cDNA 조각을 빠르게 읽는다. 일반적으로 paired-end sequencing(양쪽 끝을 모두 읽는 방식)이 많이 사용된다.

  • 100bp 전후의 short read를 읽어들여, 수많은 짧은 염기서열 조각으로부터 원래의 유전자를 유추하는 과정이 뒤따른다.

📌 Step 5: 정렬 및 정량화 (Alignment & Quantification)

시퀀싱으로 얻어진 read들은 reference genome이나 transcriptome에 정렬(mapping)된다.

  • 이때 splice junction이나 novel transcript도 감지할 수 있도록 splice-aware aligner (예: STAR, HISAT2)가 사용된다.
  • 각 유전자에 mapping된 read 수를 기준으로 발현량을 정량화하며, 일반적으로 TPM, FPKM, 또는 raw count로 표현한다.

🔍 RNA-seq으로 가능한 분석들

  • 유전자 발현량 정량화 (Differential expression)
  • 대체 스플라이싱 분석
  • 신규 유전자/전사체 발견
  • 유전자 간 상호작용 네트워크 분석
  • 암 유래 fusion gene 탐지
  • 바이러스 감염 시 전사체 변화 관찰

🧠 마무리

RNA-seq은 단순한 유전자 발현량 측정을 넘어, 세포가 어떤 기능을 수행하고 있으며 어떤 상태에 놓여 있는지를 파악하는 창이 되어주었다. 특히 NGS와 결합된 이후, 생물학과 의학 분야의 판을 바꾼 대표적 기술로 자리잡았다. 이후 bulk RNA-seq → single cell RNA-seq → spatial transcriptomics로 이어지는 전사체 분석 기술의 발전은 여전히 진행 중이다.