遺傳性視網膜疾病(IRD)是一組具有高度遺傳和臨床異質性的單基因遺傳性眼病,基因診斷目前已成為IRD患者臨床診療中必不可少的檢測項目。約30%的患者通過目標區域或全外顯子測序后不能確定其致病基因或僅檢測到常染色隱性遺傳致病基因的單等位基因變異。這些未檢出的“隱藏變異”主要是位于已知IRD致病基因非編碼區的深內含子或啟動子區變異及結構變異,其辨識及致病性判定具有一定的挑戰性,需通過全基因組測序并結合多種細胞生物學手段綜合分析。
引用本文: 李楊, 石婕, 張昕. 加強遺傳性視網膜疾病致病基因隱藏變異的挖掘. 中華眼底病雜志, 2023, 39(7): 521-524. doi: 10.3760/cma.j.cn511434-20230704-00298 復制
遺傳性視網膜疾病(IRD)是一組具有高度遺傳和臨床異質性的單基因遺傳性眼病,患病率約為1/2 000,全球IRD患者超過200萬[1]。IRD主要有視網膜色素變性、視錐和(或)錐桿細胞營養不良、Leber先天性黑矇(LCA)、黃斑營養不良、家族性滲出性玻璃體視網膜病變等[1],目前已知IRD致病基因多達300余個。二代測序(NGS)技術的普及使基因診斷成為IRD患者臨床診療中必不可少的檢測項目,其結果可為患者提供相應的遺傳咨詢,是患者未來進行基因治療或藥物治療的基礎。目前IRD患者分子診斷常用方法是針對基因編碼區及經典剪接位點的目標區域或全外顯子測序(TES/WES)。經上述測序分析,IRD患者致病基因的總檢出率大約在55%~70%之間,即約30%的患者不能獲得明確的基因診斷[2]。近期多項研究發現,這些患者中僅少數攜帶新的IRD致病基因,多數患者攜帶已知IRD致病基因的“隱藏變異”(missing variants or missing heritability)[2-4]。這些隱藏變異主要是位于非編碼區的深內含子變異(DIV)或啟動子區變異及結構變異 (SV)等。由于大部分隱藏變異位于非編碼區,其辨識及致病性判定都具有一定的挑戰性,常需通過全基因組測序(WGS)并結合多種細胞生物學手段綜合分析。
1 DIV辨識及其意義
非經典剪接位點(外顯子上游-14~-3、下游+3~+6,以及外顯子兩端第1~2個堿基變異)以外的內含子變異為DIV[5]。目前已在ABCA4、CHM、CNGB3、CEP290、OFD1、PRPF31、USH2A等多個IRD致病基因中檢測到多種致病DIV[2-6],其中在ABCA4基因檢出的DIV數量最多,達60余個[6-7]。近期本團隊對290例ABCA4相關視網膜病變患者致病變異特點進行了總結分析,在這組患者中共發現了9種DIV, 等位基因頻率近7%(數據暫未發表)。非編碼區域的單核苷酸變異(SNV)數量遠遠高于編碼區,從如此眾多的SNV中篩選出致病或可疑致病變異難度較大,另外WGS產生海量的基因變異數據,因此基于患者臨床表型的靶向基因重點分析則有助于準確找到這些隱藏變異[4, 7]。本團隊前期對4例攜帶WFS1單等位基因的Wolfram 綜合征(WFS)患者進行了WGS的深入分析。盡管WGS產生了大量的測序數據,由于患者具有典型的WFS臨床表型,我們首先針對WFS1基因進行重點分析,結果在1例患者中發現了一個位于內含子6的雜合DIV c.712+681C>T,這也是WFS1基因的第一個DIV[8]。
DIV致病性判定仍然遵從2015年美國醫學遺傳學與基因組學學會(ACMG)制定的《基因變異分類指南》[9],首先通過對這些可疑變異在正常人群中的分布頻率和家系成員共分離情況進行初步篩選;篩選后的DIV再用至少5種生物信息學軟件預測其是否干擾基因pre-mRNA正常剪接。常用的軟件有Human Splicing Finder、Splice Site Finder-like、MaxEntScan、NetGene2和 NNSplice等。致病性DIV往往生成一個潛在的強剪接供體位點,導致一個或多個假外顯子(PE)的插入。這些插入的PE引起編碼氨基酸閱讀框架改變并產生提前終止密碼子,最終引發無義變異介導的衰退反應。如果3個生物信息學軟件預測DIV引起基因pre-mRNA異常剪接,則需通過體外細胞功能學實驗進一步驗證。
驗證DIV致病性的理想方法是直接從患者來源的組織細胞中(如皮膚成纖維細胞或外周血細胞)提取RNA,針對目的基因進行反轉錄聚合酶鏈反應分析轉錄或剪接情況。但某些IRD致病基因(如ABCA4基因)僅在視網膜中特異表達,因此其DIV變異功能分析主要通過建立微小基因(minigene)或中小基因(midigene)體外剪接系統轉染人源細胞系(如ARPE-19細胞、HEK293T細胞等)進行驗證[6-8]。本團隊前期體外功能實驗結果證實,WFS1基因變異c.712+681C>T導致該基因的異常剪接,造成1個或2個PE的插入(兩種異常剪接產生同樣截短蛋白p.Gly238Lysfs*27),并發現該變異也同時產生正常剪接產物[8]。對ABCA4基因多項研究結果也發現,某些DIV既產生正常剪接產物,又可以產生插入PE的異常剪接產物,但正常與異常剪接產物的表達豐度在不同細胞中的比例卻不同[10-11]。近期研究表明,人視網膜有一套復雜pre-mRNA剪接系統,形成組織或細胞特異性的剪接識別位點,因此上述在各種人源細胞系中進行的體外功能實驗不能反映IRD基因DIV在視網膜的真正剪接情況[5, 10-11]。CEP290基因DIV c.2991+1655A>G(p.Cys998*)是高加索LCA10患者的熱點變異,研究發現攜帶該純合變異患者的皮膚成纖維細胞和淋巴細胞中CEP290的正常與異常轉錄(插入PE)的比例為1∶1, 而在經誘導多能干細胞(iPSC)分化成3D視網膜類器官(RO)中該比例為1∶4,即異常轉錄的豐度大大提高[12]。該研究結果不僅揭示了在人體各組織廣泛表達的CEP290 基因變異僅僅導致單純性眼部表型的機制,也證實了患者來源的經iPSC分化的視網膜組織或細胞在DIV致病機制研究中的重要性。針對ABCA4基因常見DIV(c.4539+2001G>A、 c.4539+2028C>T、c.5196+1137G>A)的兩項研究也發現,不同DIV在RO中表達異常轉錄的量不同,攜帶異常表達豐度高變異(c.4539+2001G>A)患者的臨床表型重; 而攜帶異常表達豐度低變異(c.4539+2028C>T和c.5196+1137G>A)患者的臨床表型相對輕[10-11]。
反義寡核苷酸(AON)可靶向修正DIV造成的異常剪接,為IRD治療提供了新的思路[13]。AON是單鏈寡脫氧核苷酸或寡核糖核苷酸,通過堿基互補配對與DIV雜交形成空間占位,修正異常剪接產生功能正常的蛋白質,或阻斷剪接供體位點引起含有變異的外顯子跳讀,產生縮短但具有部分功能的蛋白質[13]。針對CEP290基因DIV c.2991+1655A>G(p.Cys998*)設計的AON(QR-110也稱作 sepofarsen)目前已進入3期臨床試驗(NCT03913143)[14]。在1b/2期臨床試驗(NCT03140969)中 11例LCA10患者接受玻璃體腔注射不同劑量sepofarsen治療,12個月的隨診結果證實了其安全性,部分患者特別是攜帶純合c.2991+1655A>G 變異患者的視力及視網膜敏感度有明顯提高[15]。除了CEP290,目前還開展了多項針對USH2A、ABCA4、OPA1等基因變異AON 治療的臨床前和臨床研究[10, 13]。
2 SV
SV是指50 bp以上DNA片段的缺失、插入、重復、倒位和易位[16]。IRD致病基因的SV中以拷貝數變異(CNV)較為常見[3]。TES/WES的短讀長測序特點限制了其檢測SV的能力,因此SV在IRD的隱藏變異中也占有一定比例[2, 5]。隨著WGS的應用,在IRD致病基因中發現的CNV逐步增多,主要涉及的基因包括USH2A、EYS、PRPF31、MERTK、RPGR、CHM等[3]。盡管TES/WES也可檢測到部分CNV,但其利用探針捕獲,測序受鳥嘌呤和胞嘧啶所占的比率、假基因和片段復制等因素影響的特點易導致測序深度分布不均,削弱了檢測CNV的靈敏度;此外,TES/WES的捕獲區域僅在編碼區,而多數CNV斷裂點位于內含子區,因此用TES/WES難以確定CNV的斷裂點,無法準確描述CNV的拷貝序列和位置[2]。全基因組的CNV分析,覆蓋度均一、靈敏度高;并且可以得到斷點信息,結合生物信息學分析(通過對數期望的多序列比較判斷斷點同源性,Dfam 數據庫檢索斷點附近的轉座元素),可進一步分析其形成機制。本研究團隊前期應用WGS在ABCA4基因中檢出1個大片段缺失和2個大片段重復,在WFS1基因中檢出1個大片段缺失和1個重復,ABCA4和WFS1的CNV較罕見,這5種CNV均為首次發現[7-8]。
在SV的分析中,同樣要重視臨床評估,根據臨床表型推測出可疑的致病基因,若可疑的致病基因既往有較多SV報道,如PRPF31、USH2A和EYS等,在挖掘隱藏變異時要側重分析SV。相較于缺失、插入或重復這些CNV,倒位變異(inversion variant)則更難辨識。近期本團隊在290例ABCA4相關視網膜病變患者致病變異分析中,用WGS在1例攜帶ABCA4單等位基因患者中檢測到一個雜合8 kb倒位變異,這是目前在ABCA4基因發現的第一個倒位變異(數據暫未發表)。
3 啟動子區變異
啟動子區變異在IRD分子診斷的隱藏變異占比相對較小。核心啟動子通常在轉錄起始位點上游40到下游50個堿基之間(-40~50 bp),介導基礎水平的轉錄;臨近的啟動子元件通常位于1 kb內,包括增強子和沉默子等,廣義的啟動子區變異包括核心啟動子及其鄰近元件的變異[17]。由于其研究復雜、費時,DNA分子診斷中TES/WES常規不會對啟動子區進行檢測,尤其是起始密碼子上游的區域,啟動子區變異常需要借助WGS檢測[8, 18]。本研究團隊前期應用WGS檢出一個WFS1基因的啟動子變異(c.?6+6T>C),軟件預測該變異使第一內含子剪接供體位點消失,從而影響基因的表達 [8]。
除WFS1基因外,目前還在CHM、NMNAT1、PRPF31、OPN1LW/OPN1MW等多個IRD致病基因中檢測到啟動子變異[18-21]。啟動子區變異可通過改變轉錄因子結合位點,增強或減弱啟動子的反式激活,從而導致基因表達改變而致病。啟動子變異的識別和致病性確定比DIV和SV更具有挑戰性,一般可先使用生物信息學軟件如NetUTR server進行預測,進一步用患者來源的細胞進行mRNA和蛋白質定量分析觀察對基因表達的影響來驗證其致病性;但實際操作中往往難以獲得患者來源的細胞或者細胞系,此時可通過建立系統雙熒光素酶報告實驗驗證變異對轉錄的影響[21]。
4 小結
IRD是一組嚴重損傷視功能且具有高度遺傳和表型異質性的疾病,明確的基因診斷是患者將來進行基因和細胞治療的前提。對于經TES/WES分析未獲得明確基因診斷的IRD患者,需在臨床表型評估的基礎上,對靶向基因全基因座(編碼及非編碼區)深入系統分析,挖掘隱藏變異。IRD中致病基因隱藏變異主要是DIV、SV和啟動子區變異。隱藏變異的發現有助于明確基因的致病機制,對患者治療方式的選擇有一定意義。
遺傳性視網膜疾病(IRD)是一組具有高度遺傳和臨床異質性的單基因遺傳性眼病,患病率約為1/2 000,全球IRD患者超過200萬[1]。IRD主要有視網膜色素變性、視錐和(或)錐桿細胞營養不良、Leber先天性黑矇(LCA)、黃斑營養不良、家族性滲出性玻璃體視網膜病變等[1],目前已知IRD致病基因多達300余個。二代測序(NGS)技術的普及使基因診斷成為IRD患者臨床診療中必不可少的檢測項目,其結果可為患者提供相應的遺傳咨詢,是患者未來進行基因治療或藥物治療的基礎。目前IRD患者分子診斷常用方法是針對基因編碼區及經典剪接位點的目標區域或全外顯子測序(TES/WES)。經上述測序分析,IRD患者致病基因的總檢出率大約在55%~70%之間,即約30%的患者不能獲得明確的基因診斷[2]。近期多項研究發現,這些患者中僅少數攜帶新的IRD致病基因,多數患者攜帶已知IRD致病基因的“隱藏變異”(missing variants or missing heritability)[2-4]。這些隱藏變異主要是位于非編碼區的深內含子變異(DIV)或啟動子區變異及結構變異 (SV)等。由于大部分隱藏變異位于非編碼區,其辨識及致病性判定都具有一定的挑戰性,常需通過全基因組測序(WGS)并結合多種細胞生物學手段綜合分析。
1 DIV辨識及其意義
非經典剪接位點(外顯子上游-14~-3、下游+3~+6,以及外顯子兩端第1~2個堿基變異)以外的內含子變異為DIV[5]。目前已在ABCA4、CHM、CNGB3、CEP290、OFD1、PRPF31、USH2A等多個IRD致病基因中檢測到多種致病DIV[2-6],其中在ABCA4基因檢出的DIV數量最多,達60余個[6-7]。近期本團隊對290例ABCA4相關視網膜病變患者致病變異特點進行了總結分析,在這組患者中共發現了9種DIV, 等位基因頻率近7%(數據暫未發表)。非編碼區域的單核苷酸變異(SNV)數量遠遠高于編碼區,從如此眾多的SNV中篩選出致病或可疑致病變異難度較大,另外WGS產生海量的基因變異數據,因此基于患者臨床表型的靶向基因重點分析則有助于準確找到這些隱藏變異[4, 7]。本團隊前期對4例攜帶WFS1單等位基因的Wolfram 綜合征(WFS)患者進行了WGS的深入分析。盡管WGS產生了大量的測序數據,由于患者具有典型的WFS臨床表型,我們首先針對WFS1基因進行重點分析,結果在1例患者中發現了一個位于內含子6的雜合DIV c.712+681C>T,這也是WFS1基因的第一個DIV[8]。
DIV致病性判定仍然遵從2015年美國醫學遺傳學與基因組學學會(ACMG)制定的《基因變異分類指南》[9],首先通過對這些可疑變異在正常人群中的分布頻率和家系成員共分離情況進行初步篩選;篩選后的DIV再用至少5種生物信息學軟件預測其是否干擾基因pre-mRNA正常剪接。常用的軟件有Human Splicing Finder、Splice Site Finder-like、MaxEntScan、NetGene2和 NNSplice等。致病性DIV往往生成一個潛在的強剪接供體位點,導致一個或多個假外顯子(PE)的插入。這些插入的PE引起編碼氨基酸閱讀框架改變并產生提前終止密碼子,最終引發無義變異介導的衰退反應。如果3個生物信息學軟件預測DIV引起基因pre-mRNA異常剪接,則需通過體外細胞功能學實驗進一步驗證。
驗證DIV致病性的理想方法是直接從患者來源的組織細胞中(如皮膚成纖維細胞或外周血細胞)提取RNA,針對目的基因進行反轉錄聚合酶鏈反應分析轉錄或剪接情況。但某些IRD致病基因(如ABCA4基因)僅在視網膜中特異表達,因此其DIV變異功能分析主要通過建立微小基因(minigene)或中小基因(midigene)體外剪接系統轉染人源細胞系(如ARPE-19細胞、HEK293T細胞等)進行驗證[6-8]。本團隊前期體外功能實驗結果證實,WFS1基因變異c.712+681C>T導致該基因的異常剪接,造成1個或2個PE的插入(兩種異常剪接產生同樣截短蛋白p.Gly238Lysfs*27),并發現該變異也同時產生正常剪接產物[8]。對ABCA4基因多項研究結果也發現,某些DIV既產生正常剪接產物,又可以產生插入PE的異常剪接產物,但正常與異常剪接產物的表達豐度在不同細胞中的比例卻不同[10-11]。近期研究表明,人視網膜有一套復雜pre-mRNA剪接系統,形成組織或細胞特異性的剪接識別位點,因此上述在各種人源細胞系中進行的體外功能實驗不能反映IRD基因DIV在視網膜的真正剪接情況[5, 10-11]。CEP290基因DIV c.2991+1655A>G(p.Cys998*)是高加索LCA10患者的熱點變異,研究發現攜帶該純合變異患者的皮膚成纖維細胞和淋巴細胞中CEP290的正常與異常轉錄(插入PE)的比例為1∶1, 而在經誘導多能干細胞(iPSC)分化成3D視網膜類器官(RO)中該比例為1∶4,即異常轉錄的豐度大大提高[12]。該研究結果不僅揭示了在人體各組織廣泛表達的CEP290 基因變異僅僅導致單純性眼部表型的機制,也證實了患者來源的經iPSC分化的視網膜組織或細胞在DIV致病機制研究中的重要性。針對ABCA4基因常見DIV(c.4539+2001G>A、 c.4539+2028C>T、c.5196+1137G>A)的兩項研究也發現,不同DIV在RO中表達異常轉錄的量不同,攜帶異常表達豐度高變異(c.4539+2001G>A)患者的臨床表型重; 而攜帶異常表達豐度低變異(c.4539+2028C>T和c.5196+1137G>A)患者的臨床表型相對輕[10-11]。
反義寡核苷酸(AON)可靶向修正DIV造成的異常剪接,為IRD治療提供了新的思路[13]。AON是單鏈寡脫氧核苷酸或寡核糖核苷酸,通過堿基互補配對與DIV雜交形成空間占位,修正異常剪接產生功能正常的蛋白質,或阻斷剪接供體位點引起含有變異的外顯子跳讀,產生縮短但具有部分功能的蛋白質[13]。針對CEP290基因DIV c.2991+1655A>G(p.Cys998*)設計的AON(QR-110也稱作 sepofarsen)目前已進入3期臨床試驗(NCT03913143)[14]。在1b/2期臨床試驗(NCT03140969)中 11例LCA10患者接受玻璃體腔注射不同劑量sepofarsen治療,12個月的隨診結果證實了其安全性,部分患者特別是攜帶純合c.2991+1655A>G 變異患者的視力及視網膜敏感度有明顯提高[15]。除了CEP290,目前還開展了多項針對USH2A、ABCA4、OPA1等基因變異AON 治療的臨床前和臨床研究[10, 13]。
2 SV
SV是指50 bp以上DNA片段的缺失、插入、重復、倒位和易位[16]。IRD致病基因的SV中以拷貝數變異(CNV)較為常見[3]。TES/WES的短讀長測序特點限制了其檢測SV的能力,因此SV在IRD的隱藏變異中也占有一定比例[2, 5]。隨著WGS的應用,在IRD致病基因中發現的CNV逐步增多,主要涉及的基因包括USH2A、EYS、PRPF31、MERTK、RPGR、CHM等[3]。盡管TES/WES也可檢測到部分CNV,但其利用探針捕獲,測序受鳥嘌呤和胞嘧啶所占的比率、假基因和片段復制等因素影響的特點易導致測序深度分布不均,削弱了檢測CNV的靈敏度;此外,TES/WES的捕獲區域僅在編碼區,而多數CNV斷裂點位于內含子區,因此用TES/WES難以確定CNV的斷裂點,無法準確描述CNV的拷貝序列和位置[2]。全基因組的CNV分析,覆蓋度均一、靈敏度高;并且可以得到斷點信息,結合生物信息學分析(通過對數期望的多序列比較判斷斷點同源性,Dfam 數據庫檢索斷點附近的轉座元素),可進一步分析其形成機制。本研究團隊前期應用WGS在ABCA4基因中檢出1個大片段缺失和2個大片段重復,在WFS1基因中檢出1個大片段缺失和1個重復,ABCA4和WFS1的CNV較罕見,這5種CNV均為首次發現[7-8]。
在SV的分析中,同樣要重視臨床評估,根據臨床表型推測出可疑的致病基因,若可疑的致病基因既往有較多SV報道,如PRPF31、USH2A和EYS等,在挖掘隱藏變異時要側重分析SV。相較于缺失、插入或重復這些CNV,倒位變異(inversion variant)則更難辨識。近期本團隊在290例ABCA4相關視網膜病變患者致病變異分析中,用WGS在1例攜帶ABCA4單等位基因患者中檢測到一個雜合8 kb倒位變異,這是目前在ABCA4基因發現的第一個倒位變異(數據暫未發表)。
3 啟動子區變異
啟動子區變異在IRD分子診斷的隱藏變異占比相對較小。核心啟動子通常在轉錄起始位點上游40到下游50個堿基之間(-40~50 bp),介導基礎水平的轉錄;臨近的啟動子元件通常位于1 kb內,包括增強子和沉默子等,廣義的啟動子區變異包括核心啟動子及其鄰近元件的變異[17]。由于其研究復雜、費時,DNA分子診斷中TES/WES常規不會對啟動子區進行檢測,尤其是起始密碼子上游的區域,啟動子區變異常需要借助WGS檢測[8, 18]。本研究團隊前期應用WGS檢出一個WFS1基因的啟動子變異(c.?6+6T>C),軟件預測該變異使第一內含子剪接供體位點消失,從而影響基因的表達 [8]。
除WFS1基因外,目前還在CHM、NMNAT1、PRPF31、OPN1LW/OPN1MW等多個IRD致病基因中檢測到啟動子變異[18-21]。啟動子區變異可通過改變轉錄因子結合位點,增強或減弱啟動子的反式激活,從而導致基因表達改變而致病。啟動子變異的識別和致病性確定比DIV和SV更具有挑戰性,一般可先使用生物信息學軟件如NetUTR server進行預測,進一步用患者來源的細胞進行mRNA和蛋白質定量分析觀察對基因表達的影響來驗證其致病性;但實際操作中往往難以獲得患者來源的細胞或者細胞系,此時可通過建立系統雙熒光素酶報告實驗驗證變異對轉錄的影響[21]。
4 小結
IRD是一組嚴重損傷視功能且具有高度遺傳和表型異質性的疾病,明確的基因診斷是患者將來進行基因和細胞治療的前提。對于經TES/WES分析未獲得明確基因診斷的IRD患者,需在臨床表型評估的基礎上,對靶向基因全基因座(編碼及非編碼區)深入系統分析,挖掘隱藏變異。IRD中致病基因隱藏變異主要是DIV、SV和啟動子區變異。隱藏變異的發現有助于明確基因的致病機制,對患者治療方式的選擇有一定意義。