發布時間:2020-02-29所屬分類:醫學論文瀏覽:1次
摘 要: 摘要:基因編輯技術是以特異性改變遺傳物質靶向序列為目標的技術。近年來,鋅指核酸酶(zincfingernuclease,ZFN)、類轉錄激活因子效應核酸酶(transcriptionactivator-likeeffectornuclease,TALEN)、規律成簇的間隔短回文重復(regularclusteringofshortpalindro
摘要:基因編輯技術是以特異性改變遺傳物質靶向序列為目標的技術。近年來,鋅指核酸酶(zincfingernuclease,ZFN)、類轉錄激活因子效應核酸酶(transcriptionactivator-likeeffectornuclease,TALEN)、規律成簇的間隔短回文重復(regularclusteringofshortpalindromerepeats,CRISPR)和單堿基編輯(baseediting,BE)技術的相繼出現,不僅為基因功能研究提供了有力的工具,還為生命醫學提供了新的治療方案;蚓庉嫾夹g已經大范圍應用于動物細胞模型的構建、藥物靶點的篩查和基因功能研究等,在基因治療領域也展現出廣闊的應用前景。本文就基因編輯技術的研究進展及其在基因治療中的應用進行了概述,并對基因編輯技術的的原理、發展史、優缺點以及在基因治療中的應用前景和機遇挑戰進行了討論,以期為基因編輯技術的臨床轉化提供參考。
關鍵詞:基因編輯技術;CRISPR/Cas9;單堿基編輯;基因治療
基因編輯技術是以改變目的基因序列為目的,實現定點突變、插入或敲除的技術。從20世紀末人們就開始對基因編輯技術進行探索,但直到2013年CRISPR/Cas9(clusteredregularlyinterspacedshortpalindromicrepeats(CRISPR)/CRISPR-associatedprotein9)技術成功用于哺乳動物細胞,才極大地推動了基因編輯技術的發展熱潮[1]。
相關期刊推薦:《基因組學與應用生物學》Genomics and Applied Biology(雙月刊)著重刊登農林科學、醫藥科學、動物科學、環境、生態領域的研究成果。辦刊宗旨及業務范圍為:反映國內外基因組學、生物科學及農業、醫藥領域的最新進展和發展趨勢,報道前沿學科突破性成果,為中國生命科學研究與發展提供學術交流平臺。有投稿需求的作者,可以咨詢期刊天空在線編輯。
真核生物的基因組包含數十億個堿基,對其基因組的操作一直面臨挑戰。同源重組技術(homologousrecombination,HR)是最早的基因編輯技術,也是真核生物基因編輯的一個重大突破。其原理是將外源性目的基因導入受體細胞,通過同源序列交換,使外源性DNA片段取代原位點上的基因,從而達到使特定基因失活或修復缺陷基因的目的。但是對高等真核生物來說,外源DNA與目的DNA自然重組率非常低,只有10-7~10-6[2,3];若要得到穩定遺傳的純合體基因敲除模型,至少需要兩代遺傳,因此HR的大規模應用受到了一定的限制。
為應對這一挑戰,一系列基于核酸酶的基因編輯技術相繼出現,實現了在真核生物尤其是哺乳動物中精準有效的基因編輯。與傳統的基因編輯技術相比,基于核酸酶的基因編輯技術減少了外源基因隨機插入,提高了對基因組特定片段進行精確修飾的幾率。目前基因編輯技術主要包括以下幾種:人工介導的鋅指核酸酶技術(zincfingernucleases,ZFNs)、類轉錄激活因子效應核酸酶技術(transcriptionactivatorlikeeffectorsnucleases,TALENs)、規律成簇的間隔短回文重復相關蛋白技術(CRISPR/Cas9)和單堿基編輯(baseeditor,BE)技術等[4]。
基因編輯技術掀起的研究熱潮,一方面是因為基因編輯技術本身的發展,更為精準、高效、低成本的基因編輯技術不斷地被開發出來;另一方面基因編輯技術作為一項重要的工具,在基因篩查、動物、細胞模型構建等基礎研究中發揮著重要的作用,也為許多疾病的基因治療提供了新的思路[2~4]。因此,本文從基因編輯技術的發展歷程及其在基因治療中的探索和應用進行概述,并對基因編輯技術面臨的挑戰和機遇進行討論。
1基因編輯技術研究進展
基于DNA核酸酶的基因編輯技術發展迅速,從第一代DNA核酸酶編輯系統ZFNs、第二代TALENs到第三代CRISPR/Cas9系統,基因編輯效率不斷提高、成本逐漸降低,應用范圍不斷擴大。ZFNs、TALENs和CRISPR/Cas9等3種基因編輯技術都是在基因組靶標位點引起DNA雙鏈斷裂(double-strandbreaks,DSBs),進而激活細胞內部修復機制的基礎上建立的。細胞內DNA雙鏈斷裂的修復機制包括易引起隨機插入、缺失的異源末端連接(non-homologousendjoining,NHEJ)和需要同源模板存在才可以激活的同源重組修復(homologydirectedrepair,HDR)[5,6]。2016年,BE技術的開發實現了在不引起DNA雙鏈斷裂和無需同源模板的情況下的單個堿基轉換,有效地規避了基于雙鏈DNA斷裂后NHEJ和HDR修復的基因編輯技術的不足。
1.1ZFNs
20世紀90年代,FokI酶的發現促進了ZFNs的出現[7,8]。1996年,美國約翰霍普金斯大學環境衛生科學系Chandrasegaran團隊構建了基于FokⅠ酶和鋅指蛋白融合的ZFNs技術[9]。ZFNs包含兩個結構域:DNA結合的鋅指蛋白區域和限制性核酸內切酶FokⅠ的核酸酶切活性區域(圖1)。鋅指蛋白區域決定了ZFNs的序列特異性。鋅指基序一般由30個氨基酸組成,其結合鋅離子的保守區域通常為4個半胱氨酸或2個半胱氨酸和2個組氨酸,其空間結構由1個螺旋和2個反向的b平行結構組成。螺旋的1、3、6位的氨基酸分別特異性地識別并結合DNA序列中的3個連續的堿基。由于不同的鋅指基序中a螺旋的1、3、6位氨基酸不同,因此由3~6個不同鋅指基序組成的鋅指蛋白區域與FokⅠ核酸酶區域連接就構成了可以特異識別DNA序列并進行切割的人工核酸酶。FokⅠ必須二聚化才具有活性。由于FokⅠ自身二聚化也能對DNA進行切割,但是切割效率低且易產生非特異切割,所以在設計ZFNs時可以對FokⅠ進行突變,使之不能形成同源二聚體。當兩個結合不同靶序列的突變的FokⅠ被5~7bp的spacers隔開就可以形成具有核酸酶的活性的異源二聚體[10,11]。這樣設計的ZFNs可以增加其DNA序列識別的特異性。
基于Chandrasegaran的工作,美國猶他大學醫學院生物化學系的DanaCarrol團隊使用ZFNs注入果蠅胚胎,第一次實現了在動物中的基因編輯[12,13]。隨后,科學家用ZFNs技術在動物、植物和人類細胞中都實現了靶基因的編輯[10,14]。盡管ZFNs技術在多個物種中成功進行了基因編輯,但是鋅指蛋白的設計費時費力,成本較高,限制了該方法的大規模應用[14,15]。
1.2TALENs
2009年,美國愛荷華州立大學植物病理學與生物信息學系的AdamJ.Bogdanove團隊和德國馬丁盧瑟大學生物研究所的UllaBonas團隊分別發現了來自植物致病黃單胞菌屬的轉錄激活效應蛋白(transcription-activator-likeeffector,TALE)和DNA的相互作用[16,17]。將TALE蛋白與FokⅠ酶區域結合構建了新一代的核酸酶編輯技術——TALENs[14,18]。TALENs的組成和ZFNs的相似之處是在其羧酸末端也含有FokⅠ核酸酶結構域,不同之處是TALENs的DNA結合域為TALE蛋白(圖1)[19]。TALE蛋白中每個識別模塊由34個氨基酸組成,除了第12和13位氨基酸外其余氨基酸序列都是保守的,第12和13位氨基酸稱為可變的雙氨基酸殘基(repeatvariabledi-residue,RVD)。RVD決定了TALE識別并結合的DNA堿基。4種不同的堿基都有與之對應的TALE識別模塊。因此構建TALEN人工核酸酶時,只需要按照目標序列的順序將不同的TALE識別模塊的序列連接起來,再與FokⅠ的編碼序列融合即可。相對于ZFNs來說,TALENs的設計變得容易,對任意的DNA序列理論上都可以設計和構建一個特異的TALEN核酸酶。但是目標序列的每個堿基都需要一個TALE識別模塊,因此TALENs的構建過程工作量較大。此外,TALENs在人類細胞中的細胞毒性較低[14,20]。2011年,Miller等[18]第一次使用TALENs在人類細胞中對NTF3和CCR5基因進行編輯,證明了TALEN核酸酶對內源靶向基因的調節和修飾作用。
1.3CRISPR/Cas9
2012年CRISPR/Cas9的體外重構和2013年在人類細胞中證明了其基因編輯功能,標志著新一代基因編輯時代的開始[21,22]。CRISPR/Cas9系統來源于細菌和古細菌的天然獲得性免疫系統,通過CRISPRRNA(crRNA)和trans-activatingcrRNA(tracrRNA)以及Cas9蛋白組成的復合體抵御外源性DNA的入侵。CRISPR/Cas9系統發揮作用的基本過程可以分為3個階段:第一個階段為間隔序列獲得期,質;蚴删w攜帶的DNA片段被宿主的核酸酶切割成短的DNA片段,符合條件的DNA片段整合進宿主CRISPR位點成為crRNA重復序列間的間隔序列;第二個階段為CRISPR/Cas9表達期,Cas9蛋白表達,CRISPR序列由pre-crRNA加工為成熟的crRNA,成熟的crRNA包含間隔序列,靶向結合于外來入侵的DNA;第三階段為DNA干擾期,Cas9蛋白在向導crRNA的引導下識別靶向位點,并調節基因組的剪切[22]。根據Cas蛋白的不同,CRISPR/Cas系統可以分為5類:類型Ⅰ、Ⅲ和Ⅳ的CRISPR位點包含crRNA與多個Cas蛋白形成的復合物;類型Ⅱ(Cas9)和類型V(Cpf1)只需要RNA介導的核酸酶[23]。許多CRISPR系統都依賴于臨近crRNA靶向位點的PAM(protospaceradjacentmotif)序列,PAM序列的缺失將會導致Ⅰ型和Ⅱ型CRISPR系統的自我剪切[24]。
廣泛用于基因編輯的CRISPR/Cas9是Ⅱ型CRISPR系統,由Cas9蛋白和sgRNA(singleguideRNA)組成。sgRNA是根據crRNA和tracrRNA形成的高級結構設計的,與Cas9核酸酶蛋白結合,指導其識別并剪輯靶向序列,靶向序列附近必需存在含有NGG或者NAG的PAM基序[25~27](圖1)。
相比較ZFNs和TALENs,CRISPR/Cas9通過一段與目標DNA片段匹配的向導RNA引導核酸酶識別靶向位點,提高了Cas9核酸酶的特異性;同時,Cas9在sgRNA的引導下以單體蛋白的形式發揮功能,不像ZFNs和TALENs的FokⅠ酶只有二聚化才具有切割靶向DNA的活性,因此CRISPR/Cas9也避免了精細復雜的蛋白質設計或組裝的需要。但是,由于CRISPR/Cas9來自于原核生物天然獲得性免疫系統抵御外來遺傳物質的防御系統,Cas9核酸酶可能繼承了序列特異性低的特點,使其非特異性切割的幾率增加,造成脫靶效應增多。不同的科研團隊提出了不同的方法修飾或編輯Cas9和sgRNA以降低脫靶效應[28,29]。如將Cas9蛋白與FokⅠ核酸酶、鋅指蛋白或者TALE蛋白結合提高Cas9的特異性[30~32];用失活的Cas9蛋白和FokⅠ區域融合形成新的核酸酶,使其只有在核酸酶二聚化時才具有活性;Fatih等[32]將鋅指蛋白或者TALE蛋白與Cas9蛋白變異體融合增強核酸酶的特異性。另一種降低脫靶效應的方法是使用切口酶代替核酸酶,產生單鏈斷裂而不是雙鏈斷裂,單鏈斷裂不能誘導NHEJ的修復,仍然可以激活HR的精確修復[14]。單鏈斷裂可以使脫靶效應降低,但修復效率也降低,因此有人提出了使用雙切口酶的方法,既提高了基因編輯的特異性也提高了編輯的效率[33]。
1.4BE
ZFNs、TALENs和CRISPR/Cas9技術都依賴于在靶位點誘導雙鏈斷裂進而激活DNA的NHEJ和HDR。NHEJ容易引起隨機插入和缺失,造成移碼突變,進而影響靶基因的功能;HDR盡管精確性高于NHEJ,但是其在細胞中的同源重組修復效率低,約為0.1%~5%。BE技術的出現有效地改善了以上問題[34,35]。
2016年4月,美國哈佛大學DavidLiu實驗室第一次發表了不需要DNA雙鏈斷裂也不需要同源模板即可進行單堿基轉換的基因編輯技術——BE技術。該技術基于無核酸酶活性的dCas9(Inactive,ordeadCas9)或有單鏈DNA切口酶活性的Cas9n(Cas9nickase)、胞嘧啶脫氨酶、尿嘧啶糖基化酶抑制子(uracilDNAglycosylaseinhibitor,UGI)以及sgRNA形成的復合體,在不引起雙鏈DNA斷裂的情況下,直接使靶向位點的胞嘧啶(Cytosine,C)脫氨基變成尿嘧啶(Uracil,U);由于尿嘧啶糖基化酶抑制子的存在,抑制了U的切除;隨著DNA復制,U被胸腺嘧啶(Thymine,T)取代;同時,互補鏈上原來與C互補的鳥嘌呤(Guanine,G)將會替換為腺嘌呤(Adenine,A),最終實現了在一定的活性窗口內C到T和G到A的單堿基精準編輯。BE技術的出現促進了點突變基因編輯的有效性和使用范圍[36]。
DavidLiu團隊對4種胞嘧啶脫氨酶——hAID(humanactivationinduceddeaminase)、hAPOBEC3G(humanapoliproteinBmRNA-editingenzyme-catalyticpolypeptide-like-3G)、rAPOBEC1(ratapolipoproteinBmRNA-editingenzyme1)和七鰓鰻(Lethenteroncamtschaticum)來源的AID類似物PmCDA1進行評估,發現rAPOBEC1具有最高的脫氨酶活性[36]。他們通過將rAPOBEC1與dCas9的N末端以及16個殘基的XTEN連接體融合,組成了第一代堿基編輯器BE1(rAPOBEC1-XTEN-dCas9),具有5nt的活性窗口[36]。第二代堿基編輯器BE2(APOBEC-XTENdCas9-UGI)融入了UGI抑制了U糖基化引起堿基切除修復,編輯效率在人類細胞比BE1高3倍[36]。第三代堿基編輯器BE3(APOBEC-XTEN-dCas9(A840H)-UGI)恢復了Cas9HNH區域840位置組氨酸的催化作用,可以剪切非編輯鏈上與編輯鏈上U互補的G堿基,對非編輯鏈的剪切使BE3的編輯效率比BE2高2~6倍[36]。
隨著單堿基編輯技術的出現,日本科學家基于PmCDA1和dCas9或Cas9n以及鳥嘌呤糖苷化酶抑制子UGI的融合,也開發了PMCDATA-dCas9/Cas9nUGI的單堿基編輯器[37]。中國科學院上海營養與健康研究院常興研究組開發了基于hAID的dCas9-AIDx單堿基編輯系統,用于耐藥突變的篩選[38]。
2017年,DavidLiu實驗室對BE技術做了多方面改進。首先針對常用的化膿性鏈球菌(Streptococcuspyogenes)的Cas9(SpCas9)蛋白靶向范圍較窄,只識別含有NGG或NGA的PAM序列的靶位點的限制,他們使用金黃色葡萄球菌(StaphylococcusAureus)的Cas9(SaCas9)、SaCas9突變體(Sacas9-KKH)、SpCas9突變體(SpCas9-VQR、SpCas9-EQR、SpCas9-VRER)替代SpCas9,可以識別含有NGG、NGA、NGAN、NGAG、NGGG、NNGRRT和NNNRRT的PAM序列,從而顯著提高了單堿基基因編輯的靶向范圍。其次,他們通過突變胞嘧啶脫氨酶,降低酶的活性、改變底物的結合和構象,或者直接降低底物進入胞嘧啶脫氨酶活性區域的能力,縮小了單堿基編輯系統的活性窗口,從5個核苷酸窗口縮小至1~2個核苷酸活性窗口[39]。再次,DavidLiu實驗室通過對BE3引入突變來減少脫靶效應,產生了高保真的堿基編輯器(high-fidelitybaseeditor,HF-BE3)[40]。隨后,他們又報道了基于E.coliTadA(ecTadA)的新型單堿基編輯器——腺嘌呤堿基編輯器(adeninebaseeditors,ABEs),實現了A×T堿基對向G×C堿基對的轉換。經過不斷的改進,第7代的腺嘌呤堿基編輯器將靶向的A.T堿基轉化為G×C堿基對可以達到約50%的效率(人類細胞),并且引入插入或缺失的頻率低于0.1%[34]。
SCISSCIAHCI