发布信息

治疗液态癌症的组合物和方法与流程

作者:admin      2022-11-02 06:06:02     335



医药医疗技术的改进;医疗器械制造及应用技术治疗液态癌症的组合物和方法1.相关申请的交叉引用2.本技术是国际pct申请,主张2019年9月27日提交的美国临时专利申请62/907,254的优先权和权益,该临时专利申请的整体内容通过引用而整体并入本文。背景技术:::3.自体和同种异体免疫疗法是肿瘤治疗方法,在该方法中,将表达嵌合抗原受体的免疫细胞给药至受试者。为了生成表达嵌合抗原受体(car)的免疫细胞,首先从受试者(自体)或与接受治疗的受试者分开的供体(同种异体)收集免疫细胞,并经基因修饰以表达嵌合抗原受体。所得细胞在其细胞表面上表达嵌合抗原受体(例如,cart细胞),并且当给药至受试者时,嵌合抗原受体结合至由肿瘤细胞表达的标志物。这种与肿瘤标志物的相互作用激活car-t细胞,随后这些细胞杀死肿瘤细胞。但对于使自体或同种异体细胞疗法有效或高效,必须减少或避免显著的条件和细胞应答诸如t细胞信号传导抑制。对于同种异体细胞疗法,移植物抗宿主疾病和宿主对car-t细胞的排异可造成额外的挑战。编辑这些过程中牵涉到的基因可增强car-t细胞功能和对免疫阻遏或抑制的抗性,当目前用于制作此类编辑的方法具有在car-t细胞中诱导大的基因组重排的潜力,从而对其功效造成负面影响。因此,对于更精确地修饰免疫细胞尤其是car-t细胞的技术存在显著需求。本技术涉及这种和其他重要需求。技术实现要素:4.如下所述,本发明特征在于经基因修饰的免疫细胞,其具有增强的抗瘤形成活性、对免疫阻遏的抗性,以及降低的引起移植物抗宿主反应或宿主抗移植物反应的风险,其中宿主cd8+t细胞将移植物识别为非自我(例如,其中移植物接受者生成针对被移植器官的免疫应答),或其组合。在一种实施方案中,向患有移植物抗宿主疾病(gvhd)或具有发展出gvhd倾向的受试者给药car-t细胞,该细胞缺乏或具有降低水平的功能性trac。在一种实施方案中,向患有宿主抗移植物疾病(hvgd)或具有发展出hvgd倾向的受试者给药car-t细胞,该细胞缺乏或具有降低水平的β2微球蛋白(b2m)。本发明还提出用于生产和使用这些经修饰的免疫细胞的方法。5.一方面,本发明提供一种组合物,其包含两种或更多种免疫细胞,每种免疫细胞包含a)不同的嵌合抗原受体,其靶向选自由cd5、cd7、cd3、cd33和cd123所组成的群组的抗原,其中该免疫细胞包含减少或消除所靶向抗原的表达的突变;和b)一个或多个突变,其减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的免疫原性多肽的表达。在一些实施方案中,免疫细胞中的一种包含靶向cd5的嵌合抗原受体,且另一种免疫细胞包含靶向选自由cd7、cd3、cd33和cd123所组成的群组的抗原的嵌合抗原受体。在一些实施方案中,组合物包含至少三种细胞,每一种包含靶向不同抗原的嵌合抗原受体,其中被靶向抗原是cd3、cd5和cd7。在一些实施方案中,免疫细胞中的一种表达靶向cd7的嵌合抗原受体,且另一种免疫细胞表达靶向选自由cd3、cd33和cd123所组成的群组的抗原的嵌合抗原受体。在一些实施方案中,免疫细胞中的一种表达靶向cd3的嵌合抗原受体,且另一种免疫细胞表达靶向选自由cd33和cd123所组成的群组的抗原的嵌合抗原受体。在一些实施方案中,免疫细胞中的一种表达靶向cd33的嵌合抗原受体,且另一种免疫细胞表达靶向cd123的嵌合抗原受体。在一些实施方案中,一种免疫细胞表达两种、三种、四种或更多种不同的嵌合抗原受体。在一些实施方案中,嵌合抗原受体中的一种靶向cd5,且另一嵌合抗原受体靶向选自由cd7、cd3、cd33和cd123所组成的群组的抗原。在一些实施方案中,嵌合抗原受体中的一种靶向cd7,且另一嵌合抗原受体靶向选自由cd3、cd33和cd123所组成的群组的抗原。在一些实施方案中,嵌合抗原受体中的一种靶向cd3,且另一嵌合抗原受体靶向选自由cd33和cd123所组成的群组的抗原。在一些实施方案中,嵌合抗原受体中的一种靶向cd33,且另一嵌合抗原受体靶向cd123。6.另一方面,本发明提供一种组合物,其包含至少三种免疫细胞,每一种包含不同的嵌合抗原受体,其中一种嵌合抗原受体靶向cd3,一种靶向cd5,且第三种靶向cd7,其中细胞进一步包含减少或消除被靶向抗原的表达的突变;并且进一步包含一个或多个突变,所述突变减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达。7.又一方面,本发明提供一种组合物,其包含至少两种免疫细胞,每一种包含不同的嵌合抗原受体,其中一种嵌合抗原受体靶向cd3,且另一种靶向cd7,其中细胞进一步包含减少或消除被靶向抗原的表达的突变;并且进一步包含一个或多个突变,所述突变减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达。8.一方面,本发明提供一种组合物,其包含至少两种免疫细胞,每一种包含不同的嵌合抗原受体,其中一种嵌合抗原受体靶向cd5,且另一种靶向cd7,其中细胞进一步包含减少或消除被靶向抗原的表达的突变;并且进一步包含一个或多个突变,所述突变减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达。9.另一方面,本发明提供一种组合物,其包含至少两种免疫细胞,每一种包含不同的嵌合抗原受体,其中一种嵌合抗原受体靶向cd3,且另一种靶向cd5,其中细胞进一步包含减少或消除被靶向抗原的表达的突变;并且进一步包含一个或多个突变,所述突变减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达。10.又一方面,本发明提供一种组合物,其包含至少两种免疫细胞,每一种包含不同的嵌合抗原受体,其中一种嵌合抗原受体靶向cd33,且另一种靶向cd123,其中细胞进一步包含减少或消除被靶向抗原的表达的突变;并且进一步包含一个或多个突变,所述突变减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达。11.在一些实施方案中,突变是c至t或a至g突变,该突变沉默所述基因或将终止密码子引入所述和基因中。在一些实施方案中,突变引入提前终止密码子或改变剪接供体或受体位点。在一些实施方案中,突变通过包含脱氨酶结构域的碱基编辑器生成。在一些实施方案中,脱氨酶是腺苷脱氨酶。在一些实施方案中,碱基编辑器是be4。在一些实施方案中,突变将编码多肽的表达相对于缺少所述突变的对应对照细胞减少约50%或更多。在一些实施方案中,组合物包含免疫细胞群。在一些实施方案中,群的至少50%包含一个或多个突变,所述突变减少或消除所述被靶向抗原和/或所述免疫原性多肽的表达。在一些实施方案中,免疫细胞是抗同类相杀的。在一些实施方案中,免疫细胞具有增加的抗瘤形成活性。在一些实施方案中,免疫细胞不包含可检测的易位。在一些实施方案中,免疫细胞包含少于1%的插入缺失。在一些实施方案中,免疫细胞是哺乳动物细胞。在一些实施方案中,免疫细胞是人类或啮齿动物细胞。在一些实施方案中,免疫细胞是细胞毒性t细胞、调节性t细胞、t辅助细胞、树突细胞、b细胞或nk细胞,或其祖细胞。在一些实施方案中,祖细胞是造血干细胞。12.一方面,本发明提供一种药物组合物,其包含有效量的任何本文所提供的组合物和药学上可接受的赋形剂。13.另一方面,本发明提供一种碱基编辑器系统,其包含融合蛋白,所述融合蛋白包含核酸可编程dna结合蛋白(napdnabp)和脱氨酶结构域,以及至少两个向导多核苷酸,每个向导多核苷酸靶向不同的抗原,其中抗原选自由cd5、cd7、cd3、cd33和cd123所组成的群组。在一些实施方案中,一种向导多核苷酸靶向cd5,且另一种靶向选自由cd7、cd3、cd33和cd123所组成的群组。在一些实施方案中,系统包含三个向导多核苷酸,每个向导多核苷酸靶向抗原cd3、cd5和cd7中的一者。在一些实施方案中,一种向导多核苷酸靶向cd7,且另一种靶向选自由cd3、cd33和cd123所组成的群组。在一些实施方案中,一种向导多核苷酸靶向cd3,且另一种靶向选自由cd33和cd123所组成的群组。在一些实施方案中,一种你想到多核苷酸靶向cd33,且另一种靶向cd123。14.在一些实施方案中,向导多核苷酸各自包含选自表26的核酸序列。在一些实施方案中,向导多核苷酸包含选自agcgacugcagaaagaagag或cauaccagcugagccguccg的核酸序列。在一些实施方案中,融合蛋白进一步包含一个或多个尿嘧啶糖基化酶抑制剂(ugi)和/或一个或多个核定位序列(nls)。在一些实施方案中,napdnabp包含cas9、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i或cas12j/casφ多肽或其部分。在一些实施方案中,napdnabp包含cas12多肽或其片段。在一些实施方案中,napdnabp包含cas9多肽或其片段。在一些实施方案中,cas9是死亡的cas9(dcas9)或cas9切口酶(ncas9)。在一些实施方案中,cas9是经修饰的金黄色葡萄球菌cas9(sacas9)、嗜热链球菌1cas9(st1cas9)、或经修饰的酿脓链球菌cas9(spcas9)。在一些实施方案中,cas9包含改变的前间区序列邻近基序(pam)特异性。在一些实施方案中,改变的pam对核酸序列5'-ngc-3'具有特异性。15.在一些实施方案中,脱氨酶结构域能够将胞苷或腺苷脱氨基。在一些实施方案中,脱氨酶结构域是腺苷脱氨酶结构域。在一些实施方案中,胞苷脱氨酶是apobec脱氨酶。在一些实施方案中,腺苷脱氨酶是tada变体。在一些实施方案中,tada变体是tada*8变体。在一些实施方案中,tada*8变体是tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12、tada*8.13、tada*8.14、tada*8.15、tada*8.16、tada*8.17、tada*8.18、tada*8.19、tada*8.20、tada*8.21、tada*8.22、tada*8.23或tada*8.24。在一些实施方案中,tada变体是tada*9变体。16.一方面,本发明提供一种药物组合物,其包含本文所提供的任何碱基编辑器系统。17.另一方面,本发明提供一种多核苷酸,其编码本文所提供的任何碱基编辑器系统和向导多核苷酸。18.又一方面,本发明提供一种载体,其包含本文所提供的任何多核苷酸。在一些实施方案中,载体是病毒载体。在一些实施方案中,病毒载体是逆转录病毒载体、腺病毒载体、慢病毒载体、疱疹病毒载体或腺相关病毒载体(aav)。19.一方面,本发明提供一种药物组合物,其包含本文所提供的任何多核苷酸或任何载体。20.一方面,本发明提供一种用于生产具有降低的免疫原性的表达car的免疫细胞的方法。在一些实施方案中,该方法包括在表达car的免疫细胞中表达碱基编辑器系统,该碱基编辑器系统包含融合蛋白和两个向导多核苷酸,该融合蛋白包含核酸可编程dna结合蛋白(napdnabp)和脱氨酶结构域,该向导多核苷酸各自靶向编码不同抗原的多核苷酸,其中抗原选自由cd5、cd7、cd3、cd33和cd123所组成的群组,从而生产具有降低的免疫原性的表达car的免疫细胞。在一些实施方案中,免疫细胞表达或接触向导多核苷酸,所述向导多核苷酸靶向编码选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的多核苷酸。21.在一些实施方案中,该方法包括(a)在表达car的免疫细胞中表达碱基编辑器系统,该碱基编辑器系统包含融合蛋白,该融合蛋白包含核酸可编程dna结合蛋白(napdnabp)和脱氨酶结构域,和(b)使该表达car的免疫细胞与至少两个向导多核苷酸接触,每个向导多核苷酸靶向编码不同抗原的多核苷酸,其中所述抗原选自由cd5、cd7、cd3、cd33和cd123所组成的群组,从而生产具有降低的免疫原性的表达car的免疫细胞。22.在一些实施方案中,该方法进一步包括使表达car的免疫细胞与向导多核苷酸接触,所述向导多核苷酸靶向编码选自由trac、lag-3、fas、ciita、trb在一些实施方案中,免疫细胞表达嵌合抗原受体(car),所述car靶向选自由cd5、cd7、cd3、cd33和cd123所组成的群组的抗原。在一些实施方案中,该方法进一步包括将突变引入免疫细胞内,所述突变减少或消除选自由ttrac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的至少一种多肽的表达,从而生产具有降低的免疫原性的表达car的免疫细胞群。23.一方面,本发明提供一种用于生产具有降低的免疫原性的表达car的免疫细胞群的方法。在一些实施方案中,该方法包括a)将减少或消除选自由cd5、cd7、cd3、cd33和cd123所组成的群组的抗原的表达的突变引入一种免疫细胞内并将所述抗原中的一个中的不同突变引入第二种免疫细胞内;及b)将突变引入所述免疫细胞内,所述突变减少或消除选自由ttrac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的至少一种多肽的表达,从而生产具有降低的免疫原性的表达car的免疫细胞群。在一些实施方案中,由免疫细胞表达的嵌合抗原受体靶向选自由cd3、cd5、cd7、cd33和cd123所组成的群组的抗原。在一些实施方案中,通过该方法生产的免疫细胞表达靶向cd3、cd5和/或cd7抗原的嵌合抗原受体,但未能表达或表达降低的水平的cd3、cd5和/或cd7抗原。在一些实施方案中,通过该方法生产的免疫细胞表达靶向cd33和cd123抗原的嵌合抗原受体,但未能表达或表达降低的水平的cd33和cd123抗原。在一些实施方案中,car是cd5嵌合抗原受体(car)。在一些实施方案中,cd5car由表28中呈现的cd5car构建体编码。24.另一方面,本发明提供一种用于生产具有降低的免疫原性的免疫细胞的方法。在一些实施方案中,该方法包括a)将突变引入内源性cd5基因序列中或调节元件中,该突变减少或消除cd5的表达;以及b)在所述细胞中表达表28中呈现的cd5car构建体。在一些实施方案中,cd5car构建体编码cd5car多肽,所述多肽包含选自下列的氨基酸序列或由其组成:25.a)[0026][0027]b)[0028][0029][0030]c)[0031][0032]d)[0033][0034][0035]e)[0036][0037]在一些实施方案中,与相对应的对照细胞相比,通过该方法生产的免疫细胞表现出抗同类相杀性和/和增加的抗瘤形成活性。在一些实施方案中,该方法在体内或间接体内进行。在一些实施方案中,通过该方法生成的免疫细胞不包含可检测的易位。在一些实施方案中,通过该方法生成的免疫细胞包含少于1%的插入缺失。在一些实施方案中,通过该方法生成的免疫细胞包含少于5%的非靶标编辑。在一些实施方案中,通过该方法生成的免疫细胞包含少于5%的脱靶编辑。在一些实施方案中,通过核碱基修饰来生成突变。在一些实施方案中,突变在外显子中。在一些实施方案中,突变导致减少或消除蛋白质表达的提前终止密码子。在一些实施方案中,突变在剪接供体位点或剪接受体位点中。在一些实施方案中,一个或多个突变通过使靶标多核苷酸与碱基编辑器系统接触来生成,所述碱基编辑器系统包含具有核酸可编程dna结合蛋白(napdnabp)的融合蛋白、脱氨酶和一个或多个向导多核苷酸。[0038]在一些实施方案中,脱氨酶是腺苷或胞苷脱氨酶。在一些实施方案中,胞苷脱氨酶是be4。在一些实施方案中,突变将编码多肽的表达相对于缺少所述突变的对应对照细胞减少至少约50%或更多。在一些实施方案中,向导多核苷酸包含选自表26处所提供的那些的序列。在一些实施方案中,向导多核苷酸包含选自agcgacugcagaaagaagag或cauaccagcugagccguccg的核酸序列。在一些实施方案中,一个或多个核酸序列各自将napdnabp靶向至cd5、fas、lag-3、cd52、trac、b2m、ciita、trbc1、trbc2和/或pdc1/pd-1基因或调节元件。在一些实施方案中,通过电穿孔、核转染、阳离子脂质介导的方法、病毒转导或其组合将碱基编辑器和一个或多个向导核酸序列引入免疫细胞中。在一些实施方案中,该方法进一步包括将免疫细胞在培养物中扩张以生成免疫细胞群。在一些实施方案中,在至少约50%的免疫细胞群中,抗原或多肽的表达减少。在一些实施方案中,该方法进一步包括从所述免疫细胞群中耗尽tcrα/β+细胞。[0039]一方面,本发明提供通过本文所提供的任何方法生产的具有降低的免疫原性的表达car的免疫细胞。[0040]另一方面,本发明提供一种药物组合物,其包含本文所提供的任何免疫细胞。在一些实施方案中,药物组合物包括药学上可接受的赋形剂。[0041]又一方面,本发明提供一种用于杀死肿瘤细胞的方法。在一些实施方案中,该方法包括使表达选自由cd5、cd7、cd3、cd33和cd123所组成的群组的抗原的肿瘤细胞与两种或更多种免疫细胞接触,每种免疫细胞表达不同的嵌合抗原受体,所述嵌合抗原受体靶向该细胞所表达的抗原中的两者,其中免疫细胞包含一个或多个减少或消除被靶向抗原的表达的突变,和一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变。在一些实施方案中,该方法在体外或体内进行。在一些实施方案中,肿瘤细胞源自瘤形成。[0042]一方面,本发明提供用于治疗受试者的瘤形成的方法。在一些实施方案中,该方法包括向受试者给药两种或更多种免疫细胞,每种免疫细胞表达不同的嵌合抗原受体,所述嵌合抗原受体靶向由受试者的肿瘤细胞表达的抗原,所述抗原选自由cd5、cd7、cd3、cd33和cd123所组成的群组,其中免疫细胞包含一个或多个减少s或消除所述抗原的表达的突变,且免疫细胞各自进一步包含一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变。[0043]在一些实施方案中,瘤形成是血液学癌症。在一些实施方案中,瘤形成是液态癌症。在一些实施方案中,血液学癌症是白血病、骨髓瘤和/或淋巴瘤。在一些实施方案中,血液学癌症是b细胞癌症。在一些实施方案中,血液学癌症选自以下至少一项:t细胞急性成淋巴细胞性白血病(t-all)、蕈样肉芽肿(mf)、sézary综合征(ss)、外周t/nk细胞淋巴瘤、间变性大细胞淋巴瘤alk+、原发性皮肤t细胞淋巴瘤、t细胞大颗粒淋巴细胞型白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+淋巴增生性疾病、结外nk/t细胞淋巴瘤、成人t细胞白血病/淋巴瘤、t细胞幼淋巴细胞白血病、皮下脂膜炎样t细胞淋巴瘤、原发性皮肤γδt细胞淋巴瘤、侵袭性nk细胞白血病和肠病相关t细胞淋巴瘤。在一些实施方案中,血液学癌症是t细胞急性成淋巴细胞性白血病(t-all)细胞。在一些实施方案中,血液学癌症是t细胞急性骨髓性白血病(aml)。[0044]另一方面,本发明提供用于治疗选定受试者的瘤形成的方法。在一些实施方案中,该方法包括向选定受试者给药两种或更多种免疫细胞,每种免疫细胞表达不同的嵌合抗原受体,所述嵌合抗原受体靶向由受试者的肿瘤细胞表达的抗原,其中抗原选自由cd5、cd7、cd3、cd33和cd123所组成的群组,其中免疫细胞包含一个或多个减少或消除所述抗原的表达的突变,且免疫细胞各自进一步包含一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变,其中受试者经选择为患有表达选自由cd5、cd7、cd3、cd33和cd123所组成的群组的抗原的瘤形成。在一些实施方案中,血液学癌症是t细胞急性成淋巴细胞性白血病(t-all)细胞。在一些实施方案中,血液学癌症是t细胞急性骨髓性白血病(aml)。在一些实施方案中,两种或更多种表达不同嵌合抗原受体的免疫细胞依次给药。在一些实施方案中,两种或更多种表达不同嵌合抗原受体的免疫细胞同时给药。[0045]又一方面,本发明提供一种用于抗原依赖性地杀死受试者肿瘤细胞的方法。在一些实施方案中,该方法包括向患有表达选自由cd5、cd7、cd3、cd33和cd123所组成的群组的抗原的瘤形成的受试者给药两种或更多种免疫细胞,每种免疫细胞表达不同的嵌合抗原受体,所述嵌合抗原受体靶向所述抗原中的一者,其中免疫细胞包含一个或多个减少或消除被靶向抗原的表达的突变,和一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变。[0046]一方面,本发明提供一种用于抗原依赖性地杀死受试者急性骨髓性白血病(aml)细胞的方法。在一些实施方案中,该方法包括向患有表达cd33和cd123抗原的aml的受试者给药两种或更多种免疫细胞,每种免疫细胞表达不同的嵌合抗原受体,所述嵌合抗原受体靶向所述抗原中的一者,其中所述免疫细胞包含一个或多个减少或消除所述被靶向抗原的表达的突变,和一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变。[0047]一方面,本发明提供一种用于抗原依赖性地杀死受试者t细胞急性成淋巴细胞性白血病(t-all)细胞的方法。在一些实施方案中,该方法包括向患有表达cd3、cd5和cd7抗原的t-all的受试者给药至少三种免疫细胞,每种免疫细胞表达不同的嵌合抗原受体,所述嵌合抗原受体靶向所述抗原中的一者,其中所述免疫细胞包含一个或多个减少或消除所述被靶向抗原的表达的突变,和一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变。[0048]另一方面,本发明提供用于治疗选定受试者的癌症的方法。在一些实施方案中,该方法包括向受试者给药至少两种免疫细胞,每种免疫细胞表达靶向cd33或cd123抗原的嵌合抗原受体,其中免疫细胞包含一个或多个减少或消除所述和被靶向抗原的表达的突变,和一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变,其中受试者通过将癌症表征为表达cd33和cd123抗原来选择。在一些实施方案中,表达cd33和cd123抗原的癌症是aml。[0049]又一方面,本发明提供用于治疗选定受试者的癌症的方法。在一些实施方案中,该方法包括向受试者给药三种或更多种免疫细胞,每种免疫细胞表达靶向cd3、cd5和cd7抗原的不同嵌合抗原受体,其中免疫细胞包含一个或多个减少或消除所述和被靶向抗原的表达的突变,和一个或多个减少或消除选自由trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1所组成的群组的多肽的表达的突变,其中所述受试者通过将所述癌症表征为表达cd3、cd5和cd7抗原来选择。在一些实施方案中,表达cd3、cd5和cd7抗原的癌症是t-all。[0050]在一些实施方案中,免疫细胞是细胞毒性t细胞、调节性t细胞、t辅助细胞、树突细胞、b细胞或nk细胞。在一些实施方案中,受试者先前已经用淋巴细胞删除进行治疗。在一些实施方案中,淋巴细胞删除包括给药环磷酰胺、氟达拉滨和/或阿仑单抗(cy/flu/campath)。在一些实施方案中,受试者对于化疗是难治性的或具有高肿瘤负荷。在一些实施方案中,受试者随后用同种异体造血干细胞移植(allo-hsct)进行治疗。在一些实施方案中,免疫细胞源自单个人类供体。在一些实施方案中,免疫细胞对于受试者是自体的。在一些实施方案中,免疫细胞对于受试者是同种异体的。在一些实施方案中,受试者是哺乳动物受试者。在一些实施方案中,受试者是人类或啮齿动物。在一些实施方案中,受试者是人类儿童受试者。[0051]一方面,本发明提供一种试剂盒,其包括本文所提供的任何组合物,用于治疗癌症。两一方面,本发明提供一种试剂盒,其包括本文所提供的任何碱基编辑器系统,用于生成具有降低的免疫原性的表达car的免疫细胞。在一些实施方案中,本文所提供的任何试剂盒包括用于使用该试剂盒的书面使用说明。[0052]本文的说明和实施例详细示出了本公开的实施方案。应理解,本公开不限于本文所述的特定实施方案并因此可变。本领域技术人员将认识到,存在大量涵盖于本公开范畴内的对本公开的变更和修饰。[0053]除非另外指明,否则本文所公开的一些实施方案的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因学和重组dna的常规技术,这些技术是本领域所能做到的。参见,例如,sambrookandgreen,molecularcloning:alaboratorymanual,第四版(2012);currentprotocolsinmolecularbiology系列(f.m.ausubel,等人eds.);methodsinenzymology系列(academicpress,inc.);pcr2:apracticalapproach(m.j.macpherson,b.d.hamesandg.r.tayloreds.(1995));harlowandlane,eds.(1988)antibodies,alaboratorymanual;和cultureofanimalcells:amanualofbasictechniqueandspecializedapplications,第六版(r.i.freshney,ed.(2010)。[0054]尽管本公开的各种特征可以在单一实施方案的情境中描述,但这些特征也可以单独提供或以任何组合提供。相反,尽管为了清楚起见,可以在单独实施方案的情境中描述本发明,但本发明也可以在单一实施方案中实现。本文所用的章节标题仅用于组织目的,而不视为对所描述的主旨的限制。[0055]本公开的特征在所附权利要求书中以特殊性详述。通过参考以下详述示例性实施方案的具体实施方式(其中使用了本公开的原理)以及下文所述的附图,可获得对本公开的特征和优点的更佳理解。[0056]定义[0057]以下定义是对本领域定义的补充并针对本技术,且不适用于任何相关或不相关的案例,例如,任何重复授权的专利或申请。尽管与本文所述类似或等效的任何方法和材料可用于实践或测试本公开,但优选的材料和方法如本文所述。据此,本文使用术语仅用于描述具体实施方案的目的,而不试图限制。[0058]除非另做定义,否则本文使用的全部科技术语均具有本发明所属领域技术人员通常理解的意义。下述参考文献向技术人员提供很多本发明所用术语的一般定义:《微生物学和分子生物学词典(第二版)》(singleton等人,dictionaryofmicrobiologyandmolecularbiology(2nded.1994));《剑桥科技词典》(hecambridgedictionaryofscienceandtechnology(walkered.,1988));《遗传性专业词典(第五版)》(theglossaryofgenetics,5thed.,r.rieger等人(eds.),springerverlag(1991));以及《哈珀·柯林斯生物学词典》(hale&marham,theharpercollinsdictionaryofbiology(1991))。[0059]在本技术中,除非具体地另做指定,否则单数的使用包括复数。必须注意的是,如本说明书中所用,除非语境中明确地另外指明,否则单数形式“一”和“该”包括多个所指对象。在本技术中,除非另做指定“或”的使用意为“和/或”,并且理解为是包含性的。此外,术语“包括”以及其他形式诸如动词形式、主动或被动形式的使用没有限制。[0060]如本说明书和权利要求书中所用,词语“包含”(和任何形式的包含,诸如单数和复数形式)、“具有”(和任何形式的具有,诸如单数和复数形式)、“包括”(和任何形式的包括,诸如单数和复数形式)或“含有”(和任何形式的含有,诸如单数和复数形式)是包含性的或开放的,并且不排除额外的、未引用的元件或方法步骤。设想本说明书中讨论的任何实施方案可以关于本公开的任何方法或组合物来实施,反之亦然。此外,本公开的组合物可用于实现本公开的方法。[0061]术语“约”或“大约”意为处于由本领域一般技术人员确定的特定值的可接受的误差范围内,将部分地取决于该值如何测量或测定,即,测量系统的限制。例如,“约”可以意为,根据本领域的实践,处于一(1)个或超过一(1)个标准偏差内。或者,“约”可以意为给定至的至多20%、至多10%、至多5%、或至多1%的范围。或者,特别是关于生物系统或过长,该术语可以意为处于一定数量级内,诸如值的5倍内或2倍内。当在申请书和权利要求书中描述特定值时,除非另外指定,否则应假定术语“约”意为处于特定值的可接受的误差范围内。[0062]本文提供的范围理解为是该范围内所有值的简写。例如,1至50的范围理解为包括来自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50所组成组的任何数字、数字组合或子范围。[0063]说明书中的“一些实施方案”、“实施方案”、“一种实施方案”或“其他实施方案”意为关于实施方案描述的特定特点、结构或特征包括在本公开的至少一些实施方案中,但不必包括在全部实施方案中。[0064]“腺苷脱氨酶”意为能够催化腺嘌呤或腺苷的水解脱氨基的多肽或其片段。在一些实施方案中,脱氨酶或脱氨酶结构域是催化腺苷到肌苷或脱氧腺苷到脱氧肌苷的水解脱氨基。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(dna)中的腺嘌呤或腺苷的水解脱氨基。本文提供的腺苷脱氨酶(例如,工程改造的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体诸如细菌。[0065]在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体诸如人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠的天然存在的脱氨酶的变体。在一些实施方案中,腺苷脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域与天然存在的脱氨酶为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%相同。在一些实施方案中,腺苷脱氨酶来自细菌,诸如大肠杆菌(e.coli)、金黄色葡萄球菌(s.aureus)、枯草芽孢杆菌(b.subtilis)、伤寒沙门氏菌(s.typhi)、腐败希瓦氏菌(s.putrefaciens)、流感嗜血杆菌(h.influenzae)、新月柄杆菌(c.crescentus)或硫还原地杆菌(g.sulfurreducens)。在一些施方案中,腺苷脱氨酶是tada脱氨酶。在一些实施方案中,tada脱氨酶是大肠杆菌tada(ectada)脱氨酶或其片段。[0066]在一些实施方案中,ectada胞苷脱氨酶是ectada。例如,截短的ectada可以相对于全长ectada缺少一个或多个n端氨基酸。在一些实施方案中,相对于全长ectada,截短的ectada8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,相对于全长ectada,截短的ectada8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,ectada脱氨酶不包含n端甲硫氨酸。在一些实施方案中,tada脱氨酶是n端截短的tada。在特定实施方案中,tada是pct/us2017/045381中描述的tada中的任一种,该专利通过引用并入本文。[0067]在一些实施方案中,tada脱氨酶是tada变体。在一些实施方案中,tada变体是tada*7.10。在一些实施方案中,tada变体是tada*8。在一些实施方案中,tada*8是tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12、tada*8.13、tada*8.14、tada*8.15、tada*8.16、tada*8.17、tada*8.18、tada*8.19、tada*8.20、tada*8.21、tada*8.22、tada*8.23或tada*8.24。在一些实施方案中,tada*8是tada*8a、tada*8b、tada*8c、tada*8d或tada*8e。在一些实施方案中,tada*8是tada*8e。在一些实施方案中,tada变体是tada*9。[0068]“腺苷脱氨酶碱基编辑器8(abe8)多肽”或“abe8”意为本文所定义的包含腺苷脱氨酶变体的碱基编辑器,该腺苷脱氨酶变体包含在以下参考序列的氨基酸位置82和/或166处的改变:msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0069]在一些实施方案中,abe8包含相对于参考序列的如本文所述的进一步改变。[0070]“腺苷脱氨酶碱基编辑器8(abe8)多肽”意为编码abe8的多核苷酸。[0071]“腺苷脱氨酶碱基编辑器9(abe9)多肽”或“abe9”意为本文所定义的包含腺苷脱氨酶变体的碱基编辑器,该腺苷脱氨酶变体包含以下改变中的一者或多者:r21n、r23h、e25f、n38g、l51w、p54c、m70v、q71m、n72k、y73s、v82t、m94v、p124w、t133k、d139l、d139m、c146r和a158k,这些改变在以下参考序列中:[0072][0073]在参考序列中改变的相关碱基以下划线和加粗字体显示。在一些实施方案中,abe9包含相对于参考序列的如本文所述的进一步改变。abe9碱基编辑器的细节在国际pct申请号pct/2020/049975中描述,其通过引用以其整体并入本文。[0074]“腺苷脱氨酶碱基编辑器9(abe9)多肽”意为编码abe9的多核苷酸。[0075]本文中,“给药”指代向患者或受试者提供一种或多种本文所述的组合物。例如但不限于,组合物给药(例如,注射)可以通过静脉内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹腔内(i.p.)注射或肌肉内(i.m.)注射执行。可采用一种或多种此类途径。肠胃外给药可以通过例如积存注射或通过随时间推移的渐进输液进行。在一些实施方案中,肠胃外给药包括血管内、静脉内、肌肉内、动漫、鞘内、肿瘤内、皮内、腹膜内、透过器官、皮下、表皮下、关节内、包膜下、蛛网膜下和胸骨内输液或注射。或者或同时,给药可以通过口服途径进行。[0076]“药剂”意为任何小分子化学化合物、抗体、核酸分子或多肽,或其片段。[0077]“改变”意为通过该领域的标准已知方法例如本文所述的那些方法检测的基因或多肽的结构、表达水平或活性的变化(例如增加或减少)。如本文所用,改变(例如增加或减少)包括多核苷酸或多肽的变化或表达水平的变化,诸如10%的变化、25%的变化、40%的变化、或50%的变化或更高。[0078]如本文所用,“同种异体的”是指在基因上与被比较细胞有所不同的同一物种的细胞。[0079]“缓解”意为减少、压制、衰减、消除、阻止疾病的发展或进展或令疾病的发展或进展稳定化。[0080]“类似物”意为不相同但具有类似的功能或结构特征的分子。例如,多核苷酸或多肽类似物保留对应的天然存在的多核苷酸或多肽的生物学活性,同时具有某些修饰,这些修饰将所述类似物的功能相对于天然存在的多核苷酸或多肽增强。此类修饰可增加所述类似物对dna的亲和性、效率、特异性、蛋白酶或蛋白酶耐性、膜渗透性和/或半衰期,而不改变例如配体结合。类似物可包括非天然核苷酸或氨基酸。[0081]“抗瘤形成活性”意为预防或抑制肿瘤的突变和/或增殖。[0082]如本文所用,“自体的”是指来自同一受试者的细胞。[0083]如本文所用,术语“抗体”是指一种免疫球蛋白分子,其特异性地结合至特定抗原或具有与特定抗原的免疫学反应性,并且包括多克隆、单克隆、基因工程改造的和其他修饰形式的抗体,包括但不限于嵌合抗体、人源化抗体、异源缀合物抗体(例如,双特异性抗体、三特异性抗体、四特异性抗体、双体抗体、三体抗体和四体抗体)和抗体的抗原结合片段,包括例如fab'、f(ab')2、fab、fv、rlgg和scfv片段。除非另外指出,否则术语“单克隆抗体”(mab)意为包括完整分子以及能够特异性地结合至靶标蛋白的抗体片段(包括例如fab和f(ab')2片段)两者。如本文所用,fab和f(ab')2片段是指缺乏完整抗体的fc片段的抗体片段。这些抗体片段示例在本文中描述。[0084]“b细胞成熟抗原,或肿瘤坏死因子受体超家族成员17多肽,(bcma)”意为一种在成熟b淋巴细胞上表达的蛋白质,其与ncbi登录号np_001183或其片段具有至少约85%的氨基酸序列一致性。示例性bcma多肽序列提供如下。[0085]》np_001183.2肿瘤坏死因子受体超家族成员17[智人(homosapiens)][0086]mlqmagqcsqneyfdsllhacipcqlrcssntppltcqrycnasvtnsvkgtnailwtclglsliislavfvlmfllrkinseplkdefkntgsgllgmanidleksrtgdeiilprgleytveectcedcikskpkvdsdhcfplpameegatilvttktndyckslpaalsateieksisar[0087]在复发性或难治性多发性骨髓瘤和其他血液肿瘤疗法中可以靶向该抗原。[0088]“b细胞成熟抗原,或肿瘤坏死因子受体超家族成员17,(bcma)多核苷酸”意为编码bcma多肽的核酸分子。bcma基因编码细胞表面抗原,该细胞表面抗原识别b细胞激活因子。示例性b2m多核苷酸序列提供如下。[0089]》nm_001192.2智人(homosapiens)tnf受体超家族成员17(tnfrsf17),mrna[0090]aagactcaaacttagaaacttgaattagatgtggtattcaaatccttagctgccgcgaagacacagacagcccccgtaagaacccacgaagcaggcgaagttcattgttctcaacattctagctgctcttgctgcatttgctctggaattcttgtagagatattacttgtccttccaggctgttctttctgtagctcccttgttttctttttgtgatcatgttgcagatggctgggcagtgctcccaaaatgaatattttgacagtttgttgcatgcttgcataccttgtcaacttcgatgttcttctaatactcctcctctaacatgtcagcgttattgtaatgcaagtgtgaccaattcagtgaaaggaacgaatgcgattctctggacctgtttgggactgagcttaataatttctttggcagttttcgtgctaatgtttttgctaaggaagataaactctgaaccattaaaggacgagtttaaaaacacaggatcaggtctcctgggcatggctaacattgacctggaaaagagcaggactggtgatgaaattattcttccgagaggcctcgagtacacggtggaagaatgcacctgtgaagactgcatcaagagcaaaccgaaggtcgactctgaccattgctttccactcccagctatggaggaaggcgcaaccattcttgtcaccacgaaaacgaatgactattgcaagagcctgccagctgctttgagtgctacggagatagagaaatcaatttctgctaggtaattaaccatttcgactcgagcagtgccactttaaaaatcttttgtcagaatagatgatgtgtcagatctctttaggatgactgtatttttcagttgccgatacagctttttgtcctctaactgtggaaactctttatgttagatatatttctctaggttactgttgggagcttaatggtagaaacttccttggtttcatgattaaactcttttttttcctga[0091]“碱基编辑器(be)”或“核碱基编辑器(nbe)”意为结合多核苷酸并具有核碱基修饰活性的药剂。在一种实施方案中,该药剂使用核酸可编程dna结合蛋白在特异性序列处结合多核苷酸。在另一实施方案中,碱基编辑器是能够修饰核酸分子(例如dna)内的胞苷碱基的酶。在一些实施方案中,碱基编辑器能够将核酸分子内的碱基脱氨基。在一些实施方案中,碱基编辑器能够将dna分子内的碱基脱氨基。在一些实施方案中,碱基编辑器能够将dna内的胞苷脱氨基。在一些实施方案中,碱基编辑器是包含胞苷脱氨酶或腺苷脱氨酶的融合蛋白。在一些实施方案中,碱基编辑器是融合至胞苷脱氨酶或腺苷脱氨酶的cas9蛋白。在一些实施方案中,碱基编辑器是融合至胞苷脱氨酶或腺苷脱氨酶的cas9切口酶(ncas9)。在一些实施方案中,碱基编辑器融合至碱基切除修复的抑制剂,例如,ugi结构域。在一些实施方案中,融合蛋白包含cas9切口酶,该切口酶融合至脱氨酶和碱基切除修复的抑制剂,诸如ug结构域。[0092]在一些实施方案中,胞苷脱氨酶或腺苷脱氨酶核碱基编辑器是包含以下结构域a-b的多肽:nh2-[a-b]-cooh,其中a包含胞苷脱氨酶结构域、腺苷脱氨酶结构域或其活性片段,并且其中b包含一个或多个具有核酸序列特异性结合活性的结构域。在一种实施方案中,先前方面的胞苷或腺苷脱氨酶核碱基编辑器多肽含有:nh2-[an-bo]-cooh,其中a包含胞苷脱氨酶结构域、腺苷脱氨酶结构域或其活性片段,其中n是整数:1、2、3、4或5;并且其中b包含具有核酸序列特异性结合活性的结构域;并且其中o是整数:1、2、3、4或5。在一种实施方案中,多肽含有一个或多个核定位序列。在一种实施方案中,多肽含有位于n端或c端的至少一个所述核定位序列。在一种实施方案中,多肽含有作为二分体核定位信号的核定位信号。在一种实施方案中,多肽含有一个或多个通过连接子链接的结构域。[0093]在一些实施方案中,碱基编辑器是胞苷碱基编辑器(cbe)。在一些实施方案中,碱基编辑器是腺苷碱基编辑器(abe)。在一些实施方案中,碱基编辑器是腺苷碱基编辑器(abe)和胞苷碱基编辑器(cbe)。在一些实施方案中,碱基编辑器是融合至腺苷脱氨酶的无核酸酶活性的cas9(dcas9)。在一些实施方案中,cas9是环状排列的(circularpermutant)cas9(例如,spcas9或sacas9)。环状排列的cas9是本领域中已知的并且在例如oakes等人,cell176,254–267,2019中描述。在一些实施方案中,碱基编辑器融合至碱基切除修复的抑制剂,例如,ugi结构域或disn结构域。在一些实施方案中,融合蛋白包含cas9切口酶,该切口酶融合至脱氨酶和碱基切除修复的抑制剂,诸如ugi或disn结构域。在其他实施方案中,碱基编辑器是无碱基的碱基编辑器。[0094]在一些实施方案中,腺苷脱氨酶从tada进化而来。在一些实施方案中,多核苷酸可编程dna结合结构域是crispr相关(例如,cas或cpf1)酶。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的催化上死亡的cas9(dcas9)。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的cas9切口酶(ncas9)。在一些实施方案中,碱基编辑器融合至碱基切除修复(ber)的抑制剂。在一些实施方案中,碱基切除修复的抑制剂是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,碱基切除修复的抑制剂是肌苷碱基切除修复抑制剂。[0095]在一些实施方案中,通过将腺苷脱氨酶变体(例如,tada*7.10)克隆到支架中来生成碱基编辑器,该支架包括环状排列的cas9(例如,spcas9)和二分体核定位序列。在一些实施方案中,通过将腺苷脱氨酶变体(例如,tada*8)克隆到支架中来生成碱基编辑器(例如,abe8),该支架包括环状排列的cas9(例如,spcas9或sacas9)和二分体核定位序列。环状排列的cas9是本领域中已知的并且在例如oakes等人,cell176,254–267,2019中描述。[0096]在一些实施方案中,多核苷酸可编程dna结合结构域是crispr相关(例如,cas或cpf1)酶。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的催化上死亡的cas9(dcas9)。在一些实施方案中,碱基编辑器是融合至脱氨酶结构域的cas9切口酶(ncas9)。在一些实施方案中,碱基编辑器融合至碱基切除修复(ber)的抑制剂。在一些实施方案中,碱基切除修复的抑制剂是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,碱基切除修复的抑制剂是肌苷碱基切除修复抑制剂。[0097]碱基编辑器的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用以其整体并入本文。也参见komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017);和rees,h.a.,等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其整体内容通过引用并入本文。[0098]例如,用于本文所述的碱基编辑组合物、系统和方法中的腺苷碱基编辑器(abe)具有如下所述的核酸序列(8877个碱基对)(addgene,watertown,ma.;gaudellinm,等人,nature.2017nov23;551(7681):464-471.doi:10.1038/nature24644;koblanlw,等人,natbiotechnol.2018oct;36(9):843-846.doi:10.1038/nbt.4172.)。也涵盖与abe核酸序列具有至少95%或更高一致性的多核苷酸序列。[0099]atatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctctgaagtcgagtttagccacgagtattggatgaggcacgcactgaccctggcaaagcgagcatgggatgaaagagaagtccccgtgggcgccgtgctggtgcacaacaatagagtgatcggagagggatggaacaggccaatcggccgccacgaccctaccgcacacgcagagatcatggcactgaggcagggaggcctggtcatgcagaattaccgcctgatcgatgccaccctgtatgtgacactggagccatgcgtgatgtgcgcaggagcaatgatccacagcaggatcggaagagtggtgttcggagcacgggacgccaagaccggcgcagcaggctccctgatggatgtgctgcaccaccccggcatgaaccaccgggtggagatcacagagggaatcctggcagacgagtgcgccgccctgctgagcgatttctttagaatgcggagacaggagatcaaggcccagaagaaggcacagagctccaccgactctggaggatctagcggaggatcctctggaagcgagacaccaggcacaagcgagtccgccacaccagagagctccggcggctcctccggaggatcctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagagggcacgcgatgagagggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctggaacagagccatcggcctgcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctggtcatgcagaactacagactgattgacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccggcgccatgatccactctaggatcggccgcgtggtgtttggcgtgaggaacgcaaaaaccggcgccgcaggctccctgatggacgtgctgcactaccccggcatgaatcaccgcgtcgaaattaccgagggaatcctggcagatgaatgtgccgccctgctgtgctatttctttcggatgcctagacaggtgttcaatgctcagaagaaggcccagagctccaccgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaa[0100]cttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacactcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactac[0101]gatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatc[0102]在一些实施方案中,碱基编辑器是腺苷脱氨酶碱基编辑器8(abe8)。在一些实施方案中,abe8选自来自下文表13、14或16的碱基编辑器。在一些实施方案中,abe8含有从tada进化而来的腺苷脱氨酶。在一些实施方案中,abe8的腺苷脱氨酶变体是如下文表11、13或14中所述的tada*8变体。在一些实施方案中,腺苷脱氨酶是tada*7.10变体(例如,tada*8),其包含选自由以下组的改变中的一者或多者:y147t、q154s、y123h、v82s、t166r和/或q154r。在各种实施方案中,abe8包含tada*7.10变体(例如,tada*8),该变体具有选自以下组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r。在一些实施方案中,abe8是单体构建体。在一些实施方案中,abe8是异二聚构建体。在一些实施方案中,abe8碱基编辑器包含序列:[0103]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd。[0104]例如,如在本文所述的碱基编辑组合物、系统和方法中使用的胞苷碱基编辑器(cbe)具有如下提供的以下核酸序列(8877个碱基对)(addgene,watertown,ma.;komorac,等人,2017,sciadv.,30;3(8):eaao4774.doi:10.1126/sciadv.aao4774)。也涵盖与be4核酸序列具有至少95%或更高一致性的多核苷酸序列。[0105][0106][0107][0108]在一些实施方案中,胞苷碱基编辑器是具有选自以下中的一个的核酸序列的be4:[0109]原始be4核酸序列:[0110]atgagctcagagactggcccagtggctgtggaccccacattgagacggcggatcgagccccatgagtttgaggtattcttcgatccgagagagctccgcaaggagacctgcctgctttacgaaattaattgggggggccggcactccatttggcgacatacatcacagaacactaacaagcacgtcgaagtcaacttcatcgagaagttcacgacagaaagatatttctgtccgaacacaaggtgcagcattacctggtttctcagctggagccgcgaatgtagtagggccatcactgaattcctgtcaaggtatccccacgtcactctgtttatttacatcgcaaggctgtaccaccacgctgacccccgcaatcgacaaggcctgcgggatttgatctcttcaggtgtgactatccaaattatgactgagcaggagtcaggatactgctggagaaactttgtgaattatagcccgagtaatgaagcccactggcctaggtatccccatctgtgggtacgactgtacgttcttgaactgtactgcatcatactgggcctgcctccttgtctcaacattctgagaaggaagcagccacagctgacattctttaccatcgctcttcagtcttgtcattaccagcgactgcccccacacattctctgggccaccgggttgaaatctggtggttcttctggtggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggtggttcttctggtggttctgataaaaagtattctattggtttagccatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgactctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctggaggatctggtggt[0111]tctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctaaaaggacggcggacggatcagagttcgagagtccgaaaaaaaaacgaaaggtcgaataa[0112]be4密码子优化1核酸序列:[0113]atgtcatccgaaaccgggccagtggccgtagacccaacactcaggaggcggatagaaccccatgagtttgaagtgttcttcgaccccagagagctgcgcaaagagacttgcctcctgtatgaaataaattgggggggtcgccattcaatttggaggcacactagccagaatactaacaaacacgtggaggtaaattttatcgagaagtttaccaccgaaagatacttttgccccaatacacggtgttcaattacctggtttctgtcatggagtccatgtggagaatgtagtagagcgataactgagttcctgtctcgatatcctcacgtcacgttgtttatatacatcgctcggctttatcaccatgcggacccgcggaacaggcaaggtcttcgggacctcatatcctctggggtgaccatccagataatgacggagcaagagagcggatactgctggcgaaactttgttaactacagcccaagcaatgaggcacactggcctagatatccgcatctctgggttcgactgtatgtccttgaactgtactgcataattctgggacttccgccatgcttgaacattctgcggcggaaacaaccacagctgacctttttcacgattgctctccaaagttgtcactaccagcgattgccaccccacatcttgtgggctactggactcaagtctggaggaagttcaggcggaagcagcgggtctgaaacgcccggaacctcagagagcgcaacgcccgaaagctctggagggtcaagtggtggtagtgataagaaatactccatcggcctcgccatcggtacgaattctgtcggttgggccgttatcaccgatgagtacaaggtcccttctaagaaattcaaggttttgggcaatacagaccgccattctataaaaaaaaacctgatcggcgcccttttgtttgacagtggtgagactgctgaagcgactcgcctgaagcgaactgccaggaggcggtatacgaggcgaaaaaaccgaatttgttacctccaggagattttctcaaatgaaatggccaaggtagatgatagtttttttcaccgcttggaagaaagttttctcgttgaggaggacaaaaagcacgagaggcacccaatctttggcaacatagtcgatgaggtcgcataccatgagaaatatcctacgatctatcatctccgcaagaagctggtcgatagcacggataaagctgacctccggctgatctaccttgctcttgctcacatgattaaattcaggggccatttcctgatagaaggagacctcaatcccgacaattctgatgtcgacaaactgtttattcagctcgttcagacctataatcaactctttgaggagaaccccatcaatgcttcaggggtggacgcaaaggccattttgtccgcgcgcttgagtaaatcacgacgcctcgagaatttgatagctcaactgccgggtgagaagaaaaacgggttgtttgggaatctcatagcgttgagtttgggacttacgccaaactttaagtctaactttgatttggccgaagatgccaaattgcagctgtccaaagatacctatgatgacgacttggataaccttcttgcgcagattggtgaccaatacgcggatctgtttcttgccgcaaaaaatctgtccgacgccatactcttgtccgatatactgcgcgtcaatactgagataactaaggctcccctcagcgcgtccatgattaaaagatacgatgagcaccaccaagatctcactctgttgaaagccctggttcgccagcagcttccagagaagtataaggagatatttttcgaccaatctaaaaacggctatgcgggttacattgacggtggcgcctctcaagaagaattctacaagtttataaagccgatacttgagaaaatggacggtacagaggaattgttggttaagctcaatcgcgaggacttgttgagaaagcagcgcacatttgacaatggtagtattccacaccagattcatctgggcgagttgcatgccattcttagaagacaagaagatttttatccgtttctgaaagataacagagaaaagattgaaaagatacttacctttcgcataccgtattatgtaggtcccctggctagagggaacagtcgcttcgcttggatgactcgaaaatcagaagaaacaataaccccctggaattttgaagaagtggtagataaaggtgcgagtgcccaatcttttattgagcggatgacaaattttgacaagaatctgcctaacgaaaaggtgcttcccaagcattcccttttgtatgaatactttacagtatataatgaactgactaaagtgaagtacgttaccgaggggatgcgaaagccagcttttctcagtggcgagcagaaaaaagcaatagttgacctgctgttcaagacgaataggaaggttaccgtcaaacagctcaaagaagattactttaaaaagatcgaatgttttgattcagttgagataagcggagtagaggatagatttaacgcaagtcttggaacttatcatgaccttttgaagatcatcaaggataaagattttttggacaacgaggagaatgaagatatcctggaagatatagtacttaccttgacgctttttgaagatcgagagatgatcgaggagcgacttaagacgtacgcacatctctttgacgataaggttatgaaacaattgaaacgccggcggtatactggctggggcaggctttctcgaaagctgattaatggtatccgcgataagcagtctggaaagacaatccttgactttctgaaaagtgatggatttgcaaatagaaactttatgcagcttatacatgatgactctttgacgttcaaggaagacatccagaaggcacaggtatccggccaaggggatagcctccatgaacacatagccaacctggccggctcaccagctattaaaaagggaatattgcaaaccgttaaggttgttgacgaactcgttaaggttatgggccgacacaaaccagagaatatcgtgattgagatggctagggagaatcagaccactcaaaaaggtcagaaaaattctcgcgaaaggatgaagcgaattgaagagggaatcaaagaacttggctctcaaattttgaaagagcacccggtagaaaacactcagctgcagaatgaaaagctgtatctgtattatctgcagaatggtcgagatatgtacgttgatcaggagctggatatcaataggctcagtgactacgatgtcgaccacatcgttcctcaatctttcctgaaagatgactctatcgacaacaaagtgttgacgcgatcagataagaaccggggaaaatccgacaatgtaccctcagaagaagttgtcaagaagatgaaaaactattggagacaattgctgaacgccaagctcataacacaacgcaagttcgataacttgacgaaagccgaaagaggtgggttgtcagaattggacaaagctggctttattaagcgccaattggtggagacccggcagattacgaaacacgtagcacaaattttggattcacgaatgaataccaaatacgacgaaaacgacaaattgatacgcgaggtgaaagtgattacgcttaagagtaagttggtttccgatttcaggaaggattttcagttttacaaagtaagagaaataaacaactaccaccacgcccatgatgcttacctcaacgcggtagttggcacagctcttatcaaaaaatatccaaagctggaaagcgagttcgtttacggtgactataaagtatacgacgttcggaagatgatagccaaatcagagcaggaaattgggaaggcaaccgcaaaatacttcttctattcaaacatcatgaacttctttaagacggagattacgctcgcgaacggcgaaatacgcaagaggcccctcatagagactaacggcgaaaccggggagatcgtatgggacaaaggacgggactttgcgaccgttagaaaagtactttcaatgccacaagtgaatattgttaaaaagacagaagtacaaacaggggggttcagtaaggaatccattttgcccaagcggaacagtgataaattgatagcaaggaaaaaagattgggaccctaagaagtacggtggtttcgactctcctaccgttgcatattcagtccttgtagttgcgaaagtggaaaaggggaaaagtaagaagcttaagagtgttaaagagcttctgggcataaccataatggaacggtctagcttcgagaaaaatccaattgactttctcgaggctaaaggttacaaggaggtaaaaaaggacctgataattaaactcccaaagtacagtctcttcgagttggagaatgggaggaagagaatgttggcatctgcaggggagctccaaaaggggaacgagctggctctgccttcaaaatacgtgaactttctgtacctggccagccactacgagaaactcaagggttctcctgaggataacgagcagaaacagctgtttgtagagcagcacaagcattacctggacgagataattgagcaaattagtgagttctcaaaaagagtaatccttgcagacgcgaatctggataaagttctttccgcctataataagcaccgggacaagcctatacgagaacaagccgagaacatcattcacctctttacccttactaatctgggcgcgccggccgccttcaaatacttcgacaccacgatagacaggaaaaggtatacgagtaccaaagaagtacttgacgccactctcatccaccagtctataacagggttgtacgaaacgaggatagatttgtcccagctcggcggcgactcaggagggtcaggcggctccggtggatcaacgaatctttccgacataatcgagaaagaaaccggcaaacagttggtgatccaagaatcaatcctgatgctgcctgaagaagtagaagaggtgattggcaacaaacctgagtctgacattcttgtccacaccgcgtatgacgagagcacggacgagaacgttatgcttctcactagcgacgcccctgagtataaaccatgggcgctggtcatccaagattccaatggggaaaacaagattaagatgcttagtggtgggtctggagggagcggtgggtccacgaacctcagcgacattattgaaaaagagactggtaaacaacttgtaatacaagagtctattctgatgttgcctgaagaggtggaggaggtgattgggaacaaaccggagtctgatatacttgttcataccgcctatgacgaatctactgatgagaatgtgatgcttttaacgtcagacgctcccgagtacaaaccctgggctctggtgattcaggacagcaatggtgagaataagattaaaatgttgagtgggggctcaaagcgcacggctgacggtagcgaatttgagagccccaaaaaaaaacgaaaggtcgaataa[0114]be4密码子优化2核酸序列:[0115]atgagcagcgagacaggccctgtggctgtggatcctacactgcggagaagaatcgagccccacgagttcgaggtgttcttcgaccccagagagctgcggaaagagacatgcctgctgtacgagatcaactggggcggcagacactctatctggcggcacacaagccagaacaccaacaagcacgtggaagtgaactttatcgagaagtttacgaccgagcggtacttctgccccaacaccagatgcagcatcacctggtttctgagctggtccccttgcggcgagtgcagcagagccatcaccgagtttctgtccagatatccccacgtgaccctgttcatctatatcgcccggctgtaccaccacgccgatcctagaaatagacagggactgcgcgacctgatcagcagcggagtgaccatccagatcatgaccgagcaagagagcggctactgctggcggaacttcgtgaactacagccccagcaacgaagcccactggcctagatatcctcacctgtgggtccgactgtacgtgctggaactgtactgcatcatcctgggcctgcctccatgcctgaacatcctgagaagaaagcagcctcagctgaccttcttcacaatcgccctgcagagctgccactaccagagactgcctccacacatcctgtgggccaccggacttaagagcggaggatctagcggcggctctagcggatctgagacacctggcacaagcgagtctgccacacctgagagtagcggcggatcttctggcggctccgacaagaagtactctatcggactggccatcggcaccaactctgttggatgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaatctgatcggcgccctgctgttcgactctggcgaaacagccgaagccaccagactgaagagaaccgccaggcggagatacacccggcggaagaaccggatctgctacctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggacaagaagcacgagcggcaccccatcttcggcaacatcgtggatgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgagactgatctacctggctctggcccacatgatcaagttccggggccactttctgatcgagggcgatctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgcctctggcgtggacgccaaggctatcctgtctgccagactgagcaagagcagaaggctggaaaacctgatcgcccagctgcctggcgagaagaagaatggcctgttcggcaacctgattgccctgagcctgggactgacccctaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaatctgctggcccagatcggcgatcagtacgccgacttgtttctggccgccaagaacctgtccgacgccatcctgctgagcgatatcctgagagtgaacaccgagatcacaaaggcccctctgagcgcctctatgatcaagagatacgacgagcaccaccaggatctgaccctgctgaaggccctcgttagacagcagctgccagagaagtacaaagagattttcttcgatcagtccaagaacggctacgccggctacattgatggcggagccagccaagaggaattctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctggtcaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaatggctctatccctcaccagatccacctgggagagctgcacgccattctgcggagacaagaggacttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttcaggatcccctactacgtgggaccactggccagaggcaatagcagattcgcctggatgaccagaaagagcgaggaaaccatcacaccctggaacttcgaggaagtggtggacaagggcgccagcgctcagtccttcatcgagcggatgaccaacttcgataagaacctgcctaacgagaaggtgctgcccaagcactccctgctgtatgagtacttcaccgtgtacaacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgcctttctgagcggcgagcagaaaaaggccattgtggatctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgacagcgtggaaatcagcggcgtggaagatcggttcaatgccagcctgggcacataccacgacctgctgaaaattatcaaggacaaggacttcctggacaacgaagagaacgaggacattctcgaggacatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacatacgcccacctgttcgacgacaaagtgatgaagcaactgaagcggaggcggtacacaggctggggcagactgtctcggaagctgatcaacggcatccgggataagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccaaggcgattctctgcacgagcacattgccaacctggccggatctcccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagcttgtgaaagtgatgggcagacacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacacagaagggccagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatggacgggatatgtacgtggaccaagagctggacatcaaccggctgagcgactacgatgtggaccatatcgtgccccagagctttctgaaggacgactccatcgataacaaggtcctgaccagaagcgacaagaaccggggcaagagcgataacgtgccctccgaagaggtggtcaagaagatgaagaactactggcgacagctgctgaacgccaagctgattacccagcggaagttcgataacctgaccaaggccgagagaggcggcctgagcgaacttgataaggccggcttcattaagcggcagctggtggaaacccggcagatcaccaaacacgtggcacagattctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtcatcaccctgaagtctaagctggtgtccgatttccggaaggatttccagttctacaaagtgcgggaaatcaacaactaccatcacgcccacgacgcctacctgaatgccgttgttggaacagccctgatcaagaagtatcccaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgaacaagagatcggcaaggctaccgccaagtactttttctacagcaacatcatgaactttttcaagacagagatcaccctggccaacggcgagatccggaaaagacccctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggcagagattttgccacagtgcggaaagtgctgagcatgccccaagtgaatatcgtgaagaaaaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcctaagcggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgatagccctaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaaaaagctcaagagcgtgaaagagctgctggggatcaccatcatggaaagaagcagctttgagaagaacccgatcgactttctggaagccaagggctacaaagaagtcaagaaggacctcatcatcaagctccccaagtacagcctgttcgagctggaaaatggccggaagcggatgctggcctcagcaggcgaactgcagaaaggcaatgaactggccctgcctagcaaatacgtcaacttcctgtacctggccagccactatgagaagctgaagggcagccccgaggacaatgagcaaaagcagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaacctggataaggtgctgtctgcctataacaagcaccgggacaagcctatcagagagcaggccgagaatatcatccacctgtttaccctgaccaacctgggagcccctgccgccttcaagtacttcgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccacactgatccaccagtctatcaccggcctgtacgaaacccggatcgacctgtctcagctcggcggcgattctggtggttctggcggaagtggcggatccaccaatctgagcgacatcatcgaaaaagagacaggcaagcagctcgtgatccaagaatccatcctgatgctgcctgaagaggttgaggaagtgatcggcaacaagcctgagtccgacatcctggtgcacaccgcctacgatgagagcaccgatgagaacgtcatgctgctgacaagcgacgcccctgagtacaagccttgggctctcgtgattcaggacagcaatggggagaacaagatcaagatgctgagcggaggtagcggaggcagtggcggaagcacaaacctgtctgatatcattgaaaaagaaaccgggaagcaactggtcattcaagagtccattctcatgctcccggaagaagtcgaggaagtcattggaaacaaacccgagagcgatattctggtccacacagcctatgacgagtctacagacgaaaacgtgatgctcctgacctctgacgctcccgagtataagccctgggcacttgttatccaggactctaacggggaaaacaaaatcaaaatgttgtccggcggcagcaagcggacagccgatggatctgagttcgagagccccaagaagaaacggaaggtggagtaa[0116]“碱基编辑活性”意为发挥作用以在化学上改变多核苷酸内的碱基。在一种实施方案中,第一碱基被转变为第二碱基。在一种实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如,将靶标c·g转变为t·a。在另一实施方案中,碱基编辑活性是腺苷或腺嘌呤脱氨酶活性,例如,将靶标a·t转变为g·c。在另一实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如将靶标c·g转变为t·a,和腺苷或腺嘌呤脱氨酶活性,例如,将靶标a·t转变为g·c。[0117]在一些实施方案中,通过编辑效率评估碱基编辑活性。可以通过任何合适手段,例如,通过测序或下一代测序来测量碱基编辑效率。在一些实施方案中,通过具有由碱基编辑器实现的核碱基转变的总测序读数的百分比,例如,具有靶标a·t碱基对转变为g·c碱基对或者靶标c·g碱基对转变为t·a碱基对的总测序读数的百分比,来测量碱基编辑效率。在一些实施方案中,通过当在细胞群中执行碱基编辑时具有由碱基编辑器实现的核碱基转变的总细胞的百分比来测量碱基编辑效率。[0118]术语“碱基编辑器系统”是指用于编辑靶标核苷酸序列的核碱基的系统。在各种实施方案中,碱基编辑器系统包含(1)多核苷酸可编程核苷酸结合结构域(例如cas9);(2)用于将所述核碱基脱氨基的脱氨酶结构域(例如腺苷脱氨酶或胞苷脱氨酶);和(3)一个或多个向导多核苷酸(例如,向导rna)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,碱基编辑器是胞苷碱基编辑器(cbe)。在一些实施方案中,碱基编辑器是腺嘌呤或腺苷碱基编辑器(abe)。在一些实施方案中,碱基编辑器系统是腺苷脱氨酶碱基编辑器8(abe8)。[0119]在一些实施方案中,abe8是单体构建体。在一些实施方案中,abe8是abe8.1-m、abe8.2-m、abe8.3-m、abe8.4-m、abe8.5-m、abe8.6-m、abe8.7-m、abe8.8-m、abe8.9-m、abe8.10-m、abe8.11-m、abe8.12-m、abe8.13-m、abe8.14-m、abe8.15-m、abe8.16-m、abe8.17-m、abe8.18-m、abe8.19-m、abe8.20-m、abe8.21-m、abe8.22-m、abe8.23-m、abe8.24-m。在一些实施方案中,abe8是异源构建体。在一些实施方案中,abe8是abe8.1-d、abe8.2-d、abe8.3-d、abe8.4-d、abe8.5-d、abe8.6-d、abe8.7-d、abe8.8-d、abe8.9-d、abe8.10-d、abe8.11-d、abe8.12-d、abe8.13-d、abe8.14-d、abe8.15-d、abe8.16-d、abe8.17-d、abe8.18-d、abe8.19-d、abe8.20-d、abe8.21-d、abe8.22-d、abe8.23-d或abe8.24-d。[0120]在一些实施方案中,碱基编辑器系统可包含超过一个碱基编辑组分。例如,碱基编辑器系统可包括超过一个脱氨酶。在一些实施方案中,碱基编辑器酮可包括一个或多个胞苷脱氨酶。在一些实施方案中,碱基编辑器酮可包括一个或多个腺苷脱氨酶。在一些实施方案中,可利用单向导多核苷酸将不同的脱氨酶靶向至靶标核酸序列。在一些实施方案中,可利用一对向导多核苷酸将不同的脱氨酶靶向至靶标核酸序列。[0121]碱基编辑器系统核碱基组分和多核苷酸可编程核苷酸结合组分可以共价地或非共价地彼此缔合,或其缔合和相互作用的任意组合。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可融合或链接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可通过与脱氨酶结构域非共价地相互作用或缔合而将脱氨酶结构域靶向至靶标核苷酸序列。例如,在一些实施方案中,核碱基编辑组分,例如,脱氨酶结构域可包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合至向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合至多肽连接子。在一些实施方案中,额外的异源部分可能能够结合至多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0122]碱基编辑器系统可进一步包含向导多核苷酸组分。应了解,碱基编辑器系统的组分可以经由共价键、非共价相互作用、或其缔合和相互作用的任意组合彼此缔合。在一些实施方案中,脱氨结构域可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组分,例如脱氨酶结构域,可包含额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外的异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可融合或链接至脱氨酶结构域。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合至向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合至多肽连接子。在一些实施方案中,额外的异源部分可能能够结合至多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0123]在一些实施方案中,碱基编辑器系统可进一步包含碱基切除修复(ber)的抑制剂组分。应了解,碱基编辑器系统的组分可以经由共价键、非共价相互作用、或其缔合和相互作用的任意组合彼此缔合。ber的抑制剂组分可包含ber抑制剂。在一些实施方案中,ber的抑制剂可以是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,ber的抑制剂可以是肌苷ber抑制剂。在一些实施方案中,ber的抑制剂可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可融合或链接至ber的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可融合或链接至脱氨酶结构域和ber的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可通过与ber的抑制剂非共价地相互作用或缔合而将ber的抑制剂靶向至靶标核苷酸序列。例如,在一些实施方案中,ber的抑制剂组分可包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。[0124]在一些实施方案中,ber的抑制剂可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的ber的抑制剂组分,可包含额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外的异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,向导多核苷酸的额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可融合或链接至ber的抑制剂。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合至向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合至多肽连接子。在一些实施方案中,额外的异源部分可能能够结合至多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[0125]“β-2微球蛋白(b2m)多肽”意为一种蛋白质,其与uniprot登录号p61769或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性b2m多肽序列提供如下。[0126]》sp|p61769|b2mg_humanβ-2-微球蛋白os=智人(homosapiens)ox=9606gn=b2mpe=1sv=1[0127]msrsvalavlallslsgleaiqrtpkiqvysrhpaengksnflncyvsgfhpsdievdllkngeriekvehsdlsfskdwsfyllyyteftptekdeyacrvnhvtlsqpkivkwdrdm[0128]“β-2微球蛋白(b2m)多核苷酸”意为一种编码b2m多肽的核酸分子。β-2微球蛋白基因编码与主要组织相容性复合体缔合的血清蛋白。b2m牵涉到由宿主cd8+t细胞进行的非自我识别中。示例性b2m多核苷酸序列提供如下。[0129]》dq217933.1智人(homosapiens)β-2微球蛋白(b2m)基因,完全编码序列[0130]catgtcataaatggtaagtccaagaaaaatacaggtattcccccccaaagaaaactgtaaaatcgacttttttctatctgtactgttttttattggtttttaaattggttttccaagtgagtaaatcagaatctatctgtaatggattttaaatttagtgtttctctgtgatgtagtaaacaagaaactagaggcaaaaatagccctgtcccttgctaaacttctaaggcacttttctagtacaactcaacactaacatttcaggcctttagtgccttatatgagtttttaaaagggggaaaagggagggagcaagagtgtcttaactcatacatttaggcataacaattattctcatattttagttattgagagggctggtagaaaaactaggtaaataatattaataattatagcgcttattaaacactacagaacacttactatgtaccaggcattgtgggaggctctctcttgtgcattatctcatttcattaggtccatggagagtattgcattttcttagtttaggcatggcctccacaataaagattatcaaaagcctaaaaatatgtaaaagaaacctagaagttatttgttgtgctccttggggaagctaggcaaatcctttcaactgaaaaccatggtgacttccaagatctctgcccctccccatcgccatggtccacttcctcttctcactgttcctcttagaaaagatctgtggactccaccaccacgaaatggcggcaccttatttatggtcactttagagggtaggttttcttaatgggtctgcctgtcatgtttaacgtccttggctgggtccaaggcagatgcagtccaaactctcactaaaattgccgagccctttgtcttccagtgtctaaaatattaatgtcaatggaatcaggccagagtttgaattctagtctcttagcctttgtttcccctgtccataaaatgaatgggggtaattctttcctcctacagtttatttatatattcactaattcattcattcatccatccattcgttcattcggtttactgagtacctactatgtgccagcccctgttctagggtggaaactaagagaatgatgtacctagagggcgctggaagctctaaagccctagcagttactgcttttactattagtggtcgtttttttctcccccccgccccccgacaaatcaacagaacaaagaaaattacctaaacagcaaggacatagggaggaacttcttggcacagaactttccaaacactttttcctgaagggatacaagaagcaagaaaggtactctttcactaggaccttctctgagctgtcctcaggatgcttttgggactatttttcttacccagagaatggagaaaccctgcagggaattcccaagctgtagttataaacagaagttctccttctgctaggtagcattcaaagatcttaatcttctgggtttccgttttctcgaatgaaaaatgcaggtccgagcagttaactggctggggcaccattagcaagtcacttagcatctctggggccagtctgcaaagcgagggggcagccttaatgtgcctccagcctgaagtcctagaatgagcgcccggtgtcccaagctggggcgcgcaccccagatcggagggcgccgatgtacagacagcaaactcacccagtctagtgcatgccttcttaaacatcacgagactctaagaaaaggaaactgaaaacgggaaagtccctctctctaacctggcactgcgtcgctggcttggagacaggtgacggtccctgcgggccttgtcctgattggctgggcacgcgtttaatataagtggaggcgtcgcgctggcgggcattcctgaagctgacagcattcgggccgagatgtctcgctccgtggccttagctgtgctcgcgctactctctctttctggcctggaggctatccagcgtgagtctctcctaccctcccgctctggtccttcctctcccgctctgcaccctctgtggccctcgctgtgctctctcgctccgtgacttcccttctccaagttctccttggtggcccgccgtggggctagtccagggctggatctcggggaagcggcggggtggcctgggagtggggaagggggtgcgcacccgggacgcgcgctacttgcccctttcggcggggagcaggggagacctttggcctacggcgacgggagggtcgggacaaagtttagggcgtcgataagcgtcagagcgccgaggttgggggagggtttctcttccgctctttcgcggggcctctggctcccccagcgcagctggagtgggggacgggtaggctcgtcccaaaggcgcggcgctgaggtttgtgaacgcgtggaggggcgcttggggtctgggggaggcgtcgcccgggtaagcctgtctgctgcggctctgcttcccttagactggagagctgtggacttcgtctaggcgcccgctaagttcgcatgtcctagcacctctgggtctatgtggggccacaccgtggggaggaaacagcacgcgacgtttgtagaatgcttggctgtgatacaaagcggtttcgaataattaacttatttgttcccatcacatgtcacttttaaaaaattataagaactacccgttattgacatctttctgtgtgccaaggactttatgtgctttgcgtcatttaattttgaaaacagttatcttccgccatagataactactatggttatcttctgcctctcacagatgaagaaactaaggcaccgagattttaagaaacttaattacacaggggataaatggcagcaatcgagattgaagtcaagcctaaccagggcttttgcgggagcgcatgccttttggctgtaattcgtgcatttttttttaagaaaaacgcctgccttctgcgtgagattctccagagcaaactgggcggcatgggccctgtggtcttttcgtacagagggcttcctctttggctctttgcctggttgtttccaagatgtactgtgcctcttactttcggttttgaaaacatgagggggttgggcgtggtagcttacgcctgtaatcccagcacttagggaggccgaggcgggaggatggcttgaggtccgtagttgagaccagcctggccaacatggtgaagcctggtctctacaaaaaataataacaaaaattagccgggtgtggtggctcgtgcctgtggtcccagctgctccggtggctgaggcgggaggatctcttgagcttaggcttttgagctatcatggcgccagtgcactccagcgtgggcaacagagcgagaccctgtctctcaaaaaagaaaaaaaaaaaaaaagaaagagaaaagaaaagaaagaaagaagtgaaggtttgtcagtcaggggagctgtaaaaccattaataaagataatccaagatggttaccaagactgttgaggacgccagagatcttgagcactttctaagtacctggcaatacactaagcgcgctcaccttttcctctggcaaaacatgatcgaaagcagaatgttttgatcatgagaaaattgcatttaatttgaatacaatttatttacaacataaaggataatgtatatatcaccaccattactggtatttgctggttatgttagatgtcattttaaaaaataacaatctgatatttaaaaaaaaatcttattttgaaaatttccaaagtaatacatgccatgcatagaccatttctggaagataccacaagaaacatgtaatgatgattgcctctgaaggtctattttcctcctctgacctgtgtgtgggttttgtttttgttttactgtgggcataaattaatttttcagttaagttttggaagcttaaataactctccaaaagtcataaagccagtaactggttgagcccaaattcaaacccagcctgtctgatacttgtcctcttcttagaaaagattacagtgatgctctcacaaaatcttgccgccttccctcaaacagagagttccaggcaggatgaatctgtgctctgatccctgaggcatttaatatgttcttattattagaagctcagatgcaaagagctctcttagcttttaatgttatgaaaaaaatcaggtcttcattagattccccaatccacctcttgatggggctagtagcctttccttaatgatagggtgtttctagagagatatatctggtcaaggtggcctggtactcctccttctccccacagcctcccagacaaggaggagtagctgccttttagtgatcatgtaccctgaatataagtgtatttaaaagaattttatacacatatatttagtgtcaatctgtatatttagtagcactaacacttctcttcattttcaatgaaaaatatagagtttataatattttcttcccacttccccatggatggtctagtcatgcctctcattttggaaagtactgtttctgaaacattaggcaatatattcccaacctggctagtttacagcaatcacctgtggatgctaattaaaacgcaaatcccactgtcacatgcattactccatttgatcataatggaaagtatgttctgtcccatttgccatagtcctcacctatccctgttgtattttatcgggtccaactcaaccatttaaggtatttgccagctcttgtatgcatttaggttttgtttctttgttttttagctcatgaaattaggtacaaagtcagagaggggtctggcatataaaacctcagcagaaataaagaggttttgttgtttggtaagaacataccttgggttggttgggcacggtggctcgtgcctgtaatcccaacactttgggaggccaaggcaggctgatcacttgaagttgggagttcaagaccagcctggccaacatggtgaaatcccgtctctactgaaaatacaaaaattaaccaggcatggtggtgtgtgcctgtagtcccaggaatcacttgaacccaggaggcggaggttgcagtgagctgagatctcaccactgcacactgcactccagcctgggcaatggaatgagattccatcccaaaaaataaaaaaataaaaaaataaagaacataccttgggttgatccacttaggaacctcagataataacatctgccacgtatagagcaattgctatgtcccaggcactctactagacacttcatacagtttagaaaatcagatgggtgtagatcaaggcaggagcaggaaccaaaaagaaaggcataaacataagaaaaaaaatggaaggggtggaaacagagtacaataacatgagtaatttgatgggggctattatgaactgagaaatgaactttgaaaagtatcttggggccaaatcatgtagactcttgagtgatgtgttaaggaatgctatgagtgctgagagggcatcagaagtccttgagagcctccagagaaaggctcttaaaaatgcagcgcaatctccagtgacagaagatactgctagaaatctgctagaaaaaaaacaaaaaaggcatgtatagaggaattatgagggaaagataccaagtcacggtttattcttcaaaatggaggtggcttgttgggaaggtggaagctcatttggccagagtggaaatggaattgggagaaatcgatgaccaaatgtaaacacttggtgcctgatatagcttgacaccaagttagccccaagtgaaataccctggcaatattaatgtgtcttttcccgatattcctcaggtactccaaagattcaggtttactcacgtcatccagcagagaatggaaagtcaaatttcctgaattgctatgtgtctgggtttcatccatccgacattgaagttgacttactgaagaatggagagagaattgaaaaagtggagcattcagacttgtctttcagcaaggactggtctttctatctcttgtactacactgaattcacccccactgaaaaagatgagtatgcctgccgtgtgaaccatgtgactttgtcacagcccaagatagttaagtggggtaagtcttacattcttttgtaagctgctgaaagttgtgtatgagtagtcatatcataaagctgctttgatataaaaaaggtctatggccatactaccctgaatgagtcccatcccatctgatataaacaatctgcatattgggattgtcagggaatgttcttaaagatcagattagtggcacctgctgagatactgatgcacagcatggtttctgaaccagtagtttccctgcagttgagcagggagcagcagcagcacttgcacaaatacatatacactcttaacacttcttacctactggcttcctctagcttttgtggcagcttcaggtatatttagcactgaacgaacatctcaagaaggtataggcctttgtttgtaagtcctgctgtcctagcatcctataatcctggacttctccagtactttctggctggattggtatctgaggctagtaggaagggcttgttcctgctgggtagctctaaacaatgtattcatgggtaggaacagcagcctattctgccagccttatttctaaccattttagacatttgttagtacatggtattttaaaagtaaaacttaatgtcttccttttttttctccactgtctttttcatagatcgagacatgtaagcagcatcatggaggtaagtttttgaccttgagaaaatgtttttgtttcactgtcctgaggactatttatagacagctctaacatgataaccctcactatgtggagaacattgacagagtaacattttagcagggaaagaagaatcctacagggtcatgttcccttctcctgtggagtggcatgaagaaggtgtatggccccaggtatggccatattactgaccctctacagagagggcaaaggaactgccagtatggtattgcaggataaaggcaggtggttacccacattacctgcaaggctttgatctttcttctgccatttccacattggacatctctgctgaggagagaaaatgaaccactcttttcctttgtataatgttgttttattcttcagacagaagagaggagttatacagctctgcagacatcccattcctgtatggggactgtgtttgcctcttagaggttcccaggccactagaggagataaagggaaacagattgttataacttgatataatgatactataatagatgtaactacaaggagctccagaagcaagagagagggaggaacttggacttctctgcatctttagttggagtccaaaggcttttcaatgaaattctactgcccagggtacattgatgctgaaaccccattcaaatctcctgttatattctagaacagggaattgatttgggagagcatcaggaaggtggatgatctgcccagtcacactgttagtaaattgtagagccaggacctgaactctaatatagtcatgtgttacttaatgacggggacatgttctgagaaatgcttacacaaacctaggtgttgtagcctactacacgcataggctacatggtatagcctattgctcctagactacaaacctgtacagcctgttactgtactgaatactgtgggcagttgtaacacaatggtaagtatttgtgtatctaaacatagaagttgcagtaaaaatatgctattttaatcttatgagaccactgtcatatatacagtccatcattgaccaaaacatcatatcagcattttttcttctaagattttgggagcaccaaagggatacactaacaggatatactctttataatgggtttggagaactgtctgcagctacttcttttaaaaaggtgatctacacagtagaaattagacaagtttggtaatgagatctgcaatccaaataaaataaattcattgctaacctttttcttttcttttcaggtttgaagatgccgcatttggattggatgaattccaaattctgcttgcttgctttttaatattgatatgcttatacacttacactttatgcacaaaatgtagggttataataatgttaacatggacatgatcttctttataattctactttgagtgctgtctccatgtttgatgtatctgagcaggttgctccacaggtagctctaggagggctggcaacttagaggtggggagcagagaattctcttatccaacatcaacatcttggtcagatttgaactcttcaatctcttgcactcaaagcttgttaagatagttaagcgtgcataagttaacttccaatttacatactctgcttagaatttgggggaaaatttagaaatataattgacaggattattggaaatttgttataatgaatgaaacattttgtcatataagattcatatttacttcttatacatttgataaagtaaggcatggttgtggttaatctggtttatttttgttccacaagttaaataaatcataaaacttgatgtgttatctcttatatctcactcccactattacccctttattttcaaacagggaaacagtcttcaagttccacttggtaaaaaatgtgaaccccttgtatatagagtttggctcacagtgtaaagggcctcagtgattcacattttccagattaggaatctgatgctcaaagaagttaaatggcatagttggggtgacacagctgtctagtgggaggccagccttctatattttagccagcgttctttcctgcgggccaggtcatgaggagtatgcagactctaagagggagcaaaagtatctgaaggatttaatattttagcaaggaatagatatacaatcatcccttggtctccctgggggattggtttcaggaccccttcttggacaccaaatctatggatatttaagtcccttctataaaatggtatagtatttgcatataacctatccacatcctcctgtatactttaaatcatttctagattacttgtaatacctaatacaatgtaaatgctatgcaaatagttgttattgtttaaggaataatgacaagaaaaaaaagtctgtacatgctcagtaaagacacaaccatccctttttttccccagtgtttttgatccatggtttgctgaatccacagatgtggagcccctggatacggaaggcccgctgtactttgaatgacaaataacagatttaaa[0131]术语“cas9”或“cas9结构域”是指rna引导的核酸酶或其片段,其包含cas9蛋白(例如,包含cas9的活性、无活性或部分活性的dna切割结构域和/或cas9的grna结合结构域的蛋白质)。cas9核酸酶有时是指casn1核酸酶或crispr(成簇的规则间隔短回文重复序列)相关核酸酶。crispr是一种适应性免疫系统,其提供针对移动基因元件(病毒、转座因子和接合质粒)的保护。crispr簇含有间隔序列、与前驱移动元件互补的序列和靶标侵入核酸。crispr簇被转录并处理为crisprrna(crrna)。在ii型crispr系统中,pre-crrna的正确处理需要反向编码的小rna(tracrrna)、内源性核糖核酸酶3(rnc)和cas9蛋白。tracrrna充当向导用于核糖核酸酶3辅助的pre-crrna处理。随后,cas9/crrna/tracrrna核酸内切地切割与间隔序列互补的线性或环状dsdna靶标。不与crrna互补的靶标链首先被核酸内切地切断,然后被3'-5'核酸外切地修剪。在自然界,dna结合和切割通常需要蛋白质和两种rna。但是,单向导rna(“sgrna”或简写为“grna”)可以经工程改造以将多种crrna和tracrrna并入单一rna物质中。参见,例如,jinekm.等人,charpentiere.science337:816-821(2012),其整体内容通过引用并入本文。cas9识别crispr重复序列中的短基序(pam或前间区序列邻近基序)以帮助区分自我与非自我。cas9核酸酶序列和结构是本领域技术人员周知的(参见,例如,“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferretti,j.j.等人,natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.等人,nature471:602-607(2011);和“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.等人,science337:816-821(2012),其各自的整体内容通过引用并入本文)。cas9直系同源物已经在各种物种中描述,包括酿脓链球菌(s.pyogenes)和嗜热链球菌(s.thermophilus)。基于本公开,其他合适的cas9核酸酶和序列对于本领域技术人员将是显而易见的,并且此类cas9核酸酶和序列包括来自生物体和基因座的cas9序列,如chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737中所公开的;其整体内容通过引用并入本文。[0132]无核酸酶活性的cas9蛋白可以互换地称为“dcas9”蛋白(对于核酸酶“死亡的”cas9)或无催化活性的cas9。用于生成具有无活性的dna切割结构域的cas9蛋白(或其片段)是已知的(参见,例如,jinek等人,science.337:816-821(2012);qi等人,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression”(2013)cell.28;152(5):1173-83,其各自的整体内容通过引用并入本文)。例如,已知cas9的dna切割结构域包括两个次结构域:hnh核酸酶次结构域和ruvc1次结构域。hnh次结构域切割与grna互补的链,而ruvc1次结构域切割非互补链。这些次结构域中的突变可以沉默cas9的核酸酶活性。例如,突变d10a和h840a将酿脓链球菌cas9的核酸酶活性完全灭活(jinek等人,science.337:816-821(2012);qi等人,cell.28;152(5):1173-83(2013))。在一些实施方案中,dcas9对应于或者部分或整体地包含具有一个或多个突变的cas9氨基酸序列,该突变将cas9核酸酶活性灭活。在一些实施方案中,dcas9结构域包含d10a和h840a突变或另一cas9中的对应突变。在一些实施方案中,cas9核酸酶具有失活的(例如,灭活的)dna切割结构域,换言之,cas9是切口酶,称为“ncas9”蛋白(对于“切口酶”cas9)。应了解,其他cas9蛋白(例如,核酸酶死亡的cas9(dcas9)、cas9切口酶(ncas9)、或核酸酶活性的cas9),包括其变体和同源物,处于本公开的范畴内。示例性cas9蛋白包括但不限于本文提供的那些。在一些实施方案中,cas9蛋白是核酸酶死亡的cas9(dcas9)。在一些实施方案中,cas9蛋白是cas9切口酶(ncas9)。在一些实施方案中,cas9蛋白是核酸酶活性的cas9。[0133]在一些实施方案中,提供包含cas9的片段的蛋白质。例如,在一些实施方案中,蛋白质包含一个或两个cas9结构域:(1)cas9的grna结合结构域;或(2)cas9的dna切割结构域。在一些实施方案中,包含cas9或其片段的蛋白质称为“cas9变体”。cas9变体与cas9或其片段共享同源性。例如,cas9变体与野生型cas9至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,与野生型cas9相比,cas9变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个氨基酸变化。在一些实施方案中,cas9变体包含cas9的片段(例如,grna结合结构域或dna切割结构域),使得该片段与野生型cas9的对应片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,该片段是对应的野生型cas9的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%、或至少99.5%。[0134]在一些实施方案中,该片段是至少100个氨基酸的长度。在一些实施方案中,该片段是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、或至少1300个氨基酸的长度。[0135]在一些实施方案中,cas9是指来自以下的cas9:溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1)、白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1)、螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1)、中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1)、螺原体(spiroplasmataiwanense)(ncbiref:nc_021846.1)、海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1)、belliellabaltica(ncbiref:nc_018010.1)、扭曲冷弯曲菌(psychroflexustorquis)(ncbiref:nc_018721.1)、嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1)、无害利斯特菌(listeriainnocua)(ncbiref:np_472073.1)、空肠弯曲杆菌(campylobacterjejuni)(ncbiref:yp_002344900.1)、或脑膜炎奈瑟氏菌(neisseriameningitidis)(ncbiref:yp_002342100.1);或是指来自任何其他生物体的cas9。[0136]在一些实施方案中,cas9来自脑膜炎奈瑟氏菌(neisseriameningitidis)(nme)。在一些实施方案中,cas9是nme1、nme2或nme3。在一些实施方案中,用于nme1、nme2或nme3的pam相互作用结构域分别是n4gat、n4cc和n4caaa(参见,例如,edraki,a.,等人,acompact,high-accuracycas9withadinucleotidepamforinvivogenomeediting,molecularcell(2018))。[0137]在一些实施方案中,如本文所提供的cas9融合蛋白包含cas9蛋白(例如,本文所提供的cas9序列中的一者)的全长氨基酸序列。然而,在其他实施方案中,本文所提供的融合蛋白不包含全长cas9序列,而仅包含其一个或多个片段。例如,在一些实施方案中,本文所提供的cas9融合蛋白包含cas9片段,其中该片段结合crrna和tracrrna或sgrna,但不包含功能性核酸酶结构域,例如,在它仅包含截短版本的核酸酶结构域或根本不包含核酸酶结构域的情况下。[0138]合适的cas9结构域和cas9片段的示例性氨基酸序列提供在本文中,且cas9结构域和片段的其他合适的序列对于本领域技术人员将是显而易见的。[0139]在一些实施方案中,cas9是指来自古生菌(例如,纳米古生菌)的cas9,其构成单细胞原核微生物的领域和王国。在一些实施方案中,cas9是指casx或casy,其已经描述于例如burstein等人,“newcrispr-cassystemsfromuncultivatedmicrobes.”cellres.2017feb21.doi:10.1038/cr.2017.21中,其整体内容通过引用并入本文。使用基因组解析的宏基因组学,鉴定了大量crispr-cas系统,包括在古生菌生命领域首次报告的cas9。这种不同的cas9蛋白是在很少研究的纳米古生菌中作为活性crispr-cas系统发现的。在细菌中发现了两种先前未知的系统,crispr-casx和crispr-casy,它们是迄今发现的最为紧凑的系统中的一个。在一些实施方案中,cas9是指casx或casx的变体。在一些实施方案中,cas9是指casy或casy的变体。应了解,其他rna引导的dna结合蛋白可以用作核酸可编程dna结合蛋白(napdnabp),并且出于本公开的范畴内。[0140]在特定实施方案中,可用于本发明方法中的napdnabp包括环状排列物,它们是本领域中已知的并且由例如oakes等人,cell176,254–267,2019描述。[0141]可并入碱基编辑器的多核苷酸可编程核苷酸结合结构域的非限制性示例包括衍生自crispr蛋白的结构域、限制性核酸酶、巨核酸酶、tal核酸酶(talen)和锌指核酸酶(zfn)。[0142]在一些实施方案中,本文所提供的核酸可编程dna结合蛋白(napdnabp)或任何融合蛋白可以是casx或casy蛋白。在一些实施方案中,napdnabp是casx蛋白。在一些实施方案中,napdnabp是casy蛋白。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与天然存在的casx或casy蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的casx或casy蛋白。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与本文所述的casx或casy蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。应了解,来自其他细菌物种的casx和casy也可根据本公开使用。[0143]术语“cas12b”或“cas12b结构域”是指rna引导的核酸酶或其片段,其包含cas12b、c2c1蛋白(例如,包含cas12b的活性、无活性或部分活性的dna切割结构域和/或cas12b的grna结合结构域的蛋白质)。其各自的内容通过引用并入本文。cas12b同源物已经在各种物种中描述,包括但不限于,抗酸土脂环酸芽孢杆菌(alicyclobacillusacidoterrestris)、嗜酸脂环酸芽孢杆菌(alicyclobacillusacidophilus)(teng等人,celldiscov.2018nov27;4:63)、外村尚芽孢杆菌(bacillushisashi)和芽孢杆菌属(bacillussp.)v3-13。基于本发明,其他合适的cas12b核酸酶序列对于本领域技术人员将是显而易见的。[0144]在一些实施方案中,包含cas12b或其片段的蛋白质称为“cas12b变体”。cas12b变体与cas12b或其片段共享同源性。例如,cas12b变体与野生型cas12b至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,与野生型cas12b相比,cas12b变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个氨基酸变化。在一些实施方案中,cas12b变体包含cas12b的片段(例如,grna结合结构域或dna切割结构域),使得该片段与野生型cas12b的对应片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,该片段是对应的野生型cas12b的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%、或至少99.5%。示例性cas12b多肽在本文中列出。[0145]“cbl原癌基因b(cblb)多肽”意为一种蛋白质,其与genbank登录号abc86700.1或其片段具有至少约85%的氨基酸序列一致性并且牵涉到免疫应答的调节中。示例性cblb多肽序列提供如下。[0146]》abc86700.1cbl-b[智人(homosapiens)][0147]mansmngrnpggrggnprkgrilgiidaiqdavgppkqaaadrrtvektwklmdkvvrlcqnpklqlknsppyildilpdtyqhlrlilskyddnqklaqlseneyfkiyidslmkkskrairlfkegkermyeeqsqdrrnltklslifshmlaeikaifpngqfqgdnfritkadaaefwrkffgdktivpwkvfrqclhevhqissgleamalkstidltcndyisvfefdiftrlfqpwgsilrnwnflavthpgymafltydevkarlqkystkpgsyifrlsctrlgqwaigyvtgdgnilqtiphnkplfqalidgsregfylypdgrsynpdltglceptphdhikvtqeqyelycemgstfqlckicaendkdvkiepcghlmctscltawqesdgqgcpfcrceikgtepiivdpfdprdegsrccsiidpfgmpmldldddddreeslmmnrlanvrkctdrqnspvtspgssplaqrrkpqpdplqiphlslppvpprldliqkgivrspcgsptgspksspcmvrkqdkplpapppplrdpppppperpppippdnrlsrhihhvesvpsrdppmpleawcprdvfgtnqlvgcrllgegspkpgitassnvngrhsrvgsdpvlmrkhrrhdlplegakvfsnghlgseeydvpprlsppppvttllpsikctgplanslsektrdpveedddeykipsshpvslnsqpshchnvkppvrscdnghcmlngthgpssekksnipdlsiylkgdvfdsasdpvplpparpptrdnpkhgsslnrtpsdydllipplgedafdalppslpppppparhsliehskppgsssrpssgqdlfllpsdpfvdlasgqvplpparrlpgenvktnrtsqdydqlpscsdgsqaparppkprprrtapeihhrkphgpeaalenvdakiaklmgegyafeevkraleiaqnnvevarsilrefafpppvsprlnl[0148]“cbl原癌基因b(cblb)多核苷酸”意为编码cblb多肽的核酸分子。cblb基因编码e3泛素连接酶。示例性cblb核酸序列提供如下。[0149]》dq349203.1智人(homosapiens)cbl-bmrna,完全编码序列[0150]atggcaaactcaatgaatggcagaaaccctggtggtcgaggaggaaatccccgaaaaggtcgaattttgggtattattgatgctattcaggatgcagttggaccccctaagcaagctgccgcagatcgcaggaccgtggagaagacttggaagctcatggacaaagtggtaagactgtgccaaaatcccaaacttcagttgaaaaatagcccaccatatatacttgatattttgcctgatacatatcagcatttacgacttatattgagtaaatatgatgacaaccagaaacttgcccaactcagtgagaatgagtactttaaaatctacattgatagccttatgaaaaagtcaaaacgggcaataagactctttaaagaaggcaaggagagaatgtatgaagaacagtcacaggacagacgaaatctcacaaaactgtcccttatcttcagtcacatgctggcagaaatcaaagcaatctttcccaatggtcaattccagggagataactttcgtatcacaaaagcagatgctgctgaattctggagaaagttttttggagacaaaactatcgtaccatggaaagtattcagacagtgccttcatgaggtccaccagattagctctggcctggaagcaatggctctaaaatcaacaattgatttaacttgcaatgattacatttcagtttttgaatttgatatttttaccaggctgtttcagccttggggctctattttgcggaattggaatttcttagctgtgacacatccaggttacatggcatttctcacatatgatgaagttaaagcacgactacagaaatatagcaccaaacccggaagctatattttccggttaagttgcactcgattgggacagtgggccattggctatgtgactggggatgggaatatcttacagaccatacctcataacaagcccttatttcaagccctgattgatggcagcagggaaggattttatctttatcctgatgggaggagttataatcctgatttaactggattatgtgaacctacacctcatgaccatataaaagttacacaggaacaatatgaattatattgtgaaatgggctccacttttcagctctgtaagatttgtgcagagaatgacaaagatgtcaagattgagccttgtgggcatttgatgtgcacctcttgccttacggcatggcaggagtcggatggtcagggctgccctttctgtcgttgtgaaataaaaggaactgagcccataatcgtggacccctttgatccaagagatgaaggctccaggtgttgcagcatcattgacccctttggcatgccgatgctagacttggacgacgatgatgatcgtgaggagtccttgatgatgaatcggttggcaaacgtccgaaagtgcactgacaggcagaactcaccagtcacatcaccaggatcctctccccttgcccagagaagaaagccacagcctgacccactccagatcccacatctaagcctgccacccgtgcctcctcgcctggatctaattcagaaaggcatagttagatctccctgtggcagcccaacgggttcaccaaagtcttctccttgcatggtgagaaaacaagataaaccactcccagcaccacctcctcccttaagagatcctcctccaccgccacctgaaagacctccaccaatcccaccagacaatagactgagtagacacatccatcatgtggaaagcgtgccttccagagacccgccaatgcctcttgaagcatggtgccctcgggatgtgtttgggactaatcagcttgtgggatgtcgactcctaggggagggctctccaaaacctggaatcacagcgagttcaaatgtcaatggaaggcacagtagagtgggctctgacccagtgcttatgcggaaacacagacgccatgatttgcctttagaaggagctaaggtcttttccaatggtcaccttggaagtgaagaatatgatgttcctccccggctttctcctcctcctccagttaccaccctcctccctagcataaagtgtactggtccgttagcaaattctctttcagagaaaacaagagacccagtagaggaagatgatgatgaatacaagattccttcatcccaccctgtttccctgaattcacaaccatctcattgtcataatgtaaaacctcctgttcggtcttgtgataatggtcactgtatgctgaatggaacacatggtccatcttcagagaagaaatcaaacatccctgacttaagcatatatttaaagggagatgtttttgattcagcctctgatcccgtgccattaccacctgccaggcctccaactcgggacaatccaaagcatggttcttcactcaacaggacgccctctgattatgatcttctcatccctccattaggtgaagatgcttttgatgccctccctccatctctcccacctcccccacctcctgcaaggcatagtctcattgaacattcaaaacctcctggctccagtagccggccatcctcaggacaggatctttttcttcttccttcagatccctttgttgatctagcaagtggccaagttcctttgcctcctgctagaaggttaccaggtgaaaatgtcaaaactaacagaacatcacaggactatgatcagcttccttcatgttcagatggttcacaggcaccagccagaccccctaaaccacgaccgcgcaggactgcaccagaaattcaccacagaaaaccccatgggcctgaggcggcattggaaaatgtcgatgcaaaaattgcaaaactcatgggagagggttatgcctttgaagaggtgaagagagccttagagatagcccagaataatgtcgaagttgcccggagcatcctccgagaatttgccttccctcctccagtatccccacgtctaaatctatag[0151]“嵌合抗原受体”或“car”意为合成的或工程改造的受体,其包含与一个或多个细胞内信号传导结构域(例如,t细胞信号传导结构域)接合的细胞外抗原结合结构域,该细胞外抗原结合结构域赋予免疫效应细胞以抗原特异性。在一些实施方案中,car包括跨膜结构域。[0152]“嵌合抗原受体t细胞”或“car-t细胞”意为表达car的t细胞,其具有由抗体来源的靶向car的结构域所决定的抗原特异性。如本文所用“car-t细胞”包括t细胞或nk细胞。如本文所用,“car-t细胞”包括经工程改造以表达car或t细胞受体(tcr)的细胞。在一些实施方案中,car-t细胞可以是t辅助cd4+和/或t效应cd8+细胞,任选以所定义比例存在。制备car(例如,用于治疗癌症)的方法可公开获得(参见例如,park等人,trendsbiotechnol.,29:550-557,2011;grupp等人,nengljmed.,368:1509-1518,2013;han等人,j.hematoloncol.6:47,2013;haso等人,(2013)blood,121,1165-1174;pct公开wo2012/079000、wo2013/059593和美国专利公开2012/0213783,其各自通过引用以其整体并入本文)。[0153]“ii类主要组织相容性复合体反式激活因子(ciita)”意为一种蛋白质,其与ncbi登录号np_001273331.1或其片段具有至少约85%的氨基酸序列一致性且具有免疫调节活性。示例性氨基酸序列提供如下。[0154]》np_001273331.1ii类mhc反式激活因子亚型1[智人(homosapiens)][0155]mrclaprpagsylsepqgssqcatmelgpleggylellnsdadplclyhfydqmdlageeeielysepdtdtincdqfsrllcdmegdeetreayaniaeldqyvfqdsqleglskdifiehigpdevigesmempaevgqksqkrpfpeelpadlkhwkpaepptvvtgsllvgpvsdcstlpclplpalfnqepasgqmrlektdqipmpfsssslsclnlpegpiqfvptistlphglwqiseagtgvssifiyhgevpqasqvpppsgftvhglptspdrpgstspfapsatdlpsmpepaltsranmtehktsptqcpaagevsnklpkwpepveqfyrslqdtygaepagpdgilvevdlvqarlerssskslerelatpdwaerqlaqgglaevllaakehrrpretrviavlgkagqgksywagavsrawacgrlpqydfvfsvpchclnrpgdayglqdllfslgpqplvaadevfshilkrpdrvllildgfeeleaqdgflhstcgpapaepcslrgllaglfqkkllrgctllltarprgrlvqslskadalfelsgfsmeqaqayvmryfessgmtehqdraltllrdrplllshshsptlcravcqlseallelgedaklpstltglyvgllgraaldsppgalaelaklawelgrrhqstlqedqfpsadvrtwamakglvqhppraaeselafpsfllqcflgalwlalsgeikdkelpqylaltprkkrpydnwlegvprflaglifqpparclgallgpsaaasvdrkqkvlarylkrlqpgtlrarqllellhcaheaeeagiwqhvvqelpgrlsflgtrltppdahvlgkaleaagqdfsldlrstgicpsglgslvglscvtrfraalsdtvalweslqqhgetkllqaaeekftiepfkakslkdvedlgklvqtqrtrsssedtagelpavrdlkklefalgpvsgpqafpklvriltafsslqhldldalsenkigdegvsqlsatfpqlksletlnlsqnnitdlgayklaealpslaasllrlslynncicdvgaeslarvlpdmvslrvmdvqynkftaagaqqlaaslrrcphvetlamwtptipfsvqehlqqqdsrislr[0156]“ii类主要组织相容性复合体反式激活因子(ciita)”意为编码ciita多肽的核酸。示例性ciita核酸序列提供如下。[0157]》nm_001286402.1智人(homosapiens)ii类主要组织相容性复合体反式激活因子(ciita),转录物变体1,mrna[0158]ggttagtgatgaggctagtgatgaggctgtgtgcttctgagctgggcatccgaaggcatccttggggaagctgagggcacgaggaggggctgccagactccgggagctgctgcctggctgggattcctacacaatgcgttgcctggctccacgccctgctgggtcctacctgtcagagccccaaggcagctcacagtgtgccaccatggagttggggcccctagaaggtggctacctggagcttcttaacagcgatgctgaccccctgtgcctctaccacttctatgaccagatggacctggctggagaagaagagattgagctctactcagaacccgacacagacaccatcaactgcgaccagttcagcaggctgttgtgtgacatggaaggtgatgaagagaccagggaggcttatgccaatatcgcggaactggaccagtatgtcttccaggactcccagctggagggcctgagcaaggacattttcatagagcacataggaccagatgaagtgatcggtgagagtatggagatgccagcagaagttgggcagaaaagtcagaaaagacccttcccagaggagcttccggcagacctgaagcactggaagccagctgagccccccactgtggtgactggcagtctcctagtgggaccagtgagcgactgctccaccctgccctgcctgccactgcctgcgctgttcaaccaggagccagcctccggccagatgcgcctggagaaaaccgaccagattcccatgcctttctccagttcctcgttgagctgcctgaatctccctgagggacccatccagtttgtccccaccatctccactctgccccatgggctctggcaaatctctgaggctggaacaggggtctccagtatattcatctaccatggtgaggtgccccaggccagccaagtaccccctcccagtggattcactgtccacggcctcccaacatctccagaccggccaggctccaccagccccttcgctccatcagccactgacctgcccagcatgcctgaacctgccctgacctcccgagcaaacatgacagagcacaagacgtcccccacccaatgcccggcagctggagaggtctccaacaagcttccaaaatggcctgagccggtggagcagttctaccgctcactgcaggacacgtatggtgccgagcccgcaggcccggatggcatcctagtggaggtggatctggtgcaggccaggctggagaggagcagcagcaagagcctggagcgggaactggccaccccggactgggcagaacggcagctggcccaaggaggcctggctgaggtgctgttggctgccaaggagcaccggcggccgcgtgagacacgagtgattgctgtgctgggcaaagctggtcagggcaagagctattgggctggggcagtgagccgggcctgggcttgtggccggcttccccagtacgactttgtcttctctgtcccctgccattgcttgaaccgtccgggggatgcctatggcctgcaggatctgctcttctccctgggcccacagccactcgtggcggccgatgaggttttcagccacatcttgaagagacctgaccgcgttctgctcatcctagacggcttcgaggagctggaagcgcaagatggcttcctgcacagcacgtgcggaccggcaccggcggagccctgctccctccgggggctgctggccggccttttccagaagaagctgctccgaggttgcaccctcctcctcacagcccggccccggggccgcctggtccagagcctgagcaaggccgacgccctatttgagctgtccggcttctccatggagcaggcccaggcatacgtgatgcgctactttgagagctcagggatgacagagcaccaagacagagccctgacgctcctccgggaccggccacttcttctcagtcacagccacagccctactttgtgccgggcagtgtgccagctctcagaggccctgctggagcttggggaggacgccaagctgccctccacgctcacgggactctatgtcggcctgctgggccgtgcagccctcgacagcccccccggggccctggcagagctggccaagctggcctgggagctgggccgcagacatcaaagtaccctacaggaggaccagttcccatccgcagacgtgaggacctgggcgatggccaaaggcttagtccaacacccaccgcgggccgcagagtccgagctggccttccccagcttcctcctgcaatgcttcctgggggccctgtggctggctctgagtggcgaaatcaaggacaaggagctcccgcagtacctagcattgaccccaaggaagaagaggccctatgacaactggctggagggcgtgccacgctttctggctgggctgatcttccagcctcccgcccgctgcctgggagccctactcgggccatcggcggctgcctcggtggacaggaagcagaaggtgcttgcgaggtacctgaagcggctgcagccggggacactgcgggcgcggcagctgctggagctgctgcactgcgcccacgaggccgaggaggctggaatttggcagcacgtggtacaggagctccccggccgcctctcttttctgggcacccgcctcacgcctcctgatgcacatgtactgggcaaggccttggaggcggcgggccaagacttctccctggacctccgcagcactggcatttgcccctctggattggggagcctcgtgggactcagctgtgtcacccgtttcagggctgccttgagcgacacggtggcgctgtgggagtccctgcagcagcatggggagaccaagctacttcaggcagcagaggagaagttcaccatcgagcctttcaaagccaagtccctgaaggatgtggaagacctgggaaagcttgtgcagactcagaggacgagaagttcctcggaagacacagctggggagctccctgctgttcgggacctaaagaaactggagtttgcgctgggccctgtctcaggcccccaggctttccccaaactggtgcggatcctcacggccttttcctccctgcagcatctggacctggatgcgctgagtgagaacaagatcggggacgagggtgtctcgcagctctcagccaccttcccccagctgaagtccttggaaaccctcaatctgtcccagaacaacatcactgacctgggtgcctacaaactcgccgaggccctgccttcgctcgctgcatccctgctcaggctaagcttgtacaataactgcatctgcgacgtgggagccgagagcttggctcgtgtgcttccggacatggtgtccctccgggtgatggacgtccagtacaacaagttcacggctgccggggcccagcagctcgctgccagccttcggaggtgtcctcatgtggagacgctggcgatgtggacgcccaccatcccattcagtgtccaggaacacctgcaacaacaggattcacggatcagcctgagatgatcccagctgtgctctggacaggcatgttctctgaggacactaaccacgctggaccttgaactgggtacttgtggacacagctcttctccaggctgtatcccatgagcctcagcatcctggcacccggcccctgctggttcagggttggcccctgcccggctgcggaatgaaccacatcttgctctgctgacagacacaggcccggctccaggctcctttagcgcccagttgggtggatgcctggtggcagctgcggtccacccaggagccccgaggccttctctgaaggacattgcggacagccacggccaggccagagggagtgacagaggcagccccattctgcctgcccaggcccctgccaccctggggagaaagtacttctttttttttatttttagacagagtctcactgttgcccaggctggcgtgcagtggtgcgatctgggttcactgcaacctccgcctcttgggttcaagcgattcttctgcttcagcctcccgagtagctgggactacaggcacccaccatcatgtctggctaatttttcatttttagtagagacagggttttgccatgttggccaggctggtctcaaactcttgacctcaggtgatccacccacctcagcctcccaaagtgctgggattacaagcgtgagccactgcaccgggccacagagaaagtacttctccaccctgctctccgaccagacaccttgacagggcacaccgggcactcagaagacactgatgggcaacccccagcctgctaattccccagattgcaacaggctgggcttcagtggcagctgcttttgtctatgggactcaatgcactgacattgttggccaaagccaaagctaggcctggccagatgcaccagcccttagcagggaaacagctaatgggacactaatggggcggtgagaggggaacagactggaagcacagcttcatttcctgtgtcttttttcactacattataaatgtctctttaatgtcacaggcaggtccagggtttgagttcataccctgttaccattttggggtacccactgctctggttatctaatatgtaacaagccaccccaaatcatagtggcttaaaacaacactcacattta[0159]本公开中,“包含”、“包含有”、“含有”和“具有”等可具有美国专利法所规定的意义,并且可意为“包括”、“包括在内”等;“主要由...组成”或“基本由...组成”等具有美国专利法所规定的意义,并且该术语是开放性的,允许超过其所引用者的存在,只要超过其所引用者的存在不改变其所引用者的基本特征或新颖特征即可,但不包括先前技术实施方案。[0160]“细胞毒t淋巴细胞相关蛋白4(ctla-4)多肽”意为一种蛋白质,其与ncbi登录号eaw70354.1或其片段具有至少约85%的序列一致性。示例性氨基酸序列提供如下:[0161]》eaw70354.1细胞毒t淋巴细胞相关蛋白4[智人(homosapiens)][0162]maclgfqrhkaqlnlatrtwpctllffllfipvfckamhvaqpavvlassrgiasfvceyaspgkatevrvtvlrqadsqvtevcaatymmgneltflddsictgtssgnqvnltiqglramdtglyickvelmypppyylgigngtqiyvidpepcpdsdfllwilaavssglffysflltavslskmlkkrsplttgvyvkmpptepecekqfqpyfipin[0163]“细胞毒t淋巴细胞相关蛋白4(ctla-4)多核苷酸”意为编码ctla-4多肽的核酸分子。ctla-4基因编码免疫球蛋白超家族并且编码将抑制信号传输到t细胞的蛋白质。示例性ctla-4核酸序列提供如下。[0164]》bc074842.2智人(homosapiens)细胞毒t淋巴细胞相关蛋白4,mrna(cdnaclonemgc:104099image:30915552),完全编码序列[0165]gacctgaacaccgctcccataaagccatggcttgccttggatttcagcggcacaaggctcagctgaacctggctaccaggacctggccctgcactctcctgttttttcttctcttcatccctgtcttctgcaaagcaatgcacgtggcccagcctgctgtggtactggccagcagccgaggcatcgccagctttgtgtgtgagtatgcatctccaggcaaagccactgaggtccgggtgacagtgcttcggcaggctgacagccaggtgactgaagtctgtgcggcaacctacatgatggggaatgagttgaccttcctagatgattccatctgcacgggcacctccagtggaaatcaagtgaacctcactatccaaggactgagggccatggacacgggactctacatctgcaaggtggagctcatgtacccaccgccatactacctgggcataggcaacggaacccagatttatgtaattgatccagaaccgtgcccagattctgacttcctcctctggatccttgcagcagttagttcggggttgtttttttatagctttctcctcacagctgtttctttgagcaaaatgctaaagaaaagaagccctcttacaacaggggtctatgtgaaaatgcccccaacagagccagaatgtgaaaagcaatttcagccttattttattcccatcaattgagaaaccattatgaagaagagagtccatatttcaatttccaagagctgagg[0166]“分化簇2(cd2)多肽”意为一种蛋白质,其与ncbi登录号np_001758.2或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性氨基酸序列提供如下。[0167]》np_001758.2t细胞表面抗原cd2亚型2前体[智人(homosapiens)][0168][0169]cd2细胞质结构域(氨基酸残基235至351)以粗体显示。来自智人(homosapiens)的示例性cd2多肽的架构显示在图4中。[0170]“分化簇2(cd2)多核苷酸”意为编码cd2多肽的核酸。示例性cd2核酸序列提供如下。》nm_001767.5智人(homosapiens)cd2分子(cd2),转录物变体2,rna[0171][0172]“分化簇5(cd5)多肽”意为一种蛋白质,其与ncbi登录号np_001333385.1或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性氨基酸序列提供如下。[0173]》np_001333385.1t细胞表面糖蛋白cd5亚型2[智人(homosapiens)][0174]mvcsqswgrsskqwedpsqaskvcqrlncgvplslgpflvtytpqssiicygqlgsfsncshsrndmchslgltclepqkttppttrppptttpeptapprlqlvaqsggqhcagvvefysgslggtisyeaqdktqdlenflcnnlqcgsflkhlpeteagraqdpgeprehqplpiqwkiqnssctslehcfrkikpqksgrvlallcsgfqpkvqsrlvggssicegtvevrqgaqwaalcdsssarsslrweevcreqqcgsvnsyrvldagdptsrglfcphqklsqchelwernsyckkvfvtcqdpnpaglaagtvasiilalvllvvllvvcgplaykklvkkfrqkkqrqwigptgmnqnmsfhrnhtatvrshaenptashvdneysqpprnshlsaypalegalhrssmqpdnssdsdydlhgaqrl[0175]“分化簇5(cd5)多核苷酸”意为编码cd5多肽的核酸。示例性cd5核酸序列提供如下。[0176]》nm_001346456.1智人(homosapiens)cd5分子(cd5),转录物变体2,mrna[0177][0178][0179]“分化簇7(cd7)多肽”意为一种蛋白质,其与ncbi参考序列np_006128.1或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性氨基酸序列提供如下。[0180]》np_006128.1t细胞抗原前体[智人(homosapiens)][0181][0182]“分化簇7(cd7)多核苷酸”意为编码cd7多肽的核酸分子。示例性cd7核酸序列提供如下。[0183]》nm_006137.7智人(homosapiens)cd7分子(cd7),mrna[0184][0185]“分化簇33(cd33)多肽”意为一种蛋白质,其与ncbi参考序列np_001763.3或其片段具有至少约85%的氨基酸序列一致性。cd33也称为siglec-3。示例性氨基酸序列提供如下。[0186]》np_001763.3髓样细胞表面抗原cd33亚型1前体[智人(homosapiens)][0187][0188]“分化簇33(cd33)多核苷酸”意为编码cd33多肽的核酸分子。示例性cd33核酸序列提供如下。[0189]》nm_001772.4智人(homosapiens)cd33分子(cd33),转录物变体1,mrna[0190][0191]“分化簇52(cd52)多肽”意为一种蛋白质,其与ncbi参考序列np_001794.2或其片段具有至少约85%的氨基酸序列一致性。cd52也称为campath-1。示例性氨基酸序列提供如下。[0192]》np_001794.2campath-1抗原前体[智人(homosapiens)][0193]1mkrflfllltisllvmvqiqtglsgqndtsqtsspsassnisggiflffvanaiihlfcf61s[0194]“分化簇52(cd52)多核苷酸”意为编码cd52多肽的核酸分子。示例性cd52核酸序列提供如下。[0195]》nm_001803.3智人(homosapiens)cd52分子(cd52),mrna[0196][0197]“分化簇123(cd123)多肽”意为一种蛋白质,其与ncbi参考序列np_002174.1或其片段具有至少约85%的氨基酸序列一致性。cd123也称为白介素-3受体。示例性氨基酸序列提供如下。[0198]》np_002174.1白介素-3受体亚基α亚型1前体[智人(homosapiens)][0199][0200]“分化簇123(cd123)多核苷酸”意为编码cd123多肽的核酸分子。示例性cd123核酸序列提供如下。[0201]》nm_002183.4智人(homosapiens)白介素3受体亚基α(il3ra),转录物变体1,mrna[0202][0203]“分化簇137(cd137)多肽”意为一种蛋白质,其与ncbi参考序列np_001552.2或其片段具有至少约85%的氨基酸序列一致性。cd137也称为4-1bb。示例性氨基酸序列提供如下。[0204]》np_001552.2肿瘤坏死因子受体超家族成员9前体[智人(homosapiens)][0205][0206]“分化簇137(cd137)多核苷酸”意为编码cd137多肽的核酸分子。示例性cd137核酸序列提供如下。[0207]》nm_001561.6智人(homosapiens)tnf受体超家族成员9(tnfrsf9),mrna[0208][0209][0210]“分化簇247(cd247)多肽”意为一种蛋白质,其与ncbi参考序列np_932170.1或其片段具有至少约85%的氨基酸序列一致性。cd137也称为cd3ζ。示例性氨基酸序列提供如下。[0211]》np_932170.1t细胞表面糖蛋白cd3ζ链亚型1前体[智人(homosapiens)][0212]1mkwkalftaailqaqlpiteaqsfglldpklcylldgilfiygviltalflrvkfsrsad61apayqqgqnqlynelnlgrreeydvldkrrgrdpemggkpqrrknpqeglynelqkdkma121eayseigmkgerrrgkghdglyqglstatkdtydalhmqalppr[0213]“分化簇247(cd247)多核苷酸”意为编码cd247多肽的核酸分子。示例性cd247核酸序列提供如下。[0214]》nm_nm_198053.3智人(homosapiens)cd247分子(cd247),转录物变体1,mrna[0215][0216]“共同给药”或“共给药”是指在疗程期间给药两种或更多种治疗剂或药物组合物。该共同给药可以是同时给药或依次给药。较晚给药的治疗剂或药物组合物的依次给药可能在给药第一种药物组合物或治疗剂后在疗程期间的任何时间发生。[0217]术语“保守氨基酸置换”或“保守突变”是指一个氨基酸被具有共有特性的另一氨基酸替换。定义个体氨基酸之间的共有特性的功能性途径是分析同源生物体的对应蛋白质之间的氨基酸变化的标准化频率(schulz,g.e.andschirmer,r.h.,principlesofproteinstructure,springer-verlag,newyork(1979))。根据此类分析,可定义多组氨基酸,其中组内氨基酸优先彼此交换,并因此在它们对整体蛋白质结构的影响方面彼此最为近似(schulz,g.e.andschirmer,r.h.,同上)。保守突变的非限制性示例包括氨基酸的氨基酸置换,例如,赖氨酸置换精氨酸,反之亦然,使得正电荷可得以保持;谷氨酸置换天冬氨酸,反之亦然,使得负电荷可得以保持;丝氨酸替换苏氨酸,使得游离–oh可得以保持;以及谷氨酰胺替换天冬酰胺,使得游离–nh2可得以保持。[0218]本文中可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸链段。该区域或序列在靠近5'末端结合有起始密码子且在靠近3'末端结合有终止密码子。编码序列也可以称为开放阅读框。[0219]“密码子优化”意为,为了增强在感兴趣的宿主细胞内的表达,通过将天然序列至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多密码子)替换为更频繁或最频繁用于宿主细胞的基因中同时维持天然氨基酸序列的密码子来修饰核酸序列的过程。对于特定氨基酸的某些密码子,各种物种均表现出特定偏倚。密码子偏倚(生物体之间密码子使用的差异)经常与信使rna(mrna)的翻译效率相关,而信使rna的翻译效率据信取决于正在被翻译的密码子的性质和特定转移rna(trna)分子的可用性。细胞中选定trna的优势通常反映了肽合成中最常用的密码子。据此,可以基于密码子优化在给定生物体内裁剪基因以进行最优基因表达。密码子使用表可轻易获得,例如,在c可在www.kazusa.orjp/codon/(2002年7月9日访问)获得的“密码子使用数据库”处获得,且这些表可以多种方式调适。参见,nakamura,y.,等人“codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000”nucl.acidsres.28:292(2000)。用于对特定序列进行密码子优化以在特定宿主细胞中表达的计算机算法也是可获得的,诸如geneforge(aptagen;jacobus,pa.)。在一些实施方案中,编码经工程改造的核酸酶的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50、或更多、或全部密码子)对应于特定氨基酸最频繁使用的密码子。[0220]“胞苷脱氨酶”意为能够催化将氨基转变为羰基的脱氨基反应的多肽或其片段。在一种实施方案中,胞苷脱氨酶将胞嘧啶转变为尿嘧啶或将5-甲基胞嘧啶转变为胸腺嘧啶。源自海七鳃鳗(petromyzonmarinus)的pmcda1(海七鳃鳗胞嘧啶脱氨酶1,(“pmcda1”))、或源自哺乳动物(例如,人类、猪、牛、马、猴等)的aid(激活诱导的胞苷脱氨酶;(“aicda”))和apobec是示例性的胞苷脱氨酶。[0221]pmcda1的碱基序列和氨基酸序列以及人类aid的碱基序列和氨基酸序列显示如下。[0222]》tr|a5h718|a5h718_petma胞嘧啶脱氨酶os=海七鳃鳗(petromyzonmarinus)ox=7757pe=2sv=1[0223]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsimiqvkilhttkspav[0224]》ef094822.1海七鳃鳗分离pmcda.21胞嘧啶脱氨酶mrna,完全编码序列[0225]tgacacgacacagccgtgtatatgaggaagggtagctggatggggggggggggaatacgttcagagaggacattagcgagcgtcttgttggtggccttgagtctagacacctgcagacatgaccgacgctgagtacgtgagaatccatgagaagttggacatctacacgtttaagaaacagtttttcaacaacaaaaaatccgtgtcgcatagatgctacgttctctttgaattaaaacgacggggtgaacgtagagcgtgtttttggggctatgctgtgaataaaccacagagcgggacagaacgtggaattcacgccgaaatctttagcattagaaaagtcgaagaatacctgcgcgacaaccccggacaattcacgataaattggtactcatcctggagtccttgtgcagattgcgctgaaaagatcttagaatggtataaccaggagctgcgggggaacggccacactttgaaaatctgggcttgcaaactctattacgagaaaaatgcgaggaatcaaattgggctgtggaacctcagagataacggggttgggttgaatgtaatggtaagtgaacactaccaatgttgcaggaaaatattcatccaatcgtcgcacaatcaattgaatgagaatagatggcttgagaagactttgaagcgagctgaaaaacgacggagcgagttgtccattatgattcaggtaaaaatactccacaccactaagagtcctgctgtttaagaggctatgcggatggttttc[0226]》tr|q6qj80|q6qj80_人类激活诱导型胞苷脱氨酶os=智人(homosapiens)ox=9606gn=aicdape=2sv=1[0227]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkapv[0228]》ng_011588.1:5001-15681智人(homosapiens)激活诱导型胞苷脱氨酶(aicda),refseqgene(lrg_17),在12号染色体上[0229]agagaaccatcattaattgaagtgagatttttctggcctgagacttgcagggaggcaagaagacactctggacaccactatggacaggtaaagaggcagtcttctcgtgggtgattgcactggccttcctctcagagcaaatctgagtaatgagactggtagctatccctttctctcatgtaactgtctgactgataagatcagcttgatcaatatgcatatatattttttgatctgtctccttttcttctattcagatcttatacgctgtcagcccaattctttctgtttcagacttctcttgatttccctctttttcatgtggcaaaagaagtagtgcgtacaatgtactgattcgtcctgagatttgtaccatggttgaaactaatttatggtaataatattaacatagcaaatctttagagactcaaatcatgaaaaggtaatagcagtactgtactaaaaacggtagtgctaattttcgtaataattttgtaaatattcaacagtaaaacaacttgaagacacactttcctagggaggcgttactgaaataatttagctatagtaagaaaatttgtaattttagaaatgccaagcattctaaattaattgcttgaaagtcactatgattgtgtccattataaggagacaaattcattcaagcaagttatttaatgttaaaggcccaattgttaggcagttaatggcacttttactattaactaatctttccatttgttcagacgtagcttaacttacctcttaggtgtgaatttggttaaggtcctcataatgtctttatgtgcagtttttgataggttattgtcatagaacttattctattcctacatttatgattactatggatgtatgagaataacacctaatccttatactttacctcaatttaactcctttataaagaacttacattacagaataaagattttttaaaaatatatttttttgtagagacagggtcttagcccagccgaggctggtctctaagtcctggcccaagcgatcctcctgcctgggcctcctaaagtgctggaattatagacatgagccatcacatccaatatacagaataaagatttttaatggaggatttaatgttcttcagaaaattttcttgaggtcagacaatgtcaaatgtctcctcagtttacactgagattttgaaaacaagtctgagctataggtccttgtgaagggtccattggaaatacttgttcaaagtaaaatggaaagcaaaggtaaaatcagcagttgaaattcagagaaagacagaaaaggagaaaagatgaaattcaacaggacagaagggaaatatattatcattaaggaggacagtatctgtagagctcattagtgatggcaaaatgacttggtcaggattatttttaacccgcttgtttctggtttgcacggctggggatgcagctagggttctgcctcagggagcacagctgtccagagcagctgtcagcctgcaagcctgaaacactccctcggtaaagtccttcctactcaggacagaaatgacgagaacagggagctggaaacaggcccctaaccagagaagggaagtaatggatcaacaaagttaactagcaggtcaggatcacgcaattcatttcactctgactggtaacatgtgacagaaacagtgtaggcttattgtattttcatgtagagtaggacccaaaaatccacccaaagtcctttatctatgccacatccttcttatctatacttccaggacactttttcttccttatgataaggctctctctctctccacacacacacacacacacacacacacacacacacacacacacacaaacacacaccccgccaaccaaggtgcatgtaaaaagatgtagattcctctgcctttctcatctacacagcccaggagggtaagttaatataagagggatttattggtaagagatgatgcttaatctgtttaacactgggcctcaaagagagaatttcttttcttctgtacttattaagcacctattatgtgttgagcttatatatacaaagggttattatatgctaatatagtaatagtaatggtggttggtactatggtaattaccataaaaattattatccttttaaaataaagctaattattattggatcttttttagtattcattttatgttttttatgtttttgattttttaaaagacaatctcaccctgttacccaggctggagtgcagtggtgcaatcatagctttctgcagtcttgaactcctgggctcaagcaatcctcctgccttggcctcccaaagtgttgggatacagtcatgagccactgcatctggcctaggatccatttagattaaaatatgcattttaaattttaaaataatatggctaatttttaccttatgtaatgtgtatactggcaataaatctagtttgctgcctaaagtttaaagtgctttccagtaagcttcatgtacgtgaggggagacatttaaagtgaaacagacagccaggtgtggtggctcacgcctgtaatcccagcactctgggaggctgaggtgggtggatcgcttgagccctggagttcaagaccagcctgagcaacatggcaaaacgctgtttctataacaaaaattagccgggcatggtggcatgtgcctgtggtcccagctactagggggctgaggcaggagaatcgttggagcccaggaggtcaaggctgcactgagcagtgcttgcgccactgcactccagcctgggtgacaggaccagaccttgcctcaaaaaaataagaagaaaaattaaaaataaatggaaacaactacaaagagctgttgtcctagatgagctacttagttaggctgatattttggtatttaacttttaaagtcagggtctgtcacctgcactacattattaaaatatcaattctcaatgtatatccacacaaagactggtacgtgaatgttcatagtacctttattcacaaaaccccaaagtagagactatccaaatatccatcaacaagtgaacaaataaacaaaatgtgctatatccatgcaatggaataccaccctgcagtacaaagaagctacttggggatgaatcccaaagtcatgacgctaaatgaaagagtcagacatgaaggaggagataatgtatgccatacgaaattctagaaaatgaaagtaacttatagttacagaaagcaaatcagggcaggcatagaggctcacacctgtaatcccagcactttgagaggccacgtgggaagattgctagaactcaggagttcaagaccagcctgggcaacacagtgaaactccattctccacaaaaatgggaaaaaaagaaagcaaatcagtggttgtcctgtggggaggggaaggactgcaaagagggaagaagctctggtggggtgagggtggtgattcaggttctgtatcctgactgtggtagcagtttggggtgtttacatccaaaaatattcgtagaattatgcatcttaaatgggtggagtttactgtatgtaaattatacctcaatgtaagaaaaaataatgtgtaagaaaactttcaattctcttgccagcaaacgttattcaaattcctgagccctttacttcgcaaattctctgcacttctgccccgtaccattaggtgacagcactagctccacaaattggataaatgcatttctggaaaagactagggacaaaatccaggcatcacttgtgctttcatatcaaccatgctgtacagcttgtgttgctgtctgcagctgcaatggggactcttgatttctttaaggaaacttgggttaccagagtatttccacaaatgctattcaaattagtgcttatgatatgcaagacactgtgctaggagccagaaaacaaagaggaggagaaatcagtcattatgtgggaacaacatagcaagatatttagatcattttgactagttaaaaaagcagcagagtacaaaatcacacatgcaatcagtataatccaaatcatgtaaatatgtgcctgtagaaagactagaggaataaacacaagaatcttaacagtcattgtcattagacactaagtctaattattattattagacactatgatatttgagatttaaaaaatctttaatattttaaaatttagagctcttctatttttccatagtattcaagtttgacaatgatcaagtattactctttctttttttttttttttttttttttttgagatggagttttggtcttgttgcccatgctggagtggaatggcatgaccatagctcactgcaacctccacctcctgggttcaagcaaagctgtcgcctcagcctcccgggtagatgggattacaggcgcccaccaccacactcggctaatgtttgtatttttagtagagatggggtttcaccatgttggccaggctggtctcaaactcctgacctcagaggatccacctgcctcagcctcccaaagtgctgggattacagatgtaggccactgcgcccggccaagtattgctcttatacattaaaaaacaggtgtgagccactgcgcccagccaggtattgctcttatacattaaaaaataggccggtgcagtggctcacgcctgtaatcccagcactttgggaagccaaggcgggcagaacacccgaggtcaggagtccaaggccagcctggccaagatggtgaaaccccgtctctattaaaaatacaaacattacctgggcatgatggtgggcgcctgtaatcccagctactcaggaggctgaggcaggaggatccgcggagcctggcagatctgcctgagcctgggaggttgaggctacagtaagccaagatcatgccagtatacttcagcctgggcgacaaagtgagaccgtaacaaaaaaaaaaaaatttaaaaaaagaaatttagatcaagatccaactgtaaaaagtggcctaaacaccacattaaagagtttggagtttattctgcaggcagaagagaaccatcagggggtcttcagcatgggaatggcatggtgcacctggtttttgtgagatcatggtggtgacagtgtggggaatgttattttggagggactggaggcagacagaccggttaaaaggccagcacaacagataaggaggaagaagatgagggcttggaccgaagcagagaagagcaaacagggaaggtacaaattcaagaaatattggggggtttgaatcaacacatttagatgattaattaaatatgaggactgaggaataagaaatgagtcaaggatggttccaggctgctaggctgcttacctgaggtggcaaagtcgggaggagtggcagtttaggacagggggcagttgaggaatattgttttgatcattttgagtttgaggtacaagttggacacttaggtaaagactggaggggaaatctgaatatacaattatgggactgaggaacaagtttattttattttttgtttcgttttcttgttgaagaacaaatttaattgtaatcccaagtcatcagcatctagaagacagtggcaggaggtgactgtcttgtgggtaagggtttggggtccttgatgagtatctctcaattggccttaaatataagcaggaaaaggagtttatgatggattccaggctcagcagggctcaggagggctcaggcagccagcagaggaagtcagagcatcttctttggtttagcccaagtaatgacttccttaaaaagctgaaggaaaatccagagtgaccagattataaactgtactcttgcattttctctccctcctctcacccacagcctcttgatgaaccggaggaagtttctttaccaattcaaaaatgtccgctgggctaagggtcggcgtgagacctacctgtgctacgtagtgaagaggcgtgacagtgctacatccttttcactggactttggttatcttcgcaataaggtatcaattaaagtcggctttgcaagcagtttaatggtcaactgtgagtgcttttagagccacctgctgatggtattacttccatccttttttggcatttgtgtctctatcacattcctcaaatccttttttttatttctttttccatgtccatgcacccatattagacatggcccaaaatatgtgatttaattcctccccagtaatgctgggcaccctaataccactccttccttcagtgccaagaacaactgctcccaaactgtttaccagctttcctcagcatctgaattgcctttgagattaattaagctaaaagcatttttatatgggagaatattatcagcttgtccaagcaaaaattttaaatgtgaaaaacaaattgtgtcttaagcatttttgaaaattaaggaagaagaatttgggaaaaaattaacggtggctcaattctgtcttccaaatgatttcttttccctcctactcacatgggtcgtaggccagtgaatacattcaacatggtgatccccagaaaactcagagaagcctcggctgatgattaattaaattgatctttcggctacccgagagaattacatttccaagagacttcttcaccaaaatccagatgggtttacataaacttctgcccacgggtatctcctctctcctaacacgctgtgacgtctgggcttggtggaatctcagggaagcatccgtggggtggaaggtcatcgtctggctcgttgtttgatggttatattaccatgcaattttctttgcctacatttgtattgaatacatcccaatctccttcctattcggtgacatgacacattctatttcagaaggctttgattttatcaagcactttcatttacttctcatggcagtgcctattacttctcttacaatacccatctgtctgctttaccaaaatctatttccccttttcagatcctcccaaatggtcctcataaactgtcctgcctccacctagtggtccaggtatatttccacaatgttacatcaacaggcacttctagccattttccttctcaaaaggtgcaaaaagcaacttcataaacacaaattaaatcttcggtgaggtagtgtgatgctgcttcctcccaactcagcgcacttcgtcttcctcattccacaaaaacccatagccttccttcactctgcaggactagtgctgccaagggttcagctctacctactggtgtgctcttttgagcaagttgcttagcctctctgtaacacaaggacaatagctgcaagcatccccaaagatcattgcaggagacaatgactaaggctaccagagccgcaataaaagtcagtgaattttagcgtggtcctctctgtctctccagaacggctgccacgtggaattgctcttcctccgctacatctcggactgggacctagaccctggccgctgctaccgcgtcacctggttcacctcctggagcccctgctacgactgtgcccgacatgtggccgactttctgcgagggaaccccaacctcagtctgaggatcttcaccgcgcgcctctacttctgtgaggaccgcaaggctgagcccgaggggctgcggcggctgcaccgcgccggggtgcaaatagccatcatgaccttcaaaggtgcgaaagggccttccgcgcaggcgcagtgcagcagcccgcattcgggattgcgatgcggaatgaatgagttagtggggaagctcgaggggaagaagtgggcggggattctggttcacctctggagccgaaattaaagattagaagcagagaaaagagtgaatggctcagagacaaggccccgaggaaatgagaaaatggggccagggttgcttctttcccctcgatttggaacctgaactgtcttctacccccatatccccgcctttttttcctttttttttttttgaagattatttttactgctggaatacttttgtagaaaaccacgaaagaactttcaaagcctgggaagggctgcatgaaaattcagttcgtctctccagacagcttcggcgcatccttttggtaaggggcttcctcgctttttaaattttctttctttctctacagtcttttttggagtttcgtatatttcttatattttcttattgttcaatcactctcagttttcatctgatgaaaactttatttctcctccacatcagctttttcttctgctgtttcaccattcagagccctctgctaaggttccttttccctcccttttctttcttttgttgtttcacatctttaaatttctgtctctccccagggttgcgtttccttcctggtcagaattcttttctcctttttttttttttttttttttttttttaaacaaacaaacaaaaaacccaaaaaaactctttcccaatttactttcttccaacatgttacaaagccatccactcagtttagaagactctccggccccaccgacccccaacctcgttttgaagccattcactcaatttgcttctctctttctctacagcccctgtatgaggttgatgacttacgagacgcatttcgtactttgggactttgatagcaacttccaggaatgtcacacacgatgaaatatctctgctgaagacagtggataaaaaacagtccttcaagtcttctctgtttttattcttcaactctcactttcttagagtttacagaaaaaatatttatatacgactctttaaaaagatctatgtcttgaaaatagagaaggaacacaggtctggccagggacgtgctgcaattggtgcagttttgaatgcaacattgtcccctactgggaataacagaactgcaggacctgggagcatcctaaagtgtcaacgtttttctatgacttttaggtaggatgagagcagaaggtagatcctaaaaagcatggtgagaggatcaaatgtttttatatcaacatcctttattatttgattcatttgagttaacagtggtgttagtgatagatttttctattcttttcccttgacgtttactttcaagtaacacaaactcttccatcaggccatgatctataggacctcctaatgagagtatctgggtgattgtgaccccaaaccatctctccaaagcattaatatccaatcatgcgctgtatgttttaatcagcagaagcatgtttttatgtttgtacaaaagaagattgttatgggtggggatggaggtatagaccatgcatggtcaccttcaagctactttaataaaggatcttaaaatgggcaggaggactgtgaacaagacaccctaataatgggttgatgtctgaagtagcaaatcttctggaaacgcaaactcttttaaggaagtccctaatttagaaacacccacaaacttcacatatcataattagcaaacaattggaaggaagttgcttgaatgttggggagaggaaaatctattggctctcgtgggtctcttcatctcagaaatgccaatcaggtcaaggtttgctacattttgtatgtgtgtgatgcttctcccaaaggtatattaactatataagagagttgtgacaaaacagaatgataaagctgcgaaccgtggcacacgctcatagttctagctgcttgggaggttgaggagggaggatggcttgaacacaggtgttcaaggccagcctgggcaacataacaagatcctgtctctcaaaaaaaaaaaaaaaaaaaagaaagagagagggccgggcgtggtggctcacgcctgtaatcccagcactttgggaggccgagccgggcggatcacctgtggtcaggagtttgagaccagcctggccaacatggcaaaaccccgtctgtactcaaaatgcaaaaattagccaggcgtggtagcaggcacctgtaatcccagctacttgggaggctgaggcaggagaatcgcttgaacccaggaggtggaggttgcagtaagctgagatcgtgccgttgcactccagcctgggcgacaagagcaagactctgtctcagaaaaaaaaaaaaaaaagagagagagagagaaagagaacaatatttgggagagaaggatggggaagcattgcaaggaaattgtgctttatccaacaaaatgtaaggagccaataagggatccctatttgtctcttttggtgtctatttgtccctaacaactgtctttgacagtgagaaaaatattcagaataaccatatccctgtgccgttattacctagcaacccttgcaatgaagatgagcagatccacaggaaaacttgaatgcacaactgtcttattttaatcttattgtacataagtttgtaaaagagttaaaaattgttacttcatgtattcatttatattttatattattttgcgtctaatgattttttattaacatgatttccttttctgatatattgaaatggagtctcaaagcttcataaatttataactttagaaatgattctaataacaacgtatgtaattgtaacattgcagtaatggtgctacgaagccatttctcttgatttttagtaaacttttatgacagcaaatttgcttctggctcactttcaatcagttaaataaatgataaataattttggaagctgtgaagataaaataccaaataaaataatataaaagtgatttatatgaagttaaaataaaaaatcagtatgatggaataaacttg[0230]载脂蛋白bmrna编辑酶,催化性多肽样(apobec)是一个进化上保守的胞苷脱氨酶家族。这一家族的成员是c到u编辑酶。apobec样蛋白的n端结构域是催化性结构域,而c端结构域是假催化性结构域。更具体地,催化性结构域是锌依赖性胞苷脱氨酶结构域,且对于胞苷脱氨基而言非常重要。apobec家族成员包括apobec1、apobec2、apobec3a、apobec3b、apobec3c、apobec3d(现在称为“apobec3e”)、apobec3f、apobec3g、apobec3h、apobec4和激活诱导型(胞苷)脱氨酶。很多经修饰的胞苷脱氨酶是可商购的,包括但不限于,sabe3、sakkh-be3、vqr-be3、eqr-be3、vrer-be3、ye1-be3、ee-be3、ye2-be3和yee-be3,它们可以从addgene获得(质粒85169、85170、85171、85172、85173、85174、85175、85176、85177)。[0231]可根据本公开的方面融合至cas9的其他示例性脱氨酶提供于本文中。应理解,在一些实施方案中,可使用相应序列的活性结构域,例如灭有定位信号的结构域(核定位序列,没有核输出信号、细胞质定位信号)。[0232]如本文所用,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨基反应的蛋白质或酶。在一些实施方案中,脱氨酶或脱氨酶结构域是胞苷脱氨酶,其催化胞苷或者脱氧胞苷分别至尿苷或脱氧尿苷的水解性脱氨基。在一些实施方案中,脱氨酶或脱氨酶结构域是胞嘧啶脱氨酶,其催化胞嘧啶至尿嘧啶的水解性脱氨基。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺嘌呤至次黄嘌呤的水解性脱氨基。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺苷或腺嘌呤(a)至肌苷(i)的水解性脱氨基。在一些实施方案中,脱氨酶或脱氨酶结构域是腺苷脱氨酶,其催化腺苷或脱氧腺苷分别至肌苷或脱氧肌苷的水解性脱氨基。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(dna)中的腺苷的水解脱氨基。本文提供的腺苷脱氨酶(例如,工程改造的腺苷脱氨酶、进化的腺苷脱氨酶)可以来自任何生物体诸如细菌。在一些实施方案中,腺苷脱氨酶来自细菌,诸如大肠杆菌(escherichiacoli)、金黄色葡萄球菌(staphylococcusaureus)、伤寒沙门氏菌(salmonellatyphimurium)、腐败希瓦氏菌(shewanellaputrefaciens)、流感嗜血杆菌(haemophilusinfluenzae)或新月柄杆菌(caulobactercrescentus)。[0233]在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体诸如人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠的天然存在的脱氨酶的变体。在一些实施方案中,腺苷脱氨酶或脱氨酶结构域在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域与天然存在的脱氨酶为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%相同。[0234]例如,碱基编辑器在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用以其整体并入本文。也参见komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017);和rees,h.a.,等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770-788.doi:10.1038/s41576-018-0059-1,其整体内容通过引用并入本文。[0235]“检测”是指鉴定待检测分析物的存在、不存在或量。[0236]“可检测标签”意为一种组合物,其链接至感兴趣的分子,使得后者可经由光谱、光化学、生物化学、免疫化学或化学手段检测。例如,可用的标签包括放射活性同位素、磁珠、金属性珠、胶体颗粒、荧光染料、电子密集型试剂、酶(例如,如酶联免疫吸附测定(elisa)中常用者)、生物素、地高辛或半抗原。[0237]“疾病”意为损害或干扰细胞、组织或器官正常功能的任何病症或病变。在一种实施方案中,疾病是瘤形成或癌症。在一些实施方案中,疾病是血液学癌症。“血液学癌症”意为免疫系统细胞的恶性病变。在一些实施方案中,血液学癌症是白血病、骨髓瘤和/或淋巴瘤。淋巴瘤和白血病是“液态癌症”或者存在于血液中的癌症的示例,并且源自骨髓中造血前体或血液中成熟造血细胞的转化。白血病可以是淋巴性的或骨髓性的以及急性的或慢性的。在骨髓瘤的情况下,转化的细胞是完全分化的浆细胞,可能作为恶性细胞的分散集合或作为骨髓中的固体团块的形式存在。在淋巴瘤的情况下,在次级淋巴组织中的转化的淋巴细胞生成固体团块。淋巴瘤归类为霍奇金淋巴瘤(hl)或非霍奇金淋巴瘤(nhl)。[0238]在一些实施方案中,血液学癌症是b细胞癌症。在一些实施方案中,b细胞癌症是淋巴瘤或白血病。在一些情况下,白血病包括白血病前期。在一些情况下,白血病是急性白血病。急性白血病包括,例如,急性骨髓性白血病(aml)。急性白血病也包括,例如,急性淋巴性白血病或急性淋巴细胞性白血病(all);all包括b谱系all、t谱系all和t细胞急性淋巴细胞性白血病(t-all)。[0239]疾病的非限制性示例包括t细胞急性成淋巴细胞性白血病(t-all)、蕈样肉芽肿(mf)、sézary综合征(ss)、外周t/nk细胞淋巴瘤、间变性大细胞淋巴瘤alk+、原发性皮肤t细胞淋巴瘤、t细胞大颗粒淋巴细胞型白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+淋巴增生性疾病、结外nk/t细胞淋巴瘤、成人t细胞白血病/淋巴瘤、t细胞幼淋巴细胞白血病、皮下脂膜炎样t细胞淋巴瘤、原发性皮肤γδt细胞淋巴瘤、侵袭性nk细胞白血病和肠病相关t细胞淋巴瘤。在一些实施方案中,疾病是液态肿瘤。在一些实施方案中,疾病是t细胞急性成淋巴细胞性白血病(t-all)。在一些实施方案中,疾病是t细胞急性骨髓性白血病(aml)。[0240]如本文所用,术语“有效量”是指生物活性剂的足以引起所希望的生物学应答的量。在一些实施方案中,有效量是相对于未治疗的患者缓解疾病症状所需的量。用来实践本发明的用于对疾病进行治疗性处理的活性剂的有效量依据给药方式以及受试者的年龄、体重和一般健康状况而变。最终,主治医师或兽医将决定适宜的量和剂量方案。此量称为“有效”量。在一种实施方案中,有效量是本发明的碱基编辑器(例如,包含可编程dna结合蛋白、核碱基编辑器和grna的融合蛋白)的量,该量足以将改变引入细胞(例如,体外细胞或体内细胞)内的感兴趣的基因中。在一种实施方案中,有效量是实现治疗效果(例如,减轻或控制疾病或其症状或病状)所需的碱基编辑器的量。此类治疗效果不必足以改变受试者、组织或器官的全部细胞中的感兴趣基因,而可以仅改变受试者、组织或器官中存在的约1%、5%、10%、25%、50%、75%或更多细胞中的感兴趣基因。[0241]在一些实施方案中,本文所提供的融合蛋白的有效量,例如,包含ncas9结构域和脱氨酶结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)的核碱基编辑器的有效量,是指融合蛋白的量,该量足以诱导对由本文所述的核碱基编辑器特异性地结合并编辑的靶标位点的编辑。如本领域技术人员将会了解的,药剂(例如,融合蛋白、核酸酶、杂交蛋白、蛋白二聚体、蛋白质(或蛋白二聚体)与多核苷酸的复合物、或多核苷酸)的量可依据各种因素而变,例如,依据所希望的生物学应答而变,例如,依据待编辑的特异性等位基因、基因组或靶标位点而变,依据待靶向的细胞或组织而不,和/或依据所使用的药剂而变。在car-t细胞的情境中,“有效量”是指给药至患者以实现治疗性应答所必需的细胞的数量。[0242]如本文所用,术语“表位”意为抗原决定簇。表位是抗原分子的一部分,通过其结构来决定江湖识别并结合它的特异性抗体。[0243]“fas细胞表面死亡受体(fas)多肽”意为一种蛋白质,其与ncbi登录号np_000034.1或其片段具有至少约85%的氨基酸序列一致性。示例性氨基酸序列提供如下。[0244]》np_000034.1肿瘤坏死因子受体超家族成员6亚型1前体[智人(homosapiens)][0245][0246]“fas细胞表面死亡受体(fas)多核苷酸”意为编码fas多肽的核酸。示例性fas核酸序列提供如下。[0247]》nm_000043.6智人(homosapiens)fas细胞表面死亡受体(fas),转录物变体1,mrna[0248][0249][0250][0251]“片段”意为多肽或核酸分子的一部分。这一部分含有参考核酸分子或多肽整个长度的至少约10%、20%、30%、40%、50%、60%、70%、80%或90%。片段可含有10、20、30、40、50、60、70、80、90、或100、200、300、400、500、600、700、800、900、或1000个核苷酸或氨基酸。[0252]“同类相杀”意为免疫细胞被其他免疫细胞杀死,包括自身抗原驱动的免疫细胞杀死。在某些实施方案中,本发明的免疫细胞经基因修饰以防止或减少被表达嵌合抗原受体(car)的免疫细胞识别的抗原的表达,从而防止或减少同类相杀。在各种实施方案中,同类相杀可以在体内(例如,在受试者体内)或间接体内(例如,在免疫细胞制剂中)发生。[0253]“移植物抗宿主疾病”(gvhd)是指一种病理状况,其中所移植的供体细胞生成针对宿主细胞的免疫应答。[0254]“向导rna”或“grna”意为一种多核苷酸,其对于靶标序列可能具有特异性并且可以与多核苷酸可编程核苷酸结合结构域蛋白(例如,cas9或cpf1)形成复合物。在一种实施方案中,向导多核苷酸是向导rna(grna)。grna可以作为两种或更多种rna的复合物存在,或作为单一rna分子存在。作为单一rna分子存在的grna可以称为单向导rna(sgrna),但“grna”可互换地使用以指代作为单一分子或作为两个或更多个分子的复合物存在的向导rna。典型地,作为单一rna物质存在的grna包含两个结构域:(1)与靶标核酸共享同源性的结构域(例如,并且引导cas9复合物至靶标的结合);和(2)结合cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于称为tracrrna的序列并且包含茎环结构。例如,在一些实施方案中,结构域(2)与jinek等人,science337:816-821(2012)中提供的tracrrna相同或同源,该文献的整体内容通过引用并入本文。grna的其他示例(例如,那些包括结构域2的)可见于题为“switchablecas9nucleasesandusesthereof”的us20160208288和题为“deliverysystemforfunctionalnucleases”的us9,737,604中,各专利的整体内容通过引用而以其整体并入本文。在一些实施方案中,grna包含两个或更多个结构域(1)和(2)并且可以成为“扩展grna”。扩展grna将会结合两个或更多个cas9蛋白并在两个或更多个不同区域处结合靶标核酸,如本文所述。grna包含与靶标位点互补的核苷酸序列,其介导核酸酶/rna复合物至所述靶标位点的结合,提供核酸酶:rna复合物的序列特异性。如本领域技术人员将会了解的,rna多核苷酸序列,例如,grna序列,包括核碱基尿嘧啶(u)(一种嘧啶衍生物)而非核碱基胸腺嘧啶(t),胸腺嘧啶包括在dna多核苷酸序列中。在rna中,尿嘧啶与腺嘌呤进行碱基配对并且在dna转录期间替换胸腺嘧啶。[0255]“异二聚体”意为一种融合蛋白,其包含两个结构域,诸如野生型tada结构域和tada结构域的变体(例如,tada*8),或两个变体tada及头晕(例如,tada*7.10和tada*8,或者两个tada*8结构域)。[0256]“宿主抗移植物疾病”(hvgd)是指一种病理状况,其中宿主的免疫系统生成针对所移植的供体细胞的免疫应答。[0257]“杂交”意为互补核碱基之间的氢键键合,该氢键键合可以是watson-crick、hoogsteen或反向hoogsteen氢键键合。例如,腺嘌呤和胸腺嘧啶是通过形成氢键进行配对的互补核碱基。[0258]“免疫细胞”意为能够生成免疫应答的免疫系统的细胞。[0259]“免疫效应细胞”意为一种淋巴细胞,其一旦被激活就能够对于靶标细胞实现免疫应答。在一些实施方案中,免疫效应细胞是效应子t细胞。在一些实施方案中,效应子t细胞是天然cd8+t细胞、细胞毒t细胞、天然杀手t(nkt)细胞、天然杀手(nk)细胞或调节性t(treg)细胞。在一些实施方案中,免疫效应细胞是效应子nk细胞。在一些实施方案中,效应子t细胞是胸腺细胞、不成熟的t淋巴细胞、成熟的t淋巴细胞、静息t淋巴细胞或激活的t淋巴细胞。在一些实施方案中,免疫效应细胞是cd4+cd8+t细胞或cd4-cd8-t细胞。在一些实施方案中,免疫效应细胞是t辅助细胞。在一些实施方案中,t辅助细胞是t辅助1(th1)、t辅助2(th2)细胞或表达cd4的辅助t细胞(cd4+t细胞)。[0260]“免疫应答调节基因”或“免疫应答调节因子”意为一种基因,其编码牵涉入免疫应答调节中的多肽。免疫应答调节基因可以以多种机制或在不同层面上调节免疫应答。例如,免疫应答调节基因可以抑制或促进免疫细胞例如t细胞的激活。免疫应答调节基因可以增加或降低免疫细胞的激活阈值。在一些实施方案中,免疫应答调节基因正向调节免疫细胞信号转导途径。在一些实施方案中,免疫应答调节基因负向调节免疫细胞信号转导途径。在一些实施方案中,免疫应答调节基因编码抗原、抗体、细胞因子或神经内分泌。[0261]“免疫原性基因”意为一种基因,其编码能引起免疫应答的多肽。例如,免疫原性基因可以编码引起免疫应答的免疫原。在一些实施方案中,免疫原性基因编码细胞表面蛋白。在一些实施方案中,免疫原性基因编码细胞表面抗原或细胞表面标志物。在一些实施方案中,细胞表面标志物是t细胞标志物或b细胞标志物。在一些实施方案中,免疫原性基因编码cd2、cd3e、cd3delta、cd3gamma、trac、trbc1、trbc2、cd4、cd5、cd7、cd8、cd19、cd23、cd27、cd28、cd30、cd33、cd52、cd70、cd127、cd122、cd130、cd132、cd38、cd69、cd11a、cd58、cd99、cd103、ccr4、ccr5、ccr6、ccr9、ccr10、cxcr3、cxcr4、cla、cd161、b2m或ciita多肽。[0262]术语“碱基修复的抑制剂”或“ibr”是指一种蛋白质,其能够抑制核酸修复酶(例如,碱基切除修复(ber)酶)的活性。在一些实施方案中,ibr是肌苷碱基切除修复的抑制剂。示例性的剪辑修复抑制剂包括ape1、endoiii、endoiv、endov、endoviii、fpg、hoggl、hneill、t7endol、t4pdg、udg、hsmugl和haag的抑制剂。在一些实施方案中,ibr是endov或haag的抑制剂。在一些实施方案中,ibr是无催化活性的endov或无催化活性的haag。在一些实施方案中,碱基修复抑制剂是endov或haag的抑制剂。在一些实施方案中,碱基修复抑制剂是无催化活性的endov或无催化活性的haag。[0263]在一些实施方案中,碱基修复抑制剂是尿嘧啶糖基化酶抑制剂(ugi)。ugi是指能够抑制尿嘧啶-dna糖基化酶碱基切除修复酶的蛋白质。在一些实施方案中,ugi结构域包含野生型ugi或野生型ugi的片段。在一些实施方案中,本文所提供的ugi蛋白包括ugi的片段和与ugi或ugi片段同源的蛋白质。在一些实施方案中,碱基修复抑制剂是肌苷碱基切除修复的抑制剂。在一些实施方案中,碱基修复抑制剂是“无催化活性的肌苷特异性核酸酶”或“死亡的肌苷特异性核酸酶”。不欲受缚于特定理论,无催化活性的肌苷糖基化酶(例如,烷基腺嘌呤糖基化酶(aag))可以结合肌苷,但不能创建无碱基位点或去除该肌苷,从而在空间上将新形成的肌苷部分从dna损伤/修复机制中阻隔开来。在一些实施方案中,物催化活性的肌苷特异性核酸酶可能能够结合核酸中的肌苷但不切割该核酸。非限制性的示例性的无催化活性的肌苷特异性核酸酶包括无催化活性的烷基腺苷糖基化酶(aag核酸酶),例如,来自人类;以及无催化活性的核酸内切酶v(endov核酸酶),例如,来自大肠杆菌。在一些实施方案中,无催化活性的aag核酸酶包含e125q突变或另一aag核酸酶中的对应突变。[0264]“增加”意为至少10%、25%、50%、75%或100%的正向改变。[0265]“内含肽”是蛋白质的片段,其能够在称为蛋白质剪接的过程中切除其自身并且用肽键将剩余片段(外显肽)接合。内含肽也称为“蛋白质内含子”。内含肽切除其自身并接合蛋白质剩余部分的过程在本文中称为“蛋白质剪接”或“内含肽介导的蛋白质剪接”。在一些实施方案中,前体蛋白(在内含肽介导的蛋白质剪接之前含有内含肽的蛋白质)的内含肽来自两个基因。本文中,这种内含肽称为分体内含肽(例如,分体内含肽-n和分体内含肽-c)。例如,在蓝藻中,dnae(即,dna聚合酶iii的催化亚基)由两个独立的基因(即dnae-n和dnae-c)编码。本文中,由dnae-n基因编码的内含肽可称为“内含肽-n”。本文中,由dnae-c基因编码的内含肽可称为“内含肽-c”。[0266]也可使用其他内含肽系统。例如,已经描述了基于dnae内含肽的合成内含肽,即cfa-n(例如,分体内含肽-n)和cfa-c(例如,分体内含肽-c)内含肽对(例如,在stevens等人,jamchemsoc.2016feb.24;138(7):2162-5中,该文献通过引用并入本文)。可根据本公开使用的内含肽对的非限制性示例包括:cfadnae内含肽、sspgyrb内含肽、sspdnax内含肽、terdnae3内含肽、terthyx内含肽、rmadnab内含肽和cneprp8内含肽(例如,如美国专利号8,394,604中所述,该专利通过引用并入本文)。[0267]下文提供示例性的内含肽的核苷酸和氨基酸序列。[0268]dnae内含肽-ndna:[0269]tgcctgtcatacgaaaccgagatactgacagtagaatatggccttctgccaatcgggaagattgtggagaaacggatagaatgcacagtttactctgtcgataacaatggtaacatttatactcagccagttgcccagtggcacgaccggggagagcaggaagtattcgaatactgtctggaggatggaagtctcattagggccactaaggaccacaaatttatgacagtcgatggccagatgctgcctatagacgaaatctttgagcgagagttggacctcatgcgagttgacaaccttcctaat[0270]dnae内含肽-n蛋白:[0271]clsyeteiltveygllpigkivekriectvysvdnngniytqpvaqwhdrgeqevfeycledgsliratkdhkfmtvdgqmlpideifereldlmrvdnlpn[0272]dnae内含肽-cdna:[0273]atgatcaagatagctacaaggaagtatcttggcaaacaaaacgtttatgatattggagtcgaaagagatcacaactttgctctgaagaacggattcatagcttctaat[0274]内含肽-c:mikiatrkylgkqnvydigverdhnfalkngfiasn[0275]cfa-ndna:[0276]tgcctgtcttatgataccgagatacttaccgttgaatatggcttcttgcctattggaaagattgtcgaagagagaattgaatgcacagtatatactgtagacaagaatggtttcgtttacacacagcccattgctcaatggcacaatcgcggcgaacaagaagtatttgagtactgtctcgaggatggaagcatcatacgagcaactaaagatcataaattcatgaccactgacgggcagatgttgccaatagatgagatattcgagcggggcttggatctcaaacaagtggatggattgcca[0277]cfa-n蛋白:[0278]clsydteiltveygflpigkiveeriectvytvdkngfvytqpiaqwhnrgeqevfeycledgsiiratkdhkfmttdgqmlpideifergldlkqvdglp[0279]cfa-cdna:[0280]atgaagaggactgccgatggatcagagtttgaatctcccaagaagaagaggaaagtaaagataatatctcgaaaaagtcttggtacccaaaatgtctatgatattggagtggagaaagatcacaacttccttctcaagaacggtctcgtagccagcaac[0281]cfa-c蛋白:mkrtadgsefespkkkrkvkiisrkslgtqnvydigvekdhnfllknglvasn[0282]内含肽-n和内含肽-c可以分别融合至分体cas9的n端部分和分体cas9的c端部分,用于将分体cas9的n端部分与分体cas9的c端部分接合。例如,在一些实施方案中,内含肽-n融合至分体cas9的n端部分的c端,即,以形成n‑‑[分体cas9的n端部分]-[内含肽-n]‑‑c的结构。在一些实施方案中,内含肽-c融合至分体cas9的c端部分的n端,即,以形成n‑‑[内含肽-c]-[分体cas9的c端部分]‑‑c的结构。用于接合内含肽所融合至的蛋白质(例如,分体cas9)的内含肽介导的蛋白质剪接机制是本领域中已知的,例如,如shah等人,chemsci.2014;5(1):446-461中所述,该文献通过引用并入本文。用于设计和使用内含肽的方法是本领域中已知的并且由例如wo2014004336、wo2017132580、us20150344549和us20180127780描述,这些专利各自通过引用而以其整体并入本文。[0283]术语“分离的”、“纯化的”或“生物学纯的”是指在不同程度上不含通常伴随它的成分(如在其原生状态下所见)的材料。“分离”表示与原始来源或周围物质分隔的程度。“纯化”表示高于分离的分割程度。“纯化的”或“生物学纯的”蛋白质足够不含其他材料,使得任何杂质在材料层面不影响该蛋白质的生物学性质或造成其他负面后果。换句话说,当通过重组dna技术生产时,如果本发明的核酸或肽基本上不含细胞材料、病毒材料或培养基,则它是纯化的;或者当化学合成时,如果不含化学前体或其他化学物质,则它是纯化的。典型使用分析化学技术例如聚丙烯酰胺凝胶电泳或高效液相色谱测定纯度及同质性。术语“纯化的”可表示核酸或蛋白质在电泳凝胶中产生实质上的一个带。对于可进行修饰例如磷酸化或糖基化的蛋白质,不同的修饰可产生不同的分离蛋白质,这些蛋白质可独立纯化。[0284]“分离的多核苷酸”意为一种核酸(例如,dna),其不含在本发明核酸分子所来源的有机体的天然基因组中位于该基因侧翼的基因。因此该术语包括,举例而言,重组dna,其被并入载体内、自主复制质粒或病毒内、或并入原核生物或真核生物的基因组dna内;或作为独立于其他序列的单独分子存在(例如,通过pcr或限制性核酸内切酶消化产生的cdna或基因组或cdna片段)。此外,该术语包括从dna分子转录的rna分子,以及作为编码附加多肽序列的杂交基因的一部分的重组dna。[0285]“分离的多肽”意为已经与其天然伴随组分分隔的本发明的多肽。典型地,当多肽不含至少60重量%的天然与其相关的蛋白质和天然有机分子。优选地,该制剂是至少75重量%、更优选至少90重量%、且最优选至少99重量%的本发明的多肽。本发明的分离多肽可以例如通过从天然来源萃取、通过表达编码此多肽的重组核酸、或通过化学合成该蛋白质而获得。可通过任何适宜的方法,例如柱色谱、聚丙烯酰胺凝胶电泳或hplc分析,来测量纯度。[0286]“前导肽“意为一种短氨基酸序列(例如,大约16至30个氨基酸的长度),其将新合成的分泌蛋白或膜蛋白引导至膜并穿过膜(例如,内质网膜)。前导肽典型定位在多肽的n端,并且可以在该多肽已经跨过膜后通过信号肽酶移除。前导肽序列典型含有三个共有结构特征:n端极性碱性区(n区)、疏水性核心和亲水性c区。在一些实施方案中,本发明的car包括前导肽序列(例如,抗原结合结构域的n端)。示例性前导肽氨基酸序列是:metdtlllwvlllwvpgstg。[0287]如本文中所用,术语“连接子”是指的键(例如,共价键)、化学基团或分子,其链接两个分子或两个部分,例如,蛋白复合物或核糖核酸复合物的两个组分或者融合蛋白的两个结构域,例如,多核苷酸可编程dna结合结构域(例如,dcas9)和脱氨酶结构域(例如,腺苷脱氨酶、胞苷脱氨酶)。连接子可以接合碱基编辑器系统的不同组分或多个组分的不同部分。例如,在一些实施方案中,连接子可以接合多核苷酸可编程核苷酸结合结构域的向导多核苷酸结合结构域与脱氨酶的催化性结构域。在一些实施方案中,连接子可以接合crispr多肽与脱氨酶。在一些实施方案中,连接子可以接合cas9与脱氨酶。在一些实施方案中,连接子可以接合dcas9与脱氨酶。在一些实施方案中,连接子可以接合ncas9与脱氨酶。在一些实施方案中,连接子可以接合向导多核苷酸与脱氨酶。在一些实施方案中,连接子可以接合碱基编辑器系统的脱氨基组分与多核苷酸可编程核苷酸结合组分。在一些实施方案中,连接子可以接合碱基编辑器系统的脱氨基组分的rna结合部分与多核苷酸可编程核苷酸结合组分。在一些实施方案中,连接子可以接合碱基编辑器系统的脱氨基组分的rna结合部分与多核苷酸可编程核苷酸结合组分的rna结合部分。连接子可以位于两个基团、分子或其他部分之间或连接子侧翼具有两个基团、分子或其他部分,并且彼此经由共价键或非共价相互作用联接,从而将两者联接。在一些实施方案中,连接子可以是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子可以是多核苷酸。在一些实施方案中,连接子可以是dna连接子。在一些实施方案中,连接子可以是rna连接子。在一些实施方案中,连接子可包含能够结合至配体的适体。在一些实施方案中,配体可以是碳水化合物、肽、蛋白质或核酸。在一些实施方案中,连接子可包含适体,该适体可源自核糖开关。适体所源自的核糖开关可以选自茶碱核糖开关、焦磷酸硫胺素(tpp)核糖开关、腺苷钴胺素(adocbl)核糖开关、s-腺苷甲硫氨酸(sam)核糖开关、sah核糖开关、黄素单核苷酸(fmn)核糖开关、四氢叶酸核糖开关、赖氨酸核糖开关、甘氨酸核糖开关、嘌呤核糖开关、glms核糖开关、或q苷前体1(preq1)核糖开关。在一些实施方案中,连接子可包含结合至多肽或蛋白质结构域诸如多肽配体的适体。在一些实施方案中,多肽配体可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。在一些实施方案中,多肽配体可以是碱基编辑器系统组分的一部分。例如,核碱基编辑组分可包含脱氨酶结构域和rna识别基序。[0288]在一些实施方案中,连接子可以是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子可以是约5至100个氨基酸的长度,例如,约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20至30、30至40、40至50、50至60、60至70、70至80、80至90、或90至100个氨基酸的长度。在一些实施方案中,连接子可以是约100至150、150至200、200至250、250至300、300至350、350至400、400至450、或450至500个氨基酸的长度。也可以考虑更长或更短的连接子。[0289]在一些实施方案中,连接子接合rna可编程核酸酶的grna结合结构域(包括cas9核酸酶结构域)与核酸编辑蛋白的催化性结构域(例如,胞苷或腺苷脱氨酶)。在一些实施方案中,连接子接合dcas9与核酸编辑蛋白。例如,连接子位于两个基团、分子或其他部分之间或连接子侧翼具有两个基团、分子或其他部分,并且彼此经由共价键联接,从而将两者联接。在一些实施方案中,连接子是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子是5至200个氨基酸的长度,例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190或200个氨基酸的长度。也考虑更长或更短的连接子。在一些实施方案中,连接子包含sgsetpgtsesatpes的氨基酸序列,也可以称为xten连接子。在一些实施方案中,连接子包含氨基酸序列sggs。在一些实施方案中,连接子包含(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes或(xp)n基序,或这些中任意者的组合,其中n独立地是1到30之间的整数,且其中x是任何氨基酸。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包含多个脯氨酸残基并且是5至21、5至14、5至9、5至7个氨基酸的长度,例如,papap、papapa、papapap、papapapa、p(ap)4、p(ap)7、p(ap)10。此类富含脯氨酸的连接子也称为“刚性”连接子。[0290]在一些实施方案中,嵌合抗原受体包含至少一个连接子。该至少一个连接子将可变重(vh)区接合或连接至嵌合抗原受体的细胞外结合结构域的恒定重(ch)区。连接子也可以将可变轻(vl)区连接至该细胞外结结合结构域的的可变恒定(vc)区。[0291]在一些实施方案中,碱基编辑器的结构域经由连接子融合,该连接子包含以下氨基酸序列:[0292]sggssgsetpgtsesatpessggs、sggssggssgsetpgtsesatpessggssggs或ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsggs。[0293]在一些实施方案中,碱基编辑器的结构域经由连接子融合,该连接子包含sgsetpgtsesatpes的氨基酸序列,也可以称为xten连接子。在一些实施方案中,连接子包含氨基酸序列sggs。在一些实施方案中,连接子是24个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列sggssggssgsetpgtsesatpes。在一些实施方案中,连接子是40个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggs。在一些实施方案中,连接子是64个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggssgsetpgtsesatpessggssggs。在一些实施方案中,连接子是92个氨基酸的长度。在一些实施方案中,连接子包含氨基酸序列pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats。[0294]如本文所用,术语“液态癌症”是指存在于体液例如血液、淋巴和骨髓中的癌细胞。液态癌症包括但不限于,白血病、骨髓瘤和液态淋巴瘤。如本文所用,液态癌症不包括实体瘤诸如肉瘤和癌,或不含囊肿或液态区域的实体淋巴瘤。“液态癌症”可以是复发性的、难治性的或转移性的。待使用本文所述方法治疗的液态癌症可以是,例如,也爱淋巴瘤;液态淋巴瘤包括含有囊肿或液态区域的淋巴瘤。[0295]“淋巴细胞激活基因3(lag-3)多肽”意为一种蛋白质,其与ncbi登录号np_002277.4或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性氨基酸序列提供如下。[0296]》np_002277.4淋巴细胞激活基因3蛋白质前体[智人(homosapiens)][0297][0298]“淋巴细胞激活基因3(lag-3)多核苷酸”意为编码lag-3多肽的核酸。示例性lag-3核酸序列提供如下。[0299]》nm_002286.6智人(homosapiens)淋巴细胞激活3(lag3),mrna[0300][0301][0302]“标志物”意为在表达水平或活性上具有与疾病或病变相关的改变的任何蛋白质或多核苷酸。[0303]如本文所用,术语“突变”是指序列(例如,核酸或氨基酸序列)内的残基被置换为另一残基,或序列内一个或多个残基的缺失或插入。本文中,突变通常描述为:原始残基的身份,然后是该残基在序列中的位置,然后是新置换的残基的身份。各种用于作出本文所提供的氨基酸置换(突变)的方法是本领域中周知的,并且由例如《分子克隆:实验室手册(第四版)》(greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012)))提供。在一些实施方案中,本文公开的碱基编辑器可以有效地在核酸(例如,受试者基因组内的核酸)中生成“期望突变”诸如点突变,而不生成大量的非期望突变诸如非期望的点突变。在一些实施方案中,期望突变是通过结合至向导多核苷酸(例如,grna)的经专门设计以生成期望突变的特异性碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)生成的突变。[0304]通常,在序列(例如,本文所述的氨基酸序列)中作出或鉴别的突变相对于参考(或野生型)序列(即,不含有该突变的序列)编号。本领域技术人员将会轻易地理解如何相对于参考序列确定氨基酸和核酸序列中的突变的位置。[0305]“瘤形成”是指表现出异常生长或增值的细胞或组织。术语瘤形成涵盖癌症、液态和实体肿瘤。在一些实施方案中,瘤形成是实体肿瘤。在其他实施方案中,瘤形成是液态肿瘤。在一些实施方案中,瘤形成是血液学癌症。在一些实施方案中,血液学癌症是白血病、骨髓瘤和/或淋巴瘤。在一些实施方案中,血液学癌症是b细胞癌症。在一些实施方案中,b细胞癌症是淋巴瘤或白血病。在一些情况下,白血病包括白血病前期。在一些情况下,白血病是急性白血病。急性白血病包括,例如,急性骨髓性白血病(aml)。急性白血病也包括,例如,急性淋巴性白血病或急性淋巴细胞性白血病(all);all包括b谱系all、t谱系all和t细胞急性淋巴细胞性白血病(t-all)。[0306]瘤形成的非限制性示例包括t细胞急性成淋巴细胞性白血病(t-all)、蕈样肉芽肿(mf)、sézary综合征(ss)、外周t/nk细胞淋巴瘤、间变性大细胞淋巴瘤alk+、原发性皮肤t细胞淋巴瘤、t细胞大颗粒淋巴细胞型白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+淋巴增生性疾病、结外nk/t细胞淋巴瘤、成人t细胞白血病/淋巴瘤、t细胞幼淋巴细胞白血病、皮下脂膜炎样t细胞淋巴瘤、原发性皮肤γδt细胞淋巴瘤、侵袭性nk细胞白血病和肠病相关t细胞淋巴瘤。在一些实施方案中,瘤形成是t细胞急性成淋巴细胞性白血病(t-all)。在一些实施方案中,瘤形成是t细胞急性骨髓性白血病(aml)。[0307]“激活的t细胞核因子1(nfatc1)多肽”意为一种蛋白质,其与ncbi登录号nm_172390.2或其片段具有至少约85%的序列一致性,并且是激活的t细胞dna结合转录复合体的组分。示例性氨基酸序列提供如下。[0308]》np_765978.1激活的t细胞核因子,细胞质1亚型a[智人(homosapiens)][0309]mpstsfpvpskfplgpaaavfgrgetlgpapraggtmksaeeehygyassnvspalplptahstlpapchnlqtstpgiippadhpsgygaaldggpagyflssghtrpdgapalesprieitsclglyhnnnqffhdvevedvlpsskrspstatlslpsleayrdpsclspasslssrscnseassyesnysypyaspqtspwqspcvspkttdpeegfprglgactllgsprhspstsprasvteeswlgarssrpaspcnkrkyslngrqppysphhsptpsphgsprvsvtddswlgnttqytssaivaainalttdssldlgdgvpvksrkttleqppsvalkvepvgedlgsppppadfapedyssfqhirkggfcdqylavpqhpyqwakpkplsptsymsptlpaldwqlpshsgpyelrievqpkshhrahyetegsrgavkasagghpivqlhgyleneplmlqlfigtaddrllrphafyqvhritgktvsttsheailsntkvleipllpensmravidcagilklrnsdielrkgetdigrkntrvrlvfrvhvpqpsgrtlslqvasnpiecsqrsaqelplvekqstdsypvvggkkmvlsghnflqdskvifvekapdghhvwemeaktdrdlckpnslvveippfrnqritspvhvsfyvcngkrkrsqyqrftylpangnaifltvsrehervgcff[0310]“激活的t细胞核因子1(nfatc1)多核苷酸”意为编码nfatc1多肽的核酸。nfatc1基因编码一种蛋白质,该蛋白质牵涉到细胞因子基因尤其是il-2和il-4在t细胞中的诱导型表达。示例性核酸序列提供如下。[0311]》nm_172390.2智人(homosapiens)激活的t细胞核因子1(nfatc1),转录物变体1,mrna[0312]ggcgggcgctcggcgactcgtccccggggccccgcgcgggcccgggcagcaggggcgtgatgtcacggca[0313]gggagggggcgcgggagccgccgggccggcggggaggcgggggaggtgttttccagctttaaaaaggcag[0314]gaggcagagcgcggccctgcgtcagagcgagactcagaggctccgaactcgccggcggagtcgccgcgcc[0315]agatcccagcagcagggcgcgggcaccggggcgcgggcagggctcggagccaccgcgcaggtcctagggc[0316]cgcggccgggccccgccacgcgcgcacacgcccctcgatgactttcctccggggcgcgcggcgctgagcc[0317]cggggcgagggctgtcttcccggagacccgaccccggcagcgcggggcggccgcttctcctgtgcctccg[0318]cccgccgctccactccccgccgccgccgcgcggatgccaagcaccagctttccagtcccttccaagtttc[0319]cacttggccctgcggctgcggtcttcgggagaggagaaactttggggcccgcgccgcgcgccggcggcac[0320]catgaagtcagcggaggaagaacactatggctatgcatcctccaacgtcagccccgccctgccgctcccc[0321]acggcgcactccaccctgccggccccgtgccacaaccttcagacctccacaccgggcatcatcccgccgg[0322]cggatcacccctcggggtacggagcagctttggacggtgggcccgcgggctacttcctctcctccggcca[0323]caccaggcctgatggggcccctgccctggagagtcctcgcatcgagataacctcgtgcttgggcctgtac[0324]cacaacaataaccagtttttccacgatgtggaggtggaagacgtcctccctagctccaaacggtccccct[0325]ccacggccacgctgagtctgcccagcctggaggcctacagagacccctcgtgcctgagcccggccagcag[0326]cctgtcctcccggagctgcaactcagaggcctcctcctacgagtccaactactcgtacccgtacgcgtcc[0327]ccccagacgtcgccatggcagtctccctgcgtgtctcccaagaccacggaccccgaggagggctttcccc[0328]gcgggctgggggcctgcacactgctgggttccccgcggcactccccctccacctcgccccgcgccagcgt[0329]cactgaggagagctggctgggtgcccgctcctccagacccgcgtccccttgcaacaagaggaagtacagc[0330]ctcaacggccggcagccgccctactcaccccaccactcgcccacgccgtccccgcacggctccccgcggg[0331]tcagcgtgaccgacgactcgtggttgggcaacaccacccagtacaccagctcggccatcgtggccgccat[0332]caacgcgctgaccaccgacagcagcctggacctgggagatggcgtccctgtcaagtcccgcaagaccacc[0333]ctggagcagccgccctcagtggcgctcaaggtggagcccgtcggggaggacctgggcagccccccgcccc[0334]cggccgacttcgcgcccgaagactactcctctttccagcacatcaggaagggcggcttctgcgaccagta[0335]cctggcggtgccgcagcacccctaccagtgggcgaagcccaagcccctgtcccctacgtcctacatgagc[0336]ccgaccctgcccgccctggactggcagctgccgtcccactcaggcccgtatgagcttcggattgaggtgc[0337]agcccaagtcccaccaccgagcccactacgagacggagggcagccggggggccgtgaaggcgtcggccgg[0338]aggacaccccatcgtgcagctgcatggctacttggagaatgagccgctgatgctgcagcttttcattggg[0339]acggcggacgaccgcctgctgcgcccgcacgccttctaccaggtgcaccgcatcacagggaagaccgtgt[0340]ccaccaccagccacgaggccatcctctccaacaccaaagtcctggagatcccactcctgccggagaacag[0341]catgcgagccgtcattgactgtgccggaatcctgaaactcagaaactccgacattgaacttcggaaagga[0342]gagacggacatcgggaggaagaacacacgggtacggctggtgttccgcgttcacgtcccgcaacccagcg[0343]gccgcacgctgtccctgcaggtggcctccaaccccatcgaatgctcccagcgctcagctcaggagctgcc[0344]tctggtggagaagcagagcacggacagctatccggtcgtgggcgggaagaagatggtcctgtctggccac[0345]aacttcctgcaggactccaaggtcattttcgtggagaaagccccagatggccaccatgtctgggagatgg[0346]aagcgaaaactgaccgggacctgtgcaagccgaattctctggtggttgagatcccgccatttcggaatca[0347]gaggataaccagccccgttcacgtcagtttctacgtctgcaacgggaagagaaagcgaagccagtaccag[0348]cgtttcacctaccttcccgccaacggtaacgccatctttctaaccgtaagccgtgaacatgagcgcgtgg[0349]ggtgctttttctaaagacgcagaaacgacgtcgccgtaaagcagcgtggcgtgttgcacatttaactgtg[0350]tgatgtcccgttagtgagaccgagccatcgatgccctgaaaaggaaaggaaaagggaagcttcggatgca[0351]ttttccttgatccctgttgggggtggggggcgggggttgcatactcagatagtcacggttattttgcttc[0352]ttgcgaatgtataacagccaaggggaaaacatggctcttctgctccaaaaaactgagggggtcctggtgt[0353]gcatttgcaccctaaagctgcttacggtgaaaaggcaaataggtatagctattttgcaggcacctttaggaataaactttgcttttaagcctgtaaaaaaaaaaaaaa[0354]术语“非保守突变”包括不同组之间的氨基酸置换,例如,赖氨酸替换色氨酸,或苯丙氨酸替换丝氨酸等。在这种情况下,优选非保守氨基酸置换不干扰或抑制功能性变体的生物学活性。非保守氨基酸置换可增强功能性变体的生物学活性,使得该功能性变体的生物学活性相较于野生型蛋白质有所增加。[0355]术语“核定位序列”、“核定位信号”或“nls”是指一种氨基酸序列,其促进蛋白质进入细胞核。核定位序列是本领域中已知的,并且在例如2000年11月23日提交的plank等人的国际pct申请pct/ep2000/011690并且在2001年5月31日公开的wo/2001/038547中有所描述,其内容通过引用其关于示例性核定位序列的公开内容而并入本文。在其他实施方案中,nls是由例如koblan等人,naturebiotech.2018doi:10.1038/nbt.4172描述的优化nls。在一些实施方案中,nls包含氨基酸序列pkkkrkvegadkrtadgsefespkkkrkv、krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprk、pkkkrkv或mdsllmnrrkflyqfknvrwakgrretylc。[0356]如本文所用,术语“核酸”和“核酸分子”是指一种化合物,其包含核碱基和酸性部分,例如,核苷、核苷酸或核苷酸的聚合物。典型地,聚合性核酸,例如包含三个或更多个核苷酸的核酸分子,是线性分子,在该分子中,相邻核苷酸经由磷酸二酯链结链接至彼此。在一些实施方案中,“核酸”是指单个核酸残基(例如,核苷酸和/或核苷)。在一些实施方案中,“核酸”是指寡核苷酸链,其包含三个或更多个单个核苷酸残基。如本文所用,术语“寡核苷酸”和“多核苷酸”可互换使用,是指核苷酸的聚合物(例如,一串至少三个核苷酸)。在一些实施方案中,“核酸”涵盖rna以及单链和/或双链dna。核酸可以是天然存在的,例如,在转录物、mrna、trna、rrna、sirna、snrna、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子基因组的情境中。另一方面,核酸分子可以是非天然存在的分子,例如,重组dna或rna、髯公染色体、工程改造的基因组、或其片段,或者合成的dna、rna、dna/rna杂交物,或者包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“dna”、“rna”和/或类似术语包括核酸类似物,例如,具有除磷酸二酯主链之外的类似物。核酸可以从天然来源纯化,使用重组表达系统生产并任选地纯化,化学合成等。若适用,例如,在化学合成分子的情况下,核酸可包含核苷类似物诸如具有经化学修饰的碱基或糖的类似物以及主链修饰。除非另外指明,否则核酸序列以5'到3'方向呈现。在一些实施方案中,核酸是或包含天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷);核苷类似物(例如,2-氨基腺苷、2-巯基胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-去氮腺苷、7-去氮鸟苷、8-氧代腺苷、8-氧代鸟苷、o(6)-甲基鸟苷和2-巯基胞苷);经化学修饰的碱基;经生物修饰的碱基(例如,甲基化碱基);插置碱基;经修饰的糖(2'-例如氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖);和/或经修饰的磷酸酯基团(例如,硫代磷酸酯和5'-n-亚磷酰胺链结)。术语“核酸可编程dna结合蛋白”或“napdnabp”可以与“多核苷酸可编程核苷酸结合结构域”互换使用,是指与核酸(例如,dna或rna)诸如向导核酸或向导多核苷酸(例如,grna)缔合的蛋白质,该核酸将napdnabp引导至特异性核酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9蛋白。cas9蛋白可与向导rna缔合,该向导rna将cas9蛋白引导至与该向导rna互补的特异性dna序列。在一些实施方案中,napdnabp是cas9结构域,例如,核酸酶活性的cas9、cas9切口酶(ncas9)、或无核酸酶活性的cas9(dcas9)。核酸可编程dna结合蛋白的非限制性示例包括cas9(例如,dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i和cas12j/casφ。cas酶的非限制性示例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也称为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、cas12j/casφ、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii型cas效应蛋白、v型cas效应蛋白、vi型cas效应蛋白、carf、ding、其同源、或其经修饰或工程改造的版本。其他核酸可编程dna结合蛋白也处于本公开范畴内,但它们可以未在本公开中具体列出。参见,例如,makarova等人“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yan等人,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,各自的整体内容通过引用并入本文。[0357]本文中可互换使用的术语“核碱基”、“含氮碱基”或“碱基”是指含氮的生物化合物,其形成核苷,核苷进而作为核苷酸的组分。核碱基形成碱基对的能力和一个堆栈在另一个上的能力直接导致长链螺旋结构,诸如核糖核酸(rna)和脱氧核糖核酸(dna)。五种核碱基,即腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和尿嘧啶(u),称为主要核碱基或标准核碱基。腺嘌呤和鸟嘌呤衍生自嘌呤,而胞嘧啶、尿嘧啶和胸腺嘧啶衍生自嘧啶。dna和rna也可含有经修饰的其他(非主要)碱基。非限制性的示例性经修饰的核碱基可包括次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶(m5c)和5-羟甲基胞嘧啶。次黄嘌呤和黄嘌呤两者均可通过诱变剂存在下的脱氨基(氨基替换为羰基)而产生。次黄嘌呤可自腺嘌呤修饰而来。黄嘌呤可在鸟嘌呤修饰而来。尿嘧啶可以来自于胞嘧啶的脱氨基反应。“核苷”由核碱基和五碳糖(核糖或脱氧核糖)组成。核苷的示例包括腺苷、鸟苷、尿苷、胞苷、5-甲基尿苷(m5u)、脱氧腺苷、脱氧鸟苷、胸苷、脱氧尿苷和脱氧胞苷。具有经修饰的核碱基的核苷的示例包括肌苷(i)、黄苷(x)、7-甲基鸟苷(m7g)、二氢尿苷(d)、5-甲基胞苷(m5c)和假尿苷(ψ)。“核苷酸”由核碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸酯基团组成。[0358]如本文所用,术语“核碱基编辑结构域”或“核碱基编辑蛋白”是指一种蛋白质或酶,其催化rna或dna中的核碱基修饰,诸如胞嘧啶(或胞苷)到尿嘧啶(或尿苷)或胸腺嘧啶(或胸苷),和腺嘌呤(或腺苷)到次黄嘌呤(或肌苷)脱氨基,以及非模板化核苷酸加成和插入。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域(例如,腺嘌呤脱氨酶或腺苷脱氨酶;或胞苷脱氨酶或胞嘧啶脱氨酶)。在一些实施方案中,核碱基编辑结构域是超过一个脱氨酶结构域(例如,腺嘌呤脱氨酶或腺苷脱氨酶和胞苷脱氨酶或胞嘧啶脱氨酶)。在一些实施方案中,核碱基编辑结构域可以是天然存在的核碱基编辑结构域。在一些实施方案中,核碱基编辑结构域可以是从天然存在的核碱基编辑结构域工程改造的或进化的核碱基编辑结构域。核碱基编辑结构域可以来自任何生物体,诸如细菌、人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠。[0359]如本文所用,“获得试剂”中的“获得”包括合成、购买或其它获取该试剂的途径。如本文所用,“患者”或“受试者”是指被诊断为患有或易患或易发展出疾病或疾患或者处于患有或发展出疾病或疾患风险下的哺乳动物受试者或个体。在一些实施方案中,术语“患者”是指具有高于平均值的发展出疾病或疾患的可能性的哺乳动物受试者。示例性患者可以是人类、非人类灵长动物、猫、狗、猪、牛、猫、马、骆驼、美洲驼、山羊、绵羊、啮齿动物(例如,小鼠、兔、大鼠、沙鼠或豚鼠)和其他可能受益于本文所公开的疗法的哺乳动物。示例性人类患者可以是男性和/或女性。[0360]本文中,“有此需要的患者”或“有此需要的受试者”是指被诊断为患有、患有、预期患有或易患疾病或疾患(例如,t或nk细胞恶性病变)或者处于该疾病或疾患风险下的患者。[0361]术语“致病突变”、“致病变体”、“造成疾病的突变”、“造成疾病的变体”、“有害突变”或“诱因性突变”是指一种基因改变或突变,其增加个体对某种疾病或疾患的易感性或倾向性。在一些实施方案中,致病突变在由基因所编码的蛋白质中包含至少一个野生型氨基酸被置换为至少一个致病氨基酸。[0362]术语“药学上可接受的载体”意为药学上可接受的材料、组合物或媒介物,诸如液体或固体填料、稀释剂、赋形剂、制造助剂(例如,润滑剂、滑石镁、硬脂酸钙或硬脂酸锌、或硬脂酸)或溶剂包封材料,牵涉到将化合物从身体的一个位点(例如,递送位点)携带或运输至另一位点(例如,器官、组织或身体的部分)中。就与制剂的其他成分相容且不损伤受试者组织(例如,生理上相容的、无菌的、生理ph等)意义而言,药学上可接受的载体是“可接受的”。术语诸如“赋形剂”、“载体”、“药学上可接受的载体”、“媒介物”等在本文中可互换地使用。[0363]术语“药物组合物”意为经配制用于药学用途的组合物。在一些实施方案中,药物组合物进一步包含药学上可接受的载体。在一些实施方案中,药物组合物包含附加试剂(例如,用于特异性递送、增加半衰期,或其他治疗性化合物)。[0364]“程序性细胞死亡受体1(pdcd1或pd-1)多肽”意为一种蛋白质,其与ncbi登录号ajs10360.1或其片段具有至少约85%的氨基酸序列一致性。pd-1蛋白被认为牵涉到免疫反应期间的t细胞功能调节中并且牵涉到耐受条件中。示例性b2m多肽序列提供如下。[0365]》ajs10360.1程序性细胞死亡1蛋白[智人(homosapiens)][0366]mqipqapwpvvwavlqlgwrpgwfldspdrpwnpptfspallvvtegdnatftcsfsntsesfvlnwyrmspsnqtdklaafpedrsqpgqdcrfrvtqlpngrdfhmsvvrarrndsgtylcgaislapkaqikeslraelrvterraevptahpspsprpagqfqtlvvgvvggllgslvllvwvlavicsraargtigarrtgqplkedpsavpvfsvdygeldfqwrektpeppvpcvpeqteyativfpsgmgtssparrgsadgprsaqplrpedghcswpl[0367]“程序性细胞死亡1(pdcd1或pd-1)多核苷酸”意为编码pd-1多肽的核酸分子。pdcd1基因编码一种抑制性细胞表面受体,其以抗原特异性方式抑制t细胞效应子功能。示例性pdcd1核酸序列提供如下。[0368]》ay238517.1智人(homosapiens)程序性细胞死亡1(pdcd1)mrna,完全编码序列[0369]atgcagatcccacaggcgccctggccagtcgtctgggcggtgctacaactgggctggcggccaggatggttcttagactccccagacaggccctggaacccccccaccttctccccagccctgctcgtggtgaccgaaggggacaacgccaccttcacctgcagcttctccaacacatcggagagcttcgtgctaaactggtaccgcatgagccccagcaaccagacggacaagctggccgccttccccgaggaccgcagccagcccggccaggactgccgcttccgtgtcacacaactgcccaacgggcgtgacttccacatgagcgtggtcagggcccggcgcaatgacagcggcacctacctctgtggggccatctccctggcccccaaggcgcagatcaaagagagcctgcgggcagagctcagggtgacagagagaagggcagaagtgcccacagcccaccccagcccctcacccaggccagccggccagttccaaaccctggtggttggtgtcgtgggcggcctgctgggcagcctggtgctgctagtctgggtcctggccgtcatctgctcccgggccgcacgagggacaataggagccaggcgcaccggccagcccctgaaggaggacccctcagccgtgcctgtgttctctgtggactatggggagctggatttccagtggcgagagaagaccccggagccccccgtgccctgtgtccctgagcagacggagtatgccaccattgtctttcctagcggaatgggcacctcatcccccgcccgcaggggctcagctgacggccctcggagtgcccagccactgaggcctgaggatggacactgctcttggcccctctga[0370]术语“蛋白质”、“肽”、“多肽”及其语法等效物在本文中可互换使用,并且是指通过肽(酰胺)键链接在一起的氨基酸残基的聚合物。该术语是指任何尺寸、结构或功能的蛋白质、肽或多肽。典型地,蛋白质、肽或多肽的长度将会是至少三个氨基酸。蛋白质、肽或多肽可以指单个蛋白质或蛋白质的集合。蛋白质、肽或多肽中的一个或多个氨基酸可以例如,通过以下进行修饰:化学实体诸如碳水化合物基团、羟基、磷酸酯基团、法尼基、异法尼基、脂肪酸基团的加成;用于缀合的连接子;官能化;或其他修饰等。蛋白质、肽或多肽也可以是单一分子或可以是多分子复合物。蛋白质、肽或多肽可以仅是天然存在的蛋白质或肽的片段。蛋白质、肽或多肽可以是天然存在的、重组的或合成的、或其任意组合。如本文所用,术语“融合蛋白”是指一种杂交多肽,其包含来自至少两种不同蛋白质的蛋白结构域。一种蛋白质可以定位在融合蛋白的氨基端(n端)部分或在羧基端(c端)蛋白处,因此分别形成氨基端融合蛋白或羧基端融合蛋白。蛋白质可包含不同的结构域,例如,核酸结合结构域(例如,cas9的grna结合结构域,其引导蛋白质到靶标位点的结合)和核酸切割结构域,或核酸编辑蛋白的催化性结构域。在一些实施方案中,蛋白质包含蛋白质部分(例如,构建核酸结合结构域的氨基酸序列)和有机化合物(例如,可充当核酸切割剂的化合物)。在一些实施方案中,蛋白质与核酸(例如,rna或dna)复合或缔合。本文所提供的任何蛋白质可通过本领域已知的任何方法生产。例如,本文所提供的蛋白质可经由重组蛋白表达和纯化来生产,其尤其适用于包含肽连接子的融合蛋白。用于重组蛋白表达和纯化的方法是周知的,并且包括由《分子克隆:实验室手册》(greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012)))描述的那些,该文献的整体内容通过引用并入本文。[0371]本文所公开的多肽和蛋白质(包括其功能性部分和功能性变体)可包含合成氨基酸代替一个或多个天然存在的氨基酸。此类合成氨基酸是本领域中已知的,并且包括,例如,氨基环己烷甲酸、正亮氨酸、α-氨基正癸酸、高丝氨酸、s-乙酰基氨基甲基-半胱氨酸、反式-3-和反式-4-羟基脯氨酸、4-氨基苯丙氨酸、4-硝基苯丙氨酸、4-氯苯丙氨酸、4-羧基苯丙氨酸、β-苯基丝氨酸、β-羟基苯丙氨酸、苯基甘氨酸、α-萘基丙氨酸、环己基丙氨酸、环己基甘氨酸、吲哚啉-2-甲酸、1,2,3,4-四氢异喹啉-3-甲酸、氨基丙二酸、氨基丙二酸单酰胺、n'-苄基-n'-甲基-赖氨酸、n',n'-二苄基-赖氨酸、6-羟基赖氨酸、鸟氨酸、α-氨基环戊烷甲酸、α-氨基环己烷甲酸、α-氨基环庚烷甲酸、α-(2-氨基-2-正亮氨酸)-甲酸、α,γ-二氨基丁酸、α,β-二氨基丙酸、高丙氨酸和α-叔丁基甘氨酸。多肽和蛋白质可与多肽构建体的一个或多个氨基酸的翻译后修饰缔合。翻译后修饰的非限制性示例包括磷酸化、酰化(包括乙酰化和甲酰化)、糖基化(包括n-联和o-联)、酰胺化、羟基化、烷基化(包括甲基化和乙基化)、泛素化、吡咯烷酮甲酸的加成、二硫键桥的形成、硫酸化、肉豆蔻酰化、棕榈酰化、异戊二烯化、法尼基化、香叶基化、糖基磷脂酰肌醇化、脂化和碘化。[0372]“启动子”意为核酸控制序列的阵列,其引导核酸的转录。启动子包括接近转录起始位点的必需核酸序列。启动子也任选地包括远端增强子或抑制子序列元件。“组成型启动子”是一种持续活跃且不受外部信号或分子调节的启动子。相反,“诱导型启动子”的活性由外部信号或分子(例如,转录因子)调节。举例而言,启动子可以是cmv启动子。[0373]如本文所用,在蛋白质或核酸语境中的术语“重组”是指在自然界不存在但作为人类工程改造产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白质或核酸分子包含氨基酸或核苷酸序列,与任何天然存在的序列相比,该序列包含一个、至少两个、至少三个、至少四个、至少五个、至少六个或至少七个突变。[0374]“降低”意为至少10%、25%、50%、75%或100%的反向改变。[0375]“参考”意为标准或对照条件。在一种实施方案中,才可是野生型或健康细胞。在其他实施方案中并且不限于,参考是为处理的细胞,该细胞未经历测试条件或经历了安慰剂或生理盐水、媒介、缓冲液和/或不携带感兴趣的多核苷酸的对照载体。[0376]“参考序列”是用作序列比对基础的定义序列。参考序列可以是特定序列的子集或整体,例如,全长度cdna或基因序列的节段,或完整的cdna或基因序列。对于多肽,参考多肽序列的长度通常将会是至少约16个氨基酸,至少约20个氨基酸,至少约25个氨基酸,约35个氨基酸、约50个氨基酸、或约100个氨基酸。对于核酸,参考核酸序列的长度通常将会是至少约50个核苷酸,至少约60个核苷酸,至少约75个核苷酸,和约100个核苷酸或约300个核苷酸或其附近或期间任意整数个核苷酸。在一些实施方案中,参考序列是感兴趣的蛋白质的野生型序列。在其他实施方案中,参考序列是编码野生型蛋白质的多核苷酸序列。[0377]术语“rna可编程核酸酶”和“rna引导的核酸酶”与并非切割靶点的一种或多种rna合用(例如,结合或缔合)。在一些实施方案中,当rna可编程核酸酶与rna复合时,可以指代为核酸酶:rna复合物。典型地,结合的rna指代为向导rna(grna)。grna可以作为两种或更多种rna的复合物存在,或作为单一rna分子存在。作为单一rna分子存在的grna可以称为单向导rna(sgrna),但“grna”可互换地使用以指代作为单一分子或作为两个或更多个分子的复合物存在的向导rna。典型地,作为单一rna物质存在的grna包含两个结构域:(1)与靶标核酸共享同源性的结构域(例如,并且引导cas9复合物至靶标的结合);和(2)结合cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于称为tracrrna的序列并且包含茎环结构。例如,在一些实施方案中,结构域(2)与jinek等人,science337:816-821(2012)中提供的tracrrna相同或同源,该文献的整体内容通过引用并入本文。grna的其他实例(例如,那些包括结构域2的)可见于2013年9月6日提交的名为“switchablecas9nucleasesandusesthereof”的美国专利申请号61/874,682和2013年9月6日提交的名为“deliverysystemforfunctionalnucleases”的美国专利临时申请号61/874,746,其各自的完整内容通过引用以其整体并入本文。在一些实施方案中,grna包含两个或更多个结构域(1)和(2)并且可以成为“扩展grna”。例如,扩展grna将会结合两个或更多个cas9蛋白并在两个或更多个不同区域处结合靶标核酸,如本文所述。grna包含与靶标位点互补的核苷酸序列,其介导核酸酶/rna复合物至所述靶标位点的结合,提供核酸酶:rna复合物的序列特异性。[0378]在一些实施方案中,rna可编程核酸酶是(crispr相关系统)cas9核酸内切酶,例如,来自酿脓链球菌(streptococcuspyogenes)的cas9(csnl)(参见例如,“completegenomesequenceofanmlstrainofstreptococcuspyogenes.”ferrettij.j.,等人,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.,等人,nature471:602-607(2011))。因为rna可编程核碱基(例如,cas9)使用rna:dna杂交以靶向dna切割位点,这些蛋白质原则上能够被靶向至向导rna特异性的任何序列。使用rna可编程核碱基诸如cas9进行位点特异性切割(例如,以修饰基因组)的方法是本领域中已知的(参见,例如,cong,l.etal,multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823(2013);mali,p.etal,rna-guidedhumangenomeengineeringviacas9.science339,823-826(2013);hwang,w.y.etal,efficientgenomeeditinginzebrafishusingacrispr-cassystem.naturebiotechnology31,227-229(2013);jinek,m.etal,rna-programmedgenomeeditinginhumancells.elife2,e00471(2013);dicarlo,j.e.etal,genomeengineeringinsaccharomycescerevisiaeusingcrispr-cassystems.nucleicacidsresearch(2013);jiang,w.etahrna-guidededitingofbacterialgenomesusingcrispr-cassystems.naturebiotechnology31,233-239(2013);其各自的整体内容通过引用并入本文)。[0379]“信号传导结构域”意为在t细胞内表达的蛋白质的细胞内部分,其转导t细胞效应子功能信号(例如,激活信号)并且引导该t细胞执行专业功能。t细胞激活可以由多种因素诱导,包括抗原与t细胞表面上的t细胞受体的结合以及同源配体与t细胞表面上的共刺激分子的结合。t细胞共刺激分子是t细胞上的同源结合配偶体,其与共刺激配体特异性地结合,从而介导t细胞的共刺激应答,诸如但不限于,增殖。共刺激分子包括但不限于mhci类分子。在一些实施方案中,共刺激结构域是cd2细胞质结构域。t细胞的激活导致免疫应答,诸如t细胞增殖和分化(参见,例如,smith-garvin等人,annu.rev.immunol.,27:591-619,2009)。示例性t细胞信号传导结构域是本领域中已知的。非限制性示例包括cd2、cd3ζ、cd8、cd28、cd27、cd154、gitr(tnfrsf18)、cd134(ox40)和cd137(4-1bb)信号传导结构域。[0380]“单链抗体”或“scfv”意为经基因工程改造的分子,其含有通过核实的肽连接子链接为经基因融合的单链分子的一个或多个抗体的vh和vl结构域(参见,例如,bird等人,science,242:423-426,1988;huston等人,proc.natl.acad.sci.,85:5879-5883,1988;ahmad等人,clin.dev.immunol.,2012,doi:10.1155/2012/980250:marbry,idrugs,13:543-549,2010)。在一些实施方案中,scfv中vh结构域和vl结构域的分子内取向是vh结构域-连接子结构域-vl结构域。在一些实施方案中,scfv中vh结构域和vl结构域的分子内取向是vl结构域-连接子结构域-vh结构域。[0381]术语“单一核苷酸多态性(snp)”是单一核苷酸中的变异,该变异出现在基因组中的特异性位置处,其中每种变异以合适的程度存在于群体中(例如,》1%)。例如,在人类基因组的特异性碱基位置处,c核苷酸可以出现在大多数个体中,但在少数个体中,该位置被a占据。这意味着在这一特异性位置存在snp,并且两个可能的核苷酸变异c或a被称为这一位置的等位基因。snp是疾病易感性的差异的基础。疾病的严重程度和我们的身体对于治疗的应答也是基因变异的体现。snp可落入基因的编码区内、基因的非编码区内或基因间区(基因之间的区域)内。在一种实施方案中,由于遗传密码的简并性,编码序列内的snp不一定改变所产生的蛋白质的氨基酸序列。编码区内的snp有两种类型:同义和非同义snp。同义snp不影响蛋白质序列,而非同义snp改变蛋白质的氨基酸序列。非同义snp有两种类型:错义和无义。不在蛋白质编码区内的snp仍然可能影响基因剪接、转录因子结合、信使rna降解、或非编码rna的序列。受这一类型的snp影响的基因表达称为esnp(表达snp)且可以在该基因的上游或下游。单一核苷酸变体(snv)是单一核苷酸中的变异而没有任何频率显著,并且可出现在体细胞中。体细胞单一核苷酸变异(例如,与癌症相关)也可称为单核苷酸改变。[0382]“特异性地结合”意为核酸分子、多肽、或其复合物(例如,核酸可编程dna结合蛋白、向导核酸和嵌合抗原受体)、化合物或分子识别并结合本发明的多肽和/或核酸分子,但基本上不识别并结合样品(例如,生物样品)中的其他分子。例如,嵌合抗原受体特异性地结合至表达在细胞表面上的特定标志物,但不结合至该细胞表面上的其他多肽、碳水化合物、脂质或任何其他化合物。[0383]可用于本发明方法中的核酸分子包括任何编码本发明多肽或其片段的核酸分子。此类核酸分子无需与内源性核酸序列100%一致,但典型将表现出基本一致性。具有与内源性序列的“基本一致性”的多核苷酸典型能与双链核酸分子的至少一条链杂交。可用于本发明方法中的核酸分子包括任何编码本发明多肽或其片段的核酸分子。此类核酸分子无需与内源性核酸序列100%一致,但典型将表现出基本一致性。具有与内源性序列的“基本一致性”的多核苷酸典型能与双链核酸分子的至少一条链杂交。“杂交”意为在各种严格条件下在互补多核苷酸序列(例如,本文所述的基因)或其片段之间配对以形成双链分子。(见,例如,wahl,g.m.ands.l.berger(1987)methodsenzymol.152:399;kimmel,a.r.(1987)methodsenzymol.152:507)。[0384]例如,严格的盐浓度一般将低于约750mmnacl和75mm柠檬酸三钠,优选低于500mmnacl和50mm柠檬酸三钠,且更优选约250mmnacl和25mm柠檬酸三钠。在有机溶剂例如甲酰胺的缺席下可获得低严格度杂交,而在至少约35%甲酰胺且更优选至少约50%甲酰胺的存在下可获得高严格度杂交。严格的温度条件一般将包括至少约30℃、更优选至少约37℃且最优选至少约42℃的温度。不同的其他参数例如杂交时间、表面活性剂例如十二烷基硫酸钠(sds)的浓度、以及载剂dna的包含或不包含是该领域技术人员所熟知的。通过按需要将这些条件组合,实现各种水平的严格度。在一种实施方案中,杂交将在30℃下在750mmnacl、75mm柠檬酸三钠和1%sds中发生。在另一实施方案中,杂交将在37℃下在500mmnacl、50mm柠檬酸三钠、1%sds、35%甲酰胺和100μg/ml变性鲑鱼精dna(ssdna)中发生。在另一实施方案中,杂交将在42℃下在250mmnacl、25mm柠檬酸三钠、1%sds、50%甲酰胺和200μg/mlssdna中发生。这些条件的可用改变对于该领域技术人员是显而易见的。[0385]对于大多数应用,杂交后的洗涤步骤也将改变严格度。洗涤严格度条件可通过盐浓度并且通过温度界定。如上,可通过减低盐浓度或升高温度来增加洗涤严格度。例如,用于洗涤步骤的严格的盐浓度优选将低于约30mmnacl和3mm柠檬酸三钠,且最优选约15mmnacl和1.5mm柠檬酸三钠。用于洗涤步骤的严格的温度条件一般将包括至少约25℃、更优选至少约42℃、甚至更优选至少约68℃的温度。一种实施方案中,洗涤步骤将在25℃下在30mmnacl、3mm柠檬酸三钠和0.1%sds中发生。在一种更优选的实施方案中,洗涤步骤将在42℃下在15mmnacl、1.5mm柠檬酸三钠和0.1%sds中发生。在一种更优选的实施方案中,洗涤步骤将在68℃下在15mmnacl、1.5mm柠檬酸三钠和0.1%sds中发生。这些条件的其他改变对于该领域技术人员是显而易见的。杂交技术是该领域技术人员所熟知的,并且在例如bentonanddavis(science196:180,1977);grunsteinandhogness(proc.natl.acad.sci.,usa72:3961,1975);《分子生物学现代方法》(ausubel等人(currentprotocolsinmolecularbiology,wileyinterscience,newyork,2001));《分子克隆技术指南》(bergerandkimmel(guidetomolecularcloningtechniques,1987,academicpress,newyork));和《分子克隆:实验室手册》(sambrook等人,molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,newyork)中有所描述。[0386]“分体”意为分为两个或更多个片段。[0387]“分体cas9蛋白”或“分体cas9”是指一种cas9蛋白,其提供为由两个独立的核苷酸序列编码的n端片段和c端片段。对应于cas9蛋白的n端部分和c端部分的多肽可以经剪接以形成“重建的”cas9蛋白。在特定实施方案中,cas9蛋白被分为位于蛋白质的无序区内的两个片段,例如,如nishimasu等人,cell,volume156,issue5,pp.935-949,2014中所述或如jiang等人(2016)science351:867-871.pdbfile:5f9r中所述,该文献各自通过引用并入本文。在一些实施方案中,蛋白质被分为位于spcas9的氨基酸a292至g364之间、f445至k483之间或e565至t637之间的区域内的任何c、t、a或s处或位于任何其他cas9、cas9变体(例如,ncas9、dcas9)或其他napdnabp中对应位置处的两个片段。在一些实施方案中,蛋白质被分为位于spcas9t310、t313、a456、s469或c574处的两个片段。在一些实施方案中,将蛋白质分为两个片段的过程称为“分裂”蛋白质。[0388]在其他实施方案中,cas9蛋白的n端部分包含氨基酸1至573或1至637酿脓链球菌cas9野生型(spcas9)(ncbi参考序列:nc_002737.2,uniprot参考序列:q99zw2),且cas9蛋白的c端部分包含spcas9野生型的氨基酸574至1368或638至1368的部分或其对应位置。[0389]分体cas9的c端部分可以与分体cas9的n端部分接合以形成完整的cas9蛋白。在一些实施方案中,cas9蛋白的c端部分起始于cas9蛋白的n端部分结束之处。因此,在一些实施方案中,分体cas9的c端部分包含spcas9的氨基酸(551至651)至1368的部分。“(551至651)至1368”意为在氨基酸551至651(含)之间的氨基酸处开始并且在氨基酸1368处结束。例如,分体cas9的c端部分可包含spcas9的氨基酸551至1368、552至1368、553至1368、554至1368、555至1368、556至1368、557至1368、558至1368、559至1368、560至1368、561至1368、562至1368、563至1368、564至1368、565至1368、566至1368、567至1368、568至1368、569至1368、570至1368、571至1368、572至1368、573至1368、574至1368、575至1368、576至1368、577至1368、578至1368、579至1368、580至1368、581至1368、582至1368、583至1368、584至1368、585至1368、586至1368、587至1368、588至1368、589至1368、590至1368、591至1368、592至1368、593至1368、594至1368、595至1368、596至1368、597至1368、598至1368、599至1368、600至1368、601至1368、602至1368、603至1368、604至1368、605至1368、606至1368、607至1368、608至1368、609至1368、610至1368、611至1368、612至1368、613至1368、614至1368、615至1368、616至1368、617至1368、618至1368、619至1368、620至1368、621至1368、622至1368、623至1368、624至1368、625至1368、626至1368、627至1368、628至1368、629至1368、630至1368、631至1368、632至1368、633至1368、634至1368、635至1368、636至1368、637至1368、638至1368、639至1368、640至1368、641至1368、642至1368、643至1368、644至1368、645至1368、646至1368、647至1368、648至1368、649至1368、650至1368或651至1368中的任一者。在一些实施方案中,分体cas9蛋白的c端部分包含spcas9的氨基酸574至1368或638至1368的部分。[0390]“受试者”意为哺乳动物,包括但不限于,人类和非人类哺乳动物,例如牛、马、犬、羊或猫。受试者包括家畜、用来提供劳动力和提供日用品诸如食物的驯养动物,包括但不限于,牛、山羊、鸡、马、猪、兔和绵羊。[0391]“基本上相同”意为多肽或核酸分子表现出至少50%的与参考氨基酸序列(例如,本文所述氨基酸序列中的任何一个)或核酸分子(例如,本文所述核酸序列中的任何一个)的一致性。在一种实施方案中,该序列在氨基酸水平上或核酸暖水瓶上与用于比较的核酸至少60%、80%或85%、90%、95%或甚至99%相同。[0392]典型使用序列分析软件(例如,威斯康星大学生物技术中心遗传学计算机组(geneticscomputergroup,universityofwisconsinbiotechnologycenter,1710universityavenue,madison,wis.53705)的序列分析软件包(sequenceanalysissoftwarepackage),blast、bestfit、cobalt、embossneedle、gap或pileup/prettybox程序)测量序列一致性。此类软件通过对不同的替换、删除和/或其他修饰指定同源性程度来匹配相同或相似的序列。保守替换典型包括系列各组的组内替换:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;以及苯丙氨酸、酪氨酸。在测定一致性程度的一个示例性方法中,可使用blast程序,e-3和e-100之间的概率评分指示密切相关的序列。[0393]使用cobalt,例如,采用以下参数:[0394]a)比对参数:空位罚分-11、-1,且末端空位罚分-5、-1,[0395]b)cdd参数:使用rpsblast打开;blaste值0.003;findconservedcolumnsandrecompute打开,和[0396]c)查询聚类参数:使用queryclusters打开;字长4;最大簇间距离0.8;alphabetregular。[0397]使用embossneedle,例如,使用以下参数:[0398]a)矩阵:blosum62;[0399]b)gapopen:10;[0400]c)gapextend:0.5;[0401]d)outputformat;对;[0402]e)endgappenalty:假;[0403]f)endgapopen:10;和[0404]g)endgapextend:0.5.[0405]术语“靶标位点”是指核酸分子内的被核碱基编辑器修饰的序列。在一种实施方案中,靶标位点由脱氨酶或包含脱氨酶(例如,胞苷或腺苷脱氨酶)的融合蛋白决定。[0406]“t细胞受体α恒定区(trac)多肽”意为一种蛋白质,其与ncbi登录号p01848.2或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性氨基酸序列提供如下。[0407]》sp|p01848.2|trac_humanrecname:full=t细胞受体α恒定区[0408]iqnpdpavyqlrdskssdksvclftdfdsqtnvsqskdsdvyitdktvldmrsmdfksnsavawsnksdfacanafnnsiipedtffpspesscdvklveksfetdtnlnfqnlsvigfrilllkvagfnllmtlrlwss[0409]“t细胞受体α恒定区(trac)多核苷酸”意为编码trac多肽的核酸。示例性trac核酸序列提供如下。[0410]ucsc人类基因组数据库,基因ensg00000277734.8人t细胞受体α链(tcr-α)[0411]catgctaatcctccggcaaacctctgtttcctcctcaaaaggcaggaggtcggaaagaataaacaatgagagtcacattaaaaacacaaaatcctacggaaatactgaagaatgagtctcagcactaaggaaaagcctccagcagctcctgctttctgagggtgaaggatagacgctgtggctctgcatgactcactagcactctatcacggccatattctggcagggtcagtggctccaactaacatttgtttggtactttacagtttattaaatagatgtttatatggagaagctctcatttctttctcagaagagcctggctaggaaggtggatgaggcaccatattcattttgcaggtgaaattcctgagatgtaaggagctgctgtgacttgctcaaggccttatatcgagtaaacggtagtgctggggcttagacgcaggtgttctgatttatagttcaaaacctctatcaatgagagagcaatctcctggtaatgtgatagatttcccaacttaatgccaacataccataaacctcccattctgctaatgcccagcctaagttggggagaccactccagattccaagatgtacagtttgctttgctgggcctttttcccatgcctgcctttactctgccagagttatattgctggggttttgaagaagatcctattaaataaaagaataagcagtattattaagtagccctgcatttcaggtttccttgagtggcaggccaggcctggccgtgaacgttcactgaaatcatggcctcttggccaagattgatagcttgtgcctgtccctgagtcccagtccatcacgagcagctggtttctaagatgctatttcccgtataaagcatgagaccgtgacttgccagccccacagagccccgcccttgtccatcactggcatctggactccagcctgggttggggcaaagagggaaatgagatcatgtcctaaccctgatcctcttgtcccacagatatccagaaccctgaccctgccgtgtaccagctgagagactctaaatccagtgacaagtctgtctgcctattcaccgattttgattctcaaacaaatgtgtcacaaagtaaggattctgatgtgtatatcacagacaaaactgtgctagacatgaggtctatggacttcaagagcaacagtgctgtggcctggagcaacaaatctgactttgcatgtgcaaacgccttcaacaacagcattattccagaagacaccttcttccccagcccaggtaagggcagctttggtgccttcgcaggctgtttccttgcttcaggaatggccaggttctgcccagagctctggtcaatgatgtctaaaactcctctgattggtggtctcggccttatccattgccaccaaaaccctctttttactaagaaacagtgagccttgttctggcagtccagagaatgacacgggaaaaaagcagatgaagagaaggtggcaggagagggcacgtggcccagcctcagtctctccaactgagttcctgcctgcctgcctttgctcagactgtttgccccttactgctcttctaggcctcattctaagccccttctccaagttgcctctccttatttctccctgtctgccaaaaaatctttcccagctcactaagtcagtctcacgcagtcactcattaacccaccaatcactgattgtgccggcacatgaatgcaccaggtgttgaagtggaggaattaaaaagtcagatgaggggtgtgcccagaggaagcaccattctagttgggggagcccatctgtcagctgggaaaagtccaaataacttcagattggaatgtgttttaactcagggttgagaaaacagctaccttcaggacaaaagtcagggaagggctctctgaagaaatgctacttgaagataccagccctaccaagggcagggagaggaccctatagaggcctgggacaggagctcaatgagaaaggagaagagcagcaggcatgagttgaatgaaggaggcagggccgggtcacagggccttctaggccatgagagggtagacagtattctaaggacgccagaaagctgttgatcggcttcaagcaggggagggacacctaatttgcttttcttttttttttttttttttttttttttttttgagatggagttttgctcttgttgcccaggctggagtgcaatggtgcatcttggctcactgcaacctccgcctcccaggttcaagtgattctcctgcctcagcctcccgagtagctgagattacaggcacccgccaccatgcctggctaattttttgtatttttagtagagacagggtttcactatgttggccaggctggtctcgaactcctgacctcaggtgatccacccgcttcagcctcccaaagtgctgggattacaggcgtgagccaccacacccggcctgcttttcttaaagatcaatctgagtgctgtacggagagtgggttgtaagccaagagtagaagcagaaagggagcagttgcagcagagagatgatggaggcctgggcagggtggtggcagggaggtaaccaacaccattcaggtttcaaaggtagaaccatgcagggatgagaaagcaaagaggggatcaaggaaggcagctggattttggcctgagcagctgagtcaatgatagtgccgtttactaagaagaaaccaaggaaaaaatttggggtgcagggatcaaaactttttggaacatatgaaagtacgtgtttatactctttatggcccttgtcactatgtatgcctcgctgcctccattggactctagaatgaagccaggcaagagcagggtctatgtgtgatggcacatgtggccagggtcatgcaacatgtactttgtacaaacagtgtatattgagtaaatagaaatggtgtccaggagccgaggtatcggtcctgccagggccaggggctctccctagcaggtgctcatatgctgtaagttccctccagatctctccacaaggaggcatggaaaggctgtagttgttcacctgcccaagaactaggaggtctggggtgggagagtcagcctgctctggatgctgaaagaatgtctgtttttccttttagaaagttcctgtgatgtcaagctggtcgagaaaagctttgaaacaggtaagacaggggtctagcctgggtttgcacaggattgcggaagtgatgaacccgcaataaccctgcctggatgagggagtgggaagaaattagtagatgtgggaatgaatgatgaggaatggaaacagcggttcaagacctgcccagagctgggtggggtctctcctgaatccctctcaccatctctgactttccattctaagcactttgaggatgagtttctagcttcaatagaccaaggactctctcctaggcctctgtattcctttcaacagctccactgtcaagagagccagagagagcttctgggtggcccagctgtgaaatttctgagtcccttagggatagccctaaacgaaccagatcatcctgaggacagccaagaggttttgccttctttcaagacaagcaacagtactcacataggctgtgggcaatggtcctgtctctcaagaatcccctgccactcctcacacccaccctgggcccatattcatttccatttgagttgttcttattgagtcatccttcctgtggtagcggaactcactaaggggcccatctggacccgaggtattgtgatgataaattctgagcacctaccccatccccagaagggctcagaaataaaataagagccaagtctagtcggtgtttcctgtcttgaaacacaatactgttggccctggaagaatgcacagaatctgtttgtaaggggatatgcacagaagctgcaagggacaggaggtgcaggagctgcaggcctcccccacccagcctgctctgccttggggaaaaccgtgggtgtgtcctgcaggccatgcaggcctgggacatgcaagcccataaccgctgtggcctcttggttttacagatacgaacctaaactttcaaaacctgtcagtgattgggttccgaatcctcctcctgaaagtggccgggtttaatctgctcatgacgctgcggctgtggtccagctgaggtgaggggccttgaagctgggagtggggtttagggacgcgggtctctgggtgcatcctaagctctgagagcaaacctccctgcagggtcttgcttttaagtccaaagcctgagcccaccaaactctcctacttcttcctgttacaaattcctcttgtgcaataataatggcctgaaacgctgtaaaatatcctcatttcagccgcctcagttgcacttctcccctatgaggtaggaagaacagttgtttagaaacgaagaaactgaggccccacagctaatgagtggaggaagagagacacttgtgtacaccacatgccttgtgttgtacttctctcaccgtgtaacctcctcatgtcctctctccccagtacggctctcttagctcagtagaaagaagacattacactcatattacaccccaatcctggctagagtctccgcaccctcctcccccagggtccccagtcgtcttgctgacaactgcatcctgttccatcaccatcaaaaaaaaactccaggctgggtgcgggggctcacacctgtaatcccagcactttgggaggcagaggcaggaggagcacaggagctggagaccagcctgggcaacacagggagaccccgcctctacaaaaagtgaaaaaattaaccaggtgtggtgctgcacacctgtagtcccagctacttaagaggctgagatgggaggatcgcttgagccctggaatgttgaggctacaatgagctgtgattgcgtcactgcactccagcctggaagacaaagcaagatcctgtctcaaataataaaaaaaataagaactccagggtacatttgctcctagaactctaccacatagccccaaacagagccatcaccatcacatccctaacagtcctgggtcttcctcagtgtccagcctgacttctgttcttcctcattccagatctgcaagattgtaagacagcctgtgctccctcgctccttcctctgcattgcccctcttctccctctccaaacagagggaactctcctacccccaaggaggtgaaagctgctaccacctctgtgcccccccggcaatgccaccaactggatcctacccgaatttatgattaagattgctgaagagctgccaaacactgctgccaccccctctgttcccttattgctgcttgtcactgcctgacattcacggcagaggcaaggctgctgcagcctcccctggctgtgcacattccctcctgctccccagagactgcctccgccatcccacagatgatggatcttcagtgggttctcttgggctctaggtcctgcagaatgttgtgaggggtttatttttttttaatagtgttcataaagaaatacatagtattcttcttctcaagacgtggggggaaattatctcattatcgaggccctgctatgctgtgtatctgggcgtgttgtatgtcctgctgccgatgccttcattaaaatgatttggaagagcaga[0412]上文中以小写字母表示的核苷酸是非翻译区或内含子,且以大写字母表示的核苷酸是外显子。[0413]》x02592.1人类t细胞α链(tcr-α)的mrna[0414]ttttgaaacccttcaaaggcagagacttgtccagcctaacctgcctgctgctcctagctcctgaggctcagggcccttggcttctgtccgctctgctcagggccctccagcgtggccactgctcagccatgctcctgctgctcgtcccagtgctcgaggtgatttttaccctgggaggaaccagagcccagtcggtgacccagcttggcagccacgtctctgtctctgaaggagccctggttctgctgaggtgcaactactcatcgtctgttccaccatatctcttctggtatgtgcaataccccaaccaaggactccagcttctcctgaagtacacatcagcggccaccctggttaaaggcatcaacggttttgaggctgaatttaagaagagtgaaacctccttccacctgacgaaaccctcagcccatatgagcgacgcggctgagtacttctgtgctgtgagtgatctcgaaccgaacagcagtgcttccaagataatctttggatcagggaccagactcagcatccggccaaatatccagaaccctgaccctgccgtgtaccagctgagagactctaaatccagtgacaagtctgtctgcctattcaccgattttgattctcaaacaaatgtgtcacaaagtaaggattctgatgtgtatatcacagacaaaactgtgctagacatgaggtctatggacttcaagagcaacagtgctgtggcctggagcaacaaatctgactttgcatgtgcaaacgccttcaacaacagcattattccagaagacaccttcttccccagcccagaaagttcctgtgatgtcaagctggtcgagaaaagctttgaaacagatacgaacctaaactttcaaaacctgtcagtgattgggttccgaatcctcctcctgaaagtggccgggtttaatctgctcatgacgctgcggctgtggtccagctgagatctgcaagattgtaagacagcctgtgctccctcgctccttcctctgcattgcccctcttctccctctccaaacagagggaactctcctacccccaaggaggtgaaagctgctaccacctctgtgcccccccggtaatgccaccaactggatcctacccgaatttatgattaagattgctgaagagctgccaaacactgctgccaccccctctgttcccttattgctgcttgtcactgcctgacattcacggcagaggcaaggctgctgcagcctcccctggctgtgcacattccctcctgctccccagagactgcctccgccatcccacagatgatggatcttcagtgggttctcttgggctctaggtcctggagaatgttgtgaggggtttatttttttttaatagtgttcataaagaaatacatagtattcttcttctcaagacgtggggggaaattatctcattatcgaggccctgctatgctgtgtgtctgggcgtgttgtatgtcctgctgccgatgccttcattaaaatgatttggaa[0415]“t细胞受体β恒定区1多肽(trbc1)”意为一种蛋白质,其与ncbi登录号p01850或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性氨基酸序列提供如下。[0416]》sp|p01850|trbc1_humant细胞受体β恒定区1os=智人(homosapiens)ox=9606gn=trbc1pe=1sv=4[0417]dlnkvfppevavfepseaeishtqkatlvclatgffpdhvelswwvngkevhsgvstdpqplkeqpalndsryclssrlrvsatfwqnprnhfrcqvqfyglsendewtqdrakpvtqivsaeawgradcgftsvsyqqgvlsatilyeillgkatlyavlvsalvlmamvkrkdf[0418]“t细胞受体β恒定区1多核苷酸(trbc1)”意为编码trbc1多肽的核酸。示例性trbc1核酸序列提供如下。[0419]》x00437.1[0420]ctggtctagaatattccacatctgctctcactctgccatggactcctggaccttctgctgtgtgtccctttgcatcctggtagcgaagcatacagatgctggagttatccagtcaccccgccatgaggtgacagagatgggacaagaagtgactctgagatgtaaaccaatttcaggccacaactcccttttctggtacagacagaccatgatgcggggactggagttgctcatttactttaacaacaacgttccgatagatgattcagggatgcccgaggatcgattctcagctaagatgcctaatgcatcattctccactctgaagatccagccctcagaacccagggactcagctgtgtacttctgtgccagcagtttctcgacctgttcggctaactatggctacaccttcggttcggggaccaggttaaccgttgtagaggacctgaacaaggtgttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacccaaaaggccacactggtgtgcctggccacaggcttcttccccgaccacgtggagctgagctggtgggtgaatgggaaggaggtgcacagtggggtcagcacagacccgcagcccctcaaggagcagcccgccctcaatgactccagatactgcctgagcagccgcctgagggtctcggccaccttctggcagaacccccgcaaccacttccgctgtcaagtccagttctacgggctctcggagaatgacgagtggacccaggatagggccaaacccgtcacccagatcgtcagcgccgaggcctggggtagagcagactgtggctttacctcggtgtcctaccagcaaggggtcctgtctgccaccatcctctatgagatcctgctagggaaggccaccctgtatgctgtgctggtcagcgcccttgtgttgatggccatggtcaagagaaaggatttctgaaggcagccctggaagtggagttaggagcttctaacccgtcatggttcaatacacattcttcttttgccagcgcttctgaagagctgctctcacctctctgcatcccaatagatatccccctatgtgcatgcacacctgcacactcacggctgaaatctccctaacccagggggac[0421]“t细胞受体β恒定区2多肽(trbc2)”意为一种蛋白质,其与ncbi登录号a0a5b9或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性氨基酸序列提供如下。[0422]》sp|a0a5b9|trbc2_humant细胞受体β恒定区1os=智人(homosapiens)ox=9606gn=trbc2pe=2sv=2[0423]dlknvfppkvavfepseaeishtqkatlvclatgfypdhvelswwvngkevhsgvstdpqplkeqpalndsryclssrlrvsatfwqnprnhfrcqvqfyglsendewtqdrakpvtqivsaeawgradcgftsesyqqgvlsatilyeillgkatlyavlvsalvlmamvkrkdsrg[0424]“t细胞受体β恒定区2多核苷酸(trbc2)”意为编码trac多肽的核酸。示例性trbc2核酸序列提供如下。[0425]》ng_001333.2:655095-656583智人(homosapiens)染色体7上的t细胞受体β基因组[0426](trb)aggacctgaaaaacgtgttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacccaaaaggccacactggtatgcctggccacaggcttctaccccgaccacgtggagctgagctggtgggtgaatgggaaggaggtgcacagtggggtcagcacagacccgcagcccctcaaggagcagcccgccctcaatgactccagatactgcctgagcagccgcctgagggtctcggccaccttctggcagaacccccgcaaccacttccgctgtcaagtccagttctacgggctctcggagaatgacgagtggacccaggatagggccaaacccgtcacccagatcgtcagcgccgaggcctggggtagagcaggtgagtggggcctggggagatgcctggaggagattaggtgagaccagctaccagggaaaatggaaagatccaggtagcggacaagactagatccagaagaaagccagagtggacaaggtgggatgatcaaggttcacagggtcagcaaagcacggtgtgcacttcccccaccaagaagcatagaggctgaatggagcacctcaagctcattcttccttcagatcctgacaccttagagctaagctttcaagtctccctgaggaccagccatacagctcagcatctgagtggtgtgcatcccattctcttctggggtcctggtttcctaagatcatagtgaccacttcgctggcactggagcagcatgagggagacagaaccagggctatcaaaggaggctgactttgtactatctgatatgcatgtgtttgtggcctgtgagtctgtgatgtaaggctcaatgtccttacaaagcagcattctctcatccatttttcttcccctgttttctttcagactgtggcttcacctccggtaagtgagtctctcctttttctctctatctttcgccgtctctgctctcgaaccagggcatggagaatccacggacacaggggcgtgagggaggccagagccacctgtgcacaggtgcctacatgctctgttcttgtcaacagagtcttaccagcaaggggtcctgtctgccaccatcctctatgagatcttgctagggaaggccaccttgtatgccgtgctggtcagtgccctcgtgctgatggccatggtaaggaggagggtgggatagggcagatgatgggggcaggggatggaacatcacacatgggcataaaggaatctcagagccagagcacagcctaatatatcctatcacctcaatgaaaccataatgaagccagactggggagaaaatgcagggaatatcacagaatgcatcatgggaggatggagacaaccagcgagccctactcaaattaggcctcagagcccgcctcccctgccctactcctgctgtgccatagcccctgaaaccctgaaaatgttctctcttccacaggtcaagagaaaggattccagaggctag[0427]“tet甲基胞嘧啶双加氧酶2(tet2)多肽”意为一种蛋白质,其与ncbi登录号fm992369.1或其片段具有至少约85%的氨基酸序列一致性并且具有将甲基胞嘧啶转化为5-羟甲基胞嘧啶的催化活性。该基因中的缺陷已经与骨髓增值性疾患相关联,并且该酶将胞嘧啶甲基化的能力有贡献于转录调节。示例性tet2氨基酸序列提供如下。[0428]》cax30492.1tet致癌基因家族成员2[智人(homosapiens)][0429]meqdrtnhvegnrlspflipsppicqteplatklqngsplperahpevngdtkwhsfksyygipcmkgsqnsrvspdftqesrgyskclqnggikrtvsepslsgllqikklkqdqkangerrnfgvsqernpgessqpnvsdlsdkkesvssvaqenavkdftsfsthncsgpenpelqilneqegksanyhdknivllknkavlmpngatvsassvehthgellektlsqyypdcvsiavqkttshinainsqatnelsceithpshtsgqinsaqtsnselppkpaavvseacdaddadnasklaamlntcsfqkpeqlqqqksvfeicpspaenniqgttklasgeefcsgsssnlqapggsserylkqnemngayfkqssvftkdsfsatttppppsqlllspppplpqvpqlpsegkstlnggvleehhhypnqsnttllrevkiegkpeappsqspnpsthvcspspmlserpqnncvnrndiqtagtmtvplcsektrpmsehlkhnppifgssgelqdncqqlmrnkeqeilkgrdkeqtrdlvpptqhylkpgwielkaprfhqaeshlkrneaslpsilqyqpnlsnqmtskqytgnsnmpgglprqaytqkttqlehksqmyqvemnqgqsqgtvdqhlqfqkpshqvhfsktdhlpkahvqslcgtrfhfqqradsqteklmspvlkqhlnqqasetepfsnshllqhkphkqaaqtqpsqsshlpqnqqqqqklqiknkeeilqtfphpqsnndqqregsffgqtkveecfhgenqyskssefethnvqmgleevqninrrnspysqtmkssackiqvscsnnthlvsenkeqtthpelfagnktqnlhhmqyfpnnvipkqdllhrcfqeqeqksqqasvlqgyknrnqdmsgqqaaqlaqqrylihnhanvfpvpdqggshtqtppqkdtqkhaalrwhllqkqeqqqtqqpqteschsqmhrpikvepgckphacmhtappenktwkkvtkqenppascdnvqqksiietmeqhlkqfhakslfdhkaltlksqkqvkvemsgpvtvltrqttaaeldshtpaleqqttssektptkrtaasvlnnfiespsklldtpiknlldtpvktqydfpscrcveqiiekdegpfythlgagpnvaaireimeerfgqkgkairierviytgkegkssqgcpiakwvvrrssseekllclvreraghtceaavivililvwegiplsladklyseltetlrkygtltnrrcalneertcacqgldpetcgasfsfgcswsmyyngckfarskiprkfkllgddpkeeekleshlqnlstlmaptykklapdaynnqieyehrapecrlglkegrpfsgvtacldfcahahrdlhnmqngstlvctltrednrefggkpedeqlhvlplykvsdvdefgsveaqeekkrsgaiqvlssfrrkvrmlaepvktcrqrkleakkaaaeklsslenssnknekeksapsrtkqtenasqakqlaellrlsgpvmqqsqqpqplqkqppqpqqqqrpqqqqphhpqtesvnsysasgstnpymrrpnpvspypnsshtsdiygstspmnfystssqaagsylnssnpmnpypgllnqntqypsyqcngnlsvdncspylgsyspqsqpmdlyrypsqdplsklslppihtlyqprfgnsqsftskylgygnqnmqgdgfssctirpnvhhvgklppypthemdghfmgatsrlppnlsnpnmdykngehhspshiihnysaapgmfnsslhalhlqnkendmlshtanglskmlpalnhdrtacvqgglhklsdangqekqplalvqgvasgaedndevwsdseqsfldpdiggvavapthgsiliecakrelhattplknpnrnhptrislvfyqhksmnepkhglalweakmaekarekeeecekygpdyvpqkshgkkvkrepaephetseptylrfikslaertmsvttdstvttspyaftrvtgpynryi[0430]“tet甲基胞嘧啶双加氧酶2(tet2)多核苷酸”意为编码tet2多肽的核酸分子。tet多肽编码甲基胞嘧啶双加氧酶并且具有转录调节活性。示例性tet2核酸序列呈现如下。[0431]》fm992369.1智人(homosapiens)tet致癌基因家族成员2(tet2基因)的mrna[0432]ccgtgccatcccaacctcccacctcgcccccaaccttcgcgcttgctctgcttcttctcccaggggtggagacccgccgaggtccccggggttcccgagggctgcacccttccccgcgctcgccagccctggcccctactccgcgctggtccgggcgcaccactccccccgcgccactgcacggcgtgagggcagcccaggtctccactgcgcgccccgctgtacggccccaggtgccgccggcctttgtgctggacgcccggtgcggggggctaattccctgggagccggggctgagggccccagggcggcggcgcaggccggggcggagcgggaggaggccggggcggagcaggaggaggcccgggcggaggaggagagccggcggtagcggcagtggcagcggcgagagcttgggcggccgccgccgcctcctcgcgagcgccgcgcgcccgggtcccgctcgcatgcaagtcacgtccgccccctcggcgcggccgccccgagacgccggccccgctgagtgatgagaacagacgtcaaactgccttatgaatattgatgcggaggctaggctgctttcgtagagaagcagaaggaagcaagatggctgccctttaggatttgttagaaaggagacccgactgcaactgctggattgctgcaaggctgagggacgagaacgaggctggcaaacattcagcagcacaccctctcaagattgtttacttgcctttgctcctgttgagttacaacgcttggaagcaggagatgggctcagcagcagccaataggacatgatccaggaagagcaaattcaactagagggcagccttgtggatggccccgaagcaagcctgatggaacaggatagaaccaaccatgttgagggcaacagactaagtccattcctgataccatcacctcccatttgccagacagaacctctggctacaaagctccagaatggaagcccactgcctgagagagctcatccagaagtaaatggagacaccaagtggcactctttcaaaagttattatggaataccctgtatgaagggaagccagaatagtcgtgtgagtcctgactttacacaagaaagtagagggtattccaagtgtttgcaaaatggaggaataaaacgcacagttagtgaaccttctctctctgggctccttcagatcaagaaattgaaacaagaccaaaaggctaatggagaaagacgtaacttcggggtaagccaagaaagaaatccaggtgaaagcagtcaaccaaatgtctccgatttgagtgataagaaagaatctgtgagttctgtagcccaagaaaatgcagttaaagatttcaccagtttttcaacacataactgcagtgggcctgaaaatccagagcttcagattctgaatgagcaggaggggaaaagtgctaattaccatgacaagaacattgtattacttaaaaacaaggcagtgctaatgcctaatggtgctacagtttctgcctcttccgtggaacacacacatggtgaactcctggaaaaaacactgtctcaatattatccagattgtgtttccattgcggtgcagaaaaccacatctcacataaatgccattaacagtcaggctactaatgagttgtcctgtgagatcactcacccatcgcatacctcagggcagatcaattccgcacagacctctaactctgagctgcctccaaagccagctgcagtggtgagtgaggcctgtgatgctgatgatgctgataatgccagtaaactagctgcaatgctaaatacctgttcctttcagaaaccagaacaactacaacaacaaaaatcagtttttgagatatgcccatctcctgcagaaaataacatccagggaaccacaaagctagcgtctggtgaagaattctgttcaggttccagcagcaatttgcaagctcctggtggcagctctgaacggtatttaaaacaaaatgaaatgaatggtgcttacttcaagcaaagctcagtgttcactaaggattccttttctgccactaccacaccaccaccaccatcacaattgcttctttctccccctcctcctcttccacaggttcctcagcttccttcagaaggaaaaagcactctgaatggtggagttttagaagaacaccaccactaccccaaccaaagtaacacaacacttttaagggaagtgaaaatagagggtaaacctgaggcaccaccttcccagagtcctaatccatctacacatgtatgcagcccttctccgatgctttctgaaaggcctcagaataattgtgtgaacaggaatgacatacagactgcagggacaatgactgttccattgtgttctgagaaaacaagaccaatgtcagaacacctcaagcataacccaccaatttttggtagcagtggagagctacaggacaactgccagcagttgatgagaaacaaagagcaagagattctgaagggtcgagacaaggagcaaacacgagatcttgtgcccccaacacagcactatctgaaaccaggatggattgaattgaaggcccctcgttttcaccaagcggaatcccatctaaaacgtaatgaggcatcactgccatcaattcttcagtatcaacccaatctctccaatcaaatgacctccaaacaatacactggaaattccaacatgcctggggggctcccaaggcaagcttacacccagaaaacaacacagctggagcacaagtcacaaatgtaccaagttgaaatgaatcaagggcagtcccaaggtacagtggaccaacatctccagttccaaaaaccctcacaccaggtgcacttctccaaaacagaccatttaccaaaagctcatgtgcagtcactgtgtggcactagatttcattttcaacaaagagcagattcccaaactgaaaaacttatgtccccagtgttgaaacagcacttgaatcaacaggcttcagagactgagccattttcaaactcacaccttttgcaacataagcctcataaacaggcagcacaaacacaaccatcccagagttcacatctccctcaaaaccagcaacagcagcaaaaattacaaataaagaataaagaggaaatactccagacttttcctcacccccaaagcaacaatgatcagcaaagagaaggatcattctttggccagactaaagtggaagaatgttttcatggtgaaaatcagtattcaaaatcaagcgagttcgagactcataatgtccaaatgggactggaggaagtacagaatataaatcgtagaaattccccttatagtcagaccatgaaatcaagtgcatgcaaaatacaggtttcttgttcaaacaatacacacctagtttcagagaataaagaacagactacacatcctgaactttttgcaggaaacaagacccaaaacttgcatcacatgcaatattttccaaataatgtgatcccaaagcaagatcttcttcacaggtgctttcaagaacaggagcagaagtcacaacaagcttcagttctacagggatataaaaatagaaaccaagatatgtctggtcaacaagctgcgcaacttgctcagcaaaggtacttgatacataaccatgcaaatgtttttcctgtgcctgaccagggaggaagtcacactcagacccctccccagaaggacactcaaaagcatgctgctctaaggtggcatctcttacagaagcaagaacagcagcaaacacagcaaccccaaactgagtcttgccatagtcagatgcacaggccaattaaggtggaacctggatgcaagccacatgcctgtatgcacacagcaccaccagaaaacaaaacatggaaaaaggtaactaagcaagagaatccacctgcaagctgtgataatgtgcagcaaaagagcatcattgagaccatggagcagcatctgaagcagtttcacgccaagtcgttatttgaccataaggctcttactctcaaatcacagaagcaagtaaaagttgaaatgtcagggccagtcacagttttgactagacaaaccactgctgcagaacttgatagccacaccccagctttagagcagcaaacaacttcttcagaaaagacaccaaccaaaagaacagctgcttctgttctcaataattttatagagtcaccttccaaattactagatactcctataaaaaatttattggatacacctgtcaagactcaatatgatttcccatcttgcagatgtgtagagcaaattattgaaaaagatgaaggtcctttttatacccatctaggagcaggtcctaatgtggcagctattagagaaatcatggaagaaaggtttggacagaagggtaaagctattaggattgaaagagtcatctatactggtaaagaaggcaaaagttctcagggatgtcctattgctaagtgggtggttcgcagaagcagcagtgaagagaagctactgtgtttggtgcgggagcgagctggccacacctgtgaggctgcagtgattgtgattctcatcctggtgtgggaaggaatcccgctgtctctggctgacaaactctactcggagcttaccgagacgctgaggaaatacggcacgctcaccaatcgccggtgtgccttgaatgaagagagaacttgcgcctgtcaggggctggatccagaaacctgtggtgcctccttctcttttggttgttcatggagcatgtactacaatggatgtaagtttgccagaagcaagatcccaaggaagtttaagctgcttggggatgacccaaaagaggaagagaaactggagtctcatttgcaaaacctgtccactcttatggcaccaacatataagaaacttgcacctgatgcatataataatcagattgaatatgaacacagagcaccagagtgccgtctgggtctgaaggaaggccgtccattctcaggggtcactgcatgtttggacttctgtgctcatgcccacagagacttgcacaacatgcagaatggcagcacattggtatgcactctcactagagaagacaatcgagaatttggaggaaaacctgaggatgagcagcttcacgttctgcctttatacaaagtctctgacgtggatgagtttgggagtgtggaagctcaggaggagaaaaaacggagtggtgccattcaggtactgagttcttttcggcgaaaagtcaggatgttagcagagccagtcaagacttgccgacaaaggaaactagaagccaagaaagctgcagctgaaaagctttcctccctggagaacagctcaaataaaaatgaaaaggaaaagtcagccccatcacgtacaaaacaaactgaaaacgcaagccaggctaaacagttggcagaacttttgcgactttcaggaccagtcatgcagcagtcccagcagccccagcctctacagaagcagccaccacagccccagcagcagcagagaccccagcagcagcagccacatcaccctcagacagagtctgtcaactcttattctgcttctggatccaccaatccatacatgagacggcccaatccagttagtccttatccaaactcttcacacacttcagatatctatggaagcaccagccctatgaacttctattccacctcatctcaagctgcaggttcatatttgaattcttctaatcccatgaacccttaccctgggcttttgaatcagaatacccaatatccatcatatcaatgcaatggaaacctatcagtggacaactgctccccatatctgggttcctattctccccagtctcagccgatggatctgtataggtatccaagccaagaccctctgtctaagctcagtctaccacccatccatacactttaccagccaaggtttggaaatagccagagttttacatctaaatacttaggttatggaaaccaaaatatgcagggagatggtttcagcagttgtaccattagaccaaatgtacatcatgtagggaaattgcctccttatcccactcatgagatggatggccacttcatgggagccacctctagattaccacccaatctgagcaatccaaacatggactataaaaatggtgaacatcattcaccttctcacataatccataactacagtgcagctccgggcatgttcaacagctctcttcatgccctgcatctccaaaacaaggagaatgacatgctttcccacacagctaatgggttatcaaagatgcttccagctcttaaccatgatagaactgcttgtgtccaaggaggcttacacaaattaagtgatgctaatggtcaggaaaagcagccattggcactagtccagggtgtggcttctggtgcagaggacaacgatgaggtctggtcagacagcgagcagagctttctggatcctgacattgggggagtggccgtggctccaactcatgggtcaattctcattgagtgtgcaaagcgtgagctgcatgccacaacccctttaaagaatcccaataggaatcaccccaccaggatctccctcgtcttttaccagcataagagcatgaatgagccaaaacatggcttggctctttgggaagccaaaatggctgaaaaagcccgtgagaaagaggaagagtgtgaaaagtatggcccagactatgtgcctcagaaatcccatggcaaaaaagtgaaacgggagcctgctgagccacatgaaacttcagagcccacttacctgcgtttcatcaagtctcttgccgaaaggaccatgtccgtgaccacagactccacagtaactacatctccatatgccttcactcgggtcacagggccttacaacagatatatatgaagatatatatgatatcacccccttttgttggttacctcacttgaaaagaccacaaccaacctgtcagtagtatagttctcatgacgtgggcagtggggaaaggtcacagtattcatgacaaatgtggtgggaaaaacctcagctcaccagcaacaaaagaggttatcttaccatagcacttaattttcactggctcccaagtggtcacagatggcatctaggaaaagaccaaagcattctatgcaaaaagaaggtggggaagaaagtgttccgcaatttacatttttaaacactggttctattattggacgagatgatatgtaaatgtgatcccccccccccgcttacaactctacacatctgtgaccacttttaataatatcaagtttgcatagtcatggaacacaaatcaaacaagtactgtagtattacagtgacaggaatcttaaaataccatctggtgctgaatatatgatgtactgaaatactggaattatggctttttgaaatgcagtttttactgtaatcttaacttttatttatcaaaatagctacaggaaacatgaatagcaggaaaacactgaatttgtttggatgttctaagaaatggtgctaagaaaatggtgtctttaatagctaaaaatttaatgcctttatatcatcaagatgctatcagtgtactccagtgcccttgaataataggggtaccttttcattcaagtttttatcataattacctattcttacacaagcttagtttttaaaatgtggacattttaaaggcctctggattttgctcatccagtgaagtccttgtaggacaataaacgtatatatgtacatatatacacaaacatgtatatgtgcacacacatgtatatgtataaatattttaaatggtgttttagaagcactttgtctacctaagctttgacaacttgaacaatgctaaggtactgagatgtttaaaaaacaagtttactttcattttagaatgcaaagttgatttttttaaggaaacaaagaaagcttttaaaatatttttgcttttagccatgcatctgctgatgagcaattgtgtccatttttaacacagccagttaaatccaccatggggcttactggattcaagggaatacgttagtccacaaaacatgttttctggtgctcatctcacatgctatactgtaaaacagttttatacaaaattgtatgacaagttcattgctcaaaaatgtacagttttaagaattttctattaactgcaggtaataattagctgcatgctgcagactcaacaaagctagttcactgaagcctatgctattttatggatcataggctcttcagagaactgaatggcagtctgcctttgtgttgataattatgtacattgtgacgttgtcatttcttagcttaagtgtcctctttaacaagaggattgagcagactgatgcctgcataagatgaataaacagggttagttccatgtgaatctgtcagttaaaaagaaacaaaaacaggcagctggtttgctgtggtggttttaaatcattaatttgtataaagaagtgaaagagttgtatagtaaattaaattgtaaacaaaacttttttaatgcaatgctttagtattttagtactgtaaaaaaattaaatatatacatatatatatatatatatatatatatatatatgagtttgaagcagaattcacatcatgatggtgctactcagcctgctacaaatatatcataatgtgagctaagaattcattaaatgtttgagtgatgttcctacttgtcatatacctcaacactagtttggcaataggatattgaactgagagtgaaagcattgtgtaccatcatttttttccaagtccttttttttattgttaaaaaaaaaagcataccttttttcaatacttgatttcttagcaagtataacttgaacttcaacctttttgttctaaaaattcagggatatttcagctcatgctctccctatgccaacatgtcacctgtgtttatgtaaaattgttgtaggttaataaatatattctttgtcagggatttaacccttttattttgaatcccttctattttacttgtacatgtgctgatgtaactaaaactaattttgtaaatctgttggctctttttattgtaaagaaaagcattttaaaagtttgaggaatcttttgactgtttcaagcaggaaaaaaaaattacatgaaaatagaatgcactgagttgataaagggaaaaattgtaaggcaggagtttggcaagtggctgttggccagagacttacttgtaactctctaaatgaagtttttttgatcctgtaatcactgaaggtacatactccatgtggacttcccttaaacaggcaaacacctacaggtatggtgtgcaacagattgtacaattacattttggcctaaatacatttttgcttactagtatttaaaataaattcttaatcagaggaggcctttgggttttattggtcaaatctttgtaagctggcttttgtctttttaaaaaatttcttgaatttgtggttgtgtccaatttgcaaacatttccaaaaatgtttgctttgcttacaaaccacatgattttaatgttttttgtataccataatatctagccccaaacatttgattactacatgtgcattggtgattttgatcatccattcttaatatttgatttctgtgtcacctactgtcatttgttaaactgctggccaacaagaacaggaagtatagtttggggggttggggagagtttacataaggaagagaagaaattgagtggcatattgtaaatatcagatctataattgtaaatataaaacctgcctcagttagaatgaatggaaagcagatctacaatttgctaatataggaatatcaggttgactatatagccatacttgaaaatgcttctgagtggtgtcaactttacttgaatgaatttttcatcttgattgacgcacagtgatgtacagttcacttctgaagctagtggttaacttgtgtaggaaacttttgcagtttgacactaagataacttctgtgtgcatttttctatgcttttttaaaaactagtttcatttcattttcatgagatgtttggtttataagatctgaggatggttataaatactgtaagtattgtaatgttatgaatgcaggttatttgaaagctgtttattattatatcattcctgataatgctatgtgagtgtttttaataaaatttatatttatttaatgcactctaagtgttgtcttcct[0433]“转化生长因子受体2(tgfbrii)多肽”意为一种蛋白质,其与ncbi登录号abg65632.1或其片段具有至少约85%的氨基酸序列一致性并且具有免疫抑制活性。示例性氨基酸序列提供如下。[0434]》abg65632.1转化生长因子β受体ii[智人(homosapiens)][0435]mgrgllrglwplhivlwtriastipphvqksvnndmivtdnngavkfpqlckfcdvrfstcdnqkscmsncsitsicekpqevcvavwrkndenitletvchdpklpyhdfiledaaspkcimkekkkpgetffmcscssdecndniifseeyntsnpdlllvifqvtgisllpplgvaisviiifycyrvnrqqklsstwetgktrklmefsehcaiileddrsdisstcanninhntellpieldtlvgkgrfaevykaklkqntseqfetvavkifpyeeyaswktekdifsdinlkhenilqfltaeerktelgkqywlitafhakgnlqeyltrhviswedlrklgsslargiahlhsdhtpcgrpkmpivhrdlkssnilvkndltcclcdfglslrldptlsvddlansgqvgtarymapevlesrmnlenvesfkqtdvysmalvlwemtsrcnavgevkdyeppfgskvrehpcvesmkdnvlrdrgrpeipsfwlnhqgiqmvcetltecwdhdpearltaqcvaerfselehldrlsgrscseekipedgslnttk[0436]“转化生长因子受体2(tgfbrii)多核苷酸”意为编码tgfbrii多肽的核酸分子。tgfbrii基因编码具有丝氨酸/苏氨酸激酶活性的跨膜蛋白。示例性tgfbrii核酸序列提供如下。[0437]》m85079.1人类tgf-βii型受体mrna,完全编码序列[0438]gttggcgaggagtttcctgtttcccccgcagcgctgagttgaagttgagtgagtcactcgcgcgcacggagcgacgacacccccgcgcgtgcacccgctcgggacaggagccggactcctgtgcagcttccctcggccgccgggggcctccccgcgcctcgccggcctccaggcccctcctggctggcgagcgggcgccacatctggcccgcacatctgcgctgccggcccggcgcggggtccggagagggcgcggcgcggagcgcagccaggggtccgggaaggcgccgtccgtgcgctgggggctcggtctatgacgagcagcggggtctgccatgggtcgggggctgctcaggggcctgtggccgctgcacatcgtcctgtggacgcgtatcgccagcacgatcccaccgcacgttcagaagtcggttaataacgacatgatagtcactgacaacaacggtgcagtcaagtttccacaactgtgtaaattttgtgatgtgagattttccacctgtgacaaccagaaatcctgcatgagcaactgcagcatcacctccatctgtgagaagccacaggaagtctgtgtggctgtatggagaaagaatgacgagaacataacactagagacagtttgccatgaccccaagctcccctaccatgactttattctggaagatgctgcttctccaaagtgcattatgaaggaaaaaaaaaagcctggtgagactttcttcatgtgttcctgtagctctgatgagtgcaatgacaacatcatcttctcagaagaatataacaccagcaatcctgacttgttgctagtcatatttcaagtgacaggcatcagcctcctgccaccactgggagttgccatatctgtcatcatcatcttctactgctaccgcgttaaccggcagcagaagctgagttcaacctgggaaaccggcaagacgcggaagctcatggagttcagcgagcactgtgccatcatcctggaagatgaccgctctgacatcagctccacgtgtgccaacaacatcaaccacaacacagagctgctgcccattgagctggacaccctggtggggaaaggtcgctttgctgaggtctataaggccaagctgaagcagaacacttcagagcagtttgagacagtggcagtcaagatctttccctatgaggagtatgcctcttggaagacagagaaggacatcttctcagacatcaatctgaagcatgagaacatactccagttcctgacggctgaggagcggaagacggagttggggaaacaatactggctgatcaccgccttccacgccaagggcaacctacaggagtacctgacgcggcatgtcatcagctgggaggacctgcgcaagctgggcagctccctcgcccgggggattgctcacctccacagtgatcacactccatgtgggaggcccaagatgcccatcgtgcacagggacctcaagagctccaatatcctcgtgaagaacgacctaacctgctgcctgtgtgactttgggctttccctgcgtctggaccctactctgtctgtggatgacctggctaacagtgggcaggtgggaactgcaagatacatggctccagaagtcctagaatccaggatgaatttggagaatgctgagtccttcaagcagaccgatgtctactccatggctctggtgctctgggaaatgacatctcgctgtaatgcagtgggagaagtaaaagattatgagcctccatttggttccaaggtgcgggagcacccctgtgtcgaaagcatgaaggacaacgtgttgagagatcgagggcgaccagaaattcccagcttctggctcaaccaccagggcatccagatggtgtgtgagacgttgactgagtgctgggaccacgacccagaggcccgtctcacagcccagtgtgtggcagaacgcttcagtgagctggagcatctggacaggctctcggggaggagctgctcggaggagaagattcctgaagacggctccctaaacactaccaaatagctcttatggggcaggctgggcatgtccaaagaggctgcccctctcaccaaa[0439]“具有ig和itim结构域的t细胞免疫受体(tigit)多肽”意为一种蛋白质,其与ncbi登录号acd74757.1或其片段具有至少约85%的氨基酸序列一致性并且具有免疫调节活性。示例性tigit氨基酸序列提供如下。[0440]》acd74757.1具有ig和itim结构域的t细胞免疫受体[智人(homosapiens)][0441]mrwcllliwaqglrqaplasgmmtgtiettgnisaekggsiilqchlssttaqvtqvnweqqdqllaicnadlgwhispsfkdrvapgpglgltlqsltvndtgeyfciyhtypdgtytgriflevlessvaehgarfqipllgamaatlvvictavivvvaltrkkkalrihsvegdlrrksagqeewspsapsppgscvqaeaapaglcgeqrgedcaelhdyfnvlsyrslgncsfftetg[0442]“具有ig和itim结构域的t细胞免疫受体(tigit)多核苷酸”意为编码tigit多肽的核酸。tigit基因编码与瘤形成和t细胞衰竭相关的抑制性免疫受体。示例性核酸序列提供如下。[0443]》eu675310.1具有ig和itim结构域的智人(homosapiens)t细胞免疫受体(tigit)mrna,完全编码序列[0444]cgtcctatctgcagtcggctactttcagtggcagaagaggccacatctgcttcctgtaggccctctgggcagaagcatgcgctggtgtctcctcctgatctgggcccaggggctgaggcaggctcccctcgcctcaggaatgatgacaggcacaatagaaacaacggggaacatttctgcagagaaaggtggctctatcatcttacaatgtcacctctcctccaccacggcacaagtgacccaggtcaactgggagcagcaggaccagcttctggccatttgtaatgctgacttggggtggcacatctccccatccttcaaggatcgagtggccccaggtcccggcctgggcctcaccctccagtcgctgaccgtgaacgatacaggggagtacttctgcatctatcacacctaccctgatgggacgtacactgggagaatcttcctggaggtcctagaaagctcagtggctgagcacggtgccaggttccagattccattgcttggagccatggccgcgacgctggtggtcatctgcacagcagtcatcgtggtggtcgcgttgactagaaagaagaaagccctcagaatccattctgtggaaggtgacctcaggagaaaatcagctggacaggaggaatggagccccagtgctccctcacccccaggaagctgtgtccaggcagaagctgcacctgctgggctctgtggagagcagcggggagaggactgtgccgagctgcatgactacttcaatgtcctgagttacagaagcctgggtaactgcagcttcttcacagagactggttagcaaccagaggcatcttctgg[0445]如本文所用,“转导”意为经由病毒载体将基因或遗传物质转移到细胞。[0446]如本文所用,“转化”是指通过引入外源性核酸将基因改变引入细胞内的过程。[0447]“转染”是指经由化学或物理手段将基因或遗传物质转移到细胞。[0448]“易位”意为核酸链段在非同源染色体之间的重排。[0449]“跨膜结构域”意为一种氨基酸序列,其插入到脂质双层,诸如细胞或病毒或病毒样颗粒的脂质双层内。跨膜结构域可用于将感兴趣的蛋白质(例如,car)锚定至膜。跨膜结构域可以源自天然来源或源自合成来源。若来源是天然的,则该结构域可以源自任何膜结合蛋白或跨膜蛋白。用于所公开的car的跨膜结构域可包括t细胞受体的α、β或ζ链、cd28、cd3ε、cd45、cd4、cd5、cd8、cd9、cd16、cd22、cd33,cd37,cd64,cd80,cd86,cd134,cd137,cd154的至少跨膜区。在一些实施方案中,跨膜结构域源自cd4、cd8α、cd28和cd3ζ。在一些实施方案中,跨膜结构域是cd8α铰链和跨膜结构域。[0450]如本文所用,术语“处理”、“治疗”等是指减轻或缓解疾病或疾患和/或与其有关的症状或者获得所希望的药理学和/或生理学效果。应理解,尽管没有排除,但治疗病变或病症并不需要完全消除该病变、病症或与之相关的症状。在一些实施方案中,该效果是治疗性的,即,不限于,该效果部分地或完全地减轻、消除、废除、削弱、减缓、降低疾病和/或可归因于该疾病的负面症候的强度或治愈疾病和/或可归因于该疾病的负面症候。在一些实施方案中,该效果是预防性的,即,该效果保护或阻止疾病或病症的出现或复发。为此,本公开的方法包括给药治疗有效量的本文所述的组合物。[0451]术语“尿嘧啶糖基化酶抑制剂”或“ugi”意为抑制尿嘧啶切除修复系统的药剂。在一种实施方案中,药剂是一种蛋白质或其片段,其结合宿主尿嘧啶-dna糖苷酶并阻止尿嘧啶残基从dna去除。在一种实施方案中,ugi是能够抑制尿嘧啶-dna糖苷酶碱基切除修复酶的蛋白质、其片段或结构域。在一些实施方案中,ugi结构域包含野生型ugi或其经修饰的版本。在一些实施方案中,ugi结构域包含下文详述的示例性氨基酸序列的片段。在一些实施方案中,ugi片段包含氨基酸序列,该氨基酸序列包含下文提供的示例性ugi序列的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。在一些实施方案中,ugi包含氨基酸序列,该氨基酸序列与下文详述的示例性ugi氨基酸序列或其片段同源。在一种实施方案中,ugi或其部分与下文详述的野生型ugi或ugi序列或其片段至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.9%或100%相同。示例性ugi包含如下的氨基酸序列:[0452]》splp14739iungi_bppb2尿嘧啶-dna糖基化酶抑制剂[0453]mtnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikml。术语“载体”是指将核酸序列引入细胞内以得到转化细胞的手段。载体包括质粒、转座子、噬菌体、病毒v脂质体和附加体。“表达载体”是包含待在接纳者细胞内表达的核酸序列的核酸序列。表达载体可包括额外的核酸序列以促进及或促使所引入的序列诸如起始子、终止子、启动子和分泌序列的表达。[0454]“t细胞受体ζ链相关蛋白激酶70(zap70)多肽”意为一种蛋白质,其与ncbi登录号aah53878.1具有至少约85%的氨基酸序列一致性并且具有激酶活性。示例性氨基酸序列提供如下。[0455]》aah53878.1ζ链(tcr)相关蛋白激酶70kda[智人(homosapiens)][0456]mpdpaahlpffygsisraeaeehlklagmadglfllrqclrslggyvlslvhdvrfhhfpierqlngtyaiaggkahcgpaelcefysrdpdglpcnlrkpcnrpsglepqpgvfdclrdamvrdyvrqtwklegealeqaiisqapqvekliattahermpwyhssltreeaerklysgaqtdgkfllrprkeqgtyalsliygktvyhylisqdkagkycipegtkfdtlwqlveylklkadgliyclkeacpnssasnasgaaaptlpahpstlthpqrridtlnsdgytpeparitspdkprpmpmdtsvyespysdpeelkdkklflkrdnlliadielgcgnfgsvrqgvyrmrkkqidvaikvlkqgtekadteemmreaqimhqldnpyivrligvcqaealmlvmemagggplhkflvgkreeipvsnvaellhqvsmgmkyleeknfvhrdlaarnvllvnrhyakisdfglskalgaddsyytarsagkwplkwyapecinfrkfssrsdvwsygvtmwealsygqkpykkmkgpevmafieqgkrmecppecppelyalmsdcwiykwedrpdfltveqrmracyyslaskvegppgstqkaeaaca[0457]“t细胞受体ζ链相关蛋白激酶70(zap70)”意为编码zap70多肽的核酸。zap70基因编码牵涉到t细胞发育和淋巴细胞激活中的酪氨酸激酶。功能性zap10的缺失可导致以cd8+t细胞的缺乏为特征的重症综合性免疫缺陷。示例性zap70核酸序列提供如下。[0458]》bc053878.1智人(homosapiens)ζ链(tcr)相关蛋白激酶70kda,mrna(cdna克隆体mgc:61743image:5757161),完全编码序列[0459]gcttgccggagctcagcagacaccaggccttccgggcaggcctggcccaccgtgggcctcagagctgctgctggggcattcagaaccggctctccattggcattgggaccagagaccccgcaagtggcctgtttgcctggacatccacctgtacgtccccaggtttcgggaggcccaggggcgatgccagaccccgcggcgcacctgcccttcttctacggcagcatctcgcgtgccgaggccgaggagcacctgaagctggcgggcatggcggacgggctcttcctgctgcgccagtgcctgcgctcgctgggcggctatgtgctgtcgctcgtgcacgatgtgcgcttccaccactttcccatcgagcgccagctcaacggcacctacgccattgccggcggcaaagcgcactgtggaccggcagagctctgcgagttctactcgcgcgaccccgacgggctgccctgcaacctgcgcaagccgtgcaaccggccgtcgggcctcgagccgcagccgggggtcttcgactgcctgcgagacgccatggtgcgtgactacgtgcgccagacgtggaagctggagggcgaggccctggagcaggccatcatcagccaggccccgcaggtggagaagctcattgctacgacggcccacgagcggatgccctggtaccacagcagcctgacgcgtgaggaggccgagcgcaaactttactctggggcgcagaccgacggcaagttcctgctgaggccgcggaaggagcagggcacatacgccctgtccctcatctatgggaagacggtgtaccactacctcatcagccaagacaaggcgggcaagtactgcattcccgagggcaccaagtttgacacgctctggcagctggtggagtatctgaagctgaaggcggacgggctcatctactgcctgaaggaggcctgccccaacagcagtgccagcaacgcctcaggggctgctgctcccacactcccagcccacccatccacgttgactcatcctcagagacgaatcgacaccctcaactcagatggatacacccctgagccagcacgcataacgtccccagacaaaccgcggccgatgcccatggacacgagcgtgtatgagagcccctacagcgacccagaggagctcaaggacaagaagctcttcctgaagcgcgataacctcctcatagctgacattgaacttggctgcggcaactttggctcagtgcgccagggcgtgtaccgcatgcgcaagaagcagatcgacgtggccatcaaggtgctgaagcagggcacggagaaggcagacacggaagagatgatgcgcgaggcgcagatcatgcaccagctggacaacccctacatcgtgcggctcattggcgtctgccaggccgaggccctcatgctggtcatggagatggctgggggcgggccgctgcacaagttcctggtcggcaagagggaggagatccctgtgagcaatgtggccgagctgctgcaccaggtgtccatggggatgaagtacctggaggagaagaactttgtgcaccgtgacctggcggcccgcaacgtcctgctggttaaccggcactacgccaagatcagcgactttggcctctccaaagcactgggtgccgacgacagctactacactgcccgctcagcagggaagtggccgctcaagtggtacgcacccgaatgcatcaacttccgcaagttctccagccgcagcgatgtctggagctatggggtcaccatgtgggaggccttgtcctacggccagaagccctacaagaagatgaaagggccggaggtcatggccttcatcgagcagggcaagcggatggaatgcccaccagagtgtccacccgaactgtacgcactcatgagtgactgctggatctacaagtgggaggatcgccccgacttcctgaccgtggagcagcgcatgcgagcctgttactacagcctggccagcaaggtggaagggcccccaggcagcacacagaaggctgaggctgcctgtgcctgagctcccgctgcccaggggagccctccacaccggctcttccccaccctcagccccaccccaggtcctgcagtctggctgagccctgcttggttgtctccacacacagctgggctgtggtagggggtgtctcaggccacaccggccttgcattgcctgcctggccccctgtcctctctggctggggagcagggaggtccgggagggtgcggctgtgcagcctgtcctgggctggtggctcccggagggccctgagctgagggcattgcttacacggatgccttcccctgggccctgacattggagcctgggcatcctcaggtggtcaggcgtagatcaccagaataaacccagcttccctcttgaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa[0460]本文中的任何变量定义中对一系列化学基团的叙述包括该变量作为任何单一基团或所列基团的组合的定义。本文中对于变量或方面的实施方案的叙述包括该实施方案作为任何单一实施方案或与其他实施方案或其部分组合。[0461]本文所提供的任何组合物或方法可与本文所提供的任何其他组合物和方法中的一者或多者合用。[0462]dna编辑已成为一种可行的手段,通过在基因水平上校正致病突变来改变疾病状态。直到最近,全部dna编辑平台的功能都是在特定的基因组位点诱导dna双链断裂(dsb),并依靠内源性dna修复途径以半随机方式确定产物结果,从而产生复杂的遗传产物群体。虽然通过同源定向修复(hdr)途径可以实现精确的、用户定义的修复结果,但在治疗上相关的细胞类型中,使用hdr进行高效修复面临许多挑战。在实践中,与竞争性、易出错的非同源末端连接途径相比,这一途径效率低下。再者,hdr严格限制在细胞周期的g1期和s期,从而阻止有丝分裂后细胞中dsb的精确修复。因此,在这些群体中,以用户定义的、可编程的方式高效地改变基因组序列已被证明是困难的或不可能的。[0463]通过引用并入[0464]本说明书中提及的全部出版物、专利和专利申请通过引用以与各独立出版物、专利或专利申请被具体且独立地指明为通过引用并入相同的程度并入本文。附图说明[0465]本发明的新颖特征在所附权利要求书中以特殊性详述。通过参考以下详述示例性实施方案的具体实施方式(其中使用了本发明的原理)以及附图,可获得对本发明的特征和优点的更佳理解:[0466]图1a至图1b是影响t细胞功能的三种蛋白质的例示性说明。图1a是trac蛋白的例示性说明,该蛋白是移植物抗宿主疾病的关键成分。图1b是b2m蛋白的例示性说明,该蛋白是存在于有核细胞上的mhc1类抗原呈递复合体的成分,其可以被宿主的cd8+t细胞识别。图1c是t细胞信号传导的例示性说明,该信号传导导致pdcd1基因的表达,并且所得pd-1蛋白发挥作用以抑制t细胞传导。[0467]图2是在碱基编辑后具有敲低的靶标基因表达的细胞的百分比的图。“ep”表示电穿孔。[0468]图3是在未经转导的细胞或经be4碱基编辑系统或cas9核酸酶转导的细胞中观察到的基因修饰类型的百分比的图。[0469]图4是描述通过细胞的百分比测得的靶标核苷酸修饰百分比的图,该细胞通过流式细胞术(fc)在经be4和将be4引导至剪接位点受体(sa)或供体(sd)的sgrna转导的细胞中测定的靶标蛋白表达为阴性,或该细胞生成stop密码子。对照细胞经虚拟电穿孔(ep)。[0470]图5是be4系统中断剪接位点受体(sa)、剪接供体(sd)或生成stop密码子的示意图。[0471]图6是总结用来中断靶标基因的sgrna的脱靶结合位点的图表。[0472]图7是总结用be4或cas9编辑的表现出减少的蛋白质表达的细胞的百分比的流式细胞术(fc)数据的图。细胞被选通至b2m或cd3,后者是trac表达的指标。[0473]图8a是未经编辑的对照细胞的facs数据的散点图。图8b是已经在b2m、trac和pd1基因座处编辑的细胞的facs数据的散点图。[0474]图9是例示性说明本文所述的碱基编辑技术在修饰可能对car-t免疫疗法产生负面影响的特异性基因中的有效性的图。[0475]图10是描述用以检测并定量基因修饰和易位的微滴式数字pcr(ddpcr)方案的示意图。[0476]图11呈现两张图,显示从对使用be4系统或cas9系统编辑的细胞的下一代测序(ngs)分析或ddpcr生成的数据。[0477]图12是例示性说明cbl-b在阻遏t细胞激活中充当的角色的原理图。[0478]图13是描述通过中断剪接位点进行cbl-b敲低的效率的图。sa=剪接受体;sd=剪接供体;stop–生成stop密码子;2°only=仅二抗;c373是指功能损失变体(c373r);rl1-a::apc-a=激光;ics=细胞内染色。[0479]图14是例示性说明在t细胞中的grin2b和dnmt1基因中的cas12b介导的插入缺失率。ep表示电穿孔。[0480]图15是总结经由用bvcas12b和对于trac、grin2b和dnmt1具有特异性的向导rna进行电穿孔(ep)来转导且针对cd3进行选通的细胞的荧光辅助细胞分选(facs)数据的图。[0481]图16是经car-p2a-mcherry慢病毒转导的细胞的荧光辅助细胞分选数据的散点图,表明了car表达。[0482]图17是荧光辅助分选数据的散点图,表明了在经聚(1,8-辛二醇柠檬酸酯)(poc)慢病毒载体转导的细胞中的car表达。[0483]图18是显示be4产生有效、持久的基因敲除且具有高产物纯度的图。[0484]图19a是代表性facs分析,显示由于通过be4或spcas9进行基因敲除导致的蛋白质表明表达的损失。图19b是显示通过be4或spcas9进行的基因敲除造成b2m表面表达损失的图。[0485]图20是描述b2m、trac和pd-1靶标位点的定位的示意图。当b2m、trac和pd-1序列重组时,可检测到易位。[0486]图21是显示多重碱基编辑不显著损害细胞扩增的图。[0487]图22是显示be4以与spcas9类似的上靶编辑效率和细胞表型生成经三重编辑的t细胞的图。[0488]图23描述流式细胞术分析,其显示经三重编辑的cd3-、b2m-、pd1-t细胞的生成。[0489]图24描述流式细胞术分析,其显示经be4和cas9编辑的细胞中的car表达。[0490]图25是显示car-t细胞杀死或抗原阳性细胞的图。[0491]图26是显示cas12b和be4可经配对以在t细胞中进行有效的多重编辑的图。[0492]图27是显示cas12b可以通过在cas12核酸酶和靶向基因座的sgrna的存在下将编码car的双链dna模板引入细胞而将嵌合抗原受体(car)的插入引导至该基因座内。[0493]图28a和图28b是显示用来沉默基因以工程化改造car-t细胞的碱基编辑路径的说明。图28a示出了用于car-t编辑的靶标。图28b显示使用碱基编辑器进行沉默的两个策略:用cbe创建终止密码子和用cbe中断剪接。[0494]图29是例示性漫画表示,在一些情况下,解决aml中的克隆性需要多种car-t。[0495]图30是例示性漫画表示,在一些情况下,消除t-allcar-t组合的同类相杀需要多重编辑。[0496]图31a和图31b例示性说明测试对于t-all的四种同时碱基编辑的实验的结果;与核酸酶相比,car-t不影响产率。图31a例示性说明用于以下情况的四处t-all编辑竞赛中的理论产率:无电穿孔(无ep;深色圆圈)、仅ep(深色方块)、cbe变体1(浅色、正三角)、cbe变体2(浅色、倒三角)和cas9(浅色菱形)。图31b例示性说明电穿孔后的细胞存活率。对于在24小时(hr)、48hr、72hr、96hr和168hr的每一组结果,结果从右至左显示为无ep、仅ep、cbe变体1、cbe变体2和cas9。[0497]图32例示性说明超过90%的四处敲除是由be4造成的。电穿孔以5m细胞规模执行,并且四重编辑在单个电穿孔(ep)步骤中进行。对于全部4个靶标,使用rbe4均实现了大于90%的编辑效率。对于每个结果组,数据从左至右为:pd1、cd7、trac和cd52。[0498]图33例示性说明碱基编辑未造成细胞产率的差异。数据为:无p(圆圈)、仅ep(方块)、rbe4(三角形)、ppbe4(倒三角)和cas9(菱形)。[0499]图34例示性说明经编辑的car-t靶向模型肿瘤细胞上的cd3和cd7。数据为:utd1:1(圆圈)、7car81:1(方块)和3car21:1(三角)。[0500]图35是用于靶向t-al肿瘤细胞的示例性cd7car-t细胞的示意图。[0501]图36是流程图,描述用于治疗具有cd7car-t细胞的患者的临床方案。[0502]图37a至图37c描述cd7car-t细胞生产。图37a是流程图,描述用于生产tall017异源融化的cd7car-t细胞的方案。图37b是流程图,描述用于生产tall083cd7car-t细胞的方案。图37c是荧光辅助细胞分选数据的散点图,表明tall017car-t细胞在融化后被高度激活。[0503]图38是描述通过下一代测序(ngs)测得的tall017和tall038cd7car-t细胞中的总编辑数的图。[0504]图39a和图39b描述在融化后24小时,tall017和tall038cd7car-t细胞中的tcrα/β、cd7和cd52的表达。图39a是tall017和tall038cd7car-t细胞的荧光辅助细胞分选数据的散点图。图39b是描述经由facs测得的残余蛋白质表达的图。[0505]图40描述用于身份组的选通方案。[0506]图41是描述作为cd2+/-与cd56+/-细胞的混合物的最终细胞产物身份的图。[0507]图42是描述融化后24小时和48小时的cd7car-t细胞表达。[0508]图43包括多张图,其描述在融化后,tall038cd7car-t细胞中的cd25表达比tall017cd7car-t细胞中低。[0509]图44是流程图,描述用于体外表征的基于cd7car-t珠的效力方案。[0510]图45a和图45b描述tall038cd7car-t细胞应答cd7抗原而释放ifnγ、tnfα和il-2。图45a是描述tall038cd7car-t细胞释放ifnγ的图。图45b是描述tall038cd7car-t细胞释放tnfα、il-10和il-2的图。[0511]图46是示意图,描述用于测量肿瘤细胞的car导向t细胞杀死的共培养方案。[0512]图47a和图47b描述,与tall017cart相比,tall038cd7car-t细胞在再次挑战时表现出增加的ccrf。图47a是描述主要挑战的图。图47b是描述次要挑战的图。[0513]图48是描述在ccrf移植后第10天/cd7car-t治疗第-1天的生物发光辐射数据(均值,sem)的图。总通量在线性尺度上测量。[0514]图49a和图49b描述在ccrf移植后第19天/cd7car-t治疗后第8天的生物发光辐射数据(均值,sem)。图49a是描述平均肿瘤负担的图。总通量在线性尺度上测量。图49b是描述平均小鼠重量的图。[0515]图50a和图50b描述在ccrf移植后第38天/cd7car-t治疗后第27天的生物发光辐射数据(均值,sem)。图50a是描述平均肿瘤负担的图。总通量在线性尺度上测量。图50b是描述平均肿瘤负担的图。总通量在对数尺度上测量。[0516]图51a和图51b描述在ccrf移植后第38天/cd7car-t治疗后第27天的生物发光辐射数据(个体小鼠)。图51a是描述平均肿瘤负担的图。总通量在线性尺度上测量。图51b是描述平均肿瘤负担的图。总通量在对数尺度上测量。[0517]图52a和图52b描述在ccrf移植后第38天/cd7car-t治疗后第27天的生物发光辐射数据(个体小鼠)。图52a包括描述平均肿瘤负担的图。总通量在线性尺度(上图)上和对数尺度(下)上测量。图52b包括描述平均肿瘤负担的图。总通量在线性尺度(上图)上和对数尺度(下)上测量。[0518]图53是描述cd5grna候选物的编辑效率的图。[0519]图54是描述经由cd5grna候选物g103和g104与be4组合的ngs取得的编辑效率的图。[0520]图55是描述示例性cd5car构建体的生产的示意图。[0521]图56是描述来自使用cd5grna候选物g103和g104进行的慢病毒载体(lvv)筛选的car表达的图。[0522]图57是描述基于铰链序列的carlvv表达的图。[0523]图58a至图58d是描述在活体成像细胞杀死测定中,经编辑的和未经编辑的构建体对于cd5+ccrf是完全细胞毒性的图。[0524]图59a和图59b描述使用sgrna103或sgrna104在cd5+ccrf-cem白血病细胞系的存在下通过cd5carlvv构建体生产细胞因子(ifnγ)的图。图59a(左)是描述以使用sgrna103编辑过的经cd5carlvv(lv63-69)转导的t细胞单独地或与ccrf细胞组合地生产ifnγ的图。图59a(右)是描述以使用sgrna104编辑的经cd5carlvv(lv63-69)转导的t细胞单独地或与ccrf细胞组合地生产ifnγ的图。图59a(下)是描述使用未经编辑的经cd5carlvv(lv63-69)转导的t细胞或ccrf细胞生产ifnγ的图。图59b(上)是描述以未经编辑的或使用sgrna103或104编辑过的经cd5carlvv(lv63-69)转导的t细胞单独地生产ifnγ的图。图59b(下)是描述以未经编辑的或使用sgrna103或104编辑过的经cd5carlvv(lv63-69)转导的ccrf细胞生产ifnγ的图。具体实施方式[0525]本发明提出经基因修饰的免疫细胞,所述免疫细胞具有增强的抗瘤形成活性、抗免疫抑制性和降低的引起移植物抗宿主反应或宿主抗移植物反应的风险,或其组合物。本发明还提出用于生产和使用这些经修饰的免疫效应细胞(例如,免疫效应细胞,诸如t细胞)的方法。[0526]在一种实施方案中,向患有移植物抗宿主疾病(gvhd)或具有发展出gvhd倾向的受试者给药car-t细胞,该细胞缺乏或具有降低水平的功能性trac。在一种实施方案中,向患有宿主抗移植物疾病(hvgd)或具有发展出hvgd倾向的受试者给药car-t细胞,该细胞缺乏或具有降低水平的β2微球蛋白(b2m)。[0527]使用如本文所述的包含胞苷脱氨酶或腺苷脱氨酶的碱基编辑器系统来实施对免疫效应细胞的修饰以表达嵌合抗原受体以及敲除或敲低特异性基因,从而减少其表达可能对免疫细胞功能造成的负面影响。[0528]自体的、患者来源的嵌合抗原受体-t细胞(car-t)疗法已经在治疗一些血液学癌症中显示了显著的疗效。虽然这些产物已经导致患者的显著临床受益,但对于生成个性化疗法的需求带来了巨大的制造挑战和经济负担。同种异体基因car-t疗法是为应对这些挑战而开发的潜在解决方案,具有与自体产品类似的临床功效,同时治疗很多具有源自单个健康供体的患者,从而实质性地降低商品成本和批次间的差异。[0529]大多数第一代同种异体基因car-t使用核酸酶将两个或更多个被靶向的基因组dna双链断裂(dsb)引入靶标t细胞群体中,依靠易错的dna修复来生成突变,这些突变以半随机模式敲除靶标基因。此类基于核酸酶的基因敲除策略辅助降低car-t的移植物抗宿主疾病和宿主排异的风险。然而,同时引入多个dsb导致最终细胞产物含有大量基因组重排诸如经平衡和未经平衡的易位,和相对高峰度的局部重排(包括倒位和大的缺失)。再者,随着通过所引入的dsb作出的同时基因修饰数量增加,在经处理的细胞群中观察到可观的基因毒性。这有可能显著降低每次生产过程中的细胞扩张潜能,从而减少每个健康供体可接受治疗的患者数量。[0530]碱基编辑器(be)是一类新兴基因编辑试剂,其能够高效地、用户定义地修饰靶标基因组dna而不产生dsb。本文中,通过使用碱基编辑技术来减少或消除可检测的基因组重排并同时还改善细胞扩张,提出了一种生产同种异体car-t细胞的方法。如本文所示,与仅使用核酸酶的编辑策略相反,通过碱基编辑来同时修饰一个或多个(例如,一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个基因的基因座产生高效基因敲除而没有可检测的易位事件。[0531]在一些实施方案中,使用本文提供的碱基编辑组合物和方法修饰免疫细胞内的至少一个或多个基因或其调节元件。在一些实施方案中,至少一个或多个基因或其调节元件选自acat1、acly、adora2a、axl、b2m、batf、bcl2l11、btla、camk2d、camp、casp8、cblb、ccr5、cd2、cd3d、cd3e、cd3g、cd4、cd5、cd7、cd8a、cd33、cd38、cd52、cd70、cd82、cd86、cd96、cd123、cd160、cd244、cd276、cdk8、cdkn1b、chi3l1、ciita、cish、csf2csk、ctla-4、cul3、cyp11a1、dck、dgka、dgkz、dhx37、elob(tceb2)、entpd1(cd39)、fadd、fas、gata3、il6、il6r、il10、il10ra、irf4、irf8、junb、lag3、、lair-1(cd305)、ldha、lif、lyn、map4k4、mapk14、mcj、mef2d、mgat5、nr4a1、nr4a2、nr4a3、nt5e(cd73)、odc1、otulinl(fam105a)、pag1、pdcd1、pdia3、phd1(egln2)、phd2(egln1)、phd3(egln3)、pik3cd、pikfyve、ppara、ppard、prdmi1、prkaca、pten、ptpn2、ptpn6、ptpn11、pvrig(cd112r)、rasa2、rfxank、selpg/psgl1、siglec15、sla、slamf7、socs1、spry1、spry2、stk4、suv39、h1tet2、tgfbrii、tigit、tim-3、tmem222、tnfaip3、tnfrsf8(cd30)、tnfrsf10b、tox、tox2、、trac、trbc1、trbc2、ubash3a、vhl、vista、xbp1、yap1和zc3h12a。在一些实施方案中,至少一个或多个基因或其调节元件选自cd3、cd5、cd7、cd33、cd123、trac、lag-3、fas、cd52、trbc1、trbc2、b2m、以及ciita和pd-1。在一些实施方案中,经修饰的免疫细胞包含在cd5和选自trac、lag-3、fas、cd52、trbc1、trbc2、b2m、以及ciita和pd-1的至少一个或多个基因或其调节元件中的修饰。在一些实施方案中,经修饰的免疫细胞包含在cd7和选自trac、lag-3、fas、cd52、trbc1、trbc2、b2m、以及ciita和pd-1的至少一个或多个基因或其调节元件中的修饰。在一些实施方案中,经修饰的免疫细胞包含在cd33和选自trac、lag-3、fas、cd52、trbc1、trbc2、b2m、以及ciita和pd-1的至少一个或多个基因或其调节元件中的修饰。在一些实施方案中,经修饰的免疫细胞包含在cd3和选自trac、lag-3、fas、cd52、trbc1、trbc2、b2m、以及ciita和pd-1的至少一个或多个基因或其调节元件中的修饰。在一些实施方案中,经修饰的免疫细胞包含在cd123和选自trac、lag-3、fas、cd52、trbc1、trbc2、b2m、以及ciita和pd-1的至少一个或多个基因或其调节元件中的修饰。基因的多重编辑可用于创建具有改善的治疗特性的car-t细胞疗法。该方法解决了经多重编辑t细胞产品的已知限制并且是朝着下一代精确细胞疗法的有前景的发展。[0532]一方面,本发明提供一种通用car-t细胞。在一些实施方案中,本文所述的car-t细胞是同种异体细胞。在一些实施方案中,通用car-t细胞是同种异体t细胞,其可用来表达所希望的car,并且可以普遍适用,无论捐赠者和接受者的免疫原性兼容性如何。同种异体免疫细胞可以源自一个或多个供体。在某些实施方案中,同种异体免疫细胞源自单个人类供体。例如,同种异体t细胞可以源自单个健康人类供体的pbmc。在某些实施方案中,同种异体免疫细胞源自多个人类供体。在一些实施方案中,如本文所述,通用car-t细胞可以通过以下生成:使用基因修饰将同步修饰引入多个基因座中,例如,三个、四个、五个、六个、七个、八个、九个、十个或更多个基因座中。如本文所述的修饰或同步修饰可以是通过碱基编辑器生成的基因编辑,诸如碱基编辑。碱基编辑器可以c碱基编辑器或a碱基编辑器。如本文所讨论,碱基编辑可用来实现基因中断,使得该基因不被表达。通过碱基编辑进行的修饰可用来实现基因表达的减少。在一些实施方案中,碱基编辑器可用来引入基因修饰,使得经编辑的基因不生成机构是或功能上可行的蛋白质产物。在一些实施方案中,修饰,诸如本文所述的同步修饰,可包含基因编辑,诸如碱基编辑,使得该基因产物的表达或功能性被以任何方式改变。例如,基因产物的表达可以相较于基线表达水平增强或上调。在一些实施方案中,基因产物的活性或功能性可以作为碱基编辑或协同作用的多个碱基编辑事件的结果而上调。[0533]在一些实施方案中,通用car-t细胞的生成可能比自体t细胞(car-t)有利,后者可能难以生成以供急用。与自体细胞制剂相比,同种异体方法更适合于与工程化改造自体t细胞表达car的不确定性相关的许多情况,并最终在医疗紧急情况下获得移植所需的细胞产物。然而,对于同种异体t细胞或“成品”t细胞,重要的是小心地穿越宿主对car-t细胞的反应性(hvgd)以及同种异体t细胞对于宿主细胞的潜在敌意(gvhd)。在这种设想下,碱基编辑可以成功地用来生成多个同时基因编辑事件,使得(a)可能减少或下调抗原的表达以生成同类相杀抗性免疫细胞;(b)可能生成平台细胞类型,其完全没有或表达少量的内源性t细胞受体,例如,tcrα链(诸如经由trac的碱基编辑),或tcrβ链(诸如通过trbc1/trbc2的碱基编辑);和/或(c)可减少或下调可能与宿主组织系统不相容的抗原的表达,且反之亦然。[0534]在一些实施方案中,本文所述的方法可用来生成表达car-t的自体t细胞。在一些实施方案中,可以在单个电穿孔事件中实施多个碱基编辑事件,从而减少电穿孔事件相关毒性。任何用于将外源性遗传物质并入细胞内的已知方法都可以用来替换电穿孔,且因此设想将本领域中已知的此类方法用于任何本文所述方法中。[0535]在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd2并且表达cd2共刺激结构域的cd2嵌合抗原受体。在一些实施方案中,给药至受试者的经cd2修饰的免疫细胞在一个或多个基因或其调节元件(例如,cd52、trac、pd-1)中用本文所提供的碱基编辑组合物和方法进一步修饰。[0536]如本文所示,碱基编辑与car插入的组合是用于生成具有最低限度基因组重排的同类相杀抗性同种异体t细胞的可用策略。基因的多重编辑也可用于创建具有改善的治疗特性的car-t细胞疗法。该方法解决了car-t疗法的已知限制并且是朝着下一代精确细胞疗法的有前景的发展。[0537]在一个实验中,碱基编辑器be4展示了对t细胞中的三种细胞表面靶标(trac、b2m和pd-1)的高效多重碱基编辑,在一次电穿孔中分别敲除95%、95%和88%的基因表达,以生成具有高百分比的b2m和cd3蛋白表达降低的细胞的细胞群。编辑这些基因中的每一种可用于创建具有改善的治疗特性的car-t细胞疗法。这些基因中的每一种可以通过单一靶向的碱基变化(c到t)沉默而不产生双链断裂。因此,经be4处理的细胞也未显示任何可测量的易位(大规模基因组重排),而用核酸酶进行相同三重编辑的细胞确实显示出可检测的基因组重排。[0538]因此,将基于核酸酶的trac基因敲除与同时进行的两个额外基因的be介导敲除偶合,产生具有最低限度基因组重排的同种异体基因t细胞群,从而能够在trac基因座有针对性地插入car转基因。综上所述,这表明,与单独使用核酸酶的方法相比,单独使用碱基编辑或与单一核酸酶敲除和car插入相结合是一种有用的策略,可以产生具有最低限度基因组重排的同种异体t细胞。该方法解决了经多重编辑t细胞产品的已知限制并且是朝着下一代精确细胞疗法的有前景的发展。[0539]嵌合抗原受体和car-t细胞[0540]本发明提供使用本文所述的核碱基编辑器修饰的免疫细胞,其表达嵌合抗原受体(car)。修饰免疫细胞以表达嵌合抗原受体可增强免疫细胞的免疫反应活性,其中嵌合抗原受体具有对抗原上的表位的亲和性,其中抗原与经改变的生物体适应性相关。例如,嵌合抗原受体可具有对于在肿瘤细胞中表达的蛋白质上的表位的亲和性。因为car-t细胞可以独立于主要组织相容性复合体(mhc)发挥作用,激活的car-t细胞可以杀死表达抗原的肿瘤细胞。car-t细胞的直接作用避开了肿瘤细胞防御机制,这些机制是作为对mhc向免疫细胞呈递抗原的应答而进化的。[0541]在一些实施方案中,本发明提供表达嵌合抗原受体的免疫效应细胞,该嵌合抗原受体靶向牵涉入自体免疫应答的b细胞(例如,受试者的表达针对受试者自身组织生成的抗体的b细胞)。[0542]一些实施方案包含自体免疫细胞免疫疗法,其中免疫细胞获自具有以表达表面标志物的癌性或其他经改变的细胞为特征的疾病或经改变的适应性的受试者。所获免疫细胞经基因修饰以表达嵌合抗原受体并针对特异性抗原而有效地重新定向。因此,在一些实施方案中,免疫细胞获自需要car-t免疫疗法的受试者。在一些实施方案中,在从受试者获得这些自体免疫细胞后,这些细胞在短时间内经培养和修饰。在其他实施方案中,获得自体细胞并随后储存以供进一步使用。这种做法可能适用于将来可能会经历将会减少免疫细胞计数的平行治疗的个体。在同种异体免疫细胞免疫疗法中,免疫细胞可以从将会接受治疗的受试者以外的供体获得。在一些实施方案中,免疫细胞从健康受试者或供体获得,并且经基因修饰以表达嵌合抗原受体并且针对特异性抗原而有效地重新定向。免疫细胞在经修饰以表达嵌合抗原受体后被给药至受试者,以用于治疗瘤形成(例如,白血病)。在一些实施方案中,待修饰以表达嵌合抗原受体的免疫细胞可以从现有的储备免疫细胞培养物获得。[0543]免疫细胞和/或免疫效应细胞可以从使用本领域中已知的标准技术从受试者或供体收集的样品分离或纯化。例如,免疫效应细胞可以通过裂解红细胞并通过离心去除外周单核血细胞而从全血样品分离或纯化。免疫效应细胞可以使用选择性纯化方法进一步分离或纯化,该方法基于细胞特异性标志物诸如cd25、cd3、cd4、cd8、cd28、cd45ra或cd45ro来分离免疫效应细胞。在一种实施方案中,cd25+用作标志物来选择调节性t细胞。在一种实施方案中,cd4+用作标志物来选择t细胞。在一种实施方案中,cd8+用作标志物来选择t细胞。在一种实施方案中,cd4+和cd8+用作标志物来选择t细胞。在一种实施方案中,cd4+和cd25+用作标志物来选择t细胞。[0544]在其他实施方案中,本发明提供在tcr恒定区(trac)处具有靶向基因敲除的t细胞,其负责tcrαβ表面表达。tcrαβ缺陷性cart细胞与同种异体免疫疗法相容(qasim等人,sci.transl.med.9,eaaj2013(2017);valton等人,molther.2015sep;23(9):1507–1518)。若需要,使用clinimacs磁珠耗尽去除残余tcrαβt细胞,从而最小化gvhd风险。在另一实施方案中,本发明提供了供体t细胞,其经间接体内选择以识别表达在接纳者造血细胞上的最小组织相容性抗原,从而最小化移植物抗宿主疾病(gvhd)的风险,而gvhd是移植后发病率和死亡率的主要原因(warren等人,blood2010;115(19):3869-3878)。用于分离或纯化免疫效应细胞的另一技术是流式细胞术。在荧光激活细胞分选中,使用对于免疫效应细胞标志物具有亲和性的经荧光标记的抗体来标记样品中的免疫效应细胞。使用适用于表达该标志物的细胞的选通策略来隔离细胞。例如,可以通过使用例如对免疫效应细胞标志物(例如,cd4、cd8、cd28、cd45)具有特异性的经荧光标记的抗体和对应选通策略将t细胞与样品中的其他细胞分离。在一种实施方案中,采用cd45选通策略。在一些实施方案中,采用一种用于其他对于免疫效应细胞为特异性的选通策略来代替cd45选通策略或与其组合。在一种实施方案中,采用cd4选通策略。在一种实施方案中,采用cd8选通策略。在一种实施方案中,采用cd25选通策略。在一种实施方案中,采用cd4和cd8选通策略。在一种实施方案中,采用cd4和cd26选通策略。在一些实施方案中,采用一种用于其他对于免疫效应细胞为特异性的选通策略来代替cd4、cd25和/或cd8选通策略或与其组合。在一些实施方案中,采用图40中提供的选通策略。[0545]本发明预期的免疫效应细胞是效应t细胞。在一些实施方案中,效应子t细胞是天然cd8+t细胞、细胞毒t细胞、天然杀手t(nkt)细胞、天然杀手(nk)细胞或调节性t(treg)细胞。在一些实施方案中,效应子t细胞是胸腺细胞、不成熟的t淋巴细胞、成熟的t淋巴细胞、静息t淋巴细胞或激活的t淋巴细胞。在一些实施方案中,免疫效应细胞是cd4+cd8+t细胞或cd4-cd8-t细胞。在一些实施方案中,免疫效应细胞是t辅助细胞。在一些实施方案中,t辅助细胞是t辅助1(th1)、t辅助2(th2)细胞或表达cd4的辅助t细胞(cd4+t细胞)。在一些实施方案中,免疫效应细胞是效应子nk细胞。在一些实施方案中,免疫效应细胞是其他t细胞亚群。经修饰的免疫效应细胞除了表达嵌合抗原受体之外,还可以表达外源性细胞因子、不同的嵌合受体或将会增强免疫效应细胞信号传导或功能的任何其他药剂。例如,嵌合抗原受体和细胞因子的共表达可增强car-t细胞裂解靶标细胞的能力。[0546]本发明预期的嵌合抗原受体包含细胞外结构域、跨膜结构域和细胞内结构域。抗原结合至细胞外结合结构域可激活car-t细胞并生成效应子应答,该效应子应答包括car-t细胞增殖、细胞因子生产和其他导致抗原表达细胞死亡的过程。在本发明的一些实施方案中,嵌合抗原受体进一步包含连接子。在一些实施方案中,连接子是(ggggs)n连接子。在一些实施方案中,连接子是(ggggs)3连接子。在一些实施方案中,本发明的car包括前导肽序列(例如,抗原结合结构域的n端)。示例性前导肽氨基酸序列是:metdtlllwvlllwvpgstg。[0547]本文预期的嵌合抗原受体的细胞外结合结构域包含抗体或其抗原结合片段的氨基酸序列,其具有对于特异性抗原的亲和性。在各种实施方案中,car特异性地结合5t4。示例性抗5t4car包括但不限于cart-5t4(oxfordbiomedicaplc)和ucart-5t4(cellectissa)。[0548]在各种实施方案中,car特异性地结合甲胎蛋白。示例性抗甲胎蛋白car包括但不限于et-1402(eurekatherapeuticsinc)。[0549]在各种实施方案中,car特异性地结合ax1。示例性抗axlcar包括但不限于cct-301-38(f1oncologyinc)。[0550]在各种实施方案中,car特异性地结合b7h6。示例性抗b7h6car包括但不限于cyad-04(celyadsa)。[0551]在各种实施方案中,car特异性地结合bcma。示例性抗bcmacar包括但不限于actr-087+sea-bcma(seattlegeneticsinc)、allo-715(cellectissa)、ari-0002(institutd'investigacionsbiomediquesaugustpiisunyer)、bb-2121(bluebirdbioinc)、bb-21217(bluebirdbioinc)、cart-bcma(universityofpennsylvania)、ct-053(carsgentherapeuticsltd)、descartes-08(cartesiantherapeutics)、fcarh-143(junotherapeuticsinc)、ictcar-032(innovativecellulartherapeuticscoltd)、im21cart(beijingimmunochinamedicalscience&technologycoltd)、jcarh-125(memorialsloan-ketteringcancercenter)、kite-585(kitepharmainc)、lcar-b38m(nanjinglegendbiotechcoltd)、lcar-b4822m(nanjinglegendbiotechcoltd)、mcarh-171(memorialsloan-ketteringcancercenter)、p-bcma-101(poseidatherapeuticsinc)、p-bcma-allo1(poseidatherapeuticsinc)、spcart-269(shanghaiunicar-therapybio-medicinetechnologycoltd)和bcma02/bb2121(bluebirdbioinc)。bcma02/bb2121car的多肽序列提供如下:[0552]malpvtalllplalllhaarpdivltqsppslamslgkratiscrasesvtilgshlihwyqqkpgqpptlliqlasnvqtgvparfsgsgsrtdftltidpveeddvavyyclqsrtiprtfgggtkleikgstsgsgkpgsgegstkgqiqlvqsgpelkkpgetvkisckasgytftdysinwvkrapgkglkwmgwintetrepayaydfrgrfafsletsastaylqinnlkyedtatyfcaldysyamdywgqgtsvtvssaaatttpaprpptpaptiasqplslrpeacrpaaggavhtrgldfacdiyiwaplagtcgvlllslvitlyckrgrkkllyifkqpfmrpvqttqeedgcscrfpeeeeggcelrvkfsrsadapayqqgqnqlynelnlgrreeydvldkrrgrdpemggkprrknpqeglynelqkdkmaeayseigmkgerrrgkghdglyqglstatkdtydalhmqalppr[0553]在各种实施方案中,car特异性地结合cck2r。示例性抗cck2rcar包括但不限于抗cck2rcar-t衔接子分子(cam)+抗fitccart细胞疗法(癌症)、endocyte/purdue(purdueuniversity)。[0554]在各种实施方案中,car特异性地结合cd抗原。示例性抗cd抗原car包括但不限于vm-802(viromedcoltd)。[0555]在各种实施方案中,car特异性地结合cd123。示例性抗cd123car包括但不限于mb-102(fortressbiotechinc)、rnacart123(universityofpennsylvania)、sfg–imc-cd123ζ(bellicumpharmaceuticalsinc)和ucart-123(cellectissa)。[0556]在各种实施方案中,car特异性地结合cd133。示例性抗cd133car包括但不限于kd-030(nanjingkaedibiotechinc)。[0557]在各种实施方案中,car特异性地结合cd138。示例性抗cd138car包括但不限于atlcar.cd138(unclinebergercomprehensivecancercenter)和cart-138中(中国人民解放军总医院)。[0558]在各种实施方案中,car特异性地结合cd171。示例性抗cd171car包括但不限于jcar-023(junotherapeuticsinc)。[0559]在各种实施方案中,car特异性地结合cd19。示例性抗cd19car包括但不限于1928z-41bbl(memorialsloan-ketteringcancercenter)、1928z-e27(memorialsloan-ketteringcancercenter)、19-28z-t2(广州生物医药与健康研究院)、4g7-card(universitycollegelondon)、4scar19(深圳市免疫基因治疗研究院)、allo-501(pfizerinc)、ata-190(qimrberghofermedicalresearchinstitute)、auto-1(universitycollegelondon)、ava-008(avactaltd)、axicabtageneciloleucel(kitepharmainc)、bg-t19(广州生物基因科技有限公司)、bind-19(shenzhenbindebioltd.)、bpx-401(bellicumpharmaceuticalsinc)、car19h28tm41bbz(westmeadinstituteformedicalresearch)、c-car-011(中国人民解放军总医院)、cd19cart(innovativecellulartherapeuticscoltd)、cik-car.cd19(formulapharmaceuticalsinc)、clic-1901(ottawahospitalresearchinstitute)、csg-cd19(carsgentherapeuticsltd)、ctl-119(universityofpennsylvania)、ctx-101(crisprtherapeuticsag)、dscar-01(shanghaihrainbiotechnology)、et-190(eurekatherapeuticsinc)、ft-819(memorialsloan-ketteringcancercenter)、icar-19(immunecelltherapyinc)、im19car-t(beijingimmunochinamedicalscience&technologycoltd)、jcar-014(junotherapeuticsinc)、jwcar-029(mingjutherapeutics(shanghai)co.、ltd)、kd-c-19(nanjingkaedibiotechinc)、lincart19(icellgenetherapeutics)、lisocabtagenemaraleucel(junotherapeuticsinc)、matchcart(shanghaihrainbiotechnology)、mb-cart19.1(上海儿童医学中心(shanghaichildren'smedicalcenter))、pbcar-0191(precisionbiosciencesinc)、pcar-019(persongenbiomedicine(suzhou)coltd)、pcar-19b(重庆精密生物科技有限公司)、pz-01(pinzelifetechnologycoltd)、rb-1916(refugebiotechnologiesinc)、sklb-083019(成都银河生物医药有限公司)、spcart-19(上海优康生物医药科技有限公司)、tbi-1501(takarabioinc)、tc-110(tcr2therapeuticsinc)、ti-1007(timmunebiotechinc)、tisagenlecleucel(abramsoncancercenteroftheuniversityofpennsylvania)、u-cart(shanghaibioraylaboratoryinc)、ucart-19(wugeninc)、ucart-19(cellectissa)、vadacabtageneleraleucel(memorialsloan-ketteringcancercenter)、xlcart-001(nanjingmedicaluniversity)、和yinnuokati-19(深圳市创新免疫科技有限公司)。[0560]在各种实施方案中,car特异性地结合cd2。示例性抗cd2car包括但不限于ucart-2(wugeninc)。[0561]在各种实施方案中,car特异性地结合cd20。示例性抗cd20car包括但不限于actr-087(nationaluniversityofsingapore)、actr-707(unumtherapeuticsinc),cbm-c20.1(中国人民解放军总医院)、mb-106(fredhutchinsoncancerresearchcenter)和mb-cart20.1(miltenyibiotecgmbh)。[0562]在各种实施方案中,car特异性地结合cd22。示例性抗cd22car包括但不限于抗cd22cart细胞疗法(b细胞急性成淋巴细胞性白血病)、宾夕法尼亚大学(universityofpennsylvania)、cd22-cart(上海优康生物医药科技有限公司)、jcar-018(opusbioinc)、mendcart(shanghaihrainbiotechnology)和ucart-22(cellectissa)。[0563]在各种实施方案中,car特异性地结合cd30。示例性抗cd30car包括但不限于atlcar.cd30(unclinebergercomprehensivecancercenter)、cbm-c30.1(中国人民解放军总医院)和hu30-cd28zeta(nationalcancerinstitute)。[0564]在各种实施方案中,car特异性地结合cd33。示例性抗cd33car包括但不限于抗cd33carγδt细胞疗法(急性骨髓性白血病)、tcbiopharm/伦敦学院大学(universitycollegelondon),car33vh(opusbioinc)、cart-33(中国人民解放军总医院)、cik-car.cd33(formulapharmaceuticalsinc)、ucart-33(cellectissa)和vor-33(columbiauniversity)。[0565]在各种实施方案中,car特异性地结合cd38。示例性抗cd38car包括但不限于ucart-38(cellectissa)。[0566]在各种实施方案中,car特异性地结合cd38a2。示例性抗cd38a2car包括但不限于t-007(tnktherapeuticsinc)。[0567]在各种实施方案中,car特异性地结合cd4。示例性抗cd4car包括但不限于cd4car(icellgenetherapeutics)。[0568]在各种实施方案中,car特异性地结合cd44。示例性抗cd44car包括但不限于car-cd44v6(istitutoscientificohsanraffaele)。[0569]在各种实施方案中,car特异性地结合cd5。示例性抗cd5car包括但不限于cd5car(icellgenetherapeutics)。示例性cd5car核酸序列提供如下:[0570]》5car-ch3-cd28tm-cd28-cd3z[0571][0572][0573]》5car-cd8ah-cd28tm-cd28-cd3z[0574][0575]》5car-cd28h-cd28tm-cd28-cd3z[0576][0577][0578]》5car-ch3-cd8atm-41bb-cd3z[0579][0580]》5car-cd8ah-cd8atm-41bb-cd3z[0581][0582][0583]在各种实施方案中,car特异性地结合cd7。示例性抗cd7car包括但不限于car-pnk(persongenbiomedicine(suzhou)coltd)和cd7.car/28ζcart细胞(baylorcollegeofmedicine)、ucart7(washingtonuniversityinstlouis)。世袭cd7car氨基酸序列如下:[0584]》7car8[0585][0586]在各种实施方案中,car特异性地结合cdh17。示例性抗cdh17car包括但不限于arb-001.t(arbeleltd)。[0587]在各种实施方案中,car特异性地结合cea。示例性抗ceacar包括但不限于horc-020(humorigininc)。[0588]在各种实施方案中,car特异性地结合嵌合tgf-β受体(ctbr)。示例性抗嵌合tgf-β受体(ctbr)car包括但不限于car-ctbrt细胞(bluebirdbioinc)。[0589]在各种实施方案中,car特异性地结合claudin18.2。示例性抗claudin18.2car包括但不限于car-cld18t细胞(carsgentherapeuticsltd)和kd-022(nanjingkaedibiotechinc)。medicine)、ic9-gd2-car-il-15t细胞(unclinebergercomprehensivecancercenter)和ikt-703(icellkealextherapeutics)。[0606]在各种实施方案中,car特异性地结合gd2和muc1。示例性抗gd2/muc1car包括但不限于psmacar-t(universityofpennsylvania)。[0607]在各种实施方案中,car特异性地结合gpc3。示例性抗gpc3car包括但不限于arb-002.t(arbeleltd)、csg-gpc3(carsgentherapeuticsltd)、glycar(baylorcollegeofmedicine)和tt-14(tessatherapeuticspteltd)。[0608]在各种实施方案中,car特异性地结合her2。示例性抗her2car包括但不限于actr-087+曲妥珠单抗(unumtherapeuticsinc)、actr-707+曲妥珠单抗(unumtherapeuticsinc)、cidecar(bellicumpharmaceuticalsinc)、mb-103(mustangbioinc)、rb-h21(refugebiotechnologiesinc)和tt-16(baylorcollegeofmedicine)。[0609]在各种实施方案中,car特异性地结合il13r。示例性抗il13rcar包括但不限于mb-101(cityofhope)和yyb-103(yooyoungpharmaceuticalscoltd)。[0610]在各种实施方案中,car特异性地结合整合素β-7。示例性抗整合素β-7car包括但不限于mmg49cart细胞疗法(osakauniversity)。[0611]在各种实施方案中,car特异性地结合lc抗原。示例性抗lc抗原car包括但不限于vm-803(viromedcoltd)和vm-804(viromedcoltd)。[0612]在各种实施方案中,car特异性地结合间皮素。示例性抗间皮素car包括但不限于carma-hmeso(johnshopkinsuniversity)、csg-meso(carsgentherapeuticsltd)、icasp9m28z(memorialsloan-ketteringcancercenter)、kd-021(nanjingkaedibiotechinc)、m-28z-t2(guangzhouinstitutesofbiomedicineandhealth)、mesocart(universityofpennsylvania)、meso-car-t+pd-78(mirimmunellc),rb-m1(refugebiotechnologiesinc)和tc-210(tcr2therapeuticsinc)。[0613]在各种实施方案中,car特异性地结合muc1。示例性抗muc1car包括但不限于anti-muc1cart-celltherapy+pd-1knockouttcelltherapy(esophagealcancer/nsclc)、guangzhouanjiebiomedicaltechnology/universityoftechnologysydney(guangzhouanjiebiomedicaltechnologycoltd)、ictcar-043(innovativecellulartherapeuticscoltd)、ictcar-046(innovativecellulartherapeuticscoltd)、p-muc1c-101(poseidatherapeuticsinc)和tab-28z(oncotabinc)。[0614]在各种实施方案中,car特异性地结合muc16。示例性抗muc16car包括但不限于4h1128z-e27(eurekatherapeuticsinc)和jcar-020(memorialsloan-ketteringcancercenter)。[0615]在各种实施方案中,car特异性地结合nfp2x7。示例性抗nfp2x7car包括但不限于bil-022c(biosceptreinternationalltd)。[0616]在各种实施方案中,car特异性地结合psca。示例性抗pscacar包括但不限于bpx-601(bellicumpharmaceuticalsinc)。[0617]在各种实施方案中,car特异性地结合psma。cik-car.psma(formulapharmaceuticalsinc)和p-psma-101(poseidatherapeuticsinc)。[0618]在各种实施方案中,car特异性地结合ror1。示例性抗ror1car包括但不限于jcar-024(fredhutchinsoncancerresearchcenter)。[0619]在各种实施方案中,car特异性地结合ror2。示例性抗ror2car包括但不限于cct-301-59(f1oncologyinc)。[0620]在各种实施方案中,car特异性地结合slamf7。示例性抗slamf7car包括但不限于ucart-cs1(cellectissa)。[0621]在各种实施方案中,car特异性地结合trbc1。示例性抗trbc1car包括但不限于auto-4(autolustherapeuticslimited)。[0622]在各种实施方案中,car特异性地结合trbc2。示例性抗trbc2car包括但不限于auto-5(autolustherapeuticslimited)。[0623]在各种实施方案中,car特异性地结合tshr。示例性抗tshrcar包括但不限于ictcat-023(innovativecellulartherapeuticscoltd)。[0624]在各种实施方案中,car特异性地结合vegfr-1。示例性抗vegfr-1car包括但不限于sklb-083017(sichuanuniversity)。[0625]在各种实施方案中,car是at-101(abcloninc);au-101、au-105和au-180(aurorabiopharmainc);carma-0508(carismatherapeutics);car-t(fatetherapeuticsinc);car-t(celldesignlabsinc);cm-cx1(celdaramedicalllc);cmd-502、cmd-503和cmd-504(baylorcollegeofmedicine);csg-002和csg-005(carsgentherapeuticsltd);et-1501、et-1502和et-1504(eurekatherapeuticsinc);ft-61314(fatetherapeuticsinc);gb-7001(shanghaigenechemcoltd);ima-201(immaticsbiotechnologiesgmbh);imm-005和imm-039(immunomeinc);immunicar(tcbiopharmltd);nt-0004和nt-0009(biontechcell和genetherapiesgmbh)、ogd-203(ogd2pharmasas)、pmc-005b(pharmabcine)、和ti-7007(timmunebiotechinc)。[0626]本文还提供编码本文所述嵌合抗原受体的核酸。在一些实施方案中,核酸是分离的或纯化的。核酸的间接体内递送可以使用本领域已知方法实施。例如,可以用编码嵌合抗原受体的核酸载体转化从受试者获得的免疫细胞。然后,该载体可以用来转化接纳者免疫细胞,使得这些细胞将会随后表达嵌合抗原受体。转化免疫细胞的有效手段包括转染和转导。此类方法是本领域中周知的。例如,适用于递送编码嵌合抗原受体的核酸分子(和编码碱基编辑器的核酸)的方法可以见于国际专利申请号pct/us2009/040040和美国专利号8,450,112、9,132,153和9,669,058,其各自以其整体并入本文。此外,本文所述的用于递送编码碱基编辑器的那些方法和载体适用于递送编码嵌合抗原受体的核酸。[0627]细胞外结合结构域[0628]本发明的嵌合抗原受体包括细胞外结合结构域。本文预期的嵌合抗原受体的细胞外结合结构域包含抗体或其抗原结合片段的氨基酸序列,其具有对于特异性抗原的亲和性。在一些实施方案中,抗原是cd3。在一些实施方案中,抗原是cd5。在一些实施方案中,抗原是cd7。在一些实施方案中,抗原是cd33。在一些实施方案中,抗原是cd123。[0629]在一些实施方案中,嵌合抗原受体包含抗体的氨基酸序列。在一些实施方案中,嵌合抗原受体包含抗体的抗原结合片段的氨基酸序列。细胞外结合结构域的抗体(或其片段)部分识别并结合至抗原的表位。在一些实施方案中,嵌合抗原受体的抗体片段部分是单链可变片段(scfv)。scfv包含单克隆抗体的轻和可变片段。在其他实施方案中,嵌合抗原受体的抗体片段部分是多链可变片段,其可包含超过一个细胞外结合结构域并因此同时结合至超过一个抗原。在多链可变片段实施方案中,铰链区可以分隔不同的可变片段,提供必要的空间排列和柔性。[0630]在其他实施方案中,嵌合抗原受体的抗体部分包含至少一条重链和至少一条轻链。在一些实施方案中,嵌合抗原受体的抗体部分包含通过二硫桥接合的两条重链以及两条轻链,其中轻链各自通过二硫桥接合至重链中的一条。在一些实施方案中,轻链包含恒定区和可变区。位于抗体可变区内的互补决定区负责抗体对于特定抗原的亲和性。因此,识别不同抗原的抗体包含不同的互补决定区。互补决定区位于细胞外结合结构域的可变结构域内,且可变结构域(即,可变重和可变轻)可以使用连接子连接,或者在一些实施方案中使用二硫桥连接。在一些实施方案中,可变重链和可变轻链通过(ggggs)n连接子连接,其中n是1至10的整数。在一些实施方案中,连接子是(ggggs)3连接子。[0631]在一些实施方案中,被细胞外结构域识别并结合的抗原是蛋白质或肽、核酸、脂质或多糖。抗原可以是异源的,诸如在致病性细菌或病毒中表达的那些。抗原也可以是合成的;例如,一些个体对合成乳胶极端过敏,且暴露于该抗原可能导致极端免疫反应。在一些实施方案中,抗原是自体的,并且在患病或者以其他方式改变的细胞上表达。例如,在一些实施方案中,抗原在肿瘤细胞中表达。在一些实施方案中,肿瘤细胞是实体瘤细胞。在其他实施方案中,肿瘤细胞是液态瘤细胞。在其他实施方案中,肿瘤细胞是血液学癌症,诸如b细胞癌症。在一些实施方案中,b细胞癌症是淋巴瘤或白血病。[0632]待使用本文所述方法治疗的液态癌症可以是例如白血病。在一些情况下,白血病包括白血病前期。在一些情况下,白血病是急性白血病。急性白血病包括,例如,急性骨髓性白血病(aml)。急性白血病也包括,例如,急性淋巴性白血病或急性淋巴细胞性白血病(all);all包括b谱系all、t谱系all和t细胞急性淋巴细胞性白血病(t-all)。[0633]瘤形成的非限制性示例包括t细胞急性成淋巴细胞性白血病(t-all)、蕈样肉芽肿(mf)、sézary综合征(ss)、外周t/nk细胞淋巴瘤、间变性大细胞淋巴瘤alk+、原发性皮肤t细胞淋巴瘤、t细胞大颗粒淋巴细胞型白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+淋巴增生性疾病、结外nk/t细胞淋巴瘤、成人t细胞白血病/淋巴瘤、t细胞幼淋巴细胞白血病、皮下脂膜炎样t细胞淋巴瘤、原发性皮肤γδt细胞淋巴瘤、侵袭性nk细胞白血病和肠病相关t细胞淋巴瘤。在一些实施方案中,瘤形成是t细胞急性成淋巴细胞性白血病(t-all)。在一些实施方案中,瘤形成是t细胞急性骨髓性白血病(aml)。[0634]抗体-抗原相互作用是非共价相互作用,由氢键键合、静电或疏水相互作用或范德华力所致。嵌合抗原受体的细胞外结合结构域对于抗原的亲和性可使用下式计算:[0635]ka=[抗体-抗原]/[抗体][抗原],其中[0636][ab]=抗体上未被占据的结合位点的摩尔浓度;[0637][ag]=抗原上未被占据的结合位点的摩尔浓度;并且[0638][ab-ag]=抗体-抗原复合物的摩尔浓度。[0639]抗体-抗原相互作用也可以基于抗原从抗体解离来表征。解离常数(kd)是缔合速率与解离速率的比率,并且与亲和常数成反比。因此,kd=1/ka。本领域技术人员将熟悉这些概念并将会知道传统方法诸如elisa测定可用来计算这些常数。[0640]跨膜结构域[0641]本发明的嵌合抗原受体包括跨膜结构域。本文所述嵌合抗原受体的跨膜结构域横跨car-t细胞脂质双层细胞膜并分隔细胞外结合结构域与细胞内信号传导结构域。在一些实施方案中,这一结构域源自其他具有跨膜结构域的受体,而在其他实施方案中,这一结构域是合成的。在一些实施方案中,跨膜结构域可以源自非人类跨膜结构域,并且在一些实施方案中可以是人源化的。“人源化的”意为具有编码跨膜结构域的核酸的序列,其经优化以使得更容易或更有效地在人类受试者中表达。在一些实施方案中,跨膜结构域源自在人类免疫效应细胞中表达的另一跨膜结构域。此类蛋白质的示例包括但不限于,t细胞受体(tcr)复合物的亚基pd1、或任何分化簇蛋白、或其他在免疫效应细胞中表达的其他蛋白质和具有跨膜结构域的蛋白质。在一些实施方案中,跨膜结构域将是合成的,并且此类序列将包含很多疏水性残基。[0642]用于所公开的car的跨膜结构域可包括t细胞受体的α、β或ζ链、cd28、cd3ε、cd45、cd4、cd5、cd8、cd9、cd16、cd22、cd33、cd37、cd64、cd80、cd86、cd134、cd137、cd154的至少跨膜区。在一些实施方案中,跨膜结构域源自cd4、cd8α、cd28或cd3ζ。在一些实施方案中,跨膜结构域是cd28跨膜结构域。在一些实施方案中,跨膜结构域是cd8α跨膜结构域。[0643]在一些实施方案中,跨膜结构域是cd8α铰链和跨膜结构域。在一些实施方案中,cd8α铰链和跨膜结构域与下文提供的示例性氨基酸序列至少85%、至少90%、至少95%、至少98%、至少99%或100%相同:[0644]sdptttpaprpptpaptiasqplslrpeacrpaaggavhtrgldfacdiyiwaplagtcgvlllslvitlyc[0645]在一些实施方案中,嵌合抗原受体经设计以包含位于跨膜结构域与细胞外结构域、细胞内结构域或两者之间的间隔序列。此类间隔序列可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。在一些实施方案中,间隔序列可以是20、30、40、50、60、70、80、90或100个氨基酸的长度。在又其他实施方案中,间隔序列可以是100到500个氨基酸之间的长度。间隔序列可以是任何多肽,其将一个结构域与另一个结构域链接并且用来定位此类经连接的结构域,以增强或优化嵌合抗原受体功能。在一些实施方案中,铰链/间隔序列选自ch3、cd8α或cd28。[0646]细胞内信号传导结构域[0647]本发明的嵌合抗原受体包括细胞内信号传导结构域。细胞内信号传导结构域是在t细胞内表达的蛋白质的细胞内部分,其转导t细胞效应子功能信号(例如,激活信号)并且引导该t细胞执行专业功能。t细胞激活可以由多种因素诱导,包括抗原与t细胞表面上的t细胞受体的结合以及同源配体与t细胞表面上的共刺激分子的结合。t细胞共刺激分子是t细胞上的同源结合配偶体,其与共刺激配体特异性地结合,从而介导t细胞的共刺激应答,诸如但不限于,增殖。共刺激分子包括但不限于mhci类分子。t细胞的激活导致免疫应答,诸如t细胞增殖和分化(参见,例如,smith-garvin等人,annu.rev.immunol.,27:591-619,2009)。示例性t细胞信号传导结构域是本领域中已知的。非限制性示例包括cd3ζ、cd8、cd28、cd27、cd154、gitr(tnfrsf18)、cd134(ox40)和cd137(4-1bb)信号传导结构域。[0648]本文设想的嵌合抗原受体的细胞内信号传导结构域包含主要信号传导结构域。在一些实施方案中,嵌合抗原受体包含主要信号传导结构域和词语或共刺激信号传导结构域。[0649]在一些实施方案中,主要信号传导结构域包含一个或多个免疫受体酪氨酸激活基序或itam。在一些实施方案中,主要信号传导结构域包含超过一个itam。并入嵌合抗原受体中的itam可以源自来自其他细胞受体的itam。在一些实施方案中,包含itam的主要信号传导结构域可以源自tcr复合物的亚基,诸如cd3γ、cd3ε、cd3ζ或cd3δ(参见图1a)。在一些实施方案中,包含itam的主要信号传导结构域可以源自fcrγ、fcrβ、cd5、cd22、cd79a、cd79b或cd66d。[0650]在一些实施方案中,主要信号传导结构域选自cd8、cd28、cd134(ox40)、cd137(4-1bb)和cd3ζ所组成的群组。在一些实施方案中,主要信号传导结构域是cd3ζ信号传导结构域。在一些实施方案中,cd3ζ信号传导结构域与下文提供的示例性氨基酸序列至少85%、至少90%、至少95%、至少98%、至少99%或100%相同:[0651]rvkfsrsadapayqqgqnqlynelnlgrreeydvldkrrgrdpemggkprrknpqeglynelqkdkmaeayseigmkgerrrgkghdglyqglstatkdtydalhmqalppr[0652]在一些实施方案中,主要信号传导结构域是cd134(ox40)信号传导结构域。在一些实施方案中,cd134(ox40)信号传导结构域与下文提供的示例性氨基酸序列至少85%、至少90%、至少95%、至少98%、至少99%或100%相同:[0653]rrdqrlppdahkppgggsfrtpiqeeqadahstlaki[0654]在一些实施方案中,次要或共刺激信号传导结构域源自4-1bb、cd2、cd4、cd28、cds、cd8α、cd83、cd134、cd137、icos或cd154。在一些实施方案中,次要信号传导结构域是cd28信号传导结构域。在一些实施方案中,cd28信号传导结构域与下文提供的示例性氨基酸序列至少85%、至少90%、至少95%、至少98%、至少99%或100%相同:[0655]skrsrllhsdymnmtprrpgptrkhyqpyapprdfaayrs[0656]在一些实施方案中,次要信号传导结构域是cd137(4-1bb)信号传导结构域。在一些实施方案中,cd137(4-1bb)信号传导结构域与下文提供的示例性氨基酸序列至少85%、至少90%、至少95%、至少98%、至少99%或100%相同:[0657]krgrkkllyifkqpfmrpvqttqeedgcscrfpeeeeggcel[0658]在一些实施方案中,cd137(4-1bb)信号传导结构域与下文提供的示例性氨基酸序列至少85%、至少90%、至少95%、至少98%、至少99%或100%相同:[0659]rfsvvkrgrkkllyifkqpfmrpvqttqeedgcscrfpeeeeggcel.[0660]在一些实施方案中,car包含一个或多个信号传导结构域。在一些实施方案中,car包含4-1bb信号传导结构域和cd3ζ信号传导结构域。在一些实施方案中,car包含cd28信号传导结构域和cd3ζ信号传导结构域。[0661]免疫细胞中靶标基因的编辑[0662]本发明提供免疫细胞,其包含嵌合抗原(car)和一个或多个经编辑的基因、一个或多个其调节元件或其组合,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含car和改变的内源性基因,其提供对同类相杀的抗性,增强免疫细胞功能、对免疫阻遏或抑制的抗性或其组合。在一些实施方案中,免疫细胞是t细胞。在一些实施方案中,免疫细胞是car-t细胞。在一些实施方案中,免疫细胞是nk细胞。在一些实施方案中,每个经编辑的基因可包含单个碱基编辑。在一些实施方案中,每个经编辑的基因可包含位于基因不同区的多个碱基编辑。[0663]在一些实施方案中,单个修饰事件(诸如电穿孔)可以引入一个或多个碱基编辑。在一些实施方案中,可以同时将至少一重、两重、三重、四重、五重、六重、七重、八重、九重、十重、十一重、十二重、十三重、十四重、十五重、十六重、十七重、十八重、十九重、二十重或更多重编辑引入一重或多重基因中。在一些实施方案中,免疫细胞,包括但不限于任何包含选自任何前述基因编辑的经编辑的基因的免疫细胞,可以经编辑以在其他基因中生成突变,该突变增强car-t的功能或降低免疫抑制或对细胞的抑制。[0664]在一些实施方案中,car-t细胞具有与类似的但不进一步具有本文所述一重或多重编辑的car-t细胞相比增加的同类相杀抗性。在一些实施方案中,car-t细胞具有与类似的但不进一步具有本文所述一重或多重编辑的car-t细胞相比降低的免疫原性。在一些实施方案中,car-t细胞具有与类似的但不进一步具有本文所述一重或多重编辑的car-t细胞相比更低的激活阈值。在一些实施方案中,car-t细胞具有与类似的但不进一步具有本文所述一重或多重编辑的car-t细胞相比增加的抗瘤形成活性。[0665]在一些实施方案中,本文提供一种免疫细胞,其具有至少一个在内源性基因中或其调节元件中的修饰。在一些实施方案中,免疫细胞可以包含在至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个内源性基因或其调节元件中的进一步修饰。[0666]在一些实施方案中,该一个或多个基因、或一个或多个其调节元件、或其组合可选自由以下所组成的群组:cd3抗原(cd3);cd5抗原(cd5);cd7抗原(cd7);cd33抗原(cd33);cd52抗原(cd52);cd123抗原(cd123);t细胞受体α恒定区(trac);程序性细胞死亡1(pdcd1或pd-1);fas细胞表面死亡受体(fas);淋巴细胞激活基因3(lag-3);ii类主要组织相容性复合体反式激活因子(ciita);t细胞受体β恒定区1(trbc1);t细胞受体β恒定区2(trbc2);和β-2微球蛋白(b2m)。在一些实施方案中,cd3、cd5、cd7、cd33或cd123被编辑。在一些实施方案中,免疫细胞包含经编辑的cd3基因,和额外的至少一个经编辑的基因。在一些实施方案中,免疫细胞包含经编辑的cd5基因,和额外的至少一个经编辑的基因。在一些实施方案中,免疫细胞包含经编辑的cd7基因,和额外的至少一个经编辑的基因。在一些实施方案中,免疫细胞包含经编辑的cd33基因,和额外的至少一个经编辑的基因。在一些实施方案中,免疫细胞包含经编辑的cd123基因,和额外的至少一个经编辑的基因。该至少一个经编辑的基因可以选自前述段落中提及的一系列基因。在一些实施方案中,cd3、cd5、cd7、cd33或cd123与trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者组合被编辑。[0667]在各种实施方案中,经修饰的免疫细胞包含在cd5、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd5、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的两者、三者、四者、五者、六者、七者、八者、九者或十者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd5中的突变以及在trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在一种实施方案中,经修饰的免疫细胞包含在cd5、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的突变。[0668]在各种实施方案中,经修饰的免疫细胞包含在cd7、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd7、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的两者、三者、四者、五者、六者、七者、八者、九者或十者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd7中的突变以及在trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在一种实施方案中,经修饰的免疫细胞包含在cd7、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的突变。[0669]在各种实施方案中,经修饰的免疫细胞包含在cd3、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd3、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的两者、三者、四者、五者、六者、七者、八者、九者或十者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd3中的突变以及在trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在一种实施方案中,经修饰的免疫细胞包含在cd3、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的突变。[0670]在各种实施方案中,经修饰的免疫细胞包含在cd33、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd33、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的两者、三者、四者、五者、六者、七者、八者、九者或十者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd33中的突变以及在trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在一种实施方案中,经修饰的免疫细胞包含在cd33、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的突变。[0671]在各种实施方案中,经修饰的免疫细胞包含在cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的两者、三者、四者、五者、六者、七者、八者、九者或十者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd123中的突变以及在trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的一者或多者或其组合中的突变。在一种实施方案中,经修饰的免疫细胞包含在cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pd1中的突变。[0672]在一些实施方案中,至少一个修饰是单个核碱基修饰。在一些实施方案中,改变的内源性基因可以通过碱基编辑创建。在一些实施方案中,碱基编辑可以减少或削弱基因表达。在一些实施方案中,碱基编辑可以减少或削弱基因激活。在一些实施方案中,碱基编辑可以减少或削弱基因产物的功能性。在一些其他实施方案中,碱基编辑可以激活或提升基因表达。在一些实施方案中,碱基编辑可以增加基因产物的功能性。[0673]表达内源性免疫细胞受体以及嵌合抗原受体的同种异体免疫细胞可以识别并粘附宿主细胞,这种情况称为移植物抗宿主疾病(gvhd)。免疫细胞受体复合物的α组分由trac基因编码,并且在一些实施方案中,该基因被编辑,使得tcr复合物的α亚基无功能或不存在。因为这一亚基是内源性免疫细胞信号传导所必需的,编辑这一基因可降低由同种异体免疫细胞造成的移植物抗宿主疾病的风险。[0674]在一些实施方案中,用来提供同类相杀抗性、增强免疫细胞功能或降低免疫阻遏或抑制的基因编辑可以在免疫细胞被转化以表达嵌合抗原受体之前在该细胞中发生。另一方面,用来增强免疫细胞功能或降低免疫阻遏或抑制的基因编辑可以在car-t细胞中发生,即,在免疫细胞已经被这暖和以表达嵌合抗原受体之后发生。[0675]在本发明的一些实施方案中,car-t细胞中的cd5经编辑以敲除或敲低表达。然后,car-t经转化以表达具有cd5scfv的嵌合抗原受体。通过敲除或敲低cd5基因的表达,经修饰的car-t细胞进行同类相杀的可能性较小。[0676]在本发明的一些实施方案中,car-t细胞中的cd7经编辑以敲除或敲低表达。然后,car-t经转化以表达具有cd7scfv的嵌合抗原受体。通过敲除或敲低cd7基因的表达,经修饰的car-t细胞进行同类相杀的可能性较小。[0677]在本发明的一些实施方案中,car-t细胞中的cd33经编辑以敲除或敲低表达。然后,car-t经转化以表达具有cd33scfv的嵌合抗原受体。通过敲除或敲低cd33基因的表达,经修饰的car-t细胞进行同类相杀的可能性较小。[0678]在本发明的一些实施方案中,car-t细胞中的cd3经编辑以敲除或敲低表达。然后,car-t经转化以表达具有cd3scfv的嵌合抗原受体。通过敲除或敲低cd3基因的表达,经修饰的car-t细胞进行同类相杀的可能性较小。[0679]在本发明的一些实施方案中,car-t细胞中的cd123经编辑以敲除或敲低表达。然后,car-t经转化以表达具有cd123scfv的嵌合抗原受体。通过敲除或敲低cd123基因的表达,经修饰的car-t细胞进行同类相杀的可能性较小。[0680]宿主免疫细胞可以潜在地将同种异体car-t细胞识别为非自我并且引起免疫应答以去除非自我细胞。b2m在几乎全部有核细胞中表达并且于mhci类复合物缔合(图1b)。循环宿主cd8+t细胞可以将这一b2m蛋白识别为非自我并且杀死同种异体细胞。为了克服这一移植物排异,在一些实施方案中,b2m基因经编辑以敲除或敲低表达。在一些实施方案中,本文提供一种免疫细胞,其具有经编辑的b2m基因,使得该免疫细胞不表达内源功能性b2m。在一些实施方案中,本文提供一种car-t细胞,其具有经编辑的b2m基因,使得该car-t细胞表现出减少的或可忽略的或没有b2m的表达。[0681]在一些实施方案中,免疫细胞包含嵌合抗原受体和一个或多个经编辑的基因、其调节元件或其组合。经编辑的基因可以是免疫应答调节基因、免疫原基因、检查点抑制剂基因、牵涉到免疫应答中的基因、细胞表面标志物例如t细胞表面标志物、或其任意组合。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的基因,该经编辑的基因与激活的t细胞增殖、α-βt细胞激活、γ-δt细胞激活、t细胞增殖的正向调节、t辅助细胞增殖或分化的负向调节有关,或其调节元件或其组合。在一些实施方案中,经编辑的基因可以是检查点抑制剂基因,例如pd1基因、pdc1基因、与其形成或激活途径相关或调节该途径的成员。在一些实施方案中,经编辑的基因是trac基因。在一些实施方案中,经编辑的基因是cd5基因。在一些实施方案中,经编辑的基因是cd7基因。在一些实施方案中,经编辑的基因是cd33基因。在一些实施方案中,经编辑的基因是cd3基因。在一些实施方案中,经编辑的基因是cd123基因。在一些实施方案中,经编辑的基因是b2m基因。在一些实施方案中,经编辑的基因是ciita基因。在一些实施方案中,经编辑的基因是trbc1/2基因。在一些实施方案中,经编辑的基因是cd5基因。在一些实施方案中,经编辑的基因是cd7基因。在一些实施方案中,经编辑的基因是cd52基因。在一些实施方案中,至少一个经编辑的基因选自pd-1、cd2、cd3、cd5、cd7、cd52、b2m、trbc1/2、ciita和trac,或其组合。在一些实施方案中,pd-1、cd2、cd52和trac基因被编辑。在一些实施方案中,pd-1、cd2、cd52、b2m、trbc1/2、ciita和trac基因被编辑。在一些实施方案中,pd-1、cd5、cd52和trac基因被编辑。在一些实施方案中,pd-1、cd3、cd7和cd52基因被编辑。[0682]在一些实施方案中,内源性基因的编辑降低了该基因的表达。在一些实施方案中,与没有修饰的对照细胞相比,内源性基因的编辑将该基因的表达减少至少50%。在一些实施方案中,与没有修饰的对照细胞相比,内源性基因的编辑将该基因的表达减少至少60%。在一些实施方案中,与没有修饰的对照细胞相比,内源性基因的编辑将该基因的表达减少至少70%。在一些实施方案中,与没有修饰的对照细胞相比,内源性基因的编辑将该基因的表达减少至少80%。在一些实施方案中,与没有修饰的对照细胞相比,内源性基因的编辑将该基因的表达减少至少90%。在一些实施方案中,与没有修饰的对照细胞相比,内源性基因的编辑将该基因的表达减少至少100%。在一些实施方案中,内源性基因的编辑消除基因表达。[0683]在本发明的一些实施方案中,car-t细胞中的pdcd1经编辑以敲除或敲低表达。pdcd1基因编码细胞表面受体pd-1(一种在免疫细胞中表达的免疫系统检查点),并且牵涉到通过促进抗原特异性免疫细胞的细胞凋亡而降低免疫性中。通过敲除或敲低pdcd1基因的表达,经修饰的car-t细胞凋亡的坑能效较低,增殖的可能性较高,并且可以从程序性细胞死亡免疫检查点逃逸。[0684]cblb编码e3泛素连接酶,该酶在抑制免疫效应细胞激活中发挥显著作用。参照图1c,cblb蛋白有利于导致免疫效应细胞耐受的信号传导途径并且积极抑制导致免疫效应细胞激活的信号传导途径。因为免疫效应细胞激活是car-t细胞进行移植后体内增殖所必需的,在本发明的一些实施方案中,cblb基因被编辑以敲除或敲低表达。[0685]在一些实施方案中,本发明提供一种免疫细胞,其具有经编辑的trac基因(其中trac基因可包含一个、两个、三个、四个、五个、六个、七个、八个、九个或十个或更多个碱基编辑),使得免疫细胞不表达内源功能性t细胞受体链。在一些实施方案中,免疫细胞是表达嵌合抗原受体的t细胞(car-t细胞)。在一些实施方案中,本文提供一种car-t细胞,其具有在trac基因中的碱基编辑,使得car-t细胞具有减少的或可忽略的或没有内源性t细胞受体α蛋白的表达。[0686]在一些实施方案中,本文提供一种免疫细胞,其具有经编辑的ciita基因,使得该免疫细胞不表达内源功能性ii类主要组织相容性复合物反向激活因子。在一些实施方案中,本文提供一种car-t细胞,其具有经编辑的ciita基因,使得该car-t细胞表现出减少的或可忽略的或没有内源性ii类主要组织相容性复合物反向激活因子的表达。[0687]在一些实施方案中,本文提供一种免疫细胞,其具有经编辑的trbc1或trbc2基因,使得该免疫细胞不表达内源功能性t细胞受体β链。在一些实施方案中,本文提供一种car-t细胞,其具有经编辑的trbc1/trbc2基因,使得该car-t细胞表现出减少的或可忽略的或没有内源性t细胞受体β链的表达。[0688]在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac、b2m、pdcd1、cblb基因或其组合,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac和b2m基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac和pdcd1基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac和cblb基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac、b2m和pdcd1基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac、b2m和cblb基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞或免疫效应细胞包含嵌合抗原受体和经编辑的trac、pdcd1和cblb基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trac、b2m、pdcd1和cblb基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的b2m基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的b2m和pdcd1基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的b2m和cblb基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的b2m、pdcd1和cblb基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的pdcd基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的pdcd和cblb基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的cblb基因,其中经编辑的基因的表达被敲除或敲低。[0689]在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的cd5基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的cd7基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的cd33基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的cd3基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的cd123基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的fas基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的lag-3基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的ciita基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trbc1基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的trbc2基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的cd52基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和一个或多个经编辑的cd3、cd5、cd7、cd33、cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和/或pd1基因,其中经编辑的基因的表达被敲除或敲低。[0690]碱基编辑可以位于基因的任何合适位置处,或在该基因的调节元件中。因此,预期在起始密码子处的单碱基编辑例如可以完全废止该基因的表达。在一些实施方案中,改变的内源性基因可以在外显子、内含子、外显子-内含子拼接点、或其调节元件中经修饰或编辑。修饰可以是对基因或其调节元件中单个核碱基的编辑。修饰可以在外显子、超过一个外显子、内含子或超过一个内含子中,或其组合。修饰可以在基因的开放阅读框中。修饰可以在基因的未截短区内,例如,在3'-utr或5'-utr中。在一些实施方案中,修饰在内源性基因的调节元件中。在一些实施方案中,修饰在启动子、增强子、算子、沉默子、绝缘子、终止子、转录起始序列、翻译起始序列(例如,kozak序列)中,或其组合。在一些实施方案中,碱基编辑可以将提前stop密码子引入外显子中,导致翻译产物的缺乏或截短,这些产物可能错误折叠并因此通过降解被消除,或者碱基编辑可以产生容易降解的不稳定mrna。[0691]在一些实施方案中,碱基编辑可以例如在人类pdc1/pd-1基因的外显子1、外显子2、或外显子3、或外显子4或外显子5上执行。在一些实施方案中,人类pdc1/pd-1基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类pdc1/pd-1基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类pdc1/pd-1基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类pdc1/pd-1基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人类pdc1/pd-1基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类pdc1/pd-1基因上在外显子1、外显子2、外显子3、外显子4、外显子5或其任意组合处执行。[0692]在一些实施方案中,人类pdc1/pd-1a基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置4、6、7、8或9来执行。在一些实施方案中,人类pdc1/pd-1a基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置4、6、7、8或9来执行。在一些实施方案中,人类pdc1/pd-1a基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置7、8或9来执行。在一些实施方案中,人类pdc1/pd-1a基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置5、7或8来执行。在一些实施方案中,人类pdc1/pd-1a基因中的碱基编辑通过编辑靶向外显子5的向导rna间隔序列的位置5或8来执行。[0693]在一些实施方案中,碱基编辑可以例如在人类cd7基因的外显子1、外显子2或外显子3上执行。在一些实施方案中,人类cd7基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类cd7基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类cd7基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类cd7基因上在外显子1、外显子2、外显子3或其任意组合处执行。在一些实施方案中,人类cd7基因中的碱基编辑在外显子1内的位置4、8、9处执行。在一些实施方案中,人类cd7基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置5、6、7、8或9来执行。在一些实施方案中,人类cd7基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置4或9来执行。[0694]在一些实施方案中,碱基编辑可以例如在人类lag-3基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7或外显子8上执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子6内的位点处执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子7内的位点处执行。在一些实施方案中,人类lag-3基因中的碱基编辑在外显子8内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类lag-3基因上在外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8或其任意组合处执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置4或8来执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置4、6或8来执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置4、5、6或7来执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子4的向导rna间隔序列的位置4、8或9来执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子5的向导rna间隔序列的位置8或9来执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子6的向导rna间隔序列的位置4、6、7或8来执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子7的向导rna间隔序列的位置4、6或7来执行。在一些实施方案中,人类lag-3基因中的碱基编辑通过编辑靶向外显子8的向导rna间隔序列的位置8来执行。[0695]在一些实施方案中,碱基编辑可以例如在人类cd33基因的外显子1、外显子2、外显子3、外显子4、外显子5或外显子6上执行。在一些实施方案中,人类cd33基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类cd33基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类cd33基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类cd33基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人类cd33基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人类cd33基因中的碱基编辑在外显子6内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类cd33基因上在外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或其任意组合处执行。在一些实施方案中,人类cd33基因中的碱基编辑通过编辑靶向外显子9的向导rna间隔序列的位置7、8或1来执行。在一些实施方案中,人类cd33基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置4、5、6或8来执行。在一些实施方案中,人类cd33基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置4、5、6或7来执行。在一些实施方案中,人类cd33基因中的碱基编辑通过编辑靶向外显子4的向导rna间隔序列的位置6或7来执行。在一些实施方案中,人类cd33基因中的碱基编辑通过编辑靶向外显子5的向导rna间隔序列的位置7或8来执行。在一些实施方案中,人类cd33基因中的碱基编辑通过编辑靶向外显子6的向导rna间隔序列的位置4、5或6来执行。[0696]在一些实施方案中,碱基编辑可以例如在人类cd123基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子7、外显子8、外显子10或外显子11上执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子7内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子8内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子10内的位点处执行。在一些实施方案中,人类cd123基因中的碱基编辑在外显子11内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类cd123基因上在外显子1、外显子2、外显子3、外显子4、外显子5、外显子7、外显子8、外显子10、外显子11或其任意组合处执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子6的向导rna间隔序列的位置1来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置4、6或8来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置5、6或8来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子4的向导rna间隔序列的位置5或6来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子5的向导rna间隔序列的位置4或5来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子7的向导rna间隔序列的位置5来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子8的向导rna间隔序列的位置5、6、7或8来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子10的向导rna间隔序列的位置4、7或8来执行。在一些实施方案中,人类cd123基因中的碱基编辑通过编辑靶向外显子11的向导rna间隔序列的位置5或8来执行。[0697]在一些实施方案中,碱基编辑可以例如在人类fas基因的外显子1、或外显子3、或外显子4、或外显子5、或外显子6、或外显子7或、外显子8或外显子9上执行。在一些实施方案中,人类fas基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类fas基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类fas基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人类fas基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人类fas中的碱基编辑在外显子6内的位点处执行。在一些实施方案中,人类fas中的碱基编辑在外显子7内的位点处执行。在一些实施方案中,人类fas中的碱基编辑在外显子8内的位点处执行。在一些实施方案中,人类fas中的碱基编辑在外显子9内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类fas基因上在外显子1、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9或其任意组合处执行。[0698]在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置9来执行。在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置6来执行。在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子4的向导rna间隔序列的位置7来执行。在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子5的向导rna间隔序列的位置5来执行。在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子6的向导rna间隔序列的位置4或7来执行。在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子7的向导rna间隔序列的位置8来执行。在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子8的向导rna间隔序列的位置8来执行。在一些实施方案中,人类fas基因中的碱基编辑通过编辑靶向外显子9的向导rna间隔序列的位置5或6来执行。[0699]在一些实施方案中,碱基编辑可以例如在人类cd52基因的外显子1、外显子2或外显子3上执行。在一些实施方案中,人类cd52基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类cd52基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类cd7基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类cd52基因上在外显子1、外显子2、外显子3或其任意组合处执行。在一些实施方案中,人类cd52基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置4或7来执行。在一些实施方案中,人类cd52基因中的碱基编辑通过编辑靶向外显子7的向导rna间隔序列的位置5、6或2来执行。[0700]在一些实施方案中,碱基编辑可以例如在人类cd5基因的外显子1、或外显子2、或外显子3、或外显子4、或外显子5、或外显子6、或外显子7或、或外显子8、或外显子9或外显子10上执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子6内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子7内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子8内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子9内的位点处执行。在一些实施方案中,人类cd5基因中的碱基编辑在外显子10内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类cd5基因上在外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10或其任意组合处执行。[0701]在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置6来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置6来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置5和/或6来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置5和/或6来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置5、6、8和/或9来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子4的向导rna间隔序列的位置4或5来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子5的向导rna间隔序列的位置4、5、7、8或9来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子6的向导rna间隔序列的位置4、5、6、7、8和/或9来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子7的向导rna间隔序列的位置4来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子8的向导rna间隔序列的位置4、5或7来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子9的向导rna间隔序列的位置6或8来执行。在一些实施方案中,人类cd5基因中的碱基编辑通过编辑靶向外显子10的向导rna间隔序列的位置9来执行。[0702]在一些实施方案中,碱基编辑可以例如在人类trac基因(ucsc基因组数据库ensg00000277734.8)的外显子1或外显子2或外显子3或外显子4上执行。在一些实施方案中,人类trac基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类trac基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类trac基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类trac基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类trac基因上在外显子1、外显子2、外显子3、外显子4或其任意组合处执行。在一些实施方案中,人类trac基因中的碱基编辑通过编辑靶向外显子1内的向导rna间隔序列的位置5、6或9来执行。[0703]在一些实施方案中,碱基编辑可以例如在人类b2m基因(染色体15,nc_000015.10,44711492–44718877;示例性mrna序列nm_004048)的外显子1、外显子2、外显子3或外显子4上执行。在一些实施方案中,人类b2m基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类b2m基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类b2m基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类b2m基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类b2m基因上在外显子1、外显子2、外显子3、外显子4或其任意组合处执行。在一些实施方案中,人类b2m基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置5来执行。在一些实施方案中,人类b2m基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置4、6或9来执行。[0704]在一些实施方案中,碱基编辑可以例如在人类ciita基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子11、外显子12、外显子13、外显子14、外显子15、外显子16、外显子17、外显子18或外显子19处执行。在一些实施方案中,人类cd52基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子4内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子5内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子6内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子7内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子8内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子9内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子10内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子11内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子12内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子13内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子14内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子15内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子16内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子17内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子18内的位点处执行。在一些实施方案中,人类ciita基因中的碱基编辑在外显子19内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类ciita基因上在外显子1、外显子2、外显子3、外显子4、外显子5、外显子6、外显子7、外显子8、外显子9、外显子10、外显子11、外显子12、外显子13、外显子14、外显子15、外显子16、外显子17、外显子18、外显子19或其任意组合处执行。[0705]在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置6或7来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置7或8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子4的向导rna间隔序列的位置8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子7的向导rna间隔序列的位置4、7或8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子8的向导rna间隔序列的位置8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子9的向导rna间隔序列的位置4、6或7来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子10的向导rna间隔序列的位置4、5或7来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子11的向导rna间隔序列的位置4、5、6、7或8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子12的向导rna间隔序列的位置6来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子14的向导rna间隔序列的位置4或5来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子15的向导rna间隔序列的位置4、7或8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子16的向导rna间隔序列的位置5、7或8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子17的向导rna间隔序列的位置7或8来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子18的向导rna间隔序列的位置5来执行。在一些实施方案中,人类ciita基因中的碱基编辑通过编辑靶向外显子19的向导rna间隔序列的位置5、6、7或8来执行。[0706]在一些实施方案中,碱基编辑可以例如在人类trbc1基因的外显子1、外显子2或外显子3上执行。在一些实施方案中,人类trbc1基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类trbc1基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类trbc1基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类trbc1基因上在外显子1、外显子2、外显子3或其任意组合处执行。在一些实施方案中,人类trbc1基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置5、6、7或8来执行。在一些实施方案中,人类trbc1基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置8来执行。在一些实施方案中,人类trbc1基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置4或5来执行。[0707]在一些实施方案中,碱基编辑可以例如在人类trbc2基因的外显子1、外显子2或外显子3上执行。在一些实施方案中,人类trbc2基因中的碱基编辑在外显子1内的位点处执行。在一些实施方案中,人类trbc2基因中的碱基编辑在外显子2内的位点处执行。在一些实施方案中,人类trbc2基因中的碱基编辑在外显子3内的位点处执行。在一些实施方案中,一个或多个碱基编辑动作可以在人类trbc2基因上在外显子1、外显子2、外显子3或其任意组合处执行。在一些实施方案中,人类trbc2基因中的碱基编辑通过编辑靶向外显子1的向导rna间隔序列的位置5、6、7或8来执行。在一些实施方案中,人类trbc2基因中的碱基编辑通过编辑靶向外显子2的向导rna间隔序列的位置7或8来执行。在一些实施方案中,人类trbc2基因中的碱基编辑通过编辑靶向外显子3的向导rna间隔序列的位置4来执行。[0708]在一些实施方案中,碱基编辑可以在内含子上执行。例如,碱基编辑可以在内含子上执行。在一些实施方案中,碱基编辑可以在内含子内的位点处执行。在一些实施方案中,碱基编辑可以在一个或多个内含子内的位点处执行。在一些实施方案中,碱基编辑可以在基因中多个内含子的任何外显子处执行。在一些实施方案中,一个或多个碱基编辑可以在外显子上、内含子上、或外显子与内含子的任意组合处执行。[0709]在一些实施方案中,修饰或碱基编辑可以在启动子位点内。在一些实施方案中,可以将碱基编辑引入替代性启动子位点内。在一些实施方案中,碱基编辑可以在5'调节元件诸如增强子内。在一些实施方案中,可以引入碱基编辑以中断核酸结合蛋白的结合位点。示例性核酸结合蛋白可以是聚合酶、核酸酶、旋转酶、拓扑异构酶、甲基化酶或甲基转移酶、转录因子、增强子、pabp、锌指蛋白等。[0710]在一些实施方案中,碱基编辑可以用于剪接中断以沉默靶标蛋白表达。在一些实施方案中,碱基编辑可以生成剪接受体-剪接供体(sa-sd)位点。生成sa-sd或sa-sd位点的被靶向碱基编辑可导致减少的基因表达。在一些实施方案中,碱基编辑器(例如,abe、cbe)用来靶向构建剪接受体和剪接供体位点的二核苷酸基序,而该位点是每个内含子的最前和最后的两个核苷酸。例如,可以靶向cd2的外显子3剪接供体(sd)位点进行碱基编辑。在一些实施方案中,使用腺苷碱基编辑器(abe)实现剪接中断。在一些实施方案中,使用胞苷碱基编辑器(cbe)实现剪接中断。在一些实施方案中,碱基编辑器(例如,abe,cbe)用来通过创建stop密码子来编辑外显子。提前终止密码子可以在外显子、内含子或未翻译区内生成。在一些实施方案中,碱基编辑可用来将超过一个stop密码子引入到一个或多个替代性阅读框中。例如,提前stop密码子可以引入到外显子2内的位置8处、外显子3内的位置4处、外显子3内的位置6处、外显子3内的位置9处、外显子4内的位置4处、外显子4内的位置5处、或外显子5内的位置4处。在一些实施方案中,通过腺苷碱基编辑器(abe)生成终止密码子。在一些实施方案中,通过胞苷碱基编辑器(cbe)生成终止密码子。在一些实施方案中,cbe生成以下编辑(以下划线字体显示)中的一者以生成终止子(stop)密码子:cag→tag;caa→taa;cga→tga;tgg→tga;tgg→tag;或tgg→taa。[0711]在一些实施方案中,可以将修饰/碱基编辑引入3'-utr处,例如,在多腺苷酸化(poly-a)位点中。在一些实施方案中,碱基编辑可以在5'-utr区上执行。[0712]在一些实施方案中,免疫细胞,包括但不限于任何包含任何前述基因编辑的免疫细胞,可以经编辑以在其他基因中生成突变,该突变增强car-t的功能或降低免疫抑制或对细胞的抑制。例如,在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2、zap70、nfatc1、tet2基因或其组合,其中经编辑的基因的表达要么被敲除要么被敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2和zap70基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2和zap70基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2和nfatc1基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2和tet2基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2、zap70和nfatc1基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2、zap70和tet2基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2、nfatc1和tet2基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tgfbr2、zap70、nfatc1和tet2基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的zap70基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的zap70和nfatc1基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的zap70和tet2基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的zap70、pdcd1和tet2基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的pdcd1基因,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的pdcd1和tet2基因,其中经编辑的基因的表达要么被敲除或要么敲低。在一些实施方案中,免疫细胞包含嵌合抗原受体和经编辑的tet2基因,其中经编辑的基因的表达被敲除或敲低。[0713]在一些实施方案中,嵌合抗原受体插入到trac基因内。这具有优势。首先,因为trac在免疫细胞内被高度表达,当其构建体被设计为将嵌合抗原受体插入trac基因内以使得该受体的表达由trac启动子驱动时,该嵌合抗原受体将会被类似地表达。其次,将嵌合抗原受体插入trac基因内将敲除trac表达。在一些实施方案中,本文所述的基因编辑系统可用来将嵌合抗原受体插入到trac基因座内。对于trac基因座具有特异性的grna可以将基因编辑系统引导至该基因座并启动双链dna切割。在特定实施方案中,grna与cas12b协同使用。在各种实施方案中,基因编辑系统与具有编码car受体的序列的核酸协同使用。示例性向导rna提供在下表1a中。[0714]表1a向导rna[0715][0716][0717]dna构建体编码嵌合抗原受体和含有位于grna靶向序列侧翼的tracdna的扩展延伸段的核酸。不受缚于理论,构建体结合至互补trac序列,然后驻留在构建体上trac序列附近的嵌合抗原受体dna被插入到损害位点处,有效地敲除trac基因并敲入嵌合抗原受体核酸。表1b提供用于trac基因的向导rna,其可以将碱基编辑结构引导至trac基因座,使得能够进行嵌合抗原受体核酸的插入。前11个grna用于bhcas12b核酸酶。第二组11个用于bvcas12b核酸酶。这些全部用于通过创建双链断裂而将car插入到trac处,而非用于碱基编辑。[0718]表1b:trac向导rna[0719][0720][0721]表1b:续[0722][0723]前11个grna用于bhcas12b核酸酶。第二组11个grna用于bvcas12b核酸酶。在第一种情况下,支架序列加粗显示。[0724]在一些实施方案中,可以使用be4碱基编辑器将本发明的编码嵌合抗原受体的核酸靶向至trac基因座。在一些实施方案中,使用crispr/cas9碱基编辑系统将嵌合抗原受体靶向至trac基因座。[0725]为了产生上述碱基编辑,从受试者采集免疫细胞并使其与两个或更多个向导rna以及包含核酸可编程dna结合蛋白(napdnabp)和胞苷脱氨酶或腺苷脱氨酶的核碱基编辑器多肽接触。在一些实施方案中,使所采集的免疫细胞与至少一种核酸接触,其中该至少一种核酸编码两个或更多个向导rna以及包含核酸可编程dna结合蛋白(napdnabp)和胞苷脱氨酶的核碱基编辑器多肽。在一些实施方案中,grna包含核苷酸类似物。这些核苷酸类似物可抑制grna被细胞过程降解。表2提供待用于grna的靶标序列。[0726][0727][0728][0729][0730][0731][0732]本发明使用的胞苷和腺苷脱氨酶核碱基编辑器可以作用于dna,包括单链dna。呈现了使用它们在免疫细胞内的靶标核碱基序列中生成修饰的方法。[0733]在某些实施方案中,本文所提供的融合蛋白包含一个或多个改善融合蛋白的碱基编辑活性的特征。例如,本文所提供的任何融合蛋白可包含具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的任何融合蛋白可具有没有核酸酶活性的cas9结构域(dcas9),或切断双螺旋dna分子的一条链的cas9结构域,称为cas9切口酶(ncas9)。不与受缚于特定例如,催化性残基(例如,h840)的存在维持cas9裂解与被靶向的核碱基相对的未经编辑的(例如,未经甲基化的)链的活性。催化性残基的突变(例如,d10到a10)阻止含有被靶向的a残基的经编辑链的裂解。此类cas9变体可以在基于grna定义的靶标序列的特异性位置处生成单链dna断裂(切口),导致非编辑链的修复,最终导致非编辑链上的核碱基改变。[0734]核碱基编辑器[0735]本文公开一种碱基编辑器或核碱基编辑器,其用于编辑、修饰或改变多核苷酸中的靶标核苷酸序列。本文描述一种核碱基编辑器或碱基编辑器,其包含多核苷酸可编程核苷酸结合结构域和核碱基编辑结构域(例如,腺苷脱氨酶、胞苷脱氨酶)。当与结合的向导多核苷酸(例如,grna)协同作用时,多核苷酸可编程核苷酸结合结构域可特异性地结合至靶标多核苷酸序列(即,经由结合的向导核酸的碱基与靶标多核苷酸序列的碱基之间的互补碱基配对),并因此将碱基编辑器定位至待编辑的所希望的靶标核酸序列。在一些实施方案中,靶标多核苷酸序列包含单链dna或双链dna。在一些实施方案中,靶标多核苷酸序列包含rna。在一些实施方案中,靶标多核苷酸序列包含dna-rna杂交物。[0736]多核苷酸可编程核苷酸结合结构域[0737]应了解,多核苷酸可编程核苷酸结合结构域也可以包括结合rna的核酸可编程蛋白质。例如,多核苷酸可编程核苷酸结合结构域可以与核酸缔合,该核酸将多核苷酸可编程核苷酸结合结构域引导至rna。其他核酸可编程dna结合蛋白也处于本公开范畴内,但它们未在本公开中具体列出。[0738]碱基编辑器的多核苷酸可编程核苷酸结合结构域自身可包含一个或多个结构域。例如,多核苷酸可编程核苷酸结合结构域可包含一个或多个核酸酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可包含核酸内切酶或核酸外切酶。本文中,术语“核酸外切酶”是指能够从游离末端消化核酸(例如,rna或dna)的蛋白质或多肽,且术语“核酸内切酶”是指能够催化(例如,切割)核酸(例如,dna或rna)中的内部区域的蛋白质或多肽。在一些实施方案中,核酸内切酶可切割双链核酸的单链。在一些实施方案中,核酸内切酶可切割双链核酸分子的两条链。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以是脱氧核糖核酸酶。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以是核糖核酸酶。[0739]在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以将靶标多核苷酸的零条、一条或两条链切口。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可包含切口酶结构域。本文中,“切口酶”是指一种包含核酸酶结构域的多核苷酸可编程核苷酸结合结构域,其能够仅切割双螺旋核酸分子(例如,dna)的两条链中的一条链。在一些实施方案中,切口酶可以通过将一个或多个突变引入活性多核苷酸可编程核苷酸结合结构域而衍生自完全催化活性(例如,天然)形式的多核苷酸可编程核苷酸结合结构域。例如,若多核苷酸可编程核苷酸结合结构域包含衍生自cas9的切口酶,则衍生自cas9的切口酶结构域可包括d10a突变和在位置840处的组氨酸。在这些实施方案中,残基h840保持催化活性,并因此可切割核酸双螺旋的一条链。在另一示例中,衍生自cas9的切口酶结构域可包含h840a突变,而在位置10处的氨基酸残基保持为d。在一些实施方案中,切口酶可以通过去除切口酶活性所不需要的核酸酶的全部或一部分而衍生自完全催化活性(例如,天然)形式的多核苷酸可编程核苷酸结合结构域。例如,若多核苷酸可编程核苷酸结合结构域包含衍生自cas9的切口酶,则衍生自cas9的切口酶结构域可包含ruvc结构域或hnh结构域中的全部或一部分的缺失。[0740]示例性的催化活性cas9的氨基酸序列如下:[0741]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd。[0742]因此,包含具有切口酶结构域的多核苷酸可编程核苷酸结合结构域的碱基编辑器能够在特异性多核苷酸靶标序列(例如,通过结合的向导核酸的互补序列确定)处生成单链dna断裂(切口)。在一些实施方案中,被包含切口酶结构域(例如,衍生自cas9的切口酶结构域)的碱基编辑器切割的核酸双螺旋靶标多核苷酸序列的链是未经碱基编辑器编辑的链(即,被碱基编辑器切割的链与包含待编辑的碱基的链相反)。在其他实施方案中,包含切口酶结构域(例如,衍生自cas9的切口酶结构域)的碱基编辑器可以切割待被靶向以进行编辑的dna分子的链。在这些实施方案中,非靶向链未经切割。[0743]本文还提供包含催化上死亡(即,不能切割靶标多核苷酸序列)的多核苷酸可编程核苷酸结合结构域的碱基编辑器。本文中,术语“催化上死亡的”和“核酸酶死亡的”互换使用,是指一种多核苷酸可编程核苷酸结合结构域,其具有一个或多个导致其失去切割核酸链的能力的突变和/或缺失。在一些实施方案中,催化上死亡的多核苷酸可编程核苷酸结合结构域碱基编辑器可能缺乏核酸酶活性,这是在一个或多个核酸酶结构域中的特异性点突变的结果。例如,在碱基编辑器包含cas9结构域的情况下,cas9可包含d10a突变和h840a突变两者。此类突变将两个核酸酶结构域失活,从而导致核酸酶活性的丧失。在其他实施方案中,催化上死亡的多核苷酸可编程核苷酸结合结构域可包含对话结构域(例如,ruvc1和/或hnh结构域)的全部或一部分的一个或多个缺失。在进一步的实施方案中,催化上死亡的多核苷酸可编程核苷酸结合结构域包含点突变(例如,d10a或h840a)以及核酸酶结构域的全部或一部分的缺失。[0744]本文也设想能够从先前功能性版本的多核苷酸可编程核苷酸结合结构域生成催化上死亡的多核苷酸可编程核苷酸结合结构域的突变。例如,在催化上死亡的cas9(“dcas9”)的情况下,提供了具有除d10a和h840a之外的突变的变体,其导致无核酸酶活性的cas9。举例而言,此类突变包括在d10和h840处的其他氨基酸置换,或cas9的核酸酶结构域内的其他置换(例如,hnh核酸酶次结构域和/或ruvc1次结构域中的置换)。基于本公开和本领域知识,其他合适的无核酸酶活性的dcas9结构域对于本领域技术人员是显而易见的并且出于本公开的范畴内。此等其他示例性合适的无核酸酶活性的cas9结构域包括但不限于,d10a/h840a、d10a/d839a/h840a和d10a/d839a/h840a/n863a突变结构域(参见,例如,prashant等人,cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.naturebiotechnology.2013;31(9):833-838,其整体内容通过引用并入本文)。[0745]可并入碱基编辑器的多核苷酸可编程核苷酸结合结构域的非限制性示例包括衍生自crispr蛋白的结构域、限制性核酸酶、巨核酸酶、tal核酸酶(talen)和锌指核酸酶(zfn)。在一些实施方案中,碱基编辑器包含具有天然或修饰的蛋白质或其部分的多核苷酸可编程核苷酸结合结构域,经由结合的向导多核苷酸,该多核苷酸可编程核苷酸结合结构域能够在crispr(即,成簇的规则间隔短回文重复序列)介导的核酸修饰期间结合至核酸序列。本文中,该蛋白质称为“crispr蛋白”。据此,本文公开一种包含具有crispr蛋白的全部或一部分的多核苷酸可编程核苷酸结合结构域的碱基编辑器(即,包含crispr蛋白的全部或一部分作为结构域(也称为衍生自crispr蛋白的结构域)的碱基编辑器)。与野生型或天然版本的crispr蛋白相比,并入碱基编辑器中的衍生自crispr蛋白的结构域可以经修饰。例如,如下所述,相对于野生型或天然版本的crispr蛋白,衍生自crispr蛋白的结构域可包含一种或多种突变、插入、缺失、重排和/或重组。[0746]crispr是一种适应性免疫系统,其提供针对移动基因元件(病毒、转座因子和接合质粒)的保护。crispr簇含有间隔序列、与前驱移动元件互补的序列和靶标侵入核酸。crispr簇被转录并处理为crisprrna(crrna)。在ii型crispr系统中,pre-crrna的正确处理需要反向编码的小rna(tracrrna)、内源性核糖核酸酶3(rnc)和cas9蛋白。tracrrna充当向导用于核糖核酸酶3辅助的pre-crrna处理。随后,cas9/crrna/tracrrna核酸内切地切割与间隔序列互补的线性或环状dsdna靶标。不与crrna互补的靶标链首先被核酸内切地切断,然后被3'-5'核酸外切地修剪。在自然界,dna结合和切割通常需要蛋白质和两种rna。但是,单向导rna(“sgrna”或简写为“grna”)可以经工程改造以将多种crrna和tracrrna并入单一rna物质中。参见,例如,jinekm.等人,science337:816-821(2012),其整体内容通过引用并入本文。。cas9识别crispr重复序列中的短基序(pam或前间区序列邻近基序)以帮助区分自我与非自我。[0747]在一些实施方案中,本文所述的方法可利用经工程改造的cas蛋白。向导rna(grna)是一种短合成rna,由cas结合所必需的支架序列和限定待修饰的基因组靶标的使用者定义的~20个核苷酸的间隔序列。因此,技术人员可改变cas蛋白的基因组靶标,特异性部分地通过grna靶向序列对于基因组靶标的特异性与对于该基因剩余部分的特异性如何来确定。[0748]在一些实施方案中,grna支架序列如下:[0749]guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。[0750]在一种实施方案中,rna支架包含茎环。在一种实施方案中,rna支架包含核酸序列:[0751]guuuuuguacucucaagauuuaaguaacuguacaacgaaacuuacacaguuacuuaaaucuugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcagggug。[0752]在一种实施方案中,rna支架包含标准茎环。在一种实施方案中,rna支架包含核酸序列:[0753]guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcu*mu*mu*mu[0754]其中m=2'-o-甲基修饰且*=3'硫代磷酸酯核苷酸见链接(即,第一个3'端rna残基在这里显示)。[0755]在一种实施方案中,rna支架包含核酸序列:[0756]guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu[0757]其中m=2'-o-甲基修饰且*=3'硫代磷酸酯核苷酸见链接(即,第一个3'端rna残基在这里显示)。[0758]在一种实施方案中,酿脓链球菌sgrna支架多核苷酸序列如下:[0759]guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc。[0760]在一种实施方案中,金黄色葡萄球菌sgrna支架多核苷酸序列如下:[0761]guuuuaguacucuguaaugaaaauuacagaaucuacuaaaacaaggcaaaaugccguguuuaucucgucaacuuguuggcgaga。[0762]在一种实施方案中,bhcas12bsgrna支架具有以下多核苷酸序列:[0763]guucugtcuuuuggucaggacaaccgucuagcuauaagugcugcagggugugagaaacuccuauugcuggacgaugucucuuacgaggcauuagcac。[0764]在一种实施方案中,bvcas12bsgrna支架具有以下多核苷酸序列:[0765]gaccuauagggucaaugaaucugugcgugugccauaaguaauuaaaaauuacccaccacaggagcaccugaaaacaggugcuuggcac。[0766]在一种实施方案中,rna支架包含非标准序列。在一种实施方案中,rna支架包含核酸序列:[0767]guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagugggaccgagucggugcu*mu*mu*muthermophilus)(ncbiref:yp_820832.1);无害利斯特菌(listeriainnocua)(ncbiref:np_472073.1);空肠弯曲杆菌(campylobacterjejuni)(ncbiref:yp_002344900.1);脑膜炎奈瑟氏菌(neisseriameningitidis)(ncbiref:yp_002342100.1);酿脓链球菌(streptococcuspyogenes)或金黄色葡萄球菌(staphylococcusaureus)。[0773]核碱基编辑器的cas9结构域[0774]cas9核酸酶序列和结构是本领域技术人员周知的(参见,例如,“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferretti,j.j.等人,natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.等人,nature471:602-607(2011);和“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.等人,science337:816-821(2012),其各自的整体内容通过引用并入本文)。cas9直系同源物已经在各种物种中描述,包括酿脓链球菌(s.pyogenes)和嗜热链球菌(s.thermophilus)。基于本公开,其他合适的cas9核酸酶和序列对于本领域技术人员将是显而易见的,并且此类cas9核酸酶和序列包括来自生物体和基因座的cas9序列,如chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737中所公开的;其整体内容通过引用并入本文。[0775]在一些实施方案中,核酸可编程dna结合结构域(napdnabp)是cas9结构域。非限制性的示例性cas9结构域在本文中提供。cas9结构域可以是核酸酶活性的cas9结构域、无核酸酶活性的cas9结构域(dcas9)或cas9切口酶(ncas9)。在一些实施方案中,cas9结构域是核酸酶活性的结构域。例如,cas9结构域可以是切断双螺旋核酸的两条链(例如,双螺旋dna分子的两条链)的cas9结构域。在一些实施方案中,cas9结构域包含本文中详述的氨基酸序列中的任一者。在一些实施方案中,cas9结构域包含氨基酸序列,该氨基酸序列与本文详述的氨基酸序列中的任一者至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的氨基酸序列中的任一者相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的氨基酸序列中的任一者相比,该氨基酸序列具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、或至少1200个相同的连续氨基酸残基。[0776]在一些实施方案中,提供包含cas9的片段的蛋白质。例如,在一些实施方案中,蛋白质包含一个或两个cas9结构域:(1)cas9的grna结合结构域;或(2)cas9的dna切割结构域。在一些实施方案中,包含cas9或其片段的蛋白质称为“cas9变体”。cas9变体与cas9或其片段共享同源性。例如,cas9变体与野生型cas9至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,与野生型cas9相比,cas9变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个氨基酸变化。在一些实施方案中,cas9变体包含cas9的片段(例如,grna结合结构域或dna切割结构域),使得该片段与野生型cas9的对应片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,该片段是对应的野生型cas9的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%、或至少99.5%。在一些实施方案中,该片段是至少100个氨基酸的长度。在一些实施方案中,该片段是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、或至少1300个氨基酸的长度。[0777]在一些实施方案中,如本文所提供的cas9融合蛋白包含cas9蛋白(例如,本文所提供的cas9序列中的一者)的全长氨基酸序列。然而,在其他实施方案中,本文所提供的融合蛋白不包含全长cas9序列,而仅包含其一个或多个片段。合适的cas9结构域和cas9片段的示例性氨基酸序列提供在本文中,且cas9结构域和片段的其他合适的序列对于本领域技术人员将是显而易见的。[0778]cas9蛋白可与向导rna缔合,该向导rna将cas9蛋白引导至与该向导rna具有互补性的特异性dna序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9结构域,例如,核酸酶活性的cas9、cas9切口酶(ncas9)、或无核酸酶活性的cas9(dcas9)。核酸可编程dna结合蛋白的示例包括而不限于,cas9(例如,dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i和cas12j/casφ。cas酶的非限制性示例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也称为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、cas12j/casφ、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii型cas效应蛋白、v型cas效应蛋白、vi型cas效应蛋白、carf、ding、其同源、或其经修饰或工程改造的版本。[0779]在一些实施方案中,野生型cas9对应于来自酿脓链球菌(streptococcuspyogenes)的cas9(ncbi参考序列:nc_017053.1)。示例性酿脓链球菌(streptococcuspyogenes)cas9(spcas9)核酸序列提供如下:[0780]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0781]示例性酿脓链球菌(streptococcuspyogenes)cas9(spcas9)氨基酸序列提供如下:[0782][0783][0784](单下划线:hnh结构域;双下划线:ruvc结构域)[0785]在一些实施方案中,野生型cas9对应于或包含以下核苷酸序列:[0786]atggataaaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctgcagga[0787]在一些实施方案中,野生型cas9对应于或包含以下氨基酸序列:[0788][0789][0790](单下划线:hnh结构域;双下划线:ruvc结构域)。[0791]在一些实施方案中,野生型cas9对应于来自酿脓链球菌(streptococcuspyogenes)的cas9(ncbi参考序列:nc_002737.2(核苷酸序列如下):[0792]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0793]在一些实施方案中,野生型cas9对应于来自酿脓链球菌(streptococcuspyogenes)的cas9(uniprot参考序列:q99zw2(氨基酸序列如下)):[0794][0795][0796](单下划线:hnh结构域;双下划线:ruvc结构域)[0797]在一些实施方案中,cas9是指来自以下的cas9:溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1)、白喉棒状杆菌(corynebacteriumdiphtheria)(ncbirefs:nc_016782.1,nc_016786.1)、螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1)、中间普雷沃菌(prevotellaintermedia)(ncbiref:nc_017861.1)、螺原体(spiroplasmataiwanense)(ncbiref:nc_021846.1)、海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1)、belliellabaltica(ncbiref:nc_018010.1)、扭曲冷弯曲菌(psychroflexustorquis)(ncbiref:nc_018721.1)、嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1)、无害利斯特菌(listeriainnocua)(ncbiref:np_472073.1)、空肠弯曲杆菌(campylobacterjejuni)(ncbiref:p_002344900.1)、或脑膜炎奈瑟氏菌(neisseriameningitidis)(ncbiref:yp_002342100.1);或是指来自任何其他生物体的cas9。specificityscreeningandpairednickasesforcooperativegenomeengineering.naturebiotechnology.2013;31(9):833-838,其整体内容通过引用并入本文)。[0803]在一些实施方案中,cas9核酸酶具有失活的(例如,灭活的)dna切割结构域,换言之,cas9是切口酶,称为“ncas9”蛋白(对于“切口酶”cas9)。无核酸酶活性的cas9蛋白可以互换地称为“dcas9”蛋白(对于核酸酶“死亡的”cas9)或无催化活性的cas9。用于生成具有无活性的dna切割结构域的cas9蛋白(或其片段)是已知的(参见,例如,jinek等人,science.337:816-821(2012);qi等人,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression”(2013)cell.28;152(5):1173-83,其各自的整体内容通过引用并入本文)。例如,已知cas9的dna切割结构域包括两个次结构域:hnh核酸酶次结构域和ruvc1次结构域。hnh次结构域切割与grna互补的链,而ruvc1次结构域切割非互补链。这些次结构域中的突变可以沉默cas9的核酸酶活性。例如,突变d10a和h840a将酿脓链球菌cas9的核酸酶活性完全灭活(jinek等人,science.337:816-821(2012);qi等人,cell.28;152(5):1173-83(2013))。[0804]在一些实施方案中,dcas9结构域包含氨基酸序列,该氨基酸序列与本文所提供的dcas9结构域中的任一者至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的氨基酸序列中的任一者相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方案中,cas9结构域包含氨基酸序列,与本文详述的氨基酸序列中的任一者相比,该氨基酸序列具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、或至少1200个相同的连续氨基酸残基。[0805]在一些实施方案中,dcas9对应于或者部分或整体地包含具有一个或多个突变的cas9氨基酸序列,该突变将cas9核酸酶活性灭活。在一些实施方案中,无核酸酶活性的dcas9结构域包含本文详述的氨基酸序列的d10x突变和h840x突变,或本文所提供的任何氨基酸序列中的对应突变,其中x是任何氨基酸变化。在一些实施方案中,无核酸酶活性的dcas9结构域包含本文详述的氨基酸序列的d10a突变和h840a突变,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,无核酸酶活性的cas9结构域包含克隆载体pplattet-grna2(登录号bav54124)中详述的氨基酸序列。[0806]在一些实施方案中,dcas9包含dcas9(d10a和h840a)的氨基酸序列:[0807][0808][0809](单下划线:hnh结构域;双下划线:ruvc结构域)。[0810]在一些实施方案中,示例性的无催化活性的cas9(dcas9)的氨基酸序列如下:[0811]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0812](参见,例如,qi等人,“repurposingcrisprasanrna-guidedplatformforsequence-specificcontrolofgeneexpression.”cell.2013;152(5):1173-83,其整体内容通过引用并入本文)。[0813]在一些实施方案中,示例性的无催化活性的cas9(dcas9)的氨基酸序列如下:[0814]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0815]在一些实施方案中,cas9结构域包含d10a突变,而上文提供的氨基酸序列中的位置840处或本文提供的任何氨基酸序列中对应位置处的残基保持为组氨酸。[0816]在其他实施方案中,提供具有除d10a和h840a之外的突变的dcas9变体,这利润导致无核酸酶活性的cas9(dcas9)。举例而言,此类突变包括在d10和h840处的其他氨基酸置换,或cas9的核酸酶结构域内的其他置换(例如,hnh核酸酶次结构域和/或ruvc1次结构域中的置换)。在一些实施方案中,提供dcas9的变体或同源物,它们至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,提供具有氨基酸序列的dcas9变体,该氨基酸序列更短或更长,相异约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。[0817]基于本公开和本领域知识,其他合适的无核酸酶活性的dcas9结构域对于本领域技术人员将是显而易见的并且出于本公开的范畴内。此等其他示例性合适的无核酸酶活性的cas9结构域包括但不限于,d10a/h840a、d10a/d839a/h840a和d10a/d839a/h840a/n863a突变结构域(参见,例如,prashant等人,cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.naturebiotechnology.2013;31(9):833-838,其整体内容通过引用并入本文)。[0818]在一些实施方案中,cas9核酸酶具有失活的(例如,灭活的)dna切割结构域,换言之,cas9是切口酶,称为“ncas9”蛋白(对于“切口酶”cas9)。cas9切口酶可以是能够仅切割双螺旋核酸分子(例如,双螺旋dna分子)的一条链的cas9蛋白。在一些实施方案中,cas9切口酶切割双螺旋核酸分子的靶标链,意味着cas9切口酶切割与结合至cas9的grna(例如,sgrna)碱基配对的链。在一些实施方案中,cas9切口酶包含d10a突变并且在位置840处具有组氨酸。在一些实施方案中,cas9切口酶切割双螺旋核酸分子的非靶标、非碱基编辑链,意味着cas9切口酶切割不与结合至cas9的grna(例如,sgrna)碱基配对的链。在一些实施方案中,cas9切口酶包含h840a突变并且在位置10处具有天冬氨酸残基,或对应的突变。在一些实施方案中,cas9切口酶包含氨基酸序列,该氨基酸序列与本文所提供的cas9切口酶中的任一者至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。基于本公开和本领域知识,其他合适的cas9切口酶对于本领域技术人员将是显而易见的并且出于本公开的范畴内。[0819]示例性的催化cas9切口酶(ncas9)的氨基酸序列如下:[0820]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0821]在一些实施方案中,cas9是指来自古生菌(例如,纳米古生菌)的cas9,其构成单细胞原核微生物的领域和王国。在一些实施方案中,核酸可编程dna结合蛋白可以是asx或casy蛋白,其已经描述于例如burstein等人,“newcrispr-cassystemsfromuncultivatedmicrobes.”cellres.2017feb21.doi:10.1038/cr.2017.21中,其整体内容通过引用并入本文。使用基因组解析的宏基因组学,鉴定了大量crispr-cas系统,包括在古生菌生命领域首次报告的cas9。这种不同的cas9蛋白是在很少研究的纳米古生菌中作为活性crispr-cas系统发现的。在细菌中发现了两种先前未知的系统,crispr-casx和crispr-casy,它们是迄今发现的最为紧凑的系统中的一个。在一些实施方案中,在本文所述的碱基编辑器系统中,cas9被casx或casx的变体替换。在一些实施方案中,在本文所述的碱基编辑器系统中,cas9被casy或casy的变体替换。应了解,其他rna引导的dna结合蛋白可以用作核酸可编程dna结合蛋白(napdnabp),并且出于本公开的范畴内。[0822]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是casx或casy蛋白。在一些实施方案中,napdnabp是casx蛋白。在一些实施方案中,napdnabp是casy蛋白。在一些实施方案中,可编程核苷酸结合蛋白包含氨基酸序列,该氨基酸序列与本文所述的casx或casy蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。在一些实施方案中,可编程核苷酸结合蛋白是天然存在的casx或casy蛋白。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与天然存在的casx或casy蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。应了解,来自其他细菌物种的casx和casy也可根据本公开使用。[0823]示例性casx((uniprot.org/uniprot/f0nn87;[0824]uniprot.org/uniprot/f0nh53)tr|f0nn87|f0nn87_sulihcrispr相关casx蛋白os=冰岛硫化叶菌(sulfolobusislandicus)(菌株hve10/4)gn=sih_0402pe=4sv=1)氨基酸序列如下:[0825]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefyefgrspgmvertrrvklevephyliiaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvriytisdavgqnpttinggfsidltkllekryllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg.[0826]示例性casx(》tr|f0nh53|f0nh53_sulircrispr相关蛋白,casxos=冰岛硫化叶菌(菌株rey15a)gn=sire_0771pe=4sv=1)氨基酸序列如下:[0827]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefykfgrspgmvertrrvklevephylimaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvsiytisdavgqnpttinggfsidltkllekrdllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg.[0828]δ变形菌纲casx[0829]mekrinkirkklsadnatkpvsrsgpmktllvrvmtddlkkrlekrrkkpevmpqvisnnaannlrmllddytkmkeailqvywqefkddhvglmckfaqpaskkidqnklkpemdekgnlttagfacsqcgqplfvykleqvsekgkaytnyfgrcnvaeheklillaqlkpvkdsdeavtyslgkfgqraldfysihvtkesthpvkplaqiagnryasgpvgkalsdacmgtiasflskyqdiiiehqkvvkgnqkrleslrelagkenleypsvtlppqphtkegvdfayneviarvrmwvnlnlwqklklsrddakpllrlkgfpsfpvverrenevdwwntinevkklidakrdmgrvfwsgvtaekrntilegynylpnendhkkregslenpkkpakrqfgdlllylekkyagdwgkvfdeaweridkkiagltshiereearnaedaqskavltdwlrakasfvlerlkemdekefyaceiqlqkwygdlrgnpfaveaenrvvdisgfsigsdghsiqyrnllawkylengkrefyllmnygkkgrirftdgtdikksgkwqgllygggkakvidltfdpddeqliilplafgtrqgrefiwndllsletgliklangrviektiynkkigrdepalfvaltferrevvdpsnikpvnligvargenipavialtdpegcplpefkdssggptdilrigegykekqraiqaakeveqrraggysrkfasksrnladdmvrnsardlfyhavthdavlvfanlsrgfgrqgkrtfmterqytkmedwltaklayegltsktylsktlaqytsktcsncgftityadmdvmlvrlkktsdgwattlnnkelkaeyqityynrykrqtvekelsaeldrlseesgnndiskwtkgrrdealfllkkrfshrpvqeqfvcldcghevhaaeqaalniarswlflnsnstefksyksgkqpfvgawqafykrrlkevwkpna[0830]示例性casy[0831]((ncbi.nlm.nih.gov/protein/apg80656.1)》apg80656.1crispr相关蛋白casy[未培养的parcubacteria组细菌])氨基酸序列如下:[0832]mskrhprisgvkgyrlhaqrleytgksgamrtikyplysspsggrtvpreivsainddyvglyglsnfddlynaekrneekvysvldfwydcvqygavfsytapgllknvaevrggsyeltktlkgshlydelqidkvikflnkkeisrangsldklkkdiidcfkaeyrerhkdqcnkladdiknakkdagaslgerqkklfrdffgiseqsendkpsftnplnltccllpfdtvnnnrnrgevlfnklkeyaqkldknegslemweyigignsgtafsnflgegflgrlrenkitelkkammditdawrgqeqeeelekrlrilaaltiklrepkfdnhwggyrsdingklsswlqnyinqtvkikedlkghkkdlkkakeminrfgesdtkeeavvssllesiekivpddsaddekpdipaiaiyrrflsdgrltlnrfvqredvqealikerleaekkkkpkkrkkksdaedeketidfkelfphlakplklvpnfygdskrelykkyknaaiytdalwkavekiyksafssslknsffdtdfdkdffikrlqkifsvyrrfntdkwkpivknsfapycdivslaenevlykpkqsrsrksaaidknrvrlpsteniakagialarelsvagfdwkdllkkeeheeyidlielhktalalllavtetqldisaldfvengtvkdfmktrdgnlvlegrflemfsqsivfselrglaglmsrkefitrsaiqtmngkqaellyiphefqsakittpkemsrafldlapaefatslepeslseksllklkqmryyphyfgyeltrtgqgidggvaenalrlekspvkkreikckqyktlgrgqnkivlyvrssyyqtqflewflhrpknvqtdvavsgsflidekkvktrwnydaltvalepvsgservfvsqpftifpeksaeeegqrylgidigeygiaytaleitgdsakildqnfisdpqlktlreevkglkldqrrgtfampstkiarireslvhslrnrihhlalkhkakivyelevsrfeegkqkikkvyatlkkadvyseidadknlqttvwgklavaseisasytsqfcgackklwraemqvdetittqeligtvrvikggtlidaikdfmrppifdendtpfpkyrdfcdkhhiskkmrgnsclficpfcranadadiqasqtiallryvkeekkvedyferfrklknikvlgqmkki。[0833]cas9核酸酶具有两个功能性核酸内切酶结构域:ruvc和hnh。cas9在靶标结合时经历构象变化,将核酸酶结构域定位以切割靶标dna的相反链。theendresultofcas9介导的dna切割的最终结果是靶标dna(pam序列上游的~3-4核苷酸)内的双链断裂(dsb)。然后,所得dsb通过两种通用修复途径的一种修复:(1)有效但易错的非同源末端接合(nhej)途径;或(2)效率较低但高保真度同源性引导修复(hdr)途径。[0834]非同源末端接合(nhej)和/或同源性引导修复(hdr)的“效率”可以通过任何便利的方法计算。例如,在一些实施方案中,效率可以表达为成功hdr的百分比。例如,surveyor核酸酶测定可用于生成切割产物,并且产物与底物的比率可以用于计算该百分比。例如,可使用surveyor核酸酶,该酶直接切割含有新整合的限制性序列的dna,而该dna作为成功hdr的结果。经切割的底物越多,表明hdr的百分比越高(hdr的效率越高)。作为说明性示例,hdr的分数(百分比)可以使用以下等式计算:[(经切割的产物)/(底物加上经切割的产物)](例如,(b+c)/(a+b+c),其中“a”是dna底物的带强度,且“b”和“c”是经切割的产物)。[0835]在一些实施方案中,效率可以表达为成功nhej的百分比。例如,t7核酸内切酶i测定可用于生成切割产物,并且产物与底物的比率可以用于计算nhej百分比。t7核酸内切酶i切割由野生型和突变体dna链杂交而来的错配杂双螺旋dna(nhej在原始断裂的位点处生成小随机插入或缺失(插入缺失))。切割越多,表明nhej的百分比越高(nhej的效率越高)。作为说明性示例,nhej的分数(百分比)可以使用以下等式计算:(1-(1-(b+c)/(a+b+c))1/2)×100,其中“a”是dna底物的带强度,且“b”和“c”是切割产物(ran等人,cell.2013sep.12;154(6):1380-9;和ran等人,natprotoc.2013nov.;8(11):2281–2308)。[0836]nhej修复途径是活性最高的修复途径,并且其频繁地在dsb位点处造成小核苷酸插入或缺失(插入缺失)。nhej介导的dsb修复的随机性具有重要的实践意义,因为表达cas9和grna或向导多核苷酸的细胞群可以导致不同配置的突变。在大多数实施方案中,nhej在靶标dna中产生小插入缺失,导致氨基酸缺失、插入或框移突变,造成所靶向基因的开放阅读框(orf)内的过早终止密码子。理想的最终结果是所靶向基因内的功能丧失突变。[0837]尽管nhej介导的dsb修复经常中断该基因的开放阅读框,但同源性引导修复(hdr)可用于生成从单核苷酸变化到大插入范围内的特异性核苷酸变化,如荧光团或标签的添加。[0838]为了利用hdr进行基因编辑,可以使用grna和cas9或cas9切口酶将含有所希望的序列的dna修复模板递送至感兴趣的细胞类型中。修复模板可含有所希望的编辑以及位于靶标上游和下游紧邻该靶标的同源序列(称为左右同源臂)。每个同源臂的长度可以取决于被引入的变化的尺寸,且插入越大,所需的同源臂越长。修复模板可以是单链寡核苷酸、双链寡核苷酸或双链dna质粒。即使在表达cas9、grna和外源性修复模板的细胞内,hdr的效率通常也较低(《10%的经修饰的等位基因)。hdr的效率可以通过将细胞同步化而增强,因为hdr在细胞周期的s期和g2期发生。化学或遗传学地抑制牵涉入nhej的基因也可增加hdr频率。[0839]在一些实施方案中,cas9是经修饰的cas9。给定的grna靶向序列可在部分同源性存在之处的整个基因组中具有额外位点。这些位点称为脱靶并且在涉及grna时应予以考虑。除了优化grna设计之外,crispr特异性也可以通过修饰cas9而增加。cas9通过两个核酸酶结构域ruvc和hnh的组合活性产生双链断裂(dsb)。cas9切口酶,spcas9的d10a突变体,保持一个核酸酶结构域并产生dna切口而非dsb。切口酶系统也可以与hdr介导的编辑组合以进行特异性基因编辑。[0840]在一些实施方案中,cas9是变体cas9蛋白。变体cas9多肽具有氨基酸序列,该氨基酸序列较之于野生型cas9蛋白的氨基酸序列相异一个氨基酸(例如,具有缺失、插入、置换、融合)。在一些实例中,变体cas9多肽具有氨基酸变化(例如,缺失、插入或置换),该变化降低cas9多肽的核酸酶活性。例如,在一些实例中,变体cas9多肽具有低于50%、低于40%、低于30%、低于20%、低于10%、低于5%、或低于1%的对应野生型cas9蛋白的核酸酶活性。在一些实施方案中,变体cas9蛋白基本上没有核酸酶活性。当受试cas9蛋白是基本上没有核酸酶活性的变体cas9蛋白时,它可以称为“dcas9”。[0841]在一些实施方案中,变体cas9蛋白具有降低的核酸酶活性。例如,变体cas9蛋白表现出低于约20%、低于约15%、低于约10%、低于约5%、低于约1%、或低于约0.1%的野生型cas9蛋白(例如,野生型cas9蛋白)的核酸内切酶活性。[0842]在一些实施方案中,变体cas9蛋白可切割向导靶标核酸的互补链,但切割双链向导靶标序列的非互补链的能力降低。例如,变体cas9蛋白可具有降低ruvc结构域的功能的突变(氨基酸置换)。作为非限制性示例,在一些实施方案中,变体cas9蛋白具有d10a(在氨基酸位置10处用天冬氨酸代替丙氨酸),并且因此可切割双链向导靶标序列的互补链但切割双链向导靶标序列的非互补链的能力降低(因此当变体cas9蛋白切割双链靶标核酸时导致单链断裂(ssb)而非双链断裂(dsb))(参见,例如,jinek等人,science.2012aug.17;337(6096):816-21)。[0843]在一些实施方案中,变体cas9蛋白可切割双链向导靶标核酸的非互补链,但切割向导靶标序列的互补链的能力降低。例如,变体cas9蛋白可具有降低hnh结构域(ruvc/hnh/ruvc结构域基序)的功能的突变(氨基酸置换)。作为非限制性示例,在一些实施方案中,变体cas9蛋白具有h840a(在氨基酸位置840处用组氨酸代替丙氨酸)突变,并且因此可切割向导靶标序列的非互补链但切割向导靶标序列的互补链的能力降低(因此当变体cas9蛋白切割双链向导靶标序列时导致ssb而非dsb)。这种cas9蛋白切割向导靶标序列(例如,单链向导靶标序列)的能力降低,但保持结合向导靶标序列(例如,单链向导靶标序列)的能力。[0844]在一些实施方案中,变体cas9蛋白切割双链靶标dna的互补链和非互补链两者的能力降低。作为非限制性示例,在一些实施方案中,变体cas9蛋白携带d10a突变和h840a突变两者,使得该多肽切割双链靶标dna的互补链和非互补链两者的能力降低。这种cas9蛋白切割靶标dna(例如,单链靶标dna)的能力降低,但保持结合靶标dna(例如,单链靶标dna)的能力。[0845]作为另一非限制性示例,在一些实施方案中,变体cas9蛋白携带w476a和w1126a突变,使得该多肽切割靶标dna的能力降低。这种cas9蛋白切割靶标dna(例如,单链靶标dna)的能力降低,但保持结合靶标dna(例如,单链靶标dna)的能力。[0846]作为另一非限制性示例,在一些实施方案中,变体cas9蛋白携带p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得该多肽切割靶标dna的能力降低。这种cas9蛋白切割靶标dna(例如,单链靶标dna)的能力降低,但保持结合靶标dna(例如,单链靶标dna)的能力。[0847]作为另一非限制性示例,在一些实施方案中,变体cas9蛋白携带h840a、w476a和w1126a突变,使得该多肽切割靶标dna的能力降低。这种cas9蛋白切割靶标dna(例如,单链靶标dna)的能力降低,但保持结合靶标dna(例如,单链靶标dna)的能力。作为另一非限制性示例,在一些实施方案中,变体cas9蛋白携带h840a、d10a、w476a和w1126a突变,使得该多肽切割靶标dna的能力降低。这种cas9蛋白切割靶标dna(例如,单链靶标dna)的能力降低,但保持结合靶标dna(例如,单链靶标dna)的能力。在系实施方案中,变体cas9在cas9hnh结构域中的位置840处具有恢复的催化his残基(a840h)。[0848]作为另一非限制性示例,在一些实施方案中,变体cas9蛋白携带h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得该多肽切割靶标dna的能力降低。这种cas9蛋白切割靶标dna(例如,单链靶标dna)的能力降低,但保持结合靶标dna(例如,单链靶标dna)的能力。作为另一非限制性示例,在一些实施方案中,变体cas9蛋白携带d10a、h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得该多肽切割靶标dna的能力降低。这种cas9蛋白切割靶标dna(例如,单链靶标dna)的能力降低,但保持结合靶标dna(例如,单链靶标dna)的能力。在一些实施方案中,当变体cas9蛋白携带w476a和w1126a突变时或当变体cas9蛋白携带p475a、w476a、n477a、d1125a、w1126a和d1127a突变时,变体cas9蛋白不有效地结合至pam序列。因此,在一些此类实施方案中,当这种变体cas9蛋白在结合方法中使用时,该方法不需要pam序列。换言之,在一些实施方案中,当这种变体cas9蛋白在结合方法中使用时,该方法可包括向导rna,但该方法可在pam序列不存在下执行(并且结合特异性因此由向导rna的靶向链段提供)。其他残基可经突变以实现上述效果(即,将一个或其他核酸酶蛋白灭活)。作为非限制性示例,残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987可改变(即,置换)。而且,除丙氨酸置换之外的突变是合适的。[0849]在一些实施方案中,变体cas9蛋白具有降低的催化活性(即,当cas9蛋白具有d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987突变,例如,d10a、g12a、g17a、e762a、h840a、n854a、n863a、h982a、h983a、a984a和/或d986a时),该变体cas9蛋白仍可以位点特异性的方式结合至靶标dna(因为它仍然被向导rna引导至靶标dna序列),只要它保持与向导rna相互作用的能力即可。[0850]在一些实施方案中,变体cas蛋白可以是spcas9、spcas9-vrqr、spcas9-vrer、xcas9(sp)、sacas9、sacas9-kkh、spcas9-mqkser、spcas9-lrkiqk或spcas9-lrvsql。[0851]在一些实施方案中,使用包括氨基酸置换d1135m、s1136q、g1218k、e1219f、a1322r、d1332a、r1335e和t1337r且对于改变的pam5'-ngc-3'具有特异性的spcas9(spcas9-mqkfraer)。[0852]酿脓链球菌cas9的替代物可以包括来自cpf1家族的rna引导的核酸内切酶,其在哺乳动物细胞中表现出切割活性。来自普雷沃菌属(prevotella)和弗朗西丝氏菌属(francisella1)(crispr/cpf1)的crispr是类似于crispr/cas9系统的dna编辑技术。cpf1是ii类crispr/cas系统的rna引导的核酸内切酶。这种获得性免疫机制见于普雷沃菌属和弗朗西丝氏菌属细菌。cpf1基因与crispr基因座相关,编码使用向导rna来发现并切割病毒dna的核酸内切酶。cpf1是一种比cas9更小且更简单的核酸内切酶,克服了crispr/cas9系统的一些限制。不同于cas9核酸酶,cpf1介导的dna切割的结果是具有短3'突出部分的双链断裂。cpf1的交错切割模式可以产生定向基因转移的可能性,类似于传统的限制酶克隆,这可增加基因编辑的效率。类似于上述cas9变体和同源物,cpf1也可以扩展可以被crispr靶向至缺乏spcas9偏好的nggpam位点的富含at的区域或富含at的基因组的位点数。cpf1基因座含有混合的α/β结构域,ruvc-i,之后是螺旋区,ruvc-ii和锌指样结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域。[0853]此外,不同于cas9,cpf1没有hnh核酸内切酶结构域,且cpf1的n端没有cas9的α-螺旋识别叶。cpf1crispr-cas结构域架构显示,cpf1在功能上是独特的,被归类为2类v型crispr系统。cpf1基因座编码cas1、cas2和cas4蛋白,相较于ii型系统,它们更类似于i型和iii型系统。功能性cpf1不需要反向激活crisprrna(tracrrna),因此仅需要crispr(crrna)。这有利于基因组编辑,因为tcpf1不仅比cas9小,而且它具有更小的sgrna分子(核苷酸数是cas9中核苷酸数的大约一半)。与被cas9靶向的富含g的pam相反,cpf1-crrna复合物通过鉴定前间区序列邻近基序5'-ytn-3'或5'-ttn-3'来切割靶标dna或rna。在鉴定pam后,cpf1引入具有4或5个核苷酸突出部分的粘端样dna双链断裂。[0854]在一些实施方案中,cas9是cas9变体,该变体对于改变的pam序列具有特异性。在一些实施方案中,额外的cas9变体和pam序列描述于miller,s.m.,等人continuousevolutionofspcas9variantscompatiblewithnon-gpams,nat.biotechnol.(2020)中其整体内容通过引用并入本文。在一些实施方案中,cas9没有特异性pam要求。在一些实施方案中,cas9变体,例如,spcas9变体,对于nrnhpam具有特异性,其中r是a或g且h是a、c或t。在一些实施方案中,spcas9变体具有对于pam序列aaa、taa、caa、gaa、tat、gat或cac的特异性。在一些实施方案中,spcas9变体包含在位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337或1339处或其对应位置处的氨基酸置换。在一些实施方案中,spcas9变体包含在位置1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335或1337处或其对应位置处的氨基酸置换。在一些实施方案中,spcas9变体包含在位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333处或其对应位置处的氨基酸置换。在一些实施方案中,spcas9变体包含在位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339处或其对应位置处的氨基酸置换。在一些实施方案中,spcas9变体包含在位置1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349处或其对应位置处的氨基酸置换。spcas9变体的示例性氨基酸置换和pam特异性显示在表3a至表3d中。[0855]表3aspcas9变体[0856][0857][0858][0859][0860]在一些实施方案中,cas9是脑膜炎奈瑟氏菌(neisseriameningitidis)cas9(nmecas9)或其变体。在一些实施方案中,nmecas9对于nnnngaywpam具有特异性,其中y是c或t且w是a或t。在一些实施方案中,nmecas9对于nnnngyttpam具有特异性,其中y是c或t。在一些实施方案中,nmecas9对于nnnngtctpam具有特异性。在一些实施方案中,nmecas9是nme1cas9。在一些实施方案中,nmecas9具有对于nnnngattpam、nnnncctapam、nnnncctcpam、nnnnccttpam、nnnncctgpam、nnnnccgtpam、nnnnccggpam、nnnncccapam、nnnnccctpam、nnnnccccpam、nnnnccatpam、nnnnccagpam、nnnnccatpam或nnngattpam的特异性。在一些实施方案中,nme1cas9具有对于nnnngattpam、nnnncctapam、nnnncctcpam、nnnnccttpam或nnnncctgpam的特异性。在一些实施方案中,nmecas9具有对于caapam、caaapam或ccapam的特异性。在一些实施方案中,nmecas9是nme2cas9。在一些实施方案中,nmecas9具有对于nnnncc(n4cc)pam的特异性,其中n是a、g、c或t中的任一个。在一些实施方案中,nmecas9具有对于nnnnccgtpam、nnnnccggpam、nnnncccapam、nnnnccctpam、nnnnccccpam、nnnnccatpam、nnnnccagpam、nnnnccatpam或nnngattpam的特异性。在一些实施方案中,nmecas9是nme3cas9。在一些实施方案中,nmecas9具有对于nnnncaaapam、nnnnccpam或nnnncnnnpam的特异性。如edraki等人mol.cell.(2019)73(4):714-726中所述的其他nmecas9特征和pam序列通过引用以其整体并入本文。[0861]示例性脑膜炎奈瑟氏菌(neisseriameningitidis)cas9蛋白,nme1cas9,(ncbi参考:wp_002235162.1;ii型crisprrna引导的核酸内切酶cas9)具有以下氨基酸序列:[0862][0863]示例性脑膜炎奈瑟氏菌(neisseriameningitidis)cas9蛋白,nme2cas9,(ncbi参考:wp_002230835;ii型crisprrna引导的核酸内切酶cas9)具有以下氨基酸序列:[0864][0865]核碱基编辑器的cas12结构域[0866]通常,微生物crispr-cas系统分为1类和2类系统。1类系统具有多亚基效应子复合物,而2类系统具有单一蛋白质效应子。例如,cas9和cpf1是2类效应子,但属于不同类型(分别为ii型和v型)。除了cpf1以外,2类v型crispr-cas系统也包括cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i和cas12j/casφ。参见,例如,shmakov等人,“discoveryandfunctionalcharacterizationofdiverseclass2crisprcassystems,”mol.cell,2015nov.5;60(3):385-397;makarova等人,“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprjournal,2018,1(5):325-336;和yan等人,“functionallydiversetypevcrispr-cassystems,”science,2019jan.4;363:88-91;各自的整体内容通过引用并入本文。v型cas蛋白含有ruvc(或ruvc样)核酸内切酶结构域。尽管成熟crisprrna(crrna)的生产通常不依赖于tracrrna,但cas12b/c2c1例如需要tracrrna来生产crrna。cas12b/c2c1依据crrna和tracrrna两者进行dna切割。[0867]本发明设想的核酸可编程dna结合蛋白包括归类为2类v型的cas蛋白(cas12蛋白)。2类v型cas蛋白的示例包括cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i和cas12j/casφ,其同源物或其经修饰的版本。如本文所用,cas12蛋白也可称为cas12核酸酶、cas12结构域或cas12蛋白结构域。在一些实施方案中,本发明的cas12蛋白包含被内部融合蛋白结构域诸如脱氨酶结构域中断的氨基酸序列。[0868]在一些实施方案中,cas12结构域是无核酸酶活性的cas12结构域或cas12切口酶。在一些实施方案中,cas12结构域是核酸酶活性的结构域。例如,cas12结构域可以是将双螺旋核酸(例如,双螺旋dna分子)的一条链切口的cas12结构域。在一些实施方案中,cas12结构域包含本文中详述的氨基酸序列中的任一者。在一些实施方案中,cas12结构域包含氨基酸序列,该氨基酸序列与本文详述的氨基酸序列中的任一者至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,cas12结构域包含氨基酸序列,与本文详述的氨基酸序列中的任一者相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方案中,cas12结构域包含氨基酸序列,与本文详述的氨基酸序列中的任一者相比,该氨基酸序列具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、或至少1200个相同的连续氨基酸残基。[0869]在一些实施方案中,提供包含cas12的片段的蛋白质。例如,在一些实施方案中,蛋白质包含一个或两个cas12结构域:(1)cas12的grna结合结构域;或(2)cas12的dna切割结构域。在一些实施方案中,包含cas12或其片段的蛋白质称为“cas12变体”。cas12变体与cas12或其片段共享同源性。例如,cas12变体与野生型cas12至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,与野生型cas12相比,cas12变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个氨基酸变化。在一些实施方案中,cas12变体包含cas12的片段(例如,grna结合结构域或dna切割结构域),使得该片段与野生型cas12的对应片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,该片段是对应的野生型cas12的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%、或至少99.5%。在一些实施方案中,该片段是至少100个氨基酸的长度。在一些实施方案中,该片段是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、或至少1300个氨基酸的长度。[0870]在一些实施方案中,cas12对应于或者部分或整体地包含具有一个或多个突变的cas12氨基酸序列,该突变将cas12核酸酶活性灭活。此类突变,举例而言,包括在cas12的ruvc核酸酶结构域内的氨基酸置换。在一些实施方案中,提供cas12的变体或同源物,它们与野生型cas12至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同、或至少约99.9%相同。在一些实施方案中,提供具有氨基酸序列的cas12变体,该氨基酸序列更短或更长,相异约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。[0871]在一些实施方案中,如本文所提供的cas12融合蛋白包含cas12蛋白(例如,本文所提供的cas12序列中的一者)的全长氨基酸序列。然而,在其他实施方案中,本文所提供的融合蛋白不包含全长cas12序列,而仅包含其一个或多个片段。合适的cas12结构域的示例性氨基酸序列提供在本文中,且cas12结构域和片段的其他合适的序列对于本领域技术人员将是显而易见的。[0872]通常,2类v型cas蛋白具有单一功能性ruvc核酸内切酶结构域(参见,例如,chen等人,“crispr-cas12atargetbindingunleashesindiscriminatesingle-strandeddnaseactivity,”science360:436-439(2018))。在一些情况下,cas12蛋白是变体cas12b蛋白。(参见strecker等人,naturecommunications,2019,10(1):art.no.:212)。在一种实施方案中,变体cas12多肽具有氨基酸序列,该氨基酸序列较之于野生型cas12蛋白的氨基酸序列相异1、2、3、4、5或更多个氨基酸(例如,具有缺失、插入、置换、融合)。在一些实例中,变体cas12多肽具有氨基酸变化(例如,缺失、插入或置换),该变化降低cas12多肽的活性。例如,在一些实例中,变体cas12是cas12b多肽,其具有低于50%、低于40%、低于30%、低于20%、低于10%、低于5%、或低于1%的对应野生型cas12b蛋白的切口酶活性。在一些情况下,变体cas12b蛋白基本上没有切口酶活性。[0873]在一些情况下,变体cas12b蛋白具有降低的切口酶活性。例如,变体cas12b蛋白表现出低于约20%、低于约15%、低于约10%、低于约5%、低于约1%、或低于约0.1%的野生型cas12b蛋白的切口酶活性。[0874]在一些实施方案中,cas12蛋白包括来自在哺乳动物细胞内显示活性的cas12a/cpf1家族的rna引导的核酸内切酶。来自普雷沃菌属(prevotella)和弗朗西丝氏菌属(francisella1)(crispr/cpf1)的crispr是类似于crispr/cas9系统的dna编辑技术。cpf1是ii类crispr/cas系统的rna引导的核酸内切酶。这种获得性免疫机制见于普雷沃菌属和弗朗西丝氏菌属细菌。cpf1基因与crispr基因座相关,编码使用向导rna来发现并切割病毒dna的核酸内切酶。cpf1是一种比cas9更小且更简单的核酸内切酶,克服了crispr/cas9系统的一些限制。不同于cas9核酸酶,cpf1介导的dna切割的结果是具有短3'突出部分的双链断裂。cpf1的交错切割模式可以产生定向基因转移的可能性,类似于传统的限制酶克隆,这可增加基因编辑的效率。类似于上述cas9变体和同源物,cpf1也可以扩展可以被crispr靶向至缺乏spcas9偏好的nggpam位点的富含at的区域或富含at的基因组的位点数。cpf1基因座含有混合的α/β结构域,ruvc-i,之后是螺旋区,ruvc-ii和锌指样结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域。此外,不同于cas9,cpf1没有hnh核酸内切酶结构域,且cpf1的n端没有cas9的α-螺旋识别叶。cpf1crispr-cas结构域架构显示,cpf1在功能上是独特的,被归类为2类v型crispr系统。cpf1基因座编码cas1、cas2和cas4蛋白,相较于ii型系统,它们更类似于i型和iii型系统。功能性cpf1不需要反向激活crisprrna(tracrrna),因此仅需要crispr(crrna)。这有利于基因组编辑,因为tcpf1不仅比cas9小,而且它具有更小的sgrna分子(核苷酸数是cas9中核苷酸数的大约一半)。与被cas9靶向的富含g的pam相反,cpf1-crrna复合物通过鉴定前间区序列邻近基序5'-ytn-3'或5'-tttn-3'来切割靶标dna或rna。在鉴定pam后,cpf1引入具有4或5个核苷酸突出部分的粘端样dna双链断裂。[0875]在本发明的一些方面,可使用以下载体,该载体编码相对于对应的野生型酶突变的crispr酶,使得突变的crispr酶缺乏切割含有靶标序列的靶标多核苷酸的一条或两条链的能力。cas12可以指一种多肽,其与野生型示例性cas12多肽(例如,来自外村尚芽孢杆菌的cas12)具有至少或至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列一致性和/或序列同源性。cas12可以指一种多肽,其与野生型示例性cas12多肽(例如,来自外村尚芽孢杆菌(bhcas12b)、芽孢杆菌属v3-13(bvcas12b)和嗜酸性脂环杆菌(alicyclobacillusacidiphilus)(aacas12b))具有至多或至多约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列一致性和/或序列同源性。cas12可以指野生型或经修饰形式的cas9蛋白,该经修饰形式的cas12蛋白可以包含氨基酸变化诸如缺失、插入、置换、变体、突变、融合、嵌合或其任意组合。[0876]在一些实施方案中,bhcas12b向导多核苷酸具有以下序列:[0877]bhcas12bsgrna支架(加下划线)+20nt至23nt向导序列(由nn表示)[0878]5'guucugtcuuuuggucaggacaaccgucuagcuauaagugcugcagggugugagaaacuccuauugcuggacgaugucucuuacgaggcauuagcacnnnnnnnnnnnnnnnnnnnn-3'[0879]在一些实施方案中,bvcas12b和aacas12b向导多核苷酸具有以下序列:[0880]bvcas12bsgrna支架(加下划线)+20nt至23nt向导序列(由nn表示)[0881]5'gaccuauagggucaaugaaucugugcgugugccauaaguaauuaaaaauuacccaccacaggagcaccugaaaacaggugcuuggcacnnnnnnnnnnnnnnnnnnnn-3'[0882]aacas12bsgrna支架(加下划线)+20nt至23nt向导序列(由nn表示)[0883]5'gucuaaaggacagaauuuuucaacgggugugccaauggccacuuuccagguggcaaagcccguugaacuucucaaaaagaacgaucugagaaguggcacnnnnnnnnnnnnnnnnnnnn-3'[0884]核酸可编程dna结合蛋白[0885]本公开的一些方面提供包含充当核酸可编程dna结合蛋白的结构域的融合蛋白,其可用于将蛋白质诸如碱基编辑器引导至特异性核酸(例如,dna或rna)序列。在特定实施方案中,融合蛋白包含核酸可编程dna结合蛋白结构域和脱氨酶结构域。核酸可编程dna结合蛋白的非限制性示例包括cas9(例如,dcas9和ncas9)、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i和cas12j/casφ。cas酶的非限制性示例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也称为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、cas12j/casφ、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、ii型cas效应蛋白、v型cas效应蛋白、vi型cas效应蛋白、carf、ding、其同源、或其经修饰或工程改造的版本。其他核酸可编程dna结合蛋白也处于本公开范畴内,但它们可以未在本公开中具体列出。参见,例如,makarova等人“classificationandnomenclatureofcrispr-cassystems:wherefromhere?”crisprj.2018oct;1:325-336.doi:10.1089/crispr.2018.0033;yan等人,“functionallydiversetypevcrispr-cassystems”science.2019jan4;363(6422):88-91.doi:10.1126/science.aav7271,各自的整体内容通过引用并入本文。[0886]具有不同于cas9的pam特异性的核酸可编程dna结合蛋白的一个示例是来自普雷沃菌属和弗朗西丝氏菌属1(cpf1)的成簇的规则间隔短回文重复序列。类似于cas9,cpf1也是2类crispr效应子。已经证明,cpf1以不同于cas9的特征来介导稳健的dna干扰。cpf1是缺乏tracrrna的单一rna引导的核酸内切酶,并且它利用富含t的前间区序列邻近基序(ttn、ttn或ytn)。此外,cpf1经由交错的dna双链断裂来切割dna。16种cpf1家族蛋白质中,来自氨基酸球菌属(acidaminococcus)和毛螺菌科(lachnospiraceae)的两种酶显示在人类细胞中具有有效的基因组编辑活性。cpf1蛋白是本领域中已知的并且先前已经有所描述,例如yamano等人,“crystalstructureofcpf1incomplexwithguidernaandtargetdna.”cell(165)2016,p.949-962;其整体内容通过引用并入本文。[0887]可用于本发明组合物和方法中的是无核酸酶活性的cpf1(dcpf1)变体,其可用作向导核苷酸序列可编程dna结合蛋白结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域但没有hnh核酸内切酶结构域,并且cpf1的n端没有cas9的α-螺旋识别叶。zetsche等人,cell,163,759-771,2015(其通过引用并入本文)中显示,cpf1的ruvc样结构域负责切割两条dna链,并且ruvc样结构域的灭活将cpf1核酸酶活性灭活。例如,对应于新凶手弗朗西丝氏菌(francisellanovicida)cpf1中的d917a、e1006a或d1255a的突变将cpf1核酸酶活性灭活。在一些实施方案中,本公开的dcpf1包含对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应理解,可根据本公开使用任何将cpf1的ruvc结构域灭活的突变,例如,置换突变、缺失或插入。[0888]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是cpf1蛋白。在一些实施方案中,cpf1蛋白是cpf1切口酶(ncpf1)。在一些实施方案中,cpf1蛋白是无核酸酶活性的cpf1(dcpf1)。在一些实施方案中,cpf1、ncpf1或dcpf1包含氨基酸序列,该氨基酸序列与本文所公开的cpf1序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。在一些实施方案中,dcpf1包含氨基酸序列,该氨基酸序列与本文所公开的cpf1至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同;并且包含对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应了解,来自其他细菌物种的cpf1也可根据本公开使用。[0889]野生型新凶手弗朗西丝氏菌(francisellanovicida)cpf1(d917、e1006和d1255加粗并加下划线)[0890][0891][0892]新凶手弗朗西丝氏菌(francisellanovicida)cpf1d917a(a917、e1006和d1255加粗并加下划线)[0893][0894][0895]新凶手弗朗西丝氏菌(francisellanovicida)cpf1e1006a(d917、a1006和d1255加粗并加下划线)[0896][0897]新凶手弗朗西丝氏菌(francisellanovicida)cpf1d1255a(d917、e1006和a1255加粗并加下划线)[0898][0899][0900]新凶手弗朗西丝氏菌(francisellanovicida)cpf1d917a/e1006a(a917、a1006和d1255加粗并加下划线)[0901][0902]新凶手弗朗西丝氏菌(francisellanovicida)cpf1d917a/d1255a(a917、e1006和a1255加粗并加下划线)[0903][0904]新凶手弗朗西丝氏菌(francisellanovicida)cpf1e1006a/d1255a(d917、a1006和a1255加粗并加下划线)[0905][0906][0907]新凶手弗朗西丝氏菌(francisellanovicida)cpf1d917a/e1006a/d1255a(a917、a1006和a1255加粗并加下划线)[0908][0909]在一些实施方案中,融合蛋白中存在的cas9结构域中的一者可以替换为不需要pam序列的向导核苷酸序列可编程dna结合蛋白结构域。[0910]在一些实施方案中,cas9结构域是来自金黄色葡萄球菌的cas9结构域(sacas9)。在一些实施方案中,sacas9结构域是核酸酶活性的sacas9、无核酸酶活性的sacas9(sacas9d)、或sacas9切口酶(sacas9n)。在一些实施方案中,sacas9结构域包含n579a突变,或本文所提供的任何氨基酸序列中的对应突变。[0911]在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可结合至具有非标准pam的核酸序列。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可结合至具有nngrrt或nngrrtpam序列的核酸序列。在一些实施方案中,sacas9结构域包含e781x、n967x和r1014x突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变,其中x是任何氨基酸。在一些实施方案中,sacas9结构域包含e781k、n967k和r1014h突变中的一者或多者,或本文所提供的任何氨基酸序列中的一个或多个对应突变。在一些实施方案中,sacas9结构域包含e781k、n967k或r1014h突变,或本文所提供的任何氨基酸序列中的对应突变。[0912]示例性sacas9序列[0913][0914]上述加下划线并加粗的残基n579可以经突变(例如,至a579)以获得sacas9切口酶。[0915]示例性sacas9n序列[0916][0917]上述残基a579,其可以从n579突变以获得sacas9切口酶,加下划线并加粗。[0918]示例性sakkhcas9[0919][0920][0921]上述残基a579,其可以从n579突变以获得sacas9切口酶,加下划线并加粗。上述残基k781、k967和h1014,其可以从e781、n967和r1014突变以获得sakkhcas9,加下划线并以斜体显示。[0922]在一些实施方案中,napdnabp是环状排列的。在以下序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。星号(*)表示stop密码子。[0923]cp5(其中msp“ngc=具有常规cas9pam如ngg的突变的变体”pid=蛋白质相互作用结构域,且“d10a”切口酶):[0924][0925][0926]在一些实施方案中,核酸可编程dna结合蛋白(napdnabp)是微生物crispr-cas系统的单一效应子。微生物crispr-cas系统的单一效应子包括而不限于,cas9、cpf1、cas12b/c2c1和cas12c/c2c3。通常,微生物crispr-cas系统分为1类和2类系统。1类系统具有多亚基效应子复合物,而2类系统具有单一蛋白质效应子。例如,cas9和cpf1是2类效应子。除了cas9和cpf1之外,三种不同的2类crispr-cas系统(cas12b/c2c1和cas12c/c2c3)已经由shmakov等人,“discoveryandfunctionalcharacterizationofdiverseclass2crisprcassystems”,mol.cell,2015nov.5;60(3):385-397描述,其整体内容通过引用并入本文。该系统中两者的效应子,cas12b/c2c1和cas12c/c2c3,含有关于cpf1的ruvc样核酸内切酶结构域。第三种系统含有具有两个阐明的hepnrnase结构域的效应子。不同于通过cas12b/c2c1生产crisprrna,成熟crisprrna的产生时tracrrna依赖性的。cas12b/c2c1依据crisprrna和tracrrna两者进行dna切割。[0927]酸土脂环酸芽孢杆菌(alicyclobaccillusacidoterrastris)cas12b/c2c1(aacc2c1)的晶体结构已经在与嵌合单分子向导rna(sgrna)的复合物中报告。参见,例如,liu等人,“c2c1-sgrnacomplexstructurerevealsrna-guideddnacleavagemechanism”,mol.cell,2017jan.19;65(2):310-322,其整体内容通过引用并入本文。晶体结构也在结合至靶标dna的酸土脂环酸芽孢杆菌c2c1中作为三元复合物报告。参见,例如,yang等人,“pam-dependenttargetdnarecognitionandcleavagebyc2c1crispr-casendonuclease”,cell,2016dec.15;167(7):1814-1828,其整体内容通过引用并入本文。aacc2c1的催化感受态构象,其中靶标和非靶标两条dna链已经独立地捕获定位在单一ruvc催化袋内,且cas12b/c2c1介导的切割导致靶标dna的交错七核苷酸断裂。cas12b/c2c1三元复合物与先前鉴定的cas9和cpf1对应物之间的结构比较证明了crispr-cas9系统所使用的机制的多样性。[0928]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp是cas12b/c2c1蛋白。在一些实施方案中,napdnabp是cas12c/c2c3蛋白。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与天然存在的cas12b/c2c1或cas12c/c2c3蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与本文所提供的napdnabp序列中的任一者至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。应了解,来自其他细菌物种的cas12b/c2c1和cas12c/c2c3也可根据本公开使用。[0929]cas12b/c2c1((uniprot.org/uniprot/t0d7a2#2)[0930]sp|t0d7a2|c2c1_aliagcrispr相关核酸内切酶c2c1os=酸土脂环酸芽孢杆菌(菌株atcc49025/dsm3922/cip106132/ncimb13137/gd3b)gn=c2c1pe=1sv=1)氨基酸序列如下:[0931]mavksikvklrlddmpeiraglwklhkevnagvryytewlsllrqenlyrrspngdgeqecdktaeeckaellerlrarqvenghrgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekekaetrksadrtadvlraladfglkplmrvytdsemssvewkplrkgqavrtwdrdmfqqaiermmsweswnqrvgqeyaklveqknrfeqknfvgqehlvhlvnqlqqdmkeaspgleskeqtahyvtgralrgsdkvfekwgklapdapfdlydaeiknvqrrntrrfgshdlfaklaepeyqalwredasfltryavynsilrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgerrhairfhkllkvengvarevddvtvpismseqldnllprdpnepialyfrdygaeqhftgefggakiqcrrdqlahmhrrrgardvylnvsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnskgrvpfffpikgndnlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpvdaanhmtpdwreafenelqklkslhgicsdkewmdavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyakdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyaldergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqelinqaqvhdllvgtmyaafssrfdartgapgircrrvparctqehnpepfpwwlnkfvvehtldacplraddliptgegeifvspfsaeegdfhqihadlnaaqnlqqrlwsdfdisqirlrcdwgevdgelvliprltgkrtadsysnkvfytntgvtyyerergkkrrkvfaqeklseeeaellveadeareksvvlmrdpsgiinrgnwtrqkefwsmvnqriegylvkqirsrvplqdsacentgdi[0932]aaccas12b(嗜热脂环酸芽胞杆菌(alicyclobacillusacidiphilus))-wp_067623834[0933]mavksmkvklrldnmpeiraglwklhtevnagvryytewlsllrqenlyrrspngdgeqecyktaeeckaellerlrarqvenghcgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekakaearkstdrtadvlraladfglkplmrvytdsdmssvqwkplrkgqavrtwdrdmfqqaiermmsweswnqrvgeayaklveqksrfeqknfvgqehlvqlvnqlqqdmkeashgleskeqtahyltgralrgsdkvfekwekldpdapfdlydteiknvqrrntrrfgshdlfaklaepkyqalwredasfltryavynsivrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgegrhairfqklltvedgvakevddvtvpismsaqlddllprdphelvalyfqdygaeqhlagefggakiqyrrdqlnhlharrgardvylnlsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnsegrvpfcfpiegnenlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpmdanqmtpdwreafedelqklkslygicgdrewteavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyqkdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyalddergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqellnqaqvhdllvgtmyaafssrfdartgapgircrrvparcareqnpepfpwwlnkfvaehkldgcplraddliptgegeffvspfsaeegdfhqihadlnaaqnlqrrlwsdfdisqirlrcdwgevdgepvliprttgkrtadsygnkvfytktgvtyyerergkkrrkvfaqeelseeeaellveadeareksvvlmrdpsgiinrgdwtrqkefwsmvnqriegylvkqirsrvrlqesacentgdi[0934]bhcas12b(外村尚芽孢杆菌(bacillushisashii))ncbi参考序列:wp_095142515[0935]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkk[0936]在一些实施方案中,cas12b是bvcas12b(v4),其是bhcas12b的变体并且包含以下相对于bhcas12b的变化:s893r、k846r和e837g。bhcas12b(v4)表示如下:5'mrnacap‑‑‑5'utr‑‑‑bhcas12b‑‑‑stop序列‑‑‑3'utr‑‑‑120polya尾部。[0937]5'utr:[0938]gggaaataagagagaaaagaagagtaagaagaaatataagagccacc[0939]3'utr(trilink标准utr)[0940]gctggagcctcggtggccatgcttcttgccccttgggcctccccccagcccctcctccccttcctgcacccgtacccccgtggtctttgaataaagtctga[0941]bhcas12b(v4)的核酸序列[0942]atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgccaccagatccttcatcctgaagatcgagcccaacgaggaagtgaagaaaggcctctggaaaacccacgaggtgctgaaccacggaatcgcctactacatgaatatcctgaagctgatccggcaagaggccatctacgagcaccacgagcaggaccccaagaatcccaagaaggtgtccaaggccgagatccaggccgagctgtgggatttcgtgctgaagatgcagaagtgcaacagcttcacacacgaggtggacaaggacgaggtgttcaacatcctgagagagctgtacgaggaactggtgcccagcagcgtggaaaagaagggcgaagccaaccagctgagcaacaagtttctgtaccctctggtggaccccaacagccagtctggaaagggaacagccagcagcggcagaaagcccagatggtacaacctgaagattgccggcgatccctcctgggaagaagagaagaagaagtgggaagaagataagaaaaaggacccgctggccaagatcctgggcaagctggctgagtacggactgatccctctgttcatcccctacaccgacagcaacgagcccatcgtgaaagaaatcaagtggatggaaaagtcccggaaccagagcgtgcggcggctggataaggacatgttcattcaggccctggaacggttcctgagctgggagagctggaacctgaaagtgaaagaggaatacgagaaggtcgagaaagagtacaagaccctggaagagaggatcaaagaggacatccaggctctgaaggctctggaacagtatgagaaagagcggcaagaacagctgctgcgggacaccctgaacaccaacgagtaccggctgagcaagagaggccttagaggctggcgggaaatcatccagaaatggctgaaaatggacgagaacgagccctccgagaagtacctggaagtgttcaaggactaccagcggaagcaccctagagaggccggcgattacagcgtgtacgagttcctgtccaagaaagagaaccacttcatctggcggaatcaccctgagtacccctacctgtacgccaccttctgcgagatcgacaagaaaaagaaggacgccaagcagcaggccaccttcacactggccgatcctatcaatcaccctctgtgggtccgattcgaggaaagaagcggcagcaacctgaacaagtacagaatcctgaccgagcagctgcacaccgagaagctgaagaaaaagctgacagtgcagctggaccggctgatctaccctacagaatctggcggctgggaagagaagggcaaagtggacattgtgctgctgcccagccggcagttctacaaccagatcttcctggacatcgaggaaaagggcaagcacgccttcacctacaaggatgagagcatcaagttccctctgaagggcacactcggcggagccagagtgcagttcgacagagatcacctgagaagataccctcacaaggtggaaagcggcaacgtgggcagaatctacttcaacatgaccgtgaacatcgagcctacagagtccccagtgtccaagtctctgaagatccaccgggacgacttccccaaggtggtcaacttcaagcccaaagaactgaccgagtggatcaaggacagcaagggcaagaaactgaagtccggcatcgagtccctggaaatcggcctgagagtgatgagcatcgacctgggacagagacaggccgctgccgcctctattttcgaggtggtggatcagaagcccgacatcgaaggcaagctgtttttcccaatcaagggcaccgagctgtatgccgtgcacagagccagcttcaacatcaagctgcccggcgagacactggtcaagagcagagaagtgctgcggaaggccagagaggacaatctgaaactgatgaaccagaagctcaacttcctgcggaacgtgctgcacttccagcagttcgaggacatcaccgagagagagaagcgggtcaccaagtggatcagcagacaagagaacagcgacgtgcccctggtgtaccaggatgagctgatccagatccgcgagctgatgtacaagccttacaaggactgggtcgccttcctgaagcagctccacaagagactggaagtcgagatcggcaaagaagtgaagcactggcggaagtccctgagcgacggaagaaagggcctgtacggcatctccctgaagaacatcgacgagatcgatcggacccggaagttcctgctgagatggtccctgaggcctaccgaacctggcgaagtgcgtagactggaacccggccagagattcgccatcgaccagctgaatcacctgaacgccctgaaagaagatcggctgaagaagatggccaacaccatcatcatgcacgccctgggctactgctacgacgtgcggaagaagaaatggcaggctaagaaccccgcctgccagatcatcctgttcgaggatctgagcaactacaacccctacgaggaaaggtcccgcttcgagaacagcaagctcatgaagtggtccagacgcgagatccccagacaggttgcactgcagggcgagatctatggcctgcaagtgggagaagtgggcgctcagttcagcagcagattccacgccaagacaggcagccctggcatcagatgtagcgtcgtgaccaaagagaagctgcaggacaatcggttcttcaagaatctgcagagagagggcagactgaccctggacaaaatcgccgtgctgaaagagggcgatctgtacccagacaaaggcggcgagaagttcatcagcctgagcaaggatcggaagtgcgtgaccacacacgccgacatcaacgccgctcagaacctgcagaagcggttctggacaagaacccacggcttctacaaggtgtactgcaaggcctaccaggtggacggccagaccgtgtacatccctgagagcaaggaccagaagcagaagatcatcgaagagttcggcgagggctacttcattctgaaggacggggtgtacgaatgggtcaacgccggcaagctgaaaatcaagaagggcagctccaagcagagcagcagcgagctggtggatagcgacatcctgaaagacagcttcgacctggcctccgagctgaaaggcgaaaagctgatgctgtacagggaccccagcggcaatgtgttccccagcgacaaatggatggccgctggcgtgttcttcggaaagctggaacgcatcctgatcagcaagctgaccaaccagtactccatcagcaccatcgaggacgacagcagcaagcagtctatgaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaag[0943]在一些实施方案中,cas12b是bvcas12b。在一些实施方案中,cas12b包含氨基酸置换s893r、k846r和e837g,如下文提供的bvcas12b示例性序列中编号。[0944]bvcas12b(芽孢杆菌属(bacillussp.v3-13)ncbi参考序列:wp_101661451.1[0945]mairsiklkmktnsgtdsiylrkalwrthqlinegiayymnlltlyrqeaigdktkeayqaeliniirnqqrnngsseehgsdqeilallrqlyeliipssigesgdanqlgnkflyplvdpnsqsgkgtsnagrkprwkrlkeegnpdwelekkkdeerkakdptvkifdnlnkygllplfplftniqkdiewlplgkrqsvrkwdkdmfiqaierllsweswnrrvadeykqlkektesyykehltggeewiekirkfekernmeleknafapndgyfitsrqirgwdrvyekwsklpesaspeelwkvvaeqqnkmsegfgdpkvfsflanrenrdiwrghseriyhiaaynglqkklsrtkeqatftlpdaiehplwiryespggtnlnlfkleekqkknyyvtlskiiwpseekwiekenieiplapsiqfnrqiklkqhvkgkqeisfsdyssrisldgvlggsriqfnrkyiknhkellgegdigpvffnlvvdvaplqetrngrlqspigkalkvissdfskvidykpkelmdwmntgsasnsfgvasllegmrvmsidmgqrtsasvsifevvkelpkdqeqklfysindtelfaihkrsfllnlpgevvtknnkqqrqerrkkrqfvrsqirmlanvlrletkktpderkkaihklmeivqsydswtasqkevwekelnlltnmaafndeiwkeslvelhhriepyvgqivskwrkglsegrknlagismwnideledtrrlliswskrsrtpgeanrietdepfgssllqhiqnvkddrlkqmanliimtalgfkydkeekdrykrwketypacqiilfenlnrylfnldrsrrensrlmkwahrsiprtvsmqgemfglqvgdvrseyssrfhaktgapgirchalteedlkagsntlkrliedgfineselaylkkgdiipsqggelfvtlskrykkdsdnneltvihadinaaqnlqkrfwqqnsevyrvpcqlarmgedklyipksqtetikkyfgkgsfvknnteqevykweksekmkiktdttfdlqdldgfedisktielaqeqqkkyltmfrdpsgyffnnetwrpqkeywsivnniiksclkkkilsnkvel[0946]在一些实施方案中,cas12b是btcas12b.btcas12b(热噬淀粉芽孢杆菌(bacillusthermoamylovorans))ncbi参考序列:wp_041902512[0947]matrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdvvfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipftdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekehktleerikediqafksleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkfvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrklvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewgnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsm[0948]在一些实施方案中,napdnabp是指cas12c。在一些实施方案中,cas12c蛋白是cas12c1或cas12c1的变体。在一些实施方案中,cas12蛋白是cas12c2或cas12c2的变体。在一些实施方案中,cas12蛋白是来自嗜油菌属(oleiphilus)hi0009的cas12c(即ospcas12c)或ospcas12c的变体。这些cas12c分子已经在yan等人,“functionallydiversetypevcrispr-cassystems,”science,2019jan.4;363:88-91中描述,其整体内容通过引用并入本文。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与天然存在的cas12c1、cas12c2或ospcas12c蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的cas12c1、cas12c2或ospcas12c蛋白。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与本文所述的任何cas12c1、cas12c2或ospcas12c蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。应了解,来自其他细菌物种的cas12c1、cas12c2或ospcas12c也可根据本公开使用。[0949]cas12c1[0950]mqtkkthlhlisakasrkyrrtiaclsdtakkdlerrkqsgaadpaqelsclktikfklevpegsklpsfdrisqiynaletiekgslsyllfalilsgfrifpnssaaktfassscykndqfasqikeifgemvknfipselesilkkgrrknnkdwteenikrvlnsefgrknsegssalfdsflskfsqelfrkfdswnevnkkyleaaelldsmlasygpfdsvckmigdsdsrnslpdkstiaftnnaeitvdiessvmpymaiaallreyrqskskaapvayvqshltttngnglswffkfgldlirkapvsskqstsdgskslqelfsvpddkldglkfikeacealpeasllcgekgellgyqdfrtsfaghidswvanyvnrlfelielvnqlpesiklpsiltqknhnlvaslglqeaevshslelfeglvknvrqtlkklagidissspneqdikefyafsdvlnrlgsirnqienavqtakkdkidlesaiewkewkklkklpklnglgggvpkqqelldkalesvkqirhyqridferviqwavnehcletvpkflvdaekkkinkesstdfaakenavrfllegigaaargktdsvskaaynwfvvnnflakkdlnryfincqgciykppyskrrslafalrsdnkdtievvwekfetfykeiskeiekfnifsqefqtflhlenlrmklllrriqkpipaeiaffslpqeyydslppnvaflalnqeitpseyitqfnlyssflngnlillrrsrsylrakfswvgnskliyaakearlwkipnaywksdewkmildsnvlvfdkagnvlpaptlkkvceregdlrlfypllrqlphdwcyrnpfvksvgreknvievnkegepkvasalpgslfrligpapfksllddcffnpldkdlrecmlivdqeisqkveaqkveaslesctysiavpiryhleepkvsnqfenvlaidqgeaglayavfslksigeaetkpiavgtiripsirrlihsvstyrkkkqrlqnfkqnydstafimrenvtgdvcakivglmkefnafpvleydvknlesgsrqlsavykavnshflyfkepgrdalrkqlwyggdswtidgieivtrerkedgkegvekivplkvfpgrsvsarftsktcsccgrnvfdwlftekkaktnkkfnvnskgelttadgviqlfeadrskgpkfyarrkertpltkpiakgsysleeierrvrtnlrrapkskqsrdtsqsqyfcvykdcalhfsgmqadenaainigrrfltalrknrrsdfpsnvkisdrlldn[0951]cas12c2[0952]mtkhsiplhafrnsgadarkwkgriallakrgketmrtlqfplemsepeaaainttpfavaynaiegtgkgtlfdywaklhlagfrffpsggaatifrqqavfedaswnaafcqqsgkdwpwlvpsklyerftkaprevakkdgskksieftqenvaneshvslvgasitdktpedqkefflkmagalaekfdswksanedrivamkvideflkseglhlpsleniavkcsvetkpdnatvawhdapmsgvqnlaigvfatcasridniydlnggklskliqesattpnvtalswlfgkgleyfrttdidtimqdfnipasakesikplvesaqaiptmtvlgkknyapfrpnfggkidswianyasrlmllndileqiepgfelpqalldnetlmsgidmtgdelkelieavyawvdaakqglatllgrggnvddavqtfeqfsammdtlngtlntisaryvravemagkdearleklieckfdipkwcksvpklvgisgglpkveeeikvmnaafkdvrarmfvrfeeiaayvaskgagmdvydalekreleqikklksavperahiqayravlhrigravqncsektkqlfsskviemgvfknpshlnnfifnqkgaiyrspfdrsrhapyqlhadkllkndwlellaeisatlmasesteqmedalrlertrlqlqlsglpdweypaslakpdieveiqtalkmqlakdtvtsdvlqrafnlyssvlsgltfkllrrsfslkmrfsvadttqliyvpkvcdwaipkqylqaegeigiaarvvtesspakmvtevemkepkalghfmqqaphdwyfdaslggtqvagrivekgkevgkerklvgyrmrgnsayktvldkslvgntelsqcsmiieipytqtvdadfraqvqaglpkvsinlpvketitasnkdeqmlfdrfvaidlgerglgyavfdaktlelqesghrpikaitnllnrthhyeqrpnqrqkfqakfnvnlselrentvgdvchqinricayynafpvleymvpdrldkqlksvyesvtnryiwsstdahksarvqfwlggetwehpylksakdkkplvlspgrgasgkgtsqtcsccgrnpfdlikdmkprakiavvdgkaklenselklfernleskddmlarrhrneragmeqpltpgnytvdeikallranlrrapknrrtkdttvseyhcvfsdcgktmhadenaavniggkfiadiek[0953]ospcas12c[0954]mtklrhrqkklthdwagskkrevlgsngklqnpllmpvkkgqvtefrkafsayaratkgemtdgrknmfthsfepfktkpslhqceladkayqslhsylpgslahfllsahalgfrifsksgeatafqasskieayesklaselacvdlsiqnltistlfnalttsvrgkgeetsadpliarfytlltgkplsrdtqgperdlaevisrkiassfgtwkemtanplqslqffeeelhaldanvslspafdvlikmndlqgdlknrtivfdpdapvfeynaedpadiiikltaryakeaviknqnvgnyvknaitttnanglgwllnkglsllpvstddellefigvershpschalieliaqleapelfeknvfsdtrsevqgmidsavsnhiarlsssrnslsmdseelerliksfqihtphcslfigaqslsqqleslpealqsgvnsadillgstqymltnslveesiatyqrtlnrinylsgvagqingaikrkaidgekihlpaawselislpfigqpvidvesdlahlknqyqtlsnefdtlisalqknfdlnfnkallnrtqhfeamcrstkknalskpeivsyrdllarltsclyrgslvlrragievlkkhkifesnselrehvherkhfvfvspldrkakkllrltdsrpdllhvideilqhdnlenkdreslwlvrsgyllaglpdqlsssfinlpiitqkgdrrlidliqydqinrdafvmlvtsafksnlsglqyrankqsfvvtrtlspylgsklvyvpkdkdwlvpsqmfegrfadilqsdymvwkdagrlcvidtakhlsnikksvfsseevlaflrelphrtfiqtevrglgvnvdgiafnngdipslktfsncvqvkvsrtntslvqtlnrwfeggkvsppsiqferayykkddqihedaakrkirfqmpatelvhasddagwtpsyllgidpgeygmglslvsinngevldsgfihinslinfaskksnhqtkvvprqqykspyanyleqskdsaagdiahildrliyklnalpvfealsgnsqsaadqvwtkvlsfytwgdndaqnsirkqhwfgashwdikgmlrqpptekkpkpyiafpgsqvssygnsqrcsccgrnpieqlremakdtsikelkirnseiqlfdgtiklfnpdpstvierrrhnlgpsripvadrtfknispsslefkelitivsrsirhspefiakkrgigseyfcaysdcnsslnseanaaanvaqkfqkqlffel[0955]在一些实施方案中,napdnabp是指cas12g、cas12h或cas12i,其已经在例如yan等人,“functionallydiversetypevcrispr-cassystems,”science,2019jan.4;363:88-91中描述,各自的整体内容通过引用并入本文。通过聚集超过10tb的序列数据,发现了v型cas蛋白质的新分类,这些蛋白质与之前描述的v类蛋白质(包括cas12g、cas12h和cas12i)表现出微弱的相似性。在一些实施方案中,cas12蛋白是cas12g或cas12g的变体。在一些实施方案中,cas12蛋白是cas12h或cas12h的变体。在一些实施方案中,cas12蛋白是cas12i或cas12i的变体。应了解,其他rna引导的dna结合蛋白可以用作napdnabp,并且出于本公开的范畴内。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与天然存在的cas12g、cas12h或cas12i蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的cas12g、cas12h或cas12i蛋白。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与本文所述的任何cas12g、cas12h或cas12i蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。应了解,来自其他细菌物种的cas12g、cas12h或cas12i也可根据本公开使用。在一些实施方案中,cas12i是cas12i1或cas12i2。[0956]cas12g1[0957]maqasstpavsprprpryreertlvrkllprpgqskqefrenvkklrkaflqfnadvsgvcqwaiqfrprygkpaeptetfwkfflepetslppndsrspefrrlqafeaaagingaaalddpaftnelrdsilavasrpktkeaqrlfsrlkdyqpahrmilakvaaewiesryrrahqnwernyeewkkekqeweqnhpeltpeireafnqifqqlevkekrvricpaarllqnkdncqyagknkhsvlcnqfnefkknhlqgkaikffykdaekylrcglqslkpnvqgpfredwnkylrymnlkeetlrgknggrlphcknlgqecefnphtalckqyqqqlssrpdlvqhdelyrkwrreywreprkpvfrypsvkrhsiakifgenyfqadfknsvvglrldsmpagqylefafapwprnyrpqpgeteissvhlhfvgtrprigfrfrvphkrsrfdctqeeldelrsrtfprkaqdqkfleaarkrlletfpgnaeqelrllavdlgtdsaraaffigktfqqafplkivkieklyeqwpnqkqagdrrdasskqprpglsrdhvgrhlqkmraqaseiaqkrqeltgtpapetttdqaakkatlqpfdlrgltvhtarmirdwarlnarqiiqlaeenqvdlivleslrgfrppgyenldqekkrrvaffahgrirrkvtekavergmrvvtvpylasskvcaecrkkqkdnkqweknkkrglfkcegcgsqaqvdenaarvlgrvfwgeielptaip[0958]cas12h1[0959]mkvheiprsqllkikqyegsfvewyrdlqedrkkfasllfrwaafgyaareddgatyispsqallerrlllgdaedvaikfldvlfkggapssscyslfyedfalrdkakysgakrefieglatmpldkiierirqdeqlskipaeewlilgaeyspeeiweqvaprivnvdrslgkqlrerlgikcrrphdagyckilmevvarqlrshnetyheylnqthemktkvannltnefdlvcefaevleeknyglgwyvlwqgvkqalkeqkkptkiqiavdqlrqpkfaglltakwralkgaydtwklkkrlekrkafpympnwdndyqipvgltglgvftlevkrtevvvdlkehgklfcshshyfgdltaekhpsryhlkfrhklklrkrdsrveptigpwieaalreitiqkkpngvfylglpyalshgidnfqiakrffsaakpdkevinglpsemvvgaadlnlsnivapvkarigkglegplhaldygygelidgpkiltpdgprcgelislkrdiveiksaikefkacqregltmseetttwlsevespsdsprcmiqsriadtsrrlnsfkyqmnkegyqdlaealrlldamdsynsllesyqrmhlspgeqspkeakfdtkrasfrdllrrrvahtiveyfddcdivffedldgpsdsdsrnnalvkllsprtlllyirqalekrgigmvevakdgtsqnnpisghvgwrnkqnkseiyfyedkellvmdadevgamnilcrglnhsvcpysfvtkapekkndekkegdygkrvkrflkdrygssnvrflvasmgfvtvttkrpkdalvgkrlyyhggelvthdlhnrmkdeikylvekevlarrvslsdstiksyksfahv[0960]cas12i1[0961]msnkeknasetrkayttkmiprshdrmkllgnfmdylmdgtpiffelwnqfgggidrdiisgtankdkisddlllavnwfkvmpinskpqgvspsnlanlfqqysgsepdiqaqeyfasnfdtekhqwkdmrveyerllaelqlsrsdmhhdlklmykekciglslstahyitsvmfgtgaknnrqtkhqfyskviqlleestqinsveqlasiilkagdcdsyrklrircsrkgatpsilkivqdyelgtnhddevnvpslianlkeklgrfeyecewkcmekikaflaskvgpyylgsysamlenalspikgmttknckfvlkqidakndikyenepfgkivegffdspyfesdtnvkwvlhphhigesniktlwedlnaihskyeediaslsedkkekrikvyqgdvcqtintyceevgkeaktplvqllrylysrkddiavdkiidgitflskkhkvekqkinpviqkypsfnfgnnskllgkiispkdklkhnlkcnrnqvdnyiwieikvlntktmrwekhhyalsstrfleevyypatsenppdalaarfrtktngyegkpalsaeqieqirsapvglrkvkkrqmrleaarqqnllprytwgkdfninickrgnnfevtlatkvkkkkeknykvvlgydanivrkntyaaieahangdgvidyndlpvkpiesgfvtvesqvrdksydqlsyngvkllyckphvesrrsflekyrngtmkdnrgnniqidfmkdfeaiaddetslyyfnmkyckllqssirnhssqakeyreeifellrdgklsvlklsslsnlsfvmfkvaksligtyfghllkkpknsksdvkappitdedkqkadpemfalrlaleekrlnkvkskkeviankivakalelrdkygpvlikgenisdttkkgkksstnsflmdwlargvankvkemvmmhqglefvevnpnftshqdpfvhknpentfrarysrctpselteknrkeilsflsdkpskrptnayynegamaflatyglkkndvlgvslekfkqimanilhqrsedqllfpsrggmfylatykldadatsvnwngkqfwvcnadlvaaynvglvdiqkdfkkk[0962]cas12i2[0963]mssaiksyksvlrpnerknqllkstiqcledgsafffkmlqglfggitpeivrfsteqekqqqdialwcavnwfrpvsqdslthtiasdnlvekfeeyyggtasdaikqyfsasigesyywndcrqqyydlcrelgvevsdlthdleilcrekclavatesnqnnsiisvlfgtgekedrsvklritkkileaisnlkeipknvapiqeiilnvakatketfrqvyagnlgapstlekfiakdgqkefdlkklqtdlkkvirgkskerdwccqeelrsyveqntiqydlwawgemfnkahtalkikstrnynfakqrleqfkeiqslnnllvvkklndffdseffsgeetyticvhhlggkdlsklykaweddpadpenaivvlcddlknnfkkepirnilryiftirqecsaqdilaaakynqqldryksqkanpsvlgnqgftwtnavilpekaqrndrpnsldlriwlylklrhpdgrwkkhhipfydtrffqeiyaagnspvdtcqfrtprfgyhlpkltdqtairvnkkhvkaaktearirlaiqqgtlpvsnlkiteisatinskgqvripvkfdvgrqkgtlqigdrfcgydqnqtashayslwevvkegqyhkelgcfvrfissgdivsitenrgnqfdqlsyeglaypqyadwrkkaskfvslwqitkknkkkeivtveakekfdaickyqprlykfnkeyayllrdivrgkslvelqqirqeifrfieqdcgvtrlgslslstletvkavkgiiysyfstalnasknnpisdeqrkefdpelfalleklelirtrkkkqkveriansliqtclennikfirgegdlsttnnatkkkansrsmdwlargvfnkirqlapmhnitlfgcgslytshqdplvhrnpdkamkcrwaaipvkdigdwvlrklsqnlraknigtgeyyhqgvkeflshyelqdleeellkwrsdrksnipcwvlqnrlaeklgnkeavvyipvrggriyfathkvatgavsivfdqkqvwvcnadhvaaanialtvkgigeqssdeenpdgsriklqlts[0964]碱基编辑器的代表性核酸和蛋白序列如下:[0965]bhcas12bggsggs-abe8-xten20在p153处[0966][0967][0968][0969]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0970]bhcas12bggsggs-abe8-xten20在k255处[0971][0972][0973][0974]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0975]bhcas12bggsggs-abe8-xten20在d306处[0976][0977][0978][0979]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessgenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0980]bhcas12bggsggs-abe8-xten20在d980处[0981][0982][0983][0984]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessggqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0985]bhcas12bggsggs-abe8-xten20在k1019处[0986][0987][0988][0989]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagkggsggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdgssgsetpgtsesatpessglkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkkgsypydvpdyaypydvpdyaypydvpdya[0990]对于上述序列,kozak序列加粗并加下划线;标记n端核定位信号(nls);小写字母表示gggsggs连接子;_______标记编码abe8的序列,未经修饰的序列编码bhcas12b;双下划线表示xten20连接子;单下划线表示c端nls;表示gs连接子;且斜体字母代表3x血细胞凝集素(ha)标签的编码序列。[0991]在一些实施方案中,本文所提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是cas12j/casφ蛋白。cas12j/casφ在pausch等人,“crispr-casφfromhugephagesisahypercompactgenomeeditor,”science,17july2020,vol.369,issue6501,pp.333-337之描述,其通过引用以其整体并入本文。在一些实施方案中,napdnabp包含氨基酸序列,该氨基酸序列与天然存在的cas12j/casφ蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。在一些实施方案中,napdnabp是天然存在的cas12j/casφ蛋白。在一些实施方案中,napdnabp是无核酸酶活性的(“死亡的”)cas12j/casφ蛋白。应了解,来自其他物种的cas12j/casφ也可根据本公开使用。[0992]示例性cas12j/casφ氨基酸序列如下:[0993]》casφ-1[0994]madtptlftqflrhhlpgqrfrkdilkqagrilankgedatiaflrgkseesppdfqppvkcpiiacsrpltewpiyqasvaiqgyvygqslaefeasdpgcskdgllgwfdktgvctdyfsvqglnlifqnarkryigvqtkvtnrnekrhkklkrinakriaeglpeltsdepesaldetghlidppglntniycyqqvspkplalsevnqlptayagystsgddpiqpmvtkdrlsiskgqpgyipehqrallsqkkhrrmrgyglkarallvivriqddwavidlrsllrnaywrrivqtkepstitkllklvtgdpvldatrmvatftykpgivqvrsakclknkqgsklfserylnetvsvtsidlgsnnlvavatyrlvngntpellqrftlpshlvkdferykqahdtledsiqktavaslpqgqqteirmwsmygfreaqervcqelgladgsipwnvmtatstiltdlflarggdpkkcmftsepkkkknskqvlykirdrawakmyrtllsketreawnkalwglkrgspdyarlskrkeelarrcvnytistaekraqcgrtivaledlnigffhgrgkqepgwvglftrkkenrwlmqalhkaflelahhrgyhvievnpaytsqtcpvcrhcdpdnrdqhnreafhcigcgfrgnadldvathniamvaitgeslkrargsvasktpqplaae*[0995]》casφ-2[0996]mpkpavesefskvlkkhfpgerfrssymkrggkilaaqgeeavvaylqgkseeeppnfqppakchvvtksrdfaewpimkaseaiqryiyalstteraackpgksseshaawfaatgvsnhgyshvqglnlifdhtlgrydgvlkkvqlrnekararlesinasradeglpeikaeeeevatnetghllqppginpsfyvyqtispqayrprdeivlppeyagyvrdpnapiplgvvrnrcdiqkgcpgyipewqreagtaispktgkavtvpglspkknkrmrrywrsekekaqdallvtvrigtdwvvidvrgllrnarwrtiapkdislnalldlftgdpvidvrrnivtftytldacgtyarkwtlkgkqtkatldkltatqtvalvaidlgqtnpisagisrvtqengalqcepldrftlpddllkdisayriawdrneeelrarsvealpeaqqaevraldgvsketartqlcadfgldpkrlpwdkmssnttfiseallsnsvsrdqvfftpapkkgakkkapvevmrkdrtwaraykprlsveaqklknealwalkrtspeylklsrrkeelcrrsinyviektrrrtqcqivipviedlnvrffhgsgkrlpgwdnfftakkenrwfiqglhkafsdlrthrsfyvfevrpertsitcpkcghcevgnrdgeafqclscgktcnadldvathnltqvaltgktmpkreeprdaqgtaparktkkaskskappaeredqtpaqepsqts[0997]》casφ-3[0998]mekeiteltkirrefpnkkfsstdmkkagkllkaegpdavrdflnscqeiigdfkppvktnivsisrpfeewpvsmvgraiqeyyfsltkeelesvhpgtssedhksffnitglsnynytsvqglnlifknakaiydgtlvkannknkklekkfneinhkrsleglpiitpdfeepfdenghlnnppginrniygyqgcaakvfvpskhkmvslpkeyegynrdpnlslagfrnrleipegepghvpwfqrmdipegqighvnkiqrfnfvhgknsgkvkfsdktgrvkryhhskykdatkpykfleeskkvsaldsilaiitigddwvvfdirglyrnvfyrelaqkgltavqlldlftgdpvidpkkgvvtfsykegvvpvfsqkivprfksrdtlekltsqgpvallsvdlgqnepvaarvcslknindkitldnscrisflddykkqikdyrdsldeleikirleainsletnqqveirdldvfsadrakantvdmfdidpnliswdsmsdarvstqisdlylknggdesrvyfeinnkrikrsdynisqlvrpklsdstrknlndsiwklkrtseeylklskrklelsravvnytirqskllsgindiviiledldvkkkfngrgirdigwdnffssrkenrwfipafhkafselssnrglcvievnpawtsatcpdcgfcskenrdginftcrkcgvsyhadidvatlniarvavlgkpmsgpadrerlgdtkkprvarsrktmkrkdisnstveamvta*[0999]》casφ-4[1000]myslemadlksepsllakllrdrfpgkywlpkywklaekkrltggeeaaceymadkqldspppnfrpparcvilaksrpfedwpvhrvaskaqsfviglseqgfaalraappstadarrdwlrshgaseddlmaleaqlletimgnaislhggvlkkidnanvkaakrlsgrnearlnkglqelppeqegsaygadgllvnppglnlniycrksccpkpvkntarfvghypgylrdsdsilisgtmdrltiiegmpghipawqreqglvkpggrrrrlsgsesnmrqkvdpstgprrstrsgtvnrsnqrtgrngdpllveirmkedwvlldargllrnlrwreskrglscdhedlslsgllalfsgdpvidpvrnevvflygegiipvrstkpvgtrqskkllerqasmgpltliscdlgqtnliagrasaislthgslgvrssvrieldpeiiksferlrkdadrleteiltaaketlsdeqrgevnshekdspqtakaslcrelglhppslpwgqmgpsttfiadmlishgrdddaflshgefptlekrkkfdkrfclesrpllssetrkalneslwevkrtsseyarlsqrkkemarravnfvveisrrktglsnvivniedlnvrifhgggkqapgwdgffrpksenrwfiqaihkafsdlaahhgipviesdpqrtsmtcpecghcdsknrngvrflckgcgasmdadfdaacrnlervaltgkpmpkpstscerllsattgkvcsdhslshdaiekas*[1001]》casφ-5[1002]msslptplellkqkhadlfkglqfsskdnkmagkvlkkdgeeaalaflsergvsrgelpnfrppaktlvvaqsrpfeefpiyrvseaiqlyvyslsvkeletvpsgsstkkehqrffqdssvpdfgytsvqglnkifglargiylgvitrgenqlqkakskhealnkkrrasgeaetefdptpyeymtperklakppgvnhsimcyvdisvdefdfrnpdgivlpseyagycreintaiekgtvdrlghlkggpgyipghqrkesttegpkinfrkgrirrsytalyakrdsrrvrqgklalpsyrhhmmrlnsnaesailaviffgkdwvvfdlrgllrnvrwrnlfvdgstpstllgmfgdpvidpkrgvvafcykeqivpvvsksitkmvkapellnklylksedplvlvaidlgqtnpvgvgvyrvmnasldyevvtrfalesellreiesyrqrtnafeaqiraetfdamtseeqeeitrvrafsaskakenvchrfgmpvdavdwatmgsntihiakwvmrhgdpslvevleyrkdneikldkngvpkkvkltdkrianltsirlrfsqetskhyndtmwelrrkhpvyqklskskadfsrrvvnsiirrvnhlvprarivfiiedlknlgkvfhgsgkrelgwdsyfepksenrwfiqvlhkafsetgkhkgyyiiecwpnwtsctcpkcsccdsenrhgevfrclacgytcntdfgtapdnlvkiattgkglpgpkkrckgsskgknpkiarssetgvsvtesgapkvkkssptqtsqsssqsap*[1003]》casφ-6[1004]mnkiekektplaklmnenfaglrfpfaiikqagkkllkegelktieymtgkgsieplpnfkppvkclivakrrdlkyfpickasceiqsyvyslnykdfmdyfstpmtsqkqheeffkksglnieyqnvaglnlifnnvkntyngvilkvknrneklkkkaiknnyefeeiktfnddgclinkpginnviycfqsispkilknithlpkeyndydcsvdrniiqkyvsrldipesqpghvpewqrklpefnntnnprrrrkwysngrniskgysvdqvnqakiedsllaqikigedwiildirgllrdlnrrelisyknkltikdvlgffsdypiidikknlvtfcykegviqvvsqksignkkskqlleklienkpialvsidlgqtnpvsvkisklnkinnkisiesftyrflneeilkeiekyrkdydklelklinea[1005]》casφ-7[1006]msntavstrehmsnkttppsplslllrahfpglkfesqdykiagkklrdggpeavisyltgkgqaklkdvkppakafviaqsrpfiewdlvrvsrqiqekifgipatkgrpkqdglsetafneavaslevdgksklneetraafyevlgldapslhaqaqnaliksaisiregvlkkvenrneknlsktkrrkeageeatfveekahdergylihppgvnqtipgyqavvikscpsdfiglpsgclakesaealtdylphdrmtipkgqpgyvpewqhpllnrrknrrrrdwysaslnkpkatcskrsgtpnrknsrtdqiqsgrfkgaipvlmrfqdewviidirgllrnaryrkllkekstipdllslftgdpsidmrqgvctfiykagqacsakmvktknapeilseltksgpvvlvsidlgqtnpiaakvsrvtqlsdgqlshetllrellsndssdgkeiaryrvasdrlrdklanlaverlspehkseilrakndtpalckarvcaalglnpemiawdkmtpyteflataylekggdrkvatlkpknrpemlrrdikfkgtegvrievspeaaeayreaqwdlqrtspeylrlstwkqeltkrilnqlrhkaakssqcevvvmafedlnikmmhgngkwadggwdaffikkrenrwfmqafhksltelgahkgvptievtphrtsitctkcghcdkanrdgerfacqkcgfvahadleiatdniervaltgkpmpkpesersgdakksvgarkaafkpeedaeaae*[1007]》casφ-8[1008]mikptvsqfltpgfklirnhsrtaglklknegeeackkfvreneipkdecpnfqggpaianiiaksrefteweiyqsslaiqeviftlpkdklpepilkeewraqwlsehgldtvpykeaaglnliiknavntykgvqvkvdnknknnlakinrkneiaklngeqeisfeeikafddkgyllqkpspnksiycyqsvspkpfitskyhnvnlpeeyigyyrksnepivspyqfdrlripigepgyvpkwqytflskkenkrrklskriknvspilgiicikkdwcvfdmrgllrtnhwkkyhkptdsindlfdyftgdpvidtkanvvrfrykmengivnykpvrekkgkellenicdqngscklatvdvgqnnpvaiglfelkkvngeltktlisrhptpidfcnkitayrerydklessikldaikqltseqkievdnynnnftpqntkqivcsklninpndlpwdkmisgthfisekaqvsnkseiyftstdkgktkdvmksdykwfqdykpklskevrdalsdiewrlrreslefnklsksreqdarqlanwissmcdvigienlvkknnffggsgkrepgwdnfykpkkenrwwinaihkaltelsqnkgkrvillpamrtsitcpkckycdsknrngekfnclkcgielnadidvatenlatvaitaqsmpkptcersgdakkpvrarkakapefhdklapsytvvlreav*[1009]》casφ-9[1010]mrssreigdkilmrqpaektafqvfrqevigtqklsggdaktagrlykqgkmeaarewllkgarddvppnfqppakclvvavshpfeewdisktnhdvqayiyaqplqaeghlnglsekwedtsadqhklwfektgvpdrglpvqainkiakaavnrafgvvrkvenrnekrrsrdnriaehnrengltevvreapevatnadgfllhppgidpsilsyasvspvpynsskhsfvrlpeeyqaynvepdapipqfvvedrfaippgqpgyvpewqrlkcstnkhrrmrqwsnqdykpkagrrakplefqahltrerakgallvvmrikedwvvfdvrgllrnvewrkvlseearekltlkglldlftgdpvidtkrgivtflykaeitkilskrtvktknardlllrltepgedglrrevglvavdlgqthpiaaaiyrigrtsagalestvlhrqglredqkeklkeyrkrhtaldsrlrkeafetlsveqqkeivtvsgsgaqitkdkvcnylgvdpstlpwekmgsythfisddflrrggdpnivhfdrqpkkgkvskksqrikrsdsqwvgrmrprlsqetakarmeadwaaqneneeykrlarskqelarwcvntllqntrcitqcdeivvviedlnvkslhgkgarepgwdnfftpktenrwfiqilhktfselpkhrgehviegcplrtsitcpacsycdknsrngekfvcvacgatfhadfevatynlvrlattgmpmpkslerqgggekaggarkarkkakqvekivvqananvtmngaslhsp*[1011]》casφ-10[1012]mdmldtetnyatetpaqqqdyspkppkkaqrapkgfskkarpekkppkpitlftqkhfsgvrflkrvirdaskilklsesrtitfleqaierdgsappdvtppvhntimavtrpfeewpevilskalqkhcyaltkkikiktwpkkgpgkkclaawsartkiplipgqvqatnglfdrigsiydgvekkvtnrnankkleydeaikegrnpavpeyetaynidgtlinkpgynpnlyitqsrtprliteadrplvekilwqmvekktqsrnqarrarlekaahlqglpvpkfvpekvdrsqkieiriidpldkiepympqdrmaikasqdghvpywqrpflskrrnrrvragwgkqvssiqawltgallvivrlgneafladirgalrnaqwrkllkpdatyqslfnlftgdpvvntrtnhltmayregvvnivksrsfkgrqtrehlltllgqgktvagvsfdlgqkhaagllaahfglgedgnpvftpiqacflpqryldsltnyrnrydaltldmrrqsllaltpaqqqefadaqrdpggqakracclklnlnpdeirwdlvsgistmisdlyierggdprdvhqqvetkpkgkrkseirilkirdgkwaydfrpkiadetrkaqreqlwklqkasseferlsrykiniaraianwalqwgrelsgcdivipvledlnvgskffdgkgkwllgwdnrftpkkenrwfikvlhkavaelaphrgvpvyevmphrtsmtcpachychptnregdrfecqschvvkntdrdvapynilrvavegktldrwqaekkpqaepdrpmilidnqes*[1013]上述序列中的星号(*)表示stop密码子。或者,casφ-1也称为cas12j直系同源物1。因此,casφ-1至casφ-10也可以分别称为cas12j直系同源物1至10。[1014]向导多核苷酸[1015]在一种实施方案中,向导多核苷酸是向导rna。如本文所用,术语“向导rna(grna)”及其语法等效物可以是指一种rna,其可能对于靶标dna是特异性的并且可以与cas蛋白形成复合物。rna/cas复合物可有助于将cas蛋白“引导”至靶标dna。cas9/crrna/tracrrna核酸内切地切割与间隔序列互补的线性或环状dsdna靶标。不与crrna互补的靶标链首先被核酸内切地切断,然后被3'-5'核酸外切地修剪。在自然界,dna结合和切割通常需要蛋白质和两种rna。但是,单向导rna(“sgrna”或简写为“grna”)可以经工程改造以将多种crrna和tracrrna并入单一rna物质中。参见,例如,jinekm.等人,science337:816-821(2012),其整体内容通过引用并入本文。。cas9识别crispr重复序列中的短基序(pam或前间区序列邻近基序)以帮助区分自我与非自我。cas9核酸酶序列和结构是本领域技术人员周知的(参见,例如,“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferretti,j.j.等人,natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.等人,nature471:602-607(2011);和“programmabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.等人,science337:816-821(2012),其各自的整体内容通过引用并入本文)。cas9直系同源物已经在各种物种中描述,包括酿脓链球菌(s.pyogenes)和嗜热链球菌(s.thermophilus)。基于本公开,其他合适的cas9核酸酶和序列对于本领域技术人员可以是显而易见的,并且此类cas9核酸酶和序列包括来自生物体和基因座的cas9序列,如chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737中所公开的;其整体内容通过引用并入本文。在一些实施方案中,cas9核酸酶具有失活的(例如,灭活的)dna切割结构域,换言之,cas9是切口酶。[1016]在一些实施方案中,向导多核苷酸是至少一个单向导rna(“sgrna”或“grna”)。在一些实施方案中,向导多核苷酸是至少一个tracrrna。在一些实施方案中,向导多核苷酸不需要pam序列来将多核苷酸可编程dna结合结构域(例如,cas9或cpf1)引导至靶标核苷酸序列。[1017]本文所公开的碱基编辑器的多核苷酸可编程核苷酸结合结构域(例如,源自crispr的结构域)可通过与向导多核苷酸缔合来识别靶标多核苷酸序列。向导多核苷酸(例如,grna)通常是单链的并且可编程以位点特异性地(即,经由互补碱基配对)结合至多核苷酸靶标序列,从而将与该向导多核苷酸协同作用的碱基编辑器引导至该靶标序列。向导多核苷酸可以是dna。向导多核苷酸可以是rna。本领域一般技术人员将会了解,在向导多核苷酸序列中,尿嘧啶(u)替换序列中的胸腺嘧啶(t)。在一些实施方案中,向导多核苷酸包含天然核苷酸(例如,腺苷)。在一些实施方案中,向导多核苷酸包含非天然(或非自然)核苷酸(例如,肽核酸或核苷酸类似物)。在一些实施方案中,向导核酸序列的靶向区域可以是至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸的长度。向导核酸的靶向区域可以是10至30个核苷酸之间的长度,或15至25个核苷酸之间的长度,或15至20个核苷酸之间的长度。在一些实施方案中,向导多核苷酸可以截短1、2、3、4个等核苷酸,尤其在5'末端。作为非限制性示例,长度为20个核苷酸的向导多核苷酸可以截短1、2、3、4个等核苷酸,尤其在5'末端。[1018]在一些实施方案中,向导多核苷酸包含两个或更多个单个多核苷酸,这些单个多核苷酸可以经由例如互补碱基配对(例如,双向导多核苷酸)彼此相互作用。例如,向导多核苷酸可包含crisprrna(crrna)和反向活化crisprrna(tracrrna)。例如,向导多核苷酸可包含一个或多个反向活化crisprrna(tracrrna)。[1019]在ii型crispr系统中,通过crispr蛋白(例如,cas9)靶向核酸通常需要在包含识别靶标序列的序列的第一rna分子(crrna)与包含形成稳定化向导rna-crispr蛋白复合物的支架区的重复序列的第二rna分子(trrna)之间的互补碱基配对。此类双向导rna系统可用作向导多核苷酸,以将本文所公开的碱基编辑器引导至靶标多核苷酸序列。[1020]在一些实施方案中,本文所提供的碱基编辑器利用单向导多核苷酸(例如,sgrna)。在一些实施方案中,本文所提供的碱基编辑器利用双向导多核苷酸(例如,两个grna)。在一些实施方案中,本文所提供的碱基编辑器利用一个或多个向导多核苷酸(例如,多个grna)。在一些实施方案中,单向导多核苷酸用于本文所述的不同碱基编辑器。例如,单向导多核苷酸可用于胞苷碱基编辑器和腺苷碱基编辑器。[1021]在其他实施方案中,向导多核苷酸可在一个分子(即,单分子向导核酸)中包含靶向核酸的一部分的多核苷酸和该核酸的支架部分两者。例如,单分子向导多核苷酸可以是单向导rna(sgrna或grna)。本文中,术语向导多核苷酸序列任何能够与碱基编辑器相互作用并将碱基编辑器引导至靶标多核苷酸序列的单分子、双分子或多分子核酸。[1022]通常,向导多核苷酸(例如,crrna/trrna复合物或grna)包含:“多核苷酸靶链段”,该链段包括能够识别并结合至靶标多核苷酸序列的序列;和“蛋白结合链段”,该链段稳定化碱基编辑器的多核苷酸可编程核苷酸结合结构域组分内的向导多核苷酸。在一些实施方案中,向导多核苷酸的多核苷酸靶向链段识别并结合至dna多核苷酸,从而促进对dna中的碱基的编辑。在其他实施方案中,向导多核苷酸的多核苷酸靶向链段识别并结合至rna多核苷酸,从而促进对rna中的碱基的编辑。本文中,“链段”是指分子的节段或区域,例如,向导多核苷酸中的核苷酸的连续延伸段。链段也可以指复合物的区域/节段,使得链段可包含超过一个分子的区域。例如,若向导多核苷酸包含多个核酸分子,则蛋白结合链段可包括例如沿着互补性区域杂交的多个独立分子中的全部或一部分。在一些实施方案中,包含两个独立分子的靶向dna的rna的蛋白结合链段包含(i)长度为100个碱基对的第一rna的碱基对40至75;和(ii)长度为50个碱基对的第二rna分子的碱基对10至25。除非在特定语境中具体地另做定义,否则“链段”的定义不限于具体数目的总碱基对,不限于任何来自给定rna分子的特定数目的碱基对,不限于复合物内的特定数目的独立分子,且可包括rna分子的区域,这些区域可以是任何总长度并且可包括与其他分子具有互补性的区域。[1023]向导rna或向导多核苷酸可包含两个或更多个rna,例如,crisprrna(crrna)和反向活化crrna(tracrrna)。有时,向导rna或向导多核苷酸可包含单链rna,或通过将crrna的一部分(例如,功能性部分)与tracrrna融合形成的单向导rna(sgrna)。向导rna或向导多核苷酸也可以是包含crrna和tracrrna的双rna。此外,crrna可以与靶标dna杂交。[1024]如上所述,向导rna或向导多核苷酸可以是表达产物。例如,编码向导rna的dna可以是包含编码向导rna的序列的载体。可通过用分离的向导rna或包含编码向导rna的序列和启动子的质粒dna转染细胞而将向导rna或向导多核苷酸转移至该细胞内。向导rna或向导多核苷酸也可以用其他方式转移至细胞内,诸如使用病毒介导的基因递送。[1025]向导rna或向导多核苷酸可以是分离的。例如,向导rna可以以分离的rna的兴衰转移至细胞或生物体内。向导rna可以通过体外转录使用本领域中已知的任何体外转录系统制备。向导rna可以以分离的rna的形式而非以包含向导rna的编码序列的质粒的形式转移至细胞内。[1026]向导rna或向导多核苷酸可包含三个区域:位于5'末端处的第一区域,其可以与染色体序列中的靶标位点互补;第二内部区域,其可以形成茎环结构;和第三3'区域,其可以是单链的。每个向导rna的第一区域也可以是不同的,使得每个向导rna将融合蛋白引导至特异性靶标位点。再者,每个向导rna的第二和第三区域在全部向导rna中可以是相同的。[1027]向导rna或向导多核苷酸的第一区域可以与染色体序列中的靶标位点处的序列互补,使得向导rna的第一区域可以与靶标位点进行碱基配对。在一些实施方案中,向导rna可包含约10个核苷酸至25个核苷酸(即,10个核苷酸至25个核苷酸;或约10个核苷酸至约25个核苷酸;或10个核苷酸至约25个核苷酸;或约10个核苷酸至25个核苷酸)或更多.例如,向导rna的第一区域与染色体序列中靶标位点之间的碱基配对区域可以是(约)10、11、12、13、14、15、16、17、18、19、20、22、23、24、25个或更多个核苷酸的长度。在一些实施方案中,向导rna的第一区域可以是(约)19、20或21个核苷酸的长度。[1028]向导rna或向导多核苷酸也可包含形成二级结构的第二区域。例如,由向导rna形成的二级结构可包含茎(或发夹)和环。环和茎的长度可变。例如,环可以在约3至10个核苷酸的长度范围内,且茎可以在约6至20个碱基对的长度范围内。茎可包含一个或多个1至10个或约10个核苷酸的凸起。第二区域的整体长度可以在(约)16至60个核苷酸的长度范围内。例如,环可以是(约)4个核苷酸的长度,且茎可以是(约)12个碱基对。[1029]向导rna或向导多核苷酸也可在3'末端包含第三区域,该第三区域可以基本上是单链的。例如,第三区域有时不与感兴趣的细胞内的任何染色体序列互补并且有时不与向导rna的剩余部分互补。再者,第三区域的长度可变。第三区域可以是超过(约)4个核苷酸的长度。例如,第三区域的长度可以在(约)5至60个核苷酸的长度范围内。[1030]向导rna或向导多核苷酸可以靶向基因靶标的任何外显子或内含子。在一些实施方案中,向导可靶向基因的外显子1或2,在其他实施方案中,向导可靶向基因的外显子3或4。组合物可包含多个向导rna,这些向导rna全部靶向相同的外显子,或在一些实施方案中,多个向导rna可靶向不同的外显子。可靶向基因的外显子和内含子。[1031]向导rna或向导多核苷酸可靶向(约)20个核苷酸的核酸序列。靶标核酸可以少于(约)20个核苷酸。靶标核酸可以是至少或至少约5、10、15、16、17、18、19、20、21、22、23、24、25、30个或1至100个核苷酸之间任一者的长度。靶标核酸可以是至多或至多约5、10、15、16、17、18、19、20、21、22、23、24、25、30个或1至100个核苷酸之间任一者的长度。靶标核酸序列可以是紧邻pam的5'第一个核苷酸的的(约)20个碱基。向导rna可靶向核酸序列。靶标核酸可以是至少或至少约1至10、1至20、1至30、1至40、1至50、1至60、1至70、1至80、1至90、或1至100个核苷酸。[1032]向导多核苷酸,例如,向导rna,可以指一种核酸,其可以与另一种核酸(例如,细胞基因组中的靶标核酸或前间区序列)杂交。向导多核苷酸可以是rna。向导多核苷酸可以是dna。向导多核苷酸可以经编程或设计以位点特异性地结合至核酸的序列。向导多核苷酸可包含一条多核苷酸链且可称为单向导多核苷酸。向导多核苷酸可包含两条多核苷酸链且可称为双向导多核苷酸。向导rna可以作为rna分子被引入细胞或胚胎内。例如,rna分子可以是体外转录的且/或可以是化学合成的。rna可以从合成dna分子(例如,基因片段)转录。然后,向导rna可以作为rna分子被引入细胞或胚胎内。向导rna也可以以非rna核酸分子(例如,dna分子)的形式被引入细胞或胚胎内。例如,可以将编码向导rna的dna可操作地链接至启动子控制序列,以在感兴趣的细胞或胚胎内进行向导rna的表达。可以将rna编码序列可操作地链接至被rna聚合酶iii(poliii)识别的启动子序列。可用于表达向导rna的质粒载体包括但不限于,px330载体和px333载体。在一些实施方案中,质粒载体(例如,px333载体)可包含至少两个编码向导rna的dna序列。[1033]用于选择、涉及和验证向导多核苷酸(例如,向导)和靶向序列的方法在本文中描述并且是本领域技术人员已知的。例如,为了将核碱基编辑器系统中的脱氨酶结构域(例如,aid结构域)的潜在底物混杂的影响降至最低,可以将无意中成为脱氨基靶标的残基(例如,会潜在地驻留在靶标核酸基因座内ssdna上的脱靶c残基)数降至最低。此外,可使用软件工具来优化对应于靶标核酸序列的grna,例如,以将跨基因组的总脱靶活性降至最低。例如,对于使用酿脓链球菌cas9的每种可能的靶向结构与选择,可以跨基因组鉴定全部脱靶序列(在前选定的pam,例如,nag或ngg),该基因组含有最多某个数目(例如,1、2、3、4、5、6、7、8、9或10)的误配碱基对。可以鉴定与靶标位点互补的grna的第一区域,并且可将根据其总预测脱靶得分将全部第一区域(例如,crrna)排名;名次最高的靶向结构域表示似乎具有最高上靶活性和最低脱靶活性的那些。候选靶向grna可以通过使用本领域中已知和/或如本文所述的方法功能性地评定。[1034]作为非限制性示例,用于与cas9合用的向导rna的crrna中的靶标dna杂交序列可以使用dna序列检索算法鉴定。可使用定制grna设计软件基于公共工具cas-offinder进行grna设计,如baes.,parkj.,&kimj.-s.cas-offinder:afastandversatilealgorithmthatsearchesforpotentialoff-targetsitesofcas9rna-guidedendonucleases.bioinformatics30,1473-1475(2014)中所述。这一软件在计算向导的全基因组脱靶倾向后将这些向导评分。通常,对于长度在17至24范围内的向导,考虑完美匹配到7个误配范围内的匹配。一旦通过计算确定脱靶位点,就计算每个向导的总得分并使用网络界面总结到表格输出中。除了鉴定与pam序列相邻的潜在靶标位点之外,该软件还鉴定全部pam相邻序列,这些序列与所选择的靶标位点相异1、2、3或超过3个核苷酸。可获得用于靶标核酸序列(例如,靶标基因)的基因组dna序列,并且可使用可公共获得的工具(例如,repeatmasker程序)来筛选重复元件。repeatmasker对输入的dna序列进行重复元件和低复杂度区域的检索。输出是对给定查询序列中存在的重复序列的详细注释。[1035]鉴定后,可基于向导rna(例如,crrna)的第一区域到靶标位点的距离、其正交性和用于与相关pam序列进行密切匹配的5'核苷酸(例如,基于含有相关pam(例如,对于酿脓链球菌为nggpam,对于金黄色葡萄球菌为nngrrt或nngrrvpam)的人类基因组中密切匹配的5'g)的存在对这些第一区域进行排名。如本文所用,正交性是指含有最低数目的靶标序列误配的人类基因组中的序列数目。“高水平的正交性”或“良好正交性”可以指,例如,20-mer靶向结构域,其既没有除了所希望的靶标之外的人类基因组中的相同序列,也没有任何含有一个或两个靶标序列中的误配的序列。可以选择具有良好正交性的靶向结构域以将脱靶dna切割降至最低。[1036]在一些实施方案中,报告基因系统可以用于检测碱基编辑活性并测试候选向导多核苷酸。在一些实施方案中,报告基因系统可包含基于报告基因的测定,其中碱基编辑活性导致报告基因的表达。例如,报告基因系统可包括报告基因,该报告基因包含去活化的起始密码子,例如,从3'-tac-5'到3'-cac-5'的模板链上的突变。在靶标c成功脱氨基后,对应的mrna将会转录为5'-aug-3'而非5'-gug-3',使得能够进行报告基因的翻译。合适的报告基因对于本领域技术人员将是显而易见的。报告基因的非限制性示例包括编码以下的基因:绿色荧光蛋白(gfp)、红色荧光蛋白(rfp)、荧光素酶、分泌型碱性磷酸酶(seap)、或其表达可检测且对于本领域技术人员是显而易见的任何其他基因。报告基因系统可用来测试多种不同的grna,例如,为了确定各脱氨酶将会靶向靶标dna序列的哪个(些)核苷酸残基。为了评估特异性碱基编辑蛋白(例如,cas9脱氨酶融合蛋白),也可以测试靶向非模板链核苷酸残基的sgrna。在一些实施方案中,此类grna可设计为使得突变的起始密码子不会与grna进行碱基配对。向导多核苷酸可以包含标准核苷酸、经修饰的核苷酸(例如,假尿苷)、核苷酸异构体和/或核苷酸类似物。在一些实施方案中,向导多核苷酸可包含至少一个可检测的标记。可检测的标记可以是荧光团(例如,fam、tmr、cy3、cy5、德克萨斯红、俄勒冈绿、alexafluors、halo标签或任何其他合适的荧光染料)、检测标签(例如,生物素、地高辛等)、量子点或金颗粒。[1037]向导多核苷酸可化学合成和/或酶促合成。例如,向导rna可使用基于亚磷酰胺的标准固相合成方法合成。或者,通过将编码向导rna的dna可操作地链接至被噬菌体、rna聚合酶识别的启动子控制序列,可在体外合成向导rna。合适的噬菌体启动子序列的示例包括t7、t3、sp6启动子序列,或其变体。在其中向导rna包含两个独立分子(例如,crrna和tracrrna)的实施方案中,crrna可化学合成且tracrrna可酶促合成。[1038]在一些实施方案中,碱基编辑器系统可包含多个向导多核苷酸,例如,grna。例如,grna可以将碱基编辑器靶向至一个或多个靶标基因座(例如,至少一(1)个grna、至少2个grna、至少5个grna、至少10个grna、至少20个grna、至少30个grna或至少50个grna)。在一些实施方案中,多个grna序列可串联排列,且优选通过直接重复序列分离。[1039]编码向导rna或向导多核苷酸的dna也可以是载体的一部分。在一些实施方案中,载体包含额外的表达控制序列(例如,增强子序列、kozak序列、聚腺苷酸化序列、转录终止序列等)、可选择的标记物序列(例如,gfp或耐抗生素基因诸如嘌呤霉素)、复制起点等。编码向导rna或向导多核苷酸的dna分子可以是环状的或线性的。[1040]在一些实施方案中,碱基编辑器系统的一个或多个组分可以由dna序列编码。可以将此类dna序列一起或独立地引入表达系统(例如,细胞)内。例如,可以将编码多核苷酸可编程核苷酸结合结构域和向导rna的dna序列引入细胞内,每个dna序列可以是独立分子的一部分(例如,一个载体含有多核苷酸可编程核苷酸结合结构域编码序列,而第二载体含有向导rna编码序列)或两者可以是同一分子的一部分(例如,一个载体含有用于多核苷酸可编程核苷酸结合结构域和向导rna的编码(和调节)序列)。[1041]向导多核苷酸可包含一个或多个修饰以提供具有新特征或增强特征的核酸。向导多核苷酸可包含核酸亲和性标签。向导多核苷酸可包含合成核苷酸、合成核苷酸类似物、核苷酸衍生物和/或经修饰的核苷酸。[1042]在一些实施方案中,grna或向导多核苷酸可包含修饰。修饰可以在grna或向导多核苷酸的任何位置处作出。可对单一grna或向导多核苷酸作出超过一个修饰。grna或向导多核苷酸可在修饰后经历质量控制。在一些实施方案中,质量控制可包括page、hplc、ms或其任意组合。[1043]grna或向导多核苷酸的修饰可以是置换、插入、缺失、化学修饰、物理修饰、稳定化、纯化或其任意组合。[1044]grna或向导多核苷酸也可以通过以下修饰:5'腺苷酸化、5'鸟苷-三磷酸酯封端、5'n7-甲基鸟苷-三磷酸酯封端、5'三磷酸酯封端、3'磷酸酯、3'硫代磷酸酯、5'磷酸酯、5'硫代磷酸酯和、cis-syn胸苷二聚体、三聚体、c12间隔序列、c3间隔序列、c6间隔序列、dspacer、pc间隔序列、rspacer、间隔序列18、间隔序列9、3'-3'修饰、5'-5'修饰、无碱基、吖啶、偶氮苯、生物素、生物素bb、生物素teg、胆固醇基teg、脱硫生物素teg、dnpteg、dnp-x、dota、dt-生物素、双生物素、pc生物素、补骨脂素c2、补骨脂素c6、tina、3'dabcyl、黑洞淬灭剂1、黑洞淬灭剂2、dabcylse、dt-dabcyl、irdyeqc-1、qsy-21、qsy-35、qsy-7、qsy-9、羧基连接子、硫醇连接子、2'-脱氧核糖核苷类似物嘌呤、2'-脱氧核糖核苷类似物嘧啶、核糖核苷类似物、2'-o-甲基核糖核苷类似物、糖修饰类似物、wobble/通用碱基、荧光染料标记、2'-氟rna、2'-o-甲基rna、甲基磷酸酯、磷酸二酯dna、磷酸二酯rna、硫代磷酸酯dna、硫代磷酸酯rna、una、脚鸟苷-5'-三磷酸酯、5'-甲基胞苷-5'-三磷酸酯,或其任意组合。[1045]在一些实施方案中,修饰是永久的。在一些实施方案中,修饰是暂时的。在一些实施方案中,对grna或向导多核苷酸作出多个修饰。grna或向导多核苷酸修饰可改变核苷酸的生理化学性质,诸如其构象、极性、疏水性、化学反应性、碱基配对相互反应,或其任意组合。[1046]修饰也可以是硫代磷酸酯替代物。在一些实施方案中,天然磷酸二酯键可能容易被细胞核酸酶快速降解;并且,使用硫代磷酸酯(ps)键替代物进行核苷酸间链结的修饰可能更加稳定二不易被细胞降解所水解。修饰可以在grna或向导多核苷酸中增加稳定性。修饰也可以增强生物学活性。在一些实施方案中,硫代磷酸酯增强的rnagrna可抑制rnasea、rnaset1、小牛血清核酸酶,或其任意组合。这些性质可允许使用待用于特定应用的ps-rnagrna,在该应用中,暴露于核酸酶是体内或体外的高概率事件。例如,硫代磷酸酯(ps)键可以被引入grna的5'-或‘'-末端处的最末端3至5个核苷酸之间,这可以抑制核酸外切酶降解。在一些实施方案中,硫代磷酸酯键可添加到整个grna各处以减少被核酸外切酶攻击。[1047]在一些实施方案中,向导rna经设计以中断剪接位点(即,剪接受体(sa)或剪接供体(sd))。在一些实施方案中,向导rna经设计,使得碱基编辑导致提前stop密码子。表4a至表4b提供旨在中断剪接位点或导致提前stop密码子的grna靶标序列的非详尽列表。[1048][1049][1050][1051][1052][1053][1054][1055][1056][1057][1058][1059][1060][1061][1062][1063][1064][1065][1066][1067][1068][1069][1070][1071][1072][1073][1074][1075][1076][1077]前间区序列邻近基序[1078]术语“前间区序列邻近基序(pam)”或“pam样基序”是指紧随在由crispr细菌适应性免疫系统中的cas9核酸酶所靶向的dna序列之后的2至6个间接对dna序列。在一些实施方案中,pam可以是5'pam(即,定位在前间区序列5'末端的上游)。在其他实施方案中,pam可以是3'pam(即,定位在前间区序列5'末端的下游)。pam序列对于靶标结合而言至关重要,但确切序列取决于cas蛋白的类型。pam序列可以是本领域中已知的任何pam序列。合适的pam序列包括但不限于,ngg、nga、ngc、ngn、ngt、ngtt、ngcg、ngag、ngan、ngng、ngcn、ngcg、ngtn、nngrrt、nnnrrt、nngrr(n)、tttv、tycv、tycv、tatv、nnnngatt、nnagaaw或naaaac。y是嘧啶;n是任何核苷酸碱基;w是a或t。[1079]本文所提供的碱基编辑器可包含衍生自crispr蛋白的结构域,该结构域能够结合含有标准或非标准前间区序列邻近基序(pam)序列的核苷酸序列。pam位点是接近靶标多核苷酸序列的核苷酸序列。本公开的一些方面提供碱基编辑器,这些碱基编辑器包含具有不同pam特异性的crispr蛋白中的全部或一部分。[1080]例如,cas9蛋白,诸如来自酿脓链球菌的cas9(spcas9),典型需要标准nggpam序列以结合特定核酸区域,其中“ngg”中的“n”是腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)或胞嘧啶(c),且g是鸟嘌呤。pam可以是crispr蛋白特异性的,并且可以在包含不同的衍生自crispr的结构域的不同碱基编辑器之间存在差异。pam可以是靶标序列的5'或3'。pam可以是靶标序列的上游或下游。pam可以是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸的长度。pam经常是2至6个核苷酸之间的长度。[1081]在一些实施方案中,pam是“nrn”pam,其中“nrn”中的“n”是腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)或胞嘧啶(c),且r是腺嘌呤(a)或鸟嘌呤(g);或者pam是“nyn”pam,其中“nyn”中的“n”是腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)或胞嘧啶(c),且y是胞苷(c)或胸腺嘧啶(t),例如,如r.t.walton等人,2020,science,10.1126/science.aba8853(2020)中所述,其完整内容以其整体并入本文。[1082]几种pam变体在下表5中描述。[1083]表5.cas9蛋白和对应的pam序列[1084][1085][1086]在一些实施方案中,pam是ngc。在一些实施方案中,ngcpam被cas9变体识别。在一些实施方案中,ngcpam变体包括选自d1135m、s1136q、g1218k、e1219f、a1322r、d1332a、r1335e和t1337r(统称为“mqkfraer”)的一个或多个氨基酸置换。[1087]在一些实施方案中,pam是ngt。在一些实施方案中,ngtpam被cas9变体识别。在一些实施方案中,通过在一个或个残基1335、1337、1135、1136、1218和/或1219处的被靶向的突变产生ngtpam变体。在一些实施方案中,通过在一个或个残基1219、1335、1337、1218处的被靶向的突变产生ngtpam变体。在一些实施方案中,通过在一个或个残基1135、1136、1218、1219和1335处的被靶向的突变产生ngtpam变体。在一些实施方案中,ngtpam变体选自下表6a和表6b中提供的一组被靶向的突变。[1088]表6a:在残基1219、1335、1337、1218处的ngtpam变体突变[1089]变体e1219vr1335qt1337g12181fvt2fvr3fvq4fvl5fvtr6fvrr7fvqr8fvlr9llt10llr11llq12lll13fit14fir15fiq16fil17fgc18hln19fgca20hlnv21law22laf23lay24iaw25iaf26iay[1090]表6b:在残基1135、1136、1218、1219和1335处的ngtpam变体突变[1091][1092][1093]在一些实施方案中,ngtpam变体选自表6a和表6b中的变体5、7、28、31或36。在一些实施方案中,变体具有改善的ngtpam识别。[1094]在一些实施方案中,ngtpam变体在残基1219、1335、1337和/或1218处具有突变。在一些实施方案中,从下表7中提供的变体中选择具有用于改善识别的突变的ngtpam变体。[1095]表7:在残基1219、1335、1337和1218处的ngtpam变体突变[1096]变体e1219vr1335qt1337g12181fvt2fvr3fvq4fvl5fvtr6fvrr7fvqr8fvlr[1097]在一些实施方案中,从下表5中提供的变体中选择ngtpam。[1098]表8.ngtpam变体[1099][1100][1101]在一些实施方案中,ngtn变体是变体1。在一些实施方案中,ngtn变体是变体2。在一些实施方案中,ngtn变体是变体3。在一些实施方案中,ngtn变体是变体4。在一些实施方案中,ngtn变体是变体5。在一些实施方案中,ngtn变体是变体6。[1102]在一些实施方案中,cas9结构域是来自酿脓链球菌的cas9结构域(spcas9)。在一些实施方案中,spcas9结构域是核酸酶活性的spcas9、无核酸酶活性的spcas9(spcas9d)、或spcas9切口酶(spcas9n)。在一些实施方案中,spcas9包含d9x突变或本文所提供的任何氨基酸序列中的对应突变,其中x是除d之外的任何氨基酸。在一些实施方案中,spcas9结构域包含d9a突变,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可结合至具有非标准pam的核酸序列。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可结合至具有ngg、nga或ngcgpam序列的核酸序列。[1103]在一些实施方案中,spcas9结构域包含d1135x、r1335x和t1337x突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包含d1135e、r1335q和t1337r突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,spcas9结构域包含d1135e、r1335q和t1337r突变,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,spcas9结构域包含d1135x、r1335x和t1337x突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包含d1135v、r1335q和t1337r突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,spcas9结构域包含d1135v、r1335q和t1337r突变,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,spcas9结构域包含d1135x、g1218x、r1335x和t1337x突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变,其中x是任何氨基酸。在一些实施方案中,spcas9结构域包含d1135v、g1218r、r1335q和t1337r突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,spcas9结构域包含d1135v、g1218r、r1335q和t1337r突变,或本文所提供的任何氨基酸序列中的对应突变。[1104]在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域包含氨基酸序列,该氨基酸序列与本文所述的cas9多肽至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域包含本文所述的任何cas9多肽的氨基酸序列。在一些实施方案中,本文所提供的任何融合蛋白的cas9结构域由本文所述的任何cas9多肽的氨基酸序列组成。[1105]在一些实施例中,可以将被本文所公开的碱基编辑器的基于crispr蛋白的结构域所识别的pam在独立寡核苷酸上提供至编码该碱基编辑器的插入物(例如,aav插入物),从而将其提供至细胞。在此类实施方案中,提供在独立寡核苷酸上的pam可允许切割不能以其他方式被切割的靶标序列,因为在与靶标序列相同的多核苷酸上不存在邻近pam。[1106]在一种实施方案中,酿脓链球菌cas9(spcas9)可用作crispr核酸内切酶进行基因组工程改造。然而,可使用其他的。在一些实施方案中,不同的核酸内切酶可用来靶向某些基因组靶标。在一些实施方案中,可使用具有非nggpam序列的衍生自spcas9的合成变体。此外,已经鉴定了来自各种物种的cas9直系同源物,并且这些“非spcas9”可以结合也可用于本公开的多种pam序列。例如,相对大尺寸的spcas9(大约4kb编码序列)可导致携带不能在细胞内有效表达的spcas9cdna的质粒。相反,金黄色葡萄球菌cas9(sacas9)的编码序列比spcas9短大约1千碱基,可能允许其在细胞内有效地表达。类似于spcas9,sacas9核酸内切酶能够在体外修饰哺乳动物细胞中的靶标基因并且能够在体内修饰小鼠细胞中的靶标基因。在一些实施方案中,cas蛋白可靶向不同的pam序列。在一些实施方案中,例如,靶标基因可能与cas9pam即5'-ngg相邻。在其他实施方案中,其他cas9直系同源物可具有不同的pam要求。例如,其他pam诸如嗜热链球菌(s.thermophilus)的那些(对于crispr1为5'-nnagaa,且对于crispr3为5'-nggng)和脑膜炎奈瑟氏菌(neisseriameningitidis)的那些(5'-nnnngatt)也可以发现与靶标基因相邻。[1107]在一些实施方案中,对于酿脓链球菌系统,靶标基因序列可在5'-nggpam之前(即,处于其5'),并且20-nt向导rna序列可以与相反链进行碱基配对以寄到与pam相邻的cas9切割。在一些实施方案中,相邻切断可以在pam上游的(约)3个碱基对处。在一些实施方案中,相邻切断可以在pam上游的(约)10个碱基对处。在一些实施方案中,相邻切断可以在pam上游的(约)0至20个碱基对处。例如,相邻切断可以在紧邻pam上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基对处。相邻切断也可以在pam下游1至30个碱基对处。能够结合pam的示例性spcas9蛋白的序列如下:[1108]示例性的pam结合spcas9的氨基酸序列如下:[1109]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1110]示例性的pam结合spcas9n的氨基酸序列如下:[1111]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1112]示例性的pam结合speqrcas9的氨基酸序列如下:[1113][1114]在上述序列中,残基e1135、q1335和r1337,其可以从d1135、r1335和t1337突变以获得speqrcas9,加下划线并以粗体显示。[1115]示例性的pam结合spvqrcas9的氨基酸序列如下:[1116][1117][1118]在上述序列中,残基v1135、q1335和r1337,其可以从d1135、r1335和t1337突变以获得spvqrcas9,加下划线并以粗体显示。[1119]示例性的pam结合spvrercas9的氨基酸序列如下:[1120][1121][1122]在上述序列中,残基v1135、r1218、q1335和r1337,其可以从d1135、g1218、r1335和t1337突变以获得spvrercas9,加下划线并以粗体显示。[1123]在一些实施方案中,经工程改造的spcas9变体能够识别侧翼具有3'h的前间区序列邻近基序(non-gpam)(参见表3a至3d)。在一些实施方案中,spcas9变体识别nrnhpam(其中r是a或g,且h是a、c或t)。在一些实施方案中,non-gpam是nrrh、nrth或nrch(参见例如,miller,s.m.,等人continuousevolutionofspcas9variantscompatiblewithnon-gpams,nat.biotechnol.(2020),其内容通过引用以其整体并入本文)。[1124]在一些实施方案中,cas9结构域是重组cas9结构域。在一些实施方案中,重组cas9结构域是spymaccas9结构域。在一些实施方案中,spymaccas9结构域是核酸酶活性的spymaccas9、无核酸酶活性的spymaccas9(spymaccas9d)、或spymaccas9切口酶(spymaccas9n)。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可结合至具有非标准pam的核酸序列。在一些实施方案中,spymaccas9结构域、spcas9d结构域、或spcas9n构域可结合至具有naapam序列的核酸序列。[1125]具有天然5'-naan-3'pam特异性的猴链球菌(streptococcusmacacae)中spycas9的示例性cas9a同源物的序列是本领域中已知的并且由例如jakimo等人,(www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf)描述,且提供如下。[1126]spymaccas9[1127]thetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015);r.t.walton等人“unconstrainedgenometargetingwithnear-pamlessengineeredcrispr-cas9variants”science10.1126/science.aba8853(2020);hu等人“evolvedcas9variantswithbroadpamcompatibilityandhighdnaspecificity,”nature,2018apr.5,556(7699),57-63;miller等人,“continuousevolutionofspcas9variantscompatiblewithnon-gpams”nat.biotechnol.,2020apr;38(4):471-481;各自的整体内容通过引用并入本文。[1131]具有降低的排他性的cas9结构域[1132]典型地,cas9蛋白,诸如来自酿脓链球菌的cas9(spcas9),需要标准nggpam序列以结合特定核酸区域,其中“ngg”中的“n”是腺苷(a)、胸苷(t)或胞苷(c),且g是鸟苷。这可能限制编辑基因组内所希望的碱基的能力。在一些实施方案中,本文所提供的碱基编辑融合蛋白可能需要放置在精确位置处,例如,包含处于pam上游的靶标甲基的区域。参见例如,komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016),其整体内容通过引用并入本文。因此,在一些实施方案中,本文所提供的任何融合蛋白可含有cas9结构域,该结构域能够结合部含有标准pam序列(例如,ngg)的核苷酸序列。结合至非标准pam序列的cas9结构域已经在本领域中有所描述,并且对于熟练技术人员将会是显而易见的。例如,结合非标准pam序列的cas9结构域已经在kleinstiver,b.p.,等人,“engineeredcrispr-cas9nucleaseswithalteredpamspecificities”nature523,481-485(2015)和kleinstiver,b.p.,等人,“broadeningthetargetingrangeofstaphylococcusaureuscrispr-cas9bymodifyingpamrecognition”naturebiotechnology33,1293-1298(2015)中描述,各自的整体内容通过引用并入本文。[1133]具有内部插入的融合蛋白[1134]本文提供融合蛋白,该融合蛋白包含融合至核酸可编程核酸结合结构域(例如,napdnabp)的异源多肽。异源多肽可以是未见于天然或野生型napdnabp多肽序列中的多肽。异源多肽可以在napdnabp的c末端处、在napdnabp的n末端处融合至napdnabp,或插入在napdnabp的内部位置处。在一些实施方案中,异源多肽插入在napdnabp的内部位置处。在一些实施方案中,医院多肽是脱氨酶或其功能性片段。例如,融合多肽可包含位于cas9或cas12(例如,cas12b/c2c1)多肽的n端片段和c端片段侧翼的脱氨酶。融合蛋白中的脱氨酶可以是胞苷脱氨酶。在一些实施方案中,胞苷脱氨酶是apobec脱氨酶(例如,apobec1)。融合蛋白中的脱氨酶可以是腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶是tada(例如,tada*7.10或tada*8)。在一些实施方案中,tada是tada*8或tada*9。如本文所述的tada序列(例如,tada7.10或tada*8)是适用于上述融合蛋白的脱氨酶。[1135]在一些实施方案中,融合蛋白包含以下结构:[1136]nh2-[napdnabp的n端片段]-[脱氨酶]-[napdnabp的c端片段]-cooh;[1137]nh2-[cas9的n端片段]-[腺苷脱氨酶]-[cas9的c端片段]-cooh;[1138]nh2-[cas12的n端片段]-[腺苷脱氨酶]-[cas12的c端片段]-cooh;[1139]nh2-[cas9的n端片段]-[胞苷脱氨酶]-[cas9的c端片段]-cooh;[1140]nh2-[cas12的n端片段]-[胞苷脱氨酶]-[cas12的c端片段]-cooh;[1141]其中,“]-[”的每个实例是任选的连接子。[1142]脱氨酶可以是环状排列的脱氨酶。例如,脱氨酶可以是环状排列的腺苷脱氨酶。在一些实施方案中,脱氨酶是环状排列的tada,在如tada参考序列中编号的氨基酸残基116处环状排列。在一些实施方案中,脱氨酶是环状排列的tada,在如tada参考序列中编号的氨基酸残基136处环状排列。在一些实施方案中,脱氨酶是环状排列的tada,在如tada参考序列中编号的氨基酸残基65处环状排列。[1143]融合蛋白可包含超过一个脱氨酶。融合蛋白可包含,例如,1、2、3、4、5个或更多脱氨酶。在一些实施方案中,融合蛋白包含一个脱氨酶。在一些实施方案中,融合蛋白包含两个脱氨酶。融合蛋白中的两个或更多个脱氨酶可以是腺苷脱氨酶、胞苷脱氨酶、或其组合。两个或更多个脱氨酶可以是同二聚体。两个或更多个脱氨酶可以是异二聚体。两个或更多个脱氨酶可串联插入到apdnabp中。在一些实施方案中,两个或更多个脱氨酶在apdnabp中可以不是串联方式。[1144]在一些实施方案中,融合蛋白中的napdnabp是cas9多肽或其片段。cas9多肽可以是变体cas9多肽。在一些实施方案中,cas9多肽是cas9切口酶(ncas9)多肽或其片段。在一些实施方案中,cas9多肽是核酸酶死亡的cas9(dcas9)多肽或其片段。融合蛋白中的cas9多肽可以是全长cas9多肽。在一些情况下,融合蛋白中的cas9多肽可以不是全长cas9多肽。cas9多肽可以在例如n端或c端相对于天然存在的cas9蛋白截短。cas9多肽可以是环状排列的cas9蛋白。cas9多肽可以是cas9多肽的片段、部分或结构域,其仍能够结合靶标核苷酸和向导核酸序列。[1145]在一些实施方案中,cas9多肽是酿脓链球菌cas9(spcas9)、金黄色葡萄球菌cas9(sacas9)、嗜热链球菌1cas9(st1cas9),或其片段或变体。[1146]融合蛋白的cas9多肽可包含氨基酸序列,该氨基酸序列与天然存在的cas9多肽至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。[1147]融合蛋白的cas9多肽可包含氨基酸序列,该氨基酸序列与下文详述的cas9氨基酸序列(下文中称为“cas9参考序列”)至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同:[1148][1149]包含侧翼为cas9多肽的n端和c端的异源催化性结构域的融合蛋白也可用于在本文所述的方法中用于碱基编辑。包含cas9和一个或多个脱氨酶结构域(例如,腺苷脱氨酶)或者包含侧翼具有cas9序列的腺苷脱氨酶结构域的融合蛋白也可以用于靶标序列的高特异性且高效的碱基编辑。在一种实施方案中,嵌合cas9融合蛋白含有插入到cas9多肽内的异源催化性结构域(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)。在一些实施方案中,融合蛋白包含插入到cas9内的腺苷脱氨酶结构域和胞苷脱氨酶结构域。在一些实施方案中,腺苷脱氨酶融合到cas9内,并且胞苷脱氨酶融合至c端。在一些实施方案中,腺苷脱氨酶融合到cas9内,并且胞苷脱氨酶融合至n端。在一些实施方案中,胞苷脱氨酶融合到cas9内,并且腺苷脱氨酶融合至c端。在一些实施方案中,胞苷脱氨酶融合到cas9内,并且腺苷脱氨酶融合至n端。[1150]具有腺苷脱氨酶和胞苷脱氨酶以及cas9的融合蛋白的示例性结构提供如下:[1151]nh2-[cas9(腺苷脱氨酶)]-[胞苷脱氨酶]-cooh;[1152]nh2-[胞苷脱氨酶]-[cas9(腺苷脱氨酶)]-cooh;[1153]nh2-[cas9(胞苷脱氨酶)]-[腺苷脱氨酶]-cooh;或[1154]nh2-[腺苷脱氨酶]-[cas9(胞苷脱氨酶)]-cooh。[1155]在一些实施方案中上述通用架构中所用的“‑”表示任选的连接子的存在。[1156]在各种实施方案中,催化性结构域具有dna修饰活性(例如,脱氨酶活性),诸如腺苷脱氨酶活性。在一些实施方案中,腺苷脱氨酶是tada(例如,tada*7.10)。在一些实施方案中,tada是tada*8。在一些实施方案中,tada*8融合到cas9内,并且胞苷脱氨酶融合至c端。在一些实施方案中,tada*8融合到cas9内,并且胞苷脱氨酶融合至n端。在一些实施方案中,胞苷脱氨酶融合到cas9内,并且tada*8融合至c端。在一些实施方案中,胞苷脱氨酶融合到cas9内,并且tada*8融合至n端。具有tada*8和胞苷脱氨酶以及cas9的融合蛋白的示例性结构提供如下:[1157]nh2-[cas9(tada*8)]-[胞苷脱氨酶]-cooh;[1158]nh2-[胞苷脱氨酶]-[cas9(tada*8)]-cooh;[1159]nh2-[cas9(tada*8)]-[tada*8]-cooh;或[1160]nh2-[tada*8]-[cas9(tada*8)]-cooh。[1161]在一些实施方案中上述通用架构中所用的“‑”表示任选的连接子的存在。[1162]异源多肽(例如,脱氨酶)可以在合适位置插入到napdnabp(例如,cas9或cas12(例如,cas12b/c2c1))内,例如,使得napdnabp保持其结合靶标多核苷酸和向导核酸的能力。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)可以插入到napdnabp内而不破坏该脱氨酶的功能(例如,碱基编辑活性)或该napdnabp的功能(例如,结合至靶标核酸和向导核酸的能力)。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶颚胞苷脱氨酶)可以插入到napdnabp内,插入位置在例如如晶体学研究所示的无序区处或包含高温因子或b因子的区域处。蛋白质的有序性较差的区域、无序区或结构凌乱的区域(例如,暴露于溶剂的区域和环)可以用于插入而不破坏结构或功能。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)可以插入到napdnabp内的柔性环区域或暴露于溶剂的区域中。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)插入到cas9或cas12b/c2c1多肽的柔性环内。[1163]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)的插入位置通过cas9多肽的晶体结构的b因子分析来确定。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)插入到cas9多肽的区域中,该区域包含高于平均值的b因子(例如,与总蛋白或包含无序区的蛋白结构域相比,更高的b因子)。b因子或温度因子可表示原子自其平均位置的波动(例如,作为晶格中温度依赖性原子振动或静态无序的结果)。骨架原子的高b因子(例如,高于平均b因子)可能是具有相对高的局部移动性的区域的标志。这种区域可用于插入脱氨酶而不破坏结构或功能。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)可以插入在具有以下残基的位置处,该残基具有cα原子,其该原子的b因子比总蛋白的平均b因子高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、或多于200%。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)可以插入在具有以下残基的位置处,该残基具有cα原子,其该原子的b因子比包含该残基的cas9蛋白结构域的平均b因子高50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、或多于200%。包含高于平均值的b因子的cas9多肽位置可包括,例如,氨基酸残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247和1248,如上述cas9参考序列中编号。包含高于平均值的b因子的cas9多肽区域可包括,例如,氨基酸残基792至872、792至906、和2至791,如上述cas9参考序列中编号。[1164]异源多肽(例如,脱氨酶)可在选自由以下所组成的群组的氨基酸残基处插入到napdnabp中:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,异源多肽插入到以下氨基酸位置之间:768至769、791至792、792至793、1015至1016、1022至1023、1026至1027、1029至1030、1040至1041、1052至1053、1054至1055、1067至1068、1068至1069、1247至1248、或1248至1249,如上述cas参考序列中编号或其对应氨基酸位置。在一些实施方案中,异源多肽插入到以下氨基酸位置之间:769至770、792至793、793至794、1016至1017、1023至1024、1027至1028、1030至1031、1041至1042、1053至1054、1055至1056、1068至1069、1069至1070、1248至1249、或1249至1250,如上述cas参考序列中编号或其对应氨基酸位置。在一些实施方案中,异源多肽代替选自由以下所组成的群组的氨基酸残基:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247和1248,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。应理解,对于上述cas9参考序列的关于插入位置的参考用于说明性目的。本文所讨论的插入不限于上述cas9参考序列的cas9多肽序列,而是包括在变体cas9多肽(例如,cas9切口酶(ncas9)、核酸酶死亡的cas9(dcas9)、缺少核酸酶结构域的cas9变体、截短的cas9、或缺少部分或完整hnh结构域的cas9结构域)中的对应位置处的插入。[1165]异源多肽(例如,脱氨酶)可在选自由以下所组成的群组的氨基酸残基处插入到napdnabp中:768、792、1022、1026、1040、1068和1247,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,异源多肽插入到以下氨基酸位置之间:768至769、792至793、1022至1023、1026至1027、1029至1030、1040至1041、1068至1069、或1247至1248,如上述cas参考序列中编号或其对应氨基酸位置。在一些实施方案中,异源多肽插入到以下氨基酸位置之间:769至770、793至794、1023至1024、1027至1028、1030至1031、1041至1042、1069至1070、或1248至1249,如上述cas参考序列中编号或其对应氨基酸位置。在一些实施方案中,异源多肽代替选自由以下所组成的群组的氨基酸残基:768、792、1022、1026、1040、1068和1247,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1166]异源多肽(例如,脱氨酶)可在如本文所述的氨基酸残基处插入到napdnabp内,或在另一cas9多肽的对应氨基酸残基处。在一种实施方案中,异源多肽(例如,脱氨酶)可在选自由以下所组成的群组的氨基酸残基处插入到napdnabp中:1002、1003、1025、1052至1056、1242至1247、1061之1077、943至947、686至691、569至578、530至539和1060至1077,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)可插入在残基的n端或c端或替代该残基。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)插入到残基的c端处。[1167]在一些实施方案中,腺苷脱氨酶(例如,tada)插入在选自由以下所组成的群组的氨基酸残基处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶(例如,tada)插入残基792至872、792至906、或2至791的位置处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶插入在选自由以下所组成的群组的氨基酸的n端处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶插入在选自由以下所组成的群组的氨基酸的c端处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,腺苷脱氨酶插入以替换选自由以下所组成的群组的氨基酸:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1168]在一些实施方案中,胞苷脱氨酶(例如,apobec1)插入在选自由以下所组成的群组的氨基酸残基处:1016、1023、1029、1040、1069和1247,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,胞苷脱氨酶插入在选自由以下所组成的群组的氨基酸的n端处:1016、1023、1029、1040、1069和1247,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,胞苷脱氨酶插入在选自由以下所组成的群组的氨基酸的c端处:1016、1023、1029、1040、1069和1247,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,胞苷脱氨酶插入以替换选自由以下所组成的群组的氨基酸:1016、1023、1029、1040、1069和1247,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1169]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基768处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基768的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基768的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基768,如上述cas9参考序列中编号或另一cas9多肽中的对应氨基酸残基。[1170]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基791处或插入在氨基酸残基792处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基791的n端处或插入在氨基酸792的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸791的c端处或插入在氨基酸792的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸791或插入以替换氨基酸792,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1171]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1016处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1016的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1016的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基1016,如上述cas9参考序列中编号或另一cas9多肽中的对应氨基酸残基。[1172]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1022处或插入在氨基酸残基1023处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1022的n端处或插入在氨基酸残基1023的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1022的c端处或插入在氨基酸残基1023的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基1022或插入以替换氨基酸残基1023,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1173]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1026处或插入在氨基酸残基1029处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1026的n端处或插入在氨基酸残基1029的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1026的c端处或插入在氨基酸残基1029的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基1026或插入以替换氨基酸残基1029,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1174]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1040处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1040的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1040的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基1040,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1175]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1052处或插入在氨基酸残基1054处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1052的n端处或插入在氨基酸残基1054的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1052的c端处或插入在氨基酸残基1054的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基1052或插入以替换氨基酸残基1054,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1176]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1067处、或插入在氨基酸残基1068处、或插入在氨基酸残基1069处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1067的n端处、或插入在氨基酸残基1068的n端处、或插入在氨基酸残基1069的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1067的c端处、或插入在氨基酸残基1068的c端处、或插入在氨基酸残基1069的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基1067、或插入以替换氨基酸残基1068、或插入以替换氨基酸残基1069,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1177]在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1246处、或插入在氨基酸残基1247处、或插入在氨基酸残基1248处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1246的n端处、或插入在氨基酸残基1247的n端处、或插入在氨基酸残基1248的n端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入在氨基酸残基1246的c端处、或插入在氨基酸残基1247的c端处、或插入在氨基酸残基1248的c端处,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基处。在一些实施方案中,脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)插入以替换氨基酸残基1246、或插入以替换氨基酸残基1247、或插入以替换氨基酸残基1248,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1178]在一些实施方案中,异源多肽(例如,脱氨酶)插入cas9多肽的柔性环内。柔性环部分可以选自由以下项所组成的群组:530至537、569至570、686至691、943至947、1002至1025、1052至1077、1232至1247、或1298至1300,如上述cas9参考序列中编号,或另一cas9多肽的对应氨基酸残基。柔性环部分可选自由以下项所组成的群组:1至529、538至568、580至685、692至942、948至1001、1026至1051、1078至1231、或1248至1297,如上述cas9参考序列中编号,或另一cas9多肽的对应氨基酸残基。[1179]异源多肽(例如,腺苷脱氨酶)可插入对应于以下氨基酸残基的cas9多肽区内:1017至1069、1242至1247、1052至1056、1060至1077、1002–1003、943至947、530至537、568至579、686至691、1242至1247、1298–1300、1066至1077、1052至1056、或1060至1077,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1180]异源多肽(例如,腺苷脱氨酶)可插入cas9多肽的缺失区处。缺失区可对应于cas9多肽的n端或c端部分。在一些实施方案中,缺失区对应于残基792至872,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区对应于残基792至906,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区对应于残基2至791,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。在一些实施方案中,缺失区对应于残基1017至1069,如上述cas9参考序列中编号,或其对应氨基酸残基。[1181]示例性的内部融合蛋白碱基编辑器提供在下表9中:[1182]表9:cas9蛋白中的插入基因座[1183]beid修饰其他idibe001cas9tadains1015islay01ibe002cas9tadains1022islay02ibe003cas9tadains1029islay03ibe004cas9tadains1040islay04ibe005cas9tadains1068islay05ibe006cas9tadains1247islay06ibe007cas9tadains1054islay07ibe008cas9tadains1026islay08ibe009cas9tadains768islay09ibe020δhnhtada792islay20ibe021n-端融合单tada螺旋截短的165末端islay21ibe029tada-环状排列116ins1067islay29ibe031tada-环状排列136ins1248islay31ibe032tada-环状排列136ins1052islay32ibe035δ792-872tadainsislay35ibe036δ792-906tadainsislay36ibe043tada-环状排列65ins1246islay43ibe044tadainsc端截短2791islay44[1184]异源多肽(例如,脱氨酶)可插入cas9多肽的结构性或功能性结构域内。异源多肽(例如,脱氨酶)可插入cas9多肽的两个结构性或功能性结构域之间。异源多肽(例如,脱氨酶)可插cas9多肽的结构性或功能性结构域处,例如,在从cas9多肽删除该结构域后。cas9多肽的结构性或功能性结构域可包括,例如,ruvci、ruvcii、ruvciii、rec1、rec2、pi或hnh。[1185]在一些实施方案中,cas9多肽缺少选自以下所组成的群组的一个或多个结构域:ruvci、ruvcii、ruvciii、rec1、rec2、pi或hnh结构域。在一些实施方案中,cas9多肽缺少核酸酶结构域。在一些实施方案中,cas9多肽缺少hnh结构域。在一些实施方案中,cas9多肽缺少hnh结构域的一部分,使得该cas9多肽具有降低或消除的hnh活性。在一些实施方案中,cas9多肽包含核酸酶结构域的缺失,并且脱氨酶插入以替换该核酸酶结构域。在一些实施方案中,hnh结构域被删除,并且脱氨酶被插入在该处。在一些实施方案中,一个或多个ruvc结构域被删除,并且脱氨酶被插入在该处。[1186]包含异源多肽的融合蛋白侧翼可以是napdnabp的n端片段和c端片段。在一些实施方案中,融合蛋白包含脱氨酶,该脱氨酶的侧翼是cas9多肽的n端片段和c端片段。n端片段或c端片段可结合靶标多核苷酸序列。n端片段的c端或c端片段的n端可包含cas9多肽的柔性环的一部分。n端片段的c端或c端片段的n端可包含cas9多肽的α螺旋结构的一部分。n端片段或c端片段可包含dna结合结构域。n端片段或c端片段可包含ruvc结构域。n端片段或c端片段可包含hnh结构域。在一些实施方案中,n端片段或c端片段均不包含hnh结构域。[1187]在一些实施方案中,n端cas9片段的c端包含在融合蛋白将靶标核碱基脱氨基时接近该靶标核碱基的氨基酸。在一些实施方案中,c端cas9片段的n端包含在融合蛋白将靶标核碱基脱氨基时接近该靶标核碱基的氨基酸。不同脱氨酶的插入位置可以不同,以便在靶标核碱基与n端cas9片段的c端或c端cas9片段的n端中的氨基酸之间具有接近性。例如,脱氨酶的插入位置可以在选自以下所组成的群组的氨基酸残基处:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052和1246,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1188]融合蛋白的n端cas9片段(即,在融合蛋白中位于脱氨酶侧翼的n端cas9片段)可包含cas9多肽的n端。融合蛋白的n端cas9片段可包含至少约100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸的长度。融合蛋白的n端cas9片段可包含对应于以下氨基酸残基的序列:1至56、1至95、1至200、1至300、1至400、1至500、1至600、1至700、1至718、1至765、1至780、1至906、1至918、或1至1100,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。n端cas9片段可包含序列,该序列与以下氨基酸残基具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列一致性:1至56、1至95、1至200、1至300、1至400、1至500、1至600、1至700、1至718、1至765、1至780、1至906、1至918、或1至1100,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1189]融合蛋白的c端cas9片段(即,在融合蛋白中位于脱氨酶侧翼的c端cas9片段)可包含cas9多肽的c端。融合蛋白的c端cas9片段可包含至少约100、200、300、400、500、600、700、800、900、1000、1100、1200或1300个氨基酸的长度。融合蛋白的c端cas9片段可包含对应于以下氨基酸残基的序列:1099至1368、918至1368、906至1368、780至1368、765至1368、718至1368、94至1368、或56至1368,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。n端cas9片段可包含序列,该序列与以下氨基酸残基具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%序列一致性:1099至1368、918至1368、906至1368、780至1368、765至1368、718至1368、94至1368、或56至1368,如上述cas9参考序列中编号,或另一cas9多肽中的对应氨基酸残基。[1190]融合蛋白的n端cas9片段和c端cas9片段结合在一起可能不对应于天然存在的全长cas9多肽序列,例如,如上述cas9参考序列中所详述的。[1191]本文所述的融合蛋白可实现靶向脱氨基,且在非靶标位点(例如,脱靶位点)处的脱氨基减少,诸如减少全基因组谬误脱氨基。本文所述的融合蛋白可实现靶向脱氨基,且减少在非靶标位点处的旁观者脱氨基。与例如包含融合至cas9多肽的n端或c端的脱氨酶的末端融合蛋白相比,不希望的脱氨基或脱靶脱氨基作用可以减少至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%、至少95%、或至少99%。与例如包含融合至cas9多肽的n端或c端的脱氨酶的末端融合蛋白相比,不希望的脱氨基或脱靶脱氨基作用可以减少至少一倍、至少两倍、至少三倍、至少四倍、至少五倍、至少十倍、至少十五倍、至少二十倍、至少三十倍、至少四十倍、至少五十倍、至少60倍、至少70倍、至少80倍、至少90倍、或至少一百倍。[1192]在一些实施方案中,融合蛋白的脱氨酶(例如,腺苷脱氨酶、胞苷脱氨酶、或者腺苷脱氨酶和胞苷脱氨酶)将r环范围内的不超过两个核碱基脱氨基。在一些实施方案中,融合蛋白的脱氨酶将r环范围内的不超过三个核碱基脱氨基。在一些实施方案中,融合蛋白的脱氨酶将r环范围内的不超过2、3、4、5、6、7、8、9、或10个核碱基脱氨基。r环是三链核酸结构,包括dna:rna杂交物、dna:dna、或rna:rna互补结构并且与单链dna缔合。如本文所用,r环可以在靶标多核苷酸与crispr复合物或碱基编辑复合物接触时形成,其中向导多核苷酸(例如,向导rna)的一部分与靶标多核苷酸(例如,靶标dna)的一部分杂交并替代后者。在一些实施方案中,r环包含间隔序列与靶标dna互补序列的杂交区。r环区可以是约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核碱基对的长度。在一些实施方案中,r环区为约20个核碱基对的长度。应理解,如本文所用,r环区不限于与向导多核苷酸杂交的靶标dna链。例如,对r环区内的靶标核碱基的编辑可以是对包含与向导rna互补的链的dna链的编辑,或者是对作为与向导rna的互补链相反的链的dna链的编辑。在一些实施方案中,在r环区内的编辑包含编辑靶标dna序列中的与向导rna非互补的链(前间区序列链)上的核碱基。[1193]本文所述的融合蛋白可在不同于标准碱基编辑的编辑窗口内实现靶标脱氨基。在一些实施方案中,靶标核碱基是靶标多核苷酸序列中的pam序列的上游约1至约20个碱基。在一些实施方案中,靶标核碱基是靶标多核苷酸序列中的pam序列的上游约2至约12个碱基。在一些实施方案中,靶标核碱基是距离pam序列或是pam序列上游约1至9个碱基对、约2至10个碱基对、约3至11个碱基对、约4至12个碱基对、约5至13个碱基对、约6至14个碱基对、约7至15个碱基对、约8至16个碱基对、约9至17个碱基对、约10至18个碱基对、约11至19个碱基对、约12至20个碱基对、约1至7个碱基对、约2至8个碱基对、约3至9个碱基对、约4至10个碱基对、约5至11个碱基对、约6至12个碱基对、约7至13个碱基对、约8至14个碱基对、约9至15个碱基对、约10至16个碱基对、约11至17个碱基对、约12至18个碱基对、约13至19个碱基对、约14至20个碱基对、约1至5个碱基对、约2至6个碱基对、约3至7个碱基对、约4至8个碱基对、约5至9个碱基对、约6至10个碱基对、约7至11个碱基对、约8至12个碱基对、约9至13个碱基对、约10至14个碱基对、约11至15个碱基对、约12至16个碱基对、约13至17个碱基对、约14至18个碱基对、约15至19个碱基对、约16至20个碱基对、约1至3个碱基对、约2至4个碱基对、约3至5个碱基对、约4至6个碱基对、约5至7个碱基对、约6至8个碱基对、约7至9个碱基对、约8至10个碱基对、约9至11个碱基对、约10至12个碱基对、约11至13个碱基对、约12至14个碱基对、约13至15个碱基对、约14至16个碱基对、约15至17个碱基对、约16至18个碱基对、约17至19个碱基对、约18至20个碱基对。在一些实施方案中,靶标核碱基是距离pam序列或是pam序列上游约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个碱基对。在一些实施方案中,靶标核碱基是pam序列上游约1、2、3、4、5、6、7、8或9个碱基对。在一些实施方案中,靶标核碱基是pam序列上游约1、2、3、4或6个碱基对。[1194]融合蛋白可包含超过一个异源多肽。例如,融合多肽可额外包含一个或多个ugi结构域和/或一个或多个核定位信号。两个或更多个异源结构域可以串联插入。两个或更多个异源结构域可以插入在使得它们在napdnabp中不串联的位置处。[1195]融合蛋白可包含位于脱氨酶与napdnabp多肽之间的连接子。连接基可以是肽或非肽连接子。例如,连接子可以是xten、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes。在一些实施方案中,融合蛋白包含位于n端cas9片段与脱氨酶之间的连接子。在一些实施方案中,融合蛋白包含位于c端cas9片段与脱氨酶之间的连接子。在一些实施方案中,napdnabp的n端和c端片段用连接子连结至脱氨酶。在一些实施方案中,n端片段和c端片段接合至脱氨酶结构域而无需连接子。在一些实施方案中,融合蛋白包含位于n端cas9片段与脱氨酶之间的连接子,而不包含位于c端cas9片段与脱氨酶之间的连接子。在一些实施方案中,融合蛋白包含位于c端cas9片段与脱氨酶之间的连接子,而不包含位于n端cas9片段与脱氨酶之间的连接子。[1196]在一些实施方案中,融合蛋白中的napdnabp是cas12多肽,例如,cas12b/c2c1,或其片段。cas12多肽可以是变体cas12多肽。在其他实施方案中,cas12多肽的n端或c端片段包含核酸可编程dna结合结构域或ruvc结构域。在其他实施方案中,融合蛋白含有位于cas12多肽与催化性结构域之间的连接子。在其他实施方案中,连接子的氨基酸序列是ggsggs或gssgsetpgtsesatpessg。在其他实施方案中,连接子是刚性连接子。在上述方面的其他实施方案中,连接子由ggaggctctggaggaagc或ggctcttctggatctgaaacacctggcacaagcgagagcgccacccctgagagctctggc编码。[1197]包含侧翼为cas12多肽的n端和c端的异源催化性结构域的融合蛋白也可用于在本文所述的方法中用于碱基编辑。包含cas12和一个或多个脱氨酶结构域(例如,腺苷脱氨酶)或者包含侧翼具有cas12序列的腺苷脱氨酶结构域的融合蛋白也可以用于靶标序列的高特异性且高效的碱基编辑。在一种实施方案中,嵌合cas12融合蛋白含有插入到cas12多肽内的异源催化性结构域(例如,腺苷脱氨酶、胞苷脱氨酶、或腺苷脱氨酶和胞苷脱氨酶)。在一些实施方案中,融合蛋白包含插入到cas12内的腺苷脱氨酶结构域和胞苷脱氨酶结构域。在一些实施方案中,腺苷脱氨酶融合到cas12内,并且胞苷脱氨酶融合至c端。在一些实施方案中,腺苷脱氨酶融合到cas12内,并且胞苷脱氨酶融合至n端。在一些实施方案中,胞苷脱氨酶融合到cas12内,并且腺苷脱氨酶融合至c端。在一些实施方案中,胞苷脱氨酶融合到cas12内,并且腺苷脱氨酶融合至n端。具有腺苷脱氨酶和胞苷脱氨酶以及cas12的融合蛋白的示例性结构提供如下:[1198]nh2-[cas12(腺苷脱氨酶)]-[胞苷脱氨酶]-cooh;[1199]nh2-[胞苷脱氨酶]-[cas12(腺苷脱氨酶)]-cooh;[1200]nh2-[cas12(胞苷脱氨酶)]-[腺苷脱氨酶]-cooh;或[1201]nh2-[腺苷脱氨酶]-[cas12(胞苷脱氨酶)]-cooh;[1202]在一些实施方案中上述通用架构中所用的“‑”表示任选的连接子的存在。[1203]在各种实施方案中,催化性结构域具有dna修饰活性(例如,脱氨酶活性),诸如腺苷脱氨酶活性。在一些实施方案中,腺苷脱氨酶是tada(例如,tada*7.10)。在一些实施方案中,tada是tada*8。在一些实施方案中,tada*8融合到cas12内,并且胞苷脱氨酶融合至c端。在一些实施方案中,tada*8融合到cas12内,并且胞苷脱氨酶融合至n端。在一些实施方案中,胞苷脱氨酶融合到cas12内,并且tada*8融合至c端。在一些实施方案中,胞苷脱氨酶融合到cas12内,并且tada*8融合至n端。具有tada*8和胞苷脱氨酶以及cas12的融合蛋白的示例性结构提供如下:[1204]n-[cas12(tada*8)]-[把颇感脱氨酶]-c;[1205]n-[胞苷脱氨酶]-[cas12(tada*8)]-c;[1206]n-[cas12(胞苷脱氨酶)]-[tada*8]-c;或[1207]n-[tada*8]-[cas12(胞苷脱氨酶)]-c。[1208]在一些实施方案中上述通用架构中所用的“‑”表示任选的连接子的存在。[1209]在其他实施方案中,融合蛋白含有一个或多个催化性结构域。在其他实施方案中,一个或多个催化性结构域中的至少一个插入到cas12多肽内或融合在cas12n端或c端。在其他实施方案中,一个或多个催化性结构域中的至少一个插入到cas12多肽的环、α螺旋、未结构化部分、或溶剂可及部分内。在其他实施方案中,cas12多肽是cas12a、cas12b、cas12c、cas12d、cas12e、cas12g、cas12h、cas12i或cas12j/casφ。在其他实施方案中,cas12多肽与外村尚芽孢杆菌(bacillushisashii)cas12b、热噬淀粉芽孢杆菌(bacillusthermoamylovorans)cas12b、芽孢杆菌属(bacillussp.v3-13)cas12b或嗜热脂环酸芽孢杆菌(alicyclobacillusacidiphilus)cas12b具有至少约85%的氨基酸序列一致性。在其他实施方案中,cas12多肽与外村尚芽孢杆菌cas12b、热噬淀粉芽孢杆菌cas12b、芽孢杆菌属v3-13cas12b或嗜热脂环酸芽孢杆菌cas12b具有至少约90%的氨基酸序列一致性。在其他实施方案中,cas12多肽与外村尚芽孢杆菌cas12b、热噬淀粉芽孢杆菌cas12b、芽孢杆菌属v3-13cas12b或嗜热脂环酸芽孢杆菌cas12b具有至少约95%的氨基酸序列一致性。在其他实施方案中,cas12多肽含有外村尚芽孢杆菌cas12b、热噬淀粉芽孢杆菌cas12b、芽孢杆菌属v3-13cas12b或嗜热脂环酸芽孢杆菌cas12b,或由其组成。[1210]在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸位置153至154、255至256、306至307、980至981、1019至1020、534至535、604至605、或344至345之间,或cas12a、cas12c、cas12d、cas12e、cas12g、cas12h、cas12i或cas12j/casφ的对应氨基酸处。在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸p153与s154之间。在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸k255与e256之间。在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸d980与g981之间。在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸k1019与l1020之间。在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸f534与p535之间。在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸k604与g605之间。在其他实施方案中,催化性结构域插入在bhcas12b的氨基酸h344与f345之间。在其他实施方案中,催化性结构域插入在bvcas12b的氨基酸位置147与148、248与249、299与300、991与992、或1031与1032之间,或cas12a、cas12c、cas12d、cas12e、cas12g、cas12h、cas12i或cas12j/casφ的对应氨基酸处。在其他实施方案中,催化性结构域插入在bvcas12b的氨基酸p147与d148之间。在其他实施方案中,催化性结构域插入在bvcas12b的氨基酸g248与g249之间。在其他实施方案中,催化性结构域插入在bvcas12b的氨基酸p299与e300之间。在其他实施方案中,催化性结构域插入在bvcas12b的氨基酸g991与e992之间。在其他实施方案中,催化性结构域插入在bvcas12b的氨基酸k1031与m1032之间。在其他实施方案中,催化性结构域插入在aacas12b的氨基酸位置157与158、258与259、310与311、1008与1009、或1044与1045之间,或cas12a、cas12c、cas12d、cas12e、cas12g、cas12h、cas12i或cas12j/casφ的对应氨基酸处。在其他实施方案中,催化性结构域插入在aacas12b的氨基酸p157与g158之间。在其他实施方案中,催化性结构域插入在aacas12b的氨基酸v258与g259之间。在其他实施方案中,催化性结构域插入在aacas12b的氨基酸d310与p311之间。在其他实施方案中,催化性结构域插入在aacas12b的氨基酸g1008与e1009之间。在其他实施方案中,催化性结构域插入在aacas12b的氨基酸g1044与k1045之间。[1211]在其他实施方案中,融合蛋白含有核定位信号(例如,二分体核定位信号)。在其他实施方案中,核定位信号的氨基酸序列是mapkkkrkvgihgvpaa。在上述方面的其他实施方案中,核定位信号由以下序列编码:[1212]atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagcc。在其他实施方案中,cassette2b多肽含有沉默ruvc结构域催化活性的突变。在其他实施方案中,cas12b多肽含有d574a、d829a和/或d952a突变。在其他实施方案中,融合蛋白进一步含有标签(例如,流感血细胞凝集素标签)。[1213]在一些实施方案中,融合蛋白包含具有内容融合的和碱基编辑结构域(例如,脱氨酶结构域,例如腺苷脱氨酶结构域的全部或部分)的napdnabp结构域(例如,源自cas12的结构域)。在一些实施方案中,napdnabp是cas12b。在一些实施方案中,碱基编辑器包含具有bhcas12b结构域,该结构域具有插入在下表10中提供的基因座处的内部融合的tada*8结构域。[1214]表10:cas12b蛋白中的插入基因座[1215]bhcas12b插入位点插入在aa之间位置1153ps位置2255ke位置3306de位置4980dg位置51019kl位置6534fp位置7604kg位置8344hfbvcas12b插入位点插入在aa之间位置1147pd位置2248gg位置3299pe位置4991ge位置51031kmaacas12b插入位点插入在aa之间位置1157pg位置2258vg位置3310dp位置41008ge位置51044gk[1216]作为非限制性示例,腺苷脱氨酶(例如,tada*8.13)可以插入到bhcas12b中以产生有效编辑核酸序列的融合蛋白(例如,tada*8.13-bhcas12b)。[1217]在一些实施方案中,本文所述的碱基编辑系统是abe,该abe具有插入到cas9中的tada。提供了具有插入到cas9中的tada的相关abe的序列。[1218]101cas9tadains1015[1219]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1220]102cas9tadains1022[1221]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1222]103cas9tadains1029[1223]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1224]103cas9tadains1040[1225]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1226]105cas9tadains1068[1227]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdtgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1228]106cas9tadains1247[1229]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1230]107cas9tadains1054[1231]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1232]108cas9tadains1026[1233]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiaksegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1234]109cas9tadains768[1235]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1236]110.1cas9tadains1250[1237]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1238]110.2cas9tadains1250[1239]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1240]110.3cas9tadains1250[1241]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmpredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1242]110.4cas9tadains1250[1243]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrredneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1244]110.5cas9tadains1249[1245]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1246]110.5cas9tadainsδ59-661250[1247]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgssgsetpgtsesatpesgssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1248]110.6cas9tadains1251[1249]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspegssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrdneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1250]110.7cas9tadains1252[1251]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedgssgssgsetpgtsesatpesgsssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmrrneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1252]110.8cas9tadainsδ59-66c截短1250mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1253]111.1cas9tadains997[1254]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1255]111.2cas9tadains997[1256]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgssgsetpgtsesatpessggssikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1257]112δhnhtada[1258]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1259]113n端单tada螺旋截短165末端[1260]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1261]114n端单tada螺旋截短165末端δ59-65[1262]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnrtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1263]115.1cas9tadains1004[1264]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypkgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1265]115.2cas9tadains1005[1266]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1267]115.3cas9tadains1006[1268]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1269]115.4cas9tadains1007[1270]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1271]116.1cas9tadainsc端截短2792[1272]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelggssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1273]116.2cas9tadainsc端截短2791[1274]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1275]116.3cas9tadainsc端截短2790[1276]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikegssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqlgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1277]117cas9δ1017-1069[1278]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvyssgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1279]118cas9tada-cp116ins1067[1280]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietnmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypggetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1281]119cas9tadains701[1282]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1283]120cas9tadacp136ins1248[1284]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgsmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgpedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1285]121cas9tadacp136ins1052[1286]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlamnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgngeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1287]122cas9tadacp136ins1041[1288]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1289]123cas9tadacp139ins1299[1290]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1291]124cas9δ792-872tadains[1292]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdeevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1293]125cas9delta792-906tadains[1294]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1295]126tadacp65ins1003[1296]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypktahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdplesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1297]127tadacp65ins1016[1298]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1299]128tadacp65ins1022[1300]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1301]129tadacp65ins1029[1302]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeitahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1303]130tadacp65ins1041[1304]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffystahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1305]131tadacp65ins1054[1306]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlantahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpgeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1307]132tadacp65ins1246[1308]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgtahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdgssgsetpgtsesatpessgsevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdpspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[1309]在一些实施方案中,生成腺苷脱氨酶碱基编辑器以将tada或其变体在经鉴别的位置插入cas9多肽内。[1310]示例性但非限制性的融合蛋白在国际pct申请号pct/us2020/016285和美国专利临时申请号62/852,228和62/852,224中有所描述,其内容通过引用以其整体并入本文。[1311]a到g编辑[1312]在一些实施方案中,本文所述的碱基编辑器包含融合蛋白,该融合蛋白包含腺苷脱氨酶结构域。碱基编辑器的这种腺苷脱氨酶结构域可促进通过将腺嘌呤a)脱氨基以形成肌苷(i)(其表现出鸟嘌呤(g)的碱基配对性质)而将a核碱基编辑为g核碱基。腺苷脱氨酶能够将脱氧核糖核酸(dna)中的脱氧腺苷残基的腺嘌呤脱氨基(即,去除氨基团)。[1313]在一些实施方案中,本文所提供的核碱基编辑器可通过下述制备:将一个或多个蛋白质结构域融合在一起,从而生成融合蛋白。在某些实施方案中,本文所提供的融合蛋白包含一个或多个改善融合蛋白的碱基编辑活性(例如,效率、选择性和特异性)的特征。例如,本文所提供的融合蛋白可包含具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的融合蛋白可具有没有核酸酶活性的cas9结构域(dcas9),或切断双螺旋dna分子的一条链的cas9结构域,称为cas9切口酶(ncas9)。不欲受缚于任何特定理论,催化性残基(例如,h840)的存在维持cas9切割含有与所靶向的a相对的t的非靶向(例如,非脱氨基)链的活性。cas9的催化性残基的突变(例如,d10到a10)防止切割含有所靶向的a残基的被编辑链。此类cas9变体能够在基于grna定义的靶标序列的特异性位置处生成单链dna断裂(切口),导致非编辑链的修复,最终导致非编辑链上的t到c的改变。在一些实施方案中,a到g碱基编辑器进一步包含肌苷碱基切除修复的抑制剂,例如,尿嘧啶糖基化酶抑制剂(ugi)结构域或无催化活性的肌苷特异性核酸酶。不欲受缚于任何特定理论,ugi结构域或无催化活性的肌苷特异性核酸酶可抑制或防止被脱氨基的腺苷残基(例如,肌苷)的碱基切除修复,这可以改善碱基编辑器的活性或效率。[1314]包含腺苷脱氨酶的甲基编辑器可作用于任何多核苷酸,包括dna、rna和dna-rna杂交物。在某些实施方案中,包含腺苷脱氨酶的碱基编辑器可将包含rna的多核苷酸的靶标a脱氨基。例如,碱基编辑器可包含能够将rna多核苷酸和/或dna-rna杂交物多核苷酸的靶标a脱氨基的腺苷脱氨酶结构域。在一种实施方案中,并入碱基编辑器中的腺苷脱氨酶包含作用于rna的腺苷脱氨酶(adar,例如,adar1或adar2)的全部或一部分。在另一实施方案中,并入碱基编辑器中的腺苷脱氨酶包含作用于trna的腺苷脱氨酶(adat)的全部或一部分。包含腺苷脱氨酶结构域的碱基编辑器也可以能够将dna多核苷酸的a核碱基脱氨基。在一种实施方案中,碱基编辑器的腺苷脱氨酶结构域包含adat的全部或部分,该adat包含允许该adat将dna中的靶标a脱氨基的一个或多个突变。例如,碱基编辑器可包含来自大肠杆菌的adat(ectada)的全部或部分,该adat包含以下突变中的一者或多者:d108n、a106v、d147y、e155v、l84f、h123y、i156f,或另一腺苷脱氨酶中的对应突变。[1315]腺苷脱氨酶可以源自任何合适的生物体(例如,大肠杆菌)。在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌(salmonellatyphi)、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。在一些实施方案中腺苷脱氨酶是天然存在的腺苷脱氨酶,其包括对应于本文所提供的任何突变(例如,ectada中的突变)的一个或多个突变。任何同源蛋白质中的对应残基可以通过例如序列比对并确定同源残基来鉴定。可据此生成任何天然存在的腺苷脱氨酶(例如,与ectada具有同源性)中的对应于本文所述任何突变(例如,在ectada中鉴定的任何突变)的突变。[1316]腺苷脱氨酶[1317]在一些实施方案中,本发明的融合蛋白包含一个或多个腺苷脱氨酶结构域。在一些实施方案中,本文提供的腺苷脱氨酶能够将腺嘌呤脱氨基。在一些实施方案中,本文提供的腺苷脱氨酶能够将dna的脱氧腺苷中的腺嘌呤脱氨基。腺苷脱氨酶可以源自任何合适的生物体(例如,大肠杆菌(e.coli))。在一些实施方案中腺苷脱氨酶是天然存在的腺苷脱氨酶,其包括对应于本文所提供的任何突变(例如,ectada中的突变)的一个或多个突变。本领域技术人员将能够鉴定任何同源蛋白质中的对应残基,通过序列比对并确定同源残基。据此,本领域技术人员将能够生成任何天然存在的腺苷脱氨酶(例如,与ectada具有同源性)中的对应于本文所述任何突变(例如,在ectada中鉴定的任何突变)的突变。在一些实施方案中,腺苷脱氨酶来自原核生物。[1318]在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌(salmonellatyphi)、腐败希瓦氏菌、流感嗜血杆菌、新月柄杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。[1319]本发明提供腺苷脱氨酶变体,这些变体具有增加的效率(》50-60%)和特异性。特别地,本文所述的腺苷脱氨酶变体更可能编辑多核苷酸内的所希望的碱基,并且更不可能编辑不希望被改变的碱基(即,“旁观者”)。[1320]在一些施方案中,腺苷脱氨酶是tada脱氨酶。在特定实施方案中,tada是pct/us2017/045381(wo2018/027078)中描述的tada中的任一种,该专利通过引用并入本文。[1321]野生型tada(wt)腺苷脱氨酶具有以下序列(也称为tada参考序列):[1322]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd[1323]在一些实施方案中,腺苷脱氨酶是全长大肠杆菌tada脱氨酶。例如,在某些实施方案中,腺苷脱氨酶包含氨基酸序列:[1324]mrrafitgvfflsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd。[1325]在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌(escherichiacoli(e.coli))、金黄色葡萄球菌(staphylococcusaureus(s.aureus))、鼠伤寒沙门氏菌(salmonellatyphimurium(s.typhimurium))、腐败希瓦氏菌(shewanellaputrefaciens(s.putrefaciens))、流感嗜血杆菌(haemophilusinfluenzae(h.influenzae))、新月柄杆菌(caulobactercrescentus(c.crescentus))、硫还原地杆菌(geobactersulfurreducens(g.sulfurreducens))或枯草芽孢杆菌(bacillussubtilis)。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。[1326]但应了解,其他可用于本技术的腺苷脱氨酶对于本领域技术人员而言将会是显而易见的并且出于本公开的范畴内。例如,腺苷脱氨酶可以是作用于trna的腺苷脱氨酶(adat)的同源物。非限制地,示例性adat同源物的氨基酸序列包括下列:[1327]金黄色葡萄球菌(staphylococcusaureus(s.aureus))tada:[1328]mgshmtndiyfmtlaieeakkaaqlgevpigaiitkddeviarahnlretlqqptahaehiaieraakvlgswrlegctlyvtlepcvmcagtivmsriprvvygaddpkggcsgslmnllqqsnfnhraivdkgvlkeacstllttffknlrankkstn[1329]枯草芽孢杆菌(bacillussubtilis(b.subtilis))tada:[1330]mtqdelymkeaikeakkaeekgevpigavlvingeiiarahnlreteqrsiahaemlvideackalgtwrlegatlyvtlepcpmcagavvlsrvekvvfgafdpkggcsgtlmnllqeerfnhqaevvsgvleeecggmlsaffrelrkkkkaarknlse[1331]鼠伤寒沙门氏菌(salmonellatyphimurium(s.typhimurium))tada:[1332]mppafitgvtslsdveldheywmrhaltlakrawderevpvgavlvhnhrvigegwnrpigrhdptahaeimalrqgglvlqnyrlldttlyvtlepcvmcagamvhsrigrvvfgardaktgaagslidvlhhpgmnhrveiiegvlrdecatllsdffrmrrqeikalkkadraegagpav[1333]腐败希瓦氏菌(shewanellaputrefaciens(s.putrefaciens))tada:[1334]mdeywmqvamqmaekaeaagevpvgavlvkdgqqiatgynlsisqhdptahaeilclrsagkklenyrlldatlyitlepcamcagamvhsriarvvygardektgaagtvvnllqhpafnhqvevtsgvlaeacsaqlsrffkrrrdekkalklaqraqqgie[1335]流感嗜血杆菌(haemophilusinfluenzaef3031(h.influenzae))tada:[1336]mdaakvrsefdekmmryaleladkaealgeipvgavlvddarniigegwnlsivqsdptαηaeiialrngakniqnyrllnstlyvtlepctmcagailhsrikrlvfgasdyktgaigsrfhffddykmnhtleitsgvlaeecsqklstffqkrreekkiekallkslsdk[1337]新月柄杆菌(caulobactercrescentus(c.crescentus))tada:[1338]mrtdesedqdhrmmrlaldaaraaaeagetpvgavildpstgeviatagngpiaahdptahaeiaamraaaaklgnyrltdltlvvtlepcamcagaisharigrvvfgaddpkggavvhgpkffaqptchwrpevtggvladesadllrgffrarrkaki[1339]硫还原地杆菌(geobactersulfurreducens(g.sulfurreducens))tada:[1340]msslkktpirddaywmgkaireaakaaardevpigavivrdgavigrghnlregsndpsahaemiairqaarrsanwrltgatlyvtlepclmcmgaiilarlervvfgcydpkggaagslydlsadprlnhqvrlspgvcqeecgtmlsdffrdlrrrkkakatpalfiderkvppep[1341]大肠杆菌tada(ectada)的一个实施方案包括下列:[1342]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[1343]在一些实施方案中,腺苷脱氨酶包含氨基酸序列,该氨基酸序列与本文所提供的任何腺苷脱氨酶中详述的氨基酸序列中的任一者至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应了解,本文所提供的腺苷脱氨酶可包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供任何具有某一百分比的一致性加上任何本文所述突变或其组合的脱氨酶结构域。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与参考序列或本文所提供的任何腺苷脱氨酶相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与本领域已知或本文所述的氨基酸序列中的任一者相比,该氨基酸序列具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160、或至少170个相同的连续氨基酸残基。[1344]应了解,本文所提供的任何突变(例如,基于tada参考序列)可引入其他腺苷脱氨酶中,诸如大肠杆菌tada(ectada)、金黄色葡萄球菌tada(satada),或其他腺苷脱氨酶(例如,细菌腺苷脱氨酶)。对本领域技术人员将会显而易见的是,可类似地比对其他脱氨酶以鉴定可以如本文所提供者进行突变的同源氨基酸残基。因此,tada参考序列中鉴定的任何突变可以在具有同源氨基酸残基的其他腺苷脱氨酶(例如,ectada)中作出。应了解,本文所提供的任何突变可以独立地作出或与tada参考序列或另一腺苷脱氨酶中的突变以任意组合作出。[1345]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d108x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d108g、d108n、d108v、d108a或d108y突变,或另一腺苷脱氨酶中的对应突变。但应了解,可类似地比对其他脱氨酶以鉴定可以如本文所提供者进行突变的同源氨基酸残基。[1346]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106v突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1347]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e155x突变,或另一腺苷脱氨酶中的对应突变,其中x的存在指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e155d、e155g或e155v突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1348]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d147x突变,或另一腺苷脱氨酶中的对应突变,其中x的存在指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d147y突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1349]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106x、e155x或d147x突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含e155d、e155g或e155v突变。在一些实施方案中,腺苷脱氨酶包含d147y。[1350]应了解,本文所提供的任何突变(例如,基于tada参考序列的ectada氨基酸序列)可引入其他腺苷脱氨酶中,诸如金黄色葡萄球菌tada(satada),或其他腺苷脱氨酶(例如,细菌腺苷脱氨酶)。ectada中突变残基的同源性如何对本领域技术人员将会显而易见的。因此,ectada中鉴定的任何突变可以在具有同源氨基酸残基的其他腺苷脱氨酶中作出。应了解,本文所提供的任何突变可以独立地作出或与edtada或另一腺苷脱氨酶中的突变以任意组合作出。[1351]例如,腺苷脱氨酶可含有tada参考序列中的d108n、a106v、e155v和/或d147y突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的下列突变组(突变组以“;”分隔),或另一腺苷脱氨酶中的对应突变:d108n和a106v;d108n和e155v;d108n和d147y;a106v和e155v;a106v和d147y;e155v和d147y;d108n、a106v和e155v;d108n、a106v和d147y;d108n、e155v和d147y;a106v、e155v和d147y;以及d108n、a106v、e155v和d147y。但应了解,本文所提供的对应突变的任何组合可在腺苷脱氨酶(例如,ectada)中作出。[1352]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、t17x、l18x、w23x、l34x、w45x、r51x、a56x、e59x、e85x、m94x、i95x、v102x、f104x、a106x、r107x、d108x、k110x、m118x、n127x、a138x、f149x、m151x、r153x、q154x、i156x和/或k157x突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变,其中x的存在指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、t17s、l18e、w23l、l34s、w45l、r51h、a56e,或a56s、e59g、e85k,或e85g、m94l、i95l、v102a、f104l、a106v、r107c,或r107h,或r107p、d108g,或d108n,或d108v,或d108a,或d108y、k110i、m118k、n127s、a138v、f149y、m151v、r153c、q154l、i156d和/或k157r突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变。[1353]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、d108x和/或n127x突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n和/或n127s突变中的一者或多者,或另一腺苷脱氨酶(中的一个或多个对应突变。[1354]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、r26x、m61x、l68x、m70x、a106x、d108x、a109x、n127x、d147x、r152x、q154x、e155x、k161x、q163x和/或t166x突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、r26w、m61i、l68q、m70v、a106t、d108n、a109t、n127s、d147y、r152c、q154h或q154r、e155g或e155v或e155d、k161q、q163h、和/或t166p突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变。[1355]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、d108x、n127x、d147x、r152x和q154x所组成的群组的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、m61x、m70x、d108x、n127x、q154x、e155x和q163x所组成的群组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、d108x、n127x、e155x和t166x所组成的群组的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。[1356]在一些实施方案中,腺苷脱氨酶包含选自由h8x、a106x和d108x所组成的群组的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶中的一个或多个突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、r26x、l68x、d108x、n127x、d147x和e155x所组成的群组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。[1357]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、r126x、l68x、d108x、n127x、d147x和e155x所组成的群组的一个、两个、三个、四个、五个、六个或七个突变,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、d108x、a109x、n127x和e155x所组成的群组的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。[1358]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、d108n、n127s、d147y、r152c和q154h所组成的群组的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、m61i、m70v、d108n、n127s、q154r、e155g和q163h所组成的群组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、d108n、n127s、e155v和t166p所组成的群组的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、a106t、d108n、n127s、e155d和k161q所组成的群组的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、r26w、l68q、d108n、n127s、d147y和e155v所组成的群组的一个、两个、三个、四个、五个、六个、七个或八个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、d108n、a109t、n127s和e155g所组成的群组的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。[1359]在一些实施方案中,腺苷脱氨酶包含另一腺苷脱氨酶中的一个或多个突变中的一者或多者。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d108n、d108g或d108v突变,或另一腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106v和d108n突变,或另一腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r107c和d108n突变,或另一腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n、n127s、d147y和q154h突变,或另一腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n、n127s、d147y和e155v突变,或另一腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的d108n、d147y和e155v突变,或另一腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8y、d108n和n127s突变,或另一腺苷脱氨酶中的对应突变。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a106v、d108n、d147y和e155v突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1360]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s2x、h8x、i49x、l84x、h123x、n127x、i156x和/或k160x突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变,其中x的存在指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s2a、h8y、i49f、l84f、h123y、n127s、i156f和/或k160s突变中的一者或多者,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。[1361]在一些实施方案中,腺苷脱氨酶包含l84x突变腺苷脱氨酶,其中指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的l84f突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1362]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h123x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h123y突变,或另一腺苷脱氨酶中的对应突变。[1363]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的i156x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的i156f突变,或另一腺苷脱氨酶中的对应突变。[1364]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的l84x、a106x、d108x、h123x、d147x、e155x和i156x所组成的群组的一个、两个、三个、四个、五个、六个或七个突变,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的s2x、i49x、a106x、d108x、d147x和e155x所组成的群组的一个、两个、三个、四个、五个或六个突变,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8x、a106x、d108x、n127x和k160x所组成的群组的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶中的一个或多个对应突变,其中x指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸的存在。[1365]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的l84f、a106v、d108n、h123y、d147y、e155v和i156f所组成的群组的一个、两个、三个、四个、五个、六个或七个突变,或另一腺苷脱氨酶中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的s2a、i49f、a106v、d108n、d147y和e155v所组成的群组的一个、两个、三个、四个、五个或六个突变。[1366]在一些实施方案中,腺苷脱氨酶包含选自由tada参考序列中的h8y、a106t、d108n、n127s和k160s所组成的群组的一个、两个、三个、四个或五个突变,或另一腺苷脱氨酶中的一个或多个对应突变。[1367]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25x、r26x、r107x、a142x和/或a143x突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变,其中x的存在指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s、e25y、r26g、r26n、r26q、r26c、r26l、r26k、r107p、r107k、r107a、r107n、r107w、r107h、r107s、a142n、a142d、a142g、a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变。在一些实施方案中,腺苷脱氨酶包含对应于tada参考序列中的本文所述突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变。[1368]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s或e25y突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1369]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r26x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r26g、r26n、r26q、r26c、r26l或r26k突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1370]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r107x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r107p、r107k、r107a、r107n、r107w、r107h或r107s突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1371]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142n、a142d、a142g突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1372]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a143x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变,或另一腺苷脱氨酶(例如,ectada)中的对应突变。[1373]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36x、n37x、p48x、i49x、r51x、m70x、n72x、d77x、e134x、ss146x、q154x、k157x和/或k161x突变中的一者或多者,或另一腺苷脱氨酶中的一个或多个对应突变,其中x的存在指示除野生型腺苷脱氨酶中的对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36l、n37t、n37s、p48t、p48l、i49v、r51h、r51l、m70l、n72s、d77g、e134g、s146r、s146c、q154h、k157n和/或k161t突变中的一者或多者,或另一腺苷脱氨酶(例如,ectada)中的一个或多个对应突变。[1374]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36l突变,或另一腺苷脱氨酶中的对应突变。[1375]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的n37x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的n37t或n37s突变,或另一腺苷脱氨酶中的对应突变。[1376]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48t或p48l突变,或另一腺苷脱氨酶中的对应突变。[1377]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p51x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r51h或r51l突变,或另一腺苷脱氨酶中的对应突变。[1378]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s146x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s146r或s146c突变,或另一腺苷脱氨酶中的对应突变。[1379]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的k157x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的k157n突变,或另一腺苷脱氨酶中的对应突变。[1380]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的p48s、p48t或p48a突变,或另一腺苷脱氨酶中的对应突变。[1381]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142n突变,或另一腺苷脱氨酶中的对应突变。[1382]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的w23x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的w23r或w23l突变,或另一腺苷脱氨酶中的对应突变。[1383]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r152x突变,或另一腺苷脱氨酶中的对应突变,其中x指示任何除野生型腺苷脱氨酶中对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的r152p或r52h突变,或另一腺苷脱氨酶中的对应突变。[1384]在一种实施方案中,腺苷脱氨酶可包含突变h36l、r51l、l84f、a106v、d108n、h123y、s146c、d147y、e155v、i156f和k157n。在一些实施方案中,腺苷脱氨酶包含以下相对于tada参考序列的突变组合,其中组合的每个突变以“_”分隔并且突变的每个组合在括号内:[1385](a106v_d108n)、[1386](r107c_d108n)、[1387](h8y_d108n_n127s_d147y_q154h)、[1388](h8y_d108n_n127s_d147y_e155v)、[1389](d108n_d147y_e155v)、[1390](h8y_d108n_n127s)、[1391](h8y_d108n_n127s_d147y_q154h)、[1392](a106v_d108n_d147y_e155v)、[1393](d108q_d147y_e155v)、[1394](d108m_d147y_e155v)、[1395](d108l_d147y_e155v)、[1396](d108k_d147y_e155v)、[1397](d108i_d147y_e155v)、[1398](d108f_d147y_e155v)、[1399](a106v_d108n_d147y)、[1400](a106v_d108m_d147y_e155v)、[1401](e59a_a106v_d108n_d147y_e155v)、[1402](e59a催化死亡的_a106v_d108n_d147y_e155v)、[1403](l84f_a106v_d108n_h123y_d147y_e155v_i156y)、[1404](l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1405](d103a_d104n)、[1406](g22p_d103a_d104n)、[1407](d103a_d104n_s138a)、[1408](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[1409](e25g_r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[1410](e25d_r26g_l84f_a106v_r107k_d108n_h123y_a142n_a143g_d147y_e155v_i156f)、[1411](r26q_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1412](e25m_r26g_l84f_a106v_r107p_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[1413](r26c_l84f_a106v_r107h_d108n_h123y_a142n_d147y_e155v_i156f)、[1414](l84f_a106v_d108n_h123y_a142n_a143l_d147y_e155v_i156f)、[1415](r26g_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1416](e25a_r26g_l84f_a106v_r107n_d108n_h123y_a142n_a143e_d147y_e155v_i156f)、[1417](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f)、[1418](a106v_d108n_a142n_d147y_e155v)、[1419](r26g_a106v_d108n_a142n_d147y_e155v)、[1420](e25d_r26g_a106v_r107k_d108n_a142n_a143g_d147y_e155v)、[1421](r26g_a106v_d108n_r107h_a142n_a143d_d147y_e155v)、[1422](e25d_r26g_a106v_d108n_a142n_d147y_e155v)、[1423](a106v_r107k_d108n_a142n_d147y_e155v)、[1424](a106v_d108n_a142n_a143g_d147y_e155v)、[1425](a106v_d108n_a142n_a143l_d147y_e155v)、[1426](h36l_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1427](n37t_p48t_m70l_l84f_a106v_d108n_h123y_d147y_i49v_e155v_i156f)、[1428](n37s_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k161t)、[1429](h36l_l84f_a106v_d108n_h123y_d147y_q154h_e155v_i156f)、[1430](n72s_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f)、[1431](h36l_p48l_l84f_a106v_d108n_h123y_e134g_d147y_e155v_i156f)、[1432](h36l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n)、[1433](h36l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f)、[1434](l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[1435](n37s_r51h_d77g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1436](r51l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n)、[1437](d24g_q71r_l84f_h96l_a106v_d108n_h123y_d147y_e155v_i156f_k160e)、[1438](h36l_g67v_l84f_a106v_d108n_h123y_s146t_d147y_e155v_i156f)、[1439](q71l_l84f_a106v_d108n_h123y_l137m_a143e_d147y_e155v_i156f)、[1440](e25g_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l)、[1441](l84f_a91t_f104i_a106v_d108n_h123y_d147y_e155v_i156f)、[1442](n72d_l84f_a106v_d108n_h123y_g125a_d147y_e155v_i156f)、[1443](p48s_l84f_s97c_a106v_d108n_h123y_d147y_e155v_i156f)、[1444](w23g_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1445](d24g_p48l_q71r_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l)、[1446](l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1447](h36l_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、[1448](n37s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_k161t)、[1449](l84f_a106v_d108n_d147y_e155v_i156f)、[1450](r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k161t)、[1451](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k161t)、[1452](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e_k161t)、[1453](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e)、(r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1454](r74a_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1455](l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1456](r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f)、[1457](l84f_r98q_a106v_d108n_h123y_d147y_e155v_i156f)、[1458](l84f_a106v_d108n_h123y_r129q_d147y_e155v_i156f)、[1459](p48s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f)、[1460](p48s_a142n)、[1461](p48t_i49v_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_l157n)、[1462](p48t_i49v_a142n)、[1463](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1464](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156)f、[1465](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1466](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、[1467](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1468](h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n)、[1469](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f_k157n)、[1470](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1471](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n)、[1472](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[1473](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152h_e155v_i156f_k157n)、[1474](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[1475](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[1476](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_e155v_i156f_k157n)、[1477](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_r152p_e155v_i156f_k157n)、[1478](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t)、[1479](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n)、[1480](h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_r152p_e155v_i156f_k157n)。[1481]在一些实施方案中,tada脱氨酶是tada变体。在一些实施方案中,tada变体是tada*7.10。在特定实施方案中,融合蛋白包含单一tada*7.10(例如,作为单体提供)。在其他实施方案中,融合蛋白包含tada*7.10和tada(wt),它们能够形成异二聚体。在一种实施方案中,本发明的融合蛋白包含链接至tada*7.10的野生型tada,tada7.10链接至cas9切口酶。[1482]在一些实施方案中,tada*7.10包含至少一个改变。在一些实施方案中,腺苷脱氨酶包含在以下序列中的改变:[1483]tada*7.10[1484]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[1485]在一些实施方案中,tada*7.10包含氨基酸82和/或166处的改变。在特定实施方案中,tada*7.10包含以下改变中的一者或多者:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r。在其他实施方案中,tada*7.10的变体包含选自由以下所组成的群组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r。[1486]在一些实施方案中,腺苷脱氨酶变体(例如,tada*8)包含缺少。在一些实施方案中,腺苷脱氨酶变体包含c端的缺失。在特定实施方案中,腺苷脱氨酶变体包含在残基149、150、151、152、153、154、155、156和157处开始的c端缺失,相对于tada*7.10(tada参考序列),或另一tada中的相对应突变。[1487]在其他实施方案中,腺苷脱氨酶变体(例如,tada*8)是单体,其包含以下改变中的一者或多者:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。在其他实施方案中,腺苷脱氨酶变体(tada*8)是单体,其包含选自以下组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1488]在其他实施方案中,腺苷脱氨酶变体是均二聚体,其包含两个腺苷脱氨酶结构域(例如,tada*8),各自具有以下突变中的一者或多者:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。在其他实施方案中,腺苷脱氨酶变体是均二聚体,其包含两个腺苷脱氨酶结构域(例如,tada*8),各自具有选自以下的组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1489]在其他实施方案中,腺苷脱氨酶变体是野生型腺苷脱氨酶结构域和腺苷脱氨酶变体(例如,tada*8)的异二聚体,该腺苷脱氨酶变体包含以下改变中的一者或多者:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。在其他实施方案中,腺苷脱氨酶变体是野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,tada*8)的异二聚体,该腺苷脱氨酶变体结构域包含选自以下组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1490]在其他实施方案中,腺苷脱氨酶变体是tada*7.10结构域和腺苷脱氨酶变体(例如,tada*8)的异二聚体,该腺苷脱氨酶变体包含以下改变中的一者或多者:y147t、y147r、q154s、y123h、v82s、t166r和/或q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。在其他实施方案中,腺苷脱氨酶变体是tada*7.10结构域和腺苷脱氨酶变体结构域(例如,tada*8)的异二聚体,该腺苷脱氨酶变体结构域包含选自以下组的改变的组合:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1491]在特定实施方案中,腺苷脱氨酶异二聚体包含tada*8结构域和腺苷脱氨酶结构域,该腺苷脱氨酶结构域选自金哈un各色葡萄球菌tada、枯草芽孢杆菌tada、鼠伤寒沙门氏菌tada、腐败希瓦氏菌tada、流感嗜血杆菌f3031tada、新月柄杆菌tada、硫还原地杆菌tada或tada*7.10。[1492]在一些实施方案中,腺苷脱氨酶是tada*8。在一种实施方案中,腺苷脱氨酶包含tada*8,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1493]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd[1494]一些实施方案中,tada*8被截短。在一些实施方案中,相对于全长tada*8,截短的tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,相对于全长tada*8,截短的tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶是全长tada*8。[1495]在一些实施方案中,tada*8是tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12、tada*8.13、tada*8.14、tada*8.15、tada*8.16、tada*8.17、tada*8.18、tada*8.19、tada*8.20、tada*8.21、tada*8.22、tada*8.23或tada*8.24。[1496]在其他实施方案中,本公开的碱基编辑器包含腺苷脱氨酶变体(例如,tada*8)单体,该单体包含以下改变中的一者或多者:r26c、v88a、a109s、t111r、d119n、h122n、y147d、f149y、t166iand/ord167n,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。在其他实施方案中,腺苷脱氨酶变体(tada*8)单体包含选自以下组的改变的组合:r26c+a109s+t111r+d119n+h122n+y147d+f149y+t166i+d167n;v88a+a109s+t111r+d119n+h122n+f149y+t166i+d167n;r26c+a109s+t111r+d119n+h122n+f149y+t166i+d167n;v88a+t111r+d119n+f149y;anda109s+t111r+d119n+h122n+y147d+f149y+t166i+d167n,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1497]在其他实施方案中,碱基编辑器包含野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,tada*8)的异二聚体,该腺苷脱氨酶变体包含以下改变中的一者或多者:r26c、v88a、a109s、t111r、d119n、h122n、y147d、f149y、t166i和/或d167n,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。在其他实施方案中,碱基编辑器包含野生型腺苷脱氨酶结构域和腺苷脱氨酶变体结构域(例如,tada*8)的异二聚体,该腺苷脱氨酶变体结构域包含选自以下组的改变的组合:r26c+a109s+t111r+d119n+h122n+y147d+f149y+t166i+d167n;v88a+a109s+t111r+d119n+h122n+f149y+t166i+d167n;r26c+a109s+t111r+d119n+h122n+f149y+t166i+d167n;v88a+t111r+d119n+f149y;anda109s+t111r+d119n+h122n+y147d+f149y+t166i+d167n,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1498]在其他实施方案中,碱基编辑器包含tada*7.10结构域和腺苷脱氨酶变体结构域(例如,tada*8)的异二聚体,该腺苷脱氨酶变体包含以下改变中的一者或多者:r26c、v88a、a109s、t111r、d119n、h122n、y147d、f149y、t166i和/或d167n,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。在其他实施方案中,碱基编辑器包含tada*7.10结构域和腺苷脱氨酶变体结构域(例如,tada*8)的异二聚体,该腺苷脱氨酶变体结构域包含选自以下组的改变的组合:r26c+a109s+t111r+d119n+h122n+y147d+f149y+t166i+d167n;v88a+a109s+t111r+d119n+h122n+f149y+t166i+d167n;r26c+a109s+t111r+d119n+h122n+f149y+t166i+d167n;v88a+t111r+d119n+f149y;anda109s+t111r+d119n+h122n+y147d+f149y+t166i+d167n,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1499]在一些实施方案中,tada*8是如表11中所示的变体。表11显示tada氨基酸序列中的某些氨基酸位置编号,并且存在于tada-7.10腺苷脱氨酶中的那些位置处的氨基酸。表11也显示在噬菌体辅助非连续进化(pance)和噬菌体辅助连续进化(pace)后,tada变体中相对于tada-7.10的氨基酸变化,如m.richter等人,2020,naturebiotechnology,doi.org/10.1038/s41587-020-0453-z中所述,其整体内容通过引用并入本文。在一些实施方案中,tada*8是tada*8a、tada*8b、tada*8c、tada*8d或tada*8e。在一些实施方案中,tada*8是tada*8e。[1500]表11.其他tada*8变体[1501]tada氨基酸编号[1502][1503]在一种实施方案中,本发明的融合蛋白包含链接至cas9切口酶的本文所述的腺苷脱氨酶变体(例如,tada*8)。在特定实施方案中,融合蛋白包含单一tada*8(例如,作为单体提供)。在其他实施方案中,融合蛋白包含tada*8和tada(wt),它们能够形成异二聚体。[1504]在一些实施方案中,腺苷脱氨酶包含氨基酸序列,该氨基酸序列与本文所提供的任何腺苷脱氨酶中详述的氨基酸序列中的任一者至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应了解,本文所提供的腺苷脱氨酶可包括一个或多个突变(例如,本文所提供的任何突变)。本公开提供任何具有某一百分比的一致性加上任何本文所述突变或其组合的脱氨酶结构域。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与参考序列或本文所提供的任何腺苷脱氨酶相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方案中,腺苷脱氨酶包含氨基酸序列,与本领域已知或本文所述的氨基酸序列中的任一者相比,该氨基酸序列具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160、或至少170个相同的连续氨基酸残基。[1505]在特定实施方案中,tada*8包含在以下以黑体显示的任何位置处的一个或多个突变。在其他实施方案中,tada*8包含在以下划线显示的任何位置处的一个或多个突变。[1506][1507]例如,tada*8包含在氨基酸位置82和/或166处的改变(例如,v82s,t166r),该改变单独存在或与以下中的一者或多者组合:y147t、y147r、q154s、y123h和/或q154r,相对于tada*7.10(tada参考序列),或另一tada的相对应突变。在特定实施方案中,改变的组合选自由以下的组:y147t+q154r;y147t+q154s;y147r+q154s;v82s+q154s;v82s+y147r;v82s+q154r;v82s+y123h;i76y+v82s;v82s+y123h+y147t;v82s+y123h+y147r;v82s+y123h+q154r;y147r+q154r+y123h;y147r+q154r+i76y;y147r+q154r+t166r;y123h+y147r+q154r+i76y;v82s+y123h+y147r+q154r;和i76y+v82s+y123h+y147r+q154r,相对于tada*7.10(tada参考序列),或另一tada中的对应突变。[1508]在一些实施方案中,腺苷脱氨酶包含tada*8,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1509]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstd[1510]一些实施方案中,tada*8被截短。在一些实施方案中,相对于全长tada*8,截短的tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个n端氨基酸残基。在一些实施方案中,相对于全长tada*8,截短的tada*8缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个c端氨基酸残基。在一些实施方案中,腺苷脱氨酶是全长tada*8。[1511]在一种实施方案中,本发明的融合蛋白包含链接至cas9切口酶的本文所述的腺苷脱氨酶变体(例如,tada*8)。在特定实施方案中,融合蛋白包含单一tada*8(例如,作为单体提供)。在其他实施方案中,碱基编辑器包含tada*8和tada(wt),它们能够形成异二聚体。[1512]在特定实施方案中,融合蛋白包含单一(例如,作为单体提供)tada*8。在一些实施方案中,tada*8连接至cas9切口酶。在一些实施方案中,本发明的融合蛋白包含野生型tada(tada(wt))链接至tada*8的异二聚体。在其他实施方案中,本发明的融合蛋白包含野生型tada*7.10链接至tada*8的异二聚体。在一些实施方案中,碱基编辑器是包含tada*8变体单体的abe8。在一些实施方案中,碱基编辑器是包含tada*8与tada(wt)异二聚体的abe8。在一些实施方案中,碱基编辑器是包含tada*8与tada*7.10的异二聚体的abe8。在一些实施方案中,碱基编辑器是包含tada*8的异二聚体的abe8。在一些实施方案中,tada*8选自表11、13或14。在一些实施方案中,abe8选自表13、14或16。[1513]在一些实施方案中,腺苷脱氨酶是tada*9变体。在一些实施方案中,腺苷脱氨酶是选自下述变体的tada*9变体且参考以下序列(称为tada*7.10):[1514][1515]在一些实施方案中,腺苷脱氨酶包含以下改变中的一者或多者:r21n、r23h、e25f、n38g、l51w、p54c、m70v、q71m、n72k、y73s、v82t、m94v、p124w、t133k、d139l、d139m、c146r和a158k。一种或多种改变在上述序列中以加下划线和加粗字体显示。[1516]在一些实施方案中,腺苷脱氨酶包含以下改变的组合中的一者或多者:v82s+q154r+y147r;v82s+q154r+y123h;v82s+q154r+y147r+y123h;q154r+y147r+y123h+i76y+v82s;v82s+i76y;v82s+y147r;v82s+y147r+y123h;v82s+q154r+y123h;q154r+y147r+y123h+i76y;v82s+y147r;v82s+y147r+y123h;v82s+q154r+y123h;v82s+q154r+y147r;v82s+q154r+y147r;q154r+y147r+y123h+i76y;q154r+y147r+y123h+i76y+v82s;i76y_v82s_y123h_y147r_q154r;y147r+q154r+h123h;和v82s+q154r。[1517]在一些实施方案中,腺苷脱氨酶包含以下改变的组合中的一者或多者:e25f+v82s+y123h,t133k+y147r+q154r;e25f+v82s+y123h+y147r+q154r;l51w+v82s+y123h+c146r+y147r+q154r;y73s+v82s+y123h+y147r+q154r;p54c+v82s+y123h+y147r+q154r;n38g+v82t+y123h+y147r+q154r;n72k+v82s+y123h+d139l+y147r+q154r;e25f+v82s+y123h+d139m+y147r+q154r;q71m+v82s+y123h+y147r+q154r;e25f+v82s+y123h+t133k+y147r+q154r;e25f+v82s+y123h+y147r+q154r;v82s+y123h+p124w+y147r+q154r;l51w+v82s+y123h+c146r+y147r+q154r;p54c+v82s+y123h+y147r+q154r;y73s+v82s+y123h+y147r+q154r;n38g+v82t+y123h+y147r+q154r;r23h+v82s+y123h+y147r+q154r;r21n+v82s+y123h+y147r+q154r;v82s+y123h+y147r+q154r+a158k;n72k+v82s+y123h+d139l+y147r+q154r;e25f+v82s+y123h+d139m+y147r+q154r;和m70v+v82s+m94v+y123h+y147r+q154r[1518]在一些实施方案中,腺苷脱氨酶包含以下改变的组合中的一者或多者:q71m+v82s+y123h+y147r+q154r;e25f+i76y+v82s+y123h+y147r+q154r;i76y+v82t+y123h+y147r+q154r;n38g+i76y+v82s+y123h+y147r+q154r;r23h+i76y+v82s+y123h+y147r+q154r;p54c+i76y+v82s+y123h+y147r+q154r;r21n+i76y+v82s+y123h+y147r+q154r;i76y+v82s+y123h+d139m+y147r+q154r;y73s+i76y+v82s+y123h+y147r+q154r;e25f+i76y+v82s+y123h+y147r+q154r;i76y+v82t+y123h+y147r+q154r;n38g+i76y+v82s+y123h+y147r+q154r;r23h+i76y+v82s+y123h+y147r+q154r;p54c+i76y+v82s+y123h+y147r+q154r;r21n+i76y+v82s+y123h+y147r+q154r;i76y+v82s+y123h+d139m+y147r+q154r;y73s+i76y+v82s+y123h+y147r+q154r;andv82s+q154r;n72k_v82s+y123h+y147r+q154r;q71m_v82s+y123h+y147r+q154r;v82s+y123h+t133k+y147r+q154r;v82s+y123h+t133k+y147r+q154r+a158k;m70v+q71m+n72k+v82s+y123h+y147r+q154r;n72k_v82s+y123h+y147r+q154r;q71m_v82s+y123h+y147r+q154r;m70v+v82s+m94v+y123h+y147r+q154r;v82s+y123h+t133k+y147r+q154r;v82s+y123h+t133k+y147r+q154r+a158k;和m70v+q71m+n72k+v82s+y123h+y147r+q154r。在一些实施方案中,腺苷脱氨酶作为单体表达。在其他实施方案中,腺苷脱氨酶作为异二聚体表达。在一些实施方案中,脱氨酶或其他多肽序列缺少甲硫氨酸,例如,当作为融合蛋白的组分而被包括时。这可能改变位置的编号。但是,技术人员将会理解,此类相对应突变是指相同突变,例如,y73s与y72s以及d139m与d138m。[1519]在一些实施方案中,tada*9变体包含表17中所述的改变,如本文所述。在一些实施方案中,tada*9变体是单体。在一些实施方案中,tada*9变体是具有野生型tada腺苷脱氨酶的异二聚体。在一些实施方案中,tada*9变体是具有另一tada变体(例如,tada*8、tada*9)的异二聚体。tada*9腺苷脱氨酶的其他细节在国际pct申请号pct/2020/049975中描述,其通过引用以其整体并入本文。[1520]本文所提供的任何突变和任何额外突变(例如,基于ectada氨基酸序列)可引入任何其他腺苷脱氨酶内。本文所提供的任何突变可以独立地作出或与tada参考序列或另一腺苷脱氨酶(例如,ectada)中的突变以任意组合作出。[1521]a到g核碱基编辑蛋白的细节描述于国际pct申请号pct/2017/045381(wo2018/027078)和gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature,551,464-471(2017)中,其整体内容通过引用并入本文。[1522]c到t编辑[1523]在一些实施方案中,本文所公开的碱基编辑器包含融合蛋白,该融合蛋白包含能够将多核苷酸的靶标胞苷(c)碱基脱氨基以产生尿苷(u)(其具有胸腺嘧啶的碱基配对性质)的胞苷脱氨酶。在一些实施方案中,例如其中多核苷酸是双链的(例如,dna),尿苷碱基随后可以被置换为胸苷碱基(例如,通过细胞修复机构)以引起c:g到t:a的转换。在其他实施方案中,通过碱基编辑器将核酸中的c脱氨基为u不能伴随u到t的置换。[1524]将多核苷酸中的靶标c氨基以给出u是一种类型的碱基编辑的非限制性示例,该碱基编辑可以通过本文所述的碱基编辑器执行。在另一示例中,包含胞苷脱氨酶结构域的碱基编辑器可介导胞嘧啶(c)碱基到鸟嘌呤(g)碱基的转变。例如,通过碱基编辑器的胞苷脱氨酶结构域使胞苷脱氨基而产生的多核苷酸的u可以通过碱基切除修复机制(例如,通过尿嘧啶dna糖基化酶(udg)结构域)从多核苷酸中切除,从而产生无碱基位点。然后,可以通过例如跨损伤聚合酶将与该无碱基位点相对的核碱基置换为(例如,通过甲基修复机构)另一碱基,诸如c。尽管与无碱基位点相对的核碱基通常被替换为c,但也可能发生其他置换(例如,a、g或t)。[1525]据此,在一些实施方案中,本文所述的碱基编辑器包含脱氨酶结构域(例如,胞苷脱氨酶结构域),该脱氨酶结构域能够将多核苷酸中的靶标c脱氨基为u。再者,如下文所述,碱基编辑器可包含其他结构域,在一些实施方案中,该其他结构域促进脱氨基所致的u转换为t或g。例如,包含胞苷脱氨酶结构域的碱基编辑器可进一步包含尿嘧啶糖基化酶抑制剂(ugi)结构域以介导u被t置换,从而完成c到t的碱基编辑事件。在另一示例中,碱基编辑器可合并有跨损伤聚合酶以改善c到g碱基编辑的效率,因为跨损伤聚合酶可促进并入与无碱基位点相对的c(即,导致g并入在无碱基位点处,从而完成c到g的碱基编辑事件)。[1526]包含胞苷脱氨酶作为结构域的碱基编辑器可将任何多核苷酸(包括dna、rna和dna-rna杂交物)中的靶标c脱氨基。通常,胞苷脱氨酶催化在多核苷酸的单链部分的情境中定位的c核碱基。在一些实施方案中,包含靶标c的整体多核苷酸可以是单链的。例如,并入碱基编辑器内的胞苷脱氨酶可将单链rna多核苷酸中的靶标c脱氨基。在其他实施方案中,包含胞苷脱氨酶的碱基编辑器可作用于双链多核苷酸,但靶标c可以定位在多核苷酸的在脱氨基反应期间处于单链状态的部分中。例如,在其中nagpb结构域包含cas9结构域的实施方案中,几个核苷酸在cas9-grna-靶标dna复合物的形成期间可以保持未配对,胞质形成cas9“r环复合物”。这些未配对的核苷酸可以形成单链dna鼓泡,该鼓泡可以充当单链特异性核苷酸脱氨酶(例如,胞苷脱氨酶)的底物。[1527]在一些实施方案中,碱基编辑器的胞苷脱氨酶可包含载脂蛋白bmrna编辑复合物(apobec)家族脱氨酶的全部或部分。apobec是一个进化上保守的胞苷脱氨酶家族。这一家族的成员是c到u编辑酶。apobec样蛋白的n端结构域是催化性结构域,而c端结构域是假催化性结构域。更具体地,催化性结构域是锌依赖性胞苷脱氨酶结构域,且对于胞苷脱氨基而言非常重要。apobec家族成员包括apobec1、apobec2、apobec3a、apobec3b、apobec3c、apobec3d(现在称为“apobec3e”)、apobec3f、apobec3g、apobec3h、apobec4和激活诱导型(胞苷)脱氨酶。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec1脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec2脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3a脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3b脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3c脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3d脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3e脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3f脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3g脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec3h脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec4脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含激活诱导脱氨酶(aid)的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含胞苷脱氨酶1(cda1)的全部或一部分。应了解,碱基编辑器可包含来自任何适合生物体(例如,人类或大鼠)的脱氨酶。在一些实施方案中,碱基编辑器的脱氨酶结构域来自人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠。在一些实施方案中,碱基编辑器的脱氨酶结构域来源自大鼠(例如,大鼠apobec1)。在一些实施方案中,碱基编辑器的脱氨酶结构域是人类apobec1。在一些实施方案中,碱基编辑器的脱氨酶结构域是pmcda1。[1528]pmcda1的氨基酸和核酸序列显示在下文中。[1529]》tr|a5h718|a5h718_petma胞嘧啶脱氨酶os=海七鳃鳗(petromyzonmarinus)ox=7757pe=2sv=1氨基酸序列:[1530]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsimiqvkilhttkspav[1531]核酸序列:》ef094822.1海七鳃鳗分离pmcda.21胞嘧啶脱氨酶mrna,完全编码序列:[1532]tgacacgacacagccgtgtatatgaggaagggtagctggatggggggggggggaatacgttcagagaggacattagcgagcgtcttgttggtggccttgagtctagacacctgcagacatgaccgacgctgagtacgtgagaatccatgagaagttggacatctacacgtttaagaaacagtttttcaacaacaaaaaatccgtgtcgcatagatgctacgttctctttgaattaaaacgacggggtgaacgtagagcgtgtttttggggctatgctgtgaataaaccacagagcgggacagaacgtggaattcacgccgaaatctttagcattagaaaagtcgaagaatacctgcgcgacaaccccggacaattcacgataaattggtactcatcctggagtccttgtgcagattgcgctgaaaagatcttagaatggtataaccaggagctgcgggggaacggccacact[1533]ttgaaaatctgggcttgcaaactctattacgagaaaaatgcgaggaatcaaattgggctgtggaacctcagagataacggggttgggttgaatgtaatggtaagtgaacactaccaatgttgcaggaaaatattcatccaatcgtcgcacaatcaattgaatgagaatagatggcttgagaagactttgaagcgagctgaaaaacgacggagcgagttgtccattatgattcaggtaaaaatactccacaccactaagagtcctgctgtttaagaggctatgcggatggttttc[1534]人类激活诱导型胞苷脱氨酶(aid)的编码序列(cds)的氨基酸和核酸序列显示于下。[1535]》tr|q6qj80|q6qj80_人类激活诱导型胞苷脱氨酶os=智人ox=9606gn=aicdape=2sv=1氨基酸序列:[1536]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvell[1537]flryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrk[1538]aepeglrrlhragvqiaimtfkapv[1539]人类激活诱导型胞苷脱氨酶(aid)的编码序列(cds)的氨基酸和核酸序列显示于下。[1540]》tr|q6qj80|q6qj80_人类激活诱导型胞苷脱氨酶os=智人ox=9606gn=aicdape=2sv=1氨基酸序列:[1541]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvell[1542]flryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrk[1543]aepeglrrlhragvqiaimtfkapv[1544]核酸序列:》ng_011588.1:5001-15681智人激活诱导型胞苷脱氨酶(aicda),refseqgene(lrg_17),在12号染色体上:[1545]agagaaccatcattaattgaagtgagatttttctggcctgagacttgcagggaggcaagaagacactctggacaccactatggacaggtaaagaggcagtcttctcgtgggtgattgcactggccttcctctcagagcaaatctgagtaatgagactggtagctatccctttctctcatgtaactgtctgactgataagatcagcttgatcaatatgcatatatattttttgatctgtctccttttcttctattcagatcttatacgctgtcagcccaattctttctgtttcagacttctcttgatttccctctttttcatgtggcaaaagaagtagtgcgtacaatgtactgattcgtcctgagatttgtaccatggttgaaactaatttatggtaataatattaacatagcaaatctttagagactcaaatcatgaaaaggtaatagcagtactgtactaaaaacggtagtgctaattttcgtaataattttgtaaatattcaacagtaaaacaacttgaagacacactttcctagggaggcgttactgaaataatttagctatagtaagaaaatttgtaattttagaaatgccaagcattctaaattaattgcttgaaagtcactatgattgtgtccattataaggagacaaattcattcaagcaagttatttaatgttaaaggcccaattgttaggcagttaatggcacttttactattaactaatctttccatttgttcagacgtagcttaacttacctcttaggtgtgaatttggttaaggtcctcataatgtctttatgtgcagtttttgataggttattgtcatagaacttattctattcctacatttatgattactatggatgtatgagaataacacctaatccttatactttacctcaatttaactcctttataaagaacttacattacagaataaagattttttaaaaatatatttttttgtagagacagggtcttagcccagccgaggctggtctctaagtcctggcccaagcgatcctcctgcctgggcctcctaaagtgctggaattatagacatgagccatcacatccaatatacagaataaagatttttaatggaggatttaatgttcttcagaaaattttcttgaggtcagacaatgtcaaatgtctcctcagtttacactgagattttgaaaacaagtctgagctataggtccttgtgaagggtccattggaaatacttgttcaaagtaaaatggaaagcaaaggtaaaatcagcagttgaaattcagagaaagacagaaaaggagaaaagatgaaattcaacaggacagaagggaaatatattatcattaaggaggacagtatctgtagagctcattagtgatggcaaaatgacttggtcaggattatttttaacccgcttgtttctggtttgcacggctggggatgcagctagggttctgcctcagggagcacagctgtccagagcagctgtcagcctgcaagcctgaaacactccctcggtaaagtccttcctactcaggacagaaatgacgagaacagggagctggaaacaggcccctaaccagagaagggaagtaatggatcaacaaagttaactagcaggtcaggatcacgcaattcatttcactctgactggtaacatgtgacagaaacagtgtaggcttattgtattttcatgtagagtaggacccaaaaatccacccaaagtcctttatctatgccacatccttcttatctatacttccaggacactttttcttccttatgataaggctctctctctctccacacacacacacacacacacacacacacacacacacacacacacaaacacacaccccgccaaccaaggtgcatgtaaaaagatgtagattcctctgcctttctcatctacacagcccaggagggtaagttaatataagagggatttattggtaagagatgatgcttaatctgtttaacactgggcctcaaagagagaatttcttttcttctgtacttattaagcacctattatgtgttgagcttatatatacaaagggttattatatgctaatatagtaatagtaatggtggttggtactatggtaattaccataaaaattattatccttttaaaataaagctaattattattggatcttttttagtattcattttatgttttttatgtttttgattttttaaaagacaatctcaccctgttacccaggctggagtgcagtggtgcaatcatagctttctgcagtcttgaactcctgggctcaagcaatcctcctgccttggcctcccaaagtgttgggatacagtcatgagccactgcatctggcctaggatccatttagattaaaatatgcattttaaattttaaaataatatggctaatttttaccttatgtaatgtgtatactggcaataaatctagtttgctgcctaaagtttaaagtgctttccagtaagcttcatgtacgtgaggggagacatttaaagtgaaacagacagccaggtgtggtggctcacgcctgtaatcccagcactctgggaggctgaggtgggtggatcgcttgagccctggagttcaagaccagcctgagcaacatggcaaaacgctgtttctataacaaaaattagccgggcatggtggcatgtgcctgtggtcccagctactagggggctgaggcaggagaatcgttggagcccaggaggtcaaggctgcactgagcagtgcttgcgccactgcactccagcctgggtgacaggaccagaccttgcctcaaaaaaataagaagaaaaattaaaaataaatggaaacaactacaaagagctgttgtcctagatgagctacttagttaggctgatattttggtatttaacttttaaagtcagggtctgtcacctgcactacattattaaaatatcaattctcaatgtatatccacacaaagactggtacgtgaatgttcatagtacctttattcacaaaaccccaaagtagagactatccaaatatccatcaacaagtgaacaaataaacaaaatgtgctatatccatgcaatggaataccaccctgcagtacaaagaagctacttggggatgaatcccaaagtcatgacgctaaatgaaagagtcagacatgaaggaggagataatgtatgccatacgaaattctagaaaatgaaagtaacttatagttacagaaagcaaatcagggcaggcatagaggctcacacctgtaatcccagcactttgagaggccacgtgggaagattgctagaactcaggagttcaagaccagcctgggcaacacagtgaaactccattctccacaaaaatgggaaaaaaagaaagcaaatcagtggttgtcctgtggggaggggaaggactgcaaagagggaagaagctctggtggggtgagggtggtgattcaggttctgtatcctgactgtggtagcagtttggggtgtttacatccaaaaatattcgtagaattatgcatcttaaatgggtggagtttactgtatgtaaattatacctcaatgtaagaaaaaataatgtgtaagaaaactttcaattctcttgccagcaaacgttattcaaattcctgagccctttacttcgcaaattctctgcacttctgccccgtaccattaggtgacagcactagctccacaaattggataaatgcatttctggaaaagactagggacaaaatccaggcatcacttgtgctttcatatcaaccatgctgtacagcttgtgttgctgtctgcagctgcaatggggactcttgatttctttaaggaaacttgggttaccagagtatttccacaaatgctattcaaattagtgcttatgatatgcaagacactgtgctaggagccagaaaacaaagaggaggagaaatcagtcattatgtgggaacaacatagcaagatatttagatcattttgactagttaaaaaagcagcagagtacaaaatcacacatgcaatcagtataatccaaatcatgtaaatatgtgcctgtagaaagactagaggaataaacacaagaatcttaacagtcattgtcattagacactaagtctaattattattattagacactatgatatttgagatttaaaaaatctttaatattttaaaatttagagctcttctatttttccatagtattcaagtttgacaatgatcaagtattactctttctttttttttttttttttttttttttgagatggagttttggtcttgttgcccatgctggagtggaatggcatgaccatagctcactgcaacctccacctcctgggttcaagcaaagctgtcgcctcagcctcccgggtagatgggattacaggcgcccaccaccacactcggctaatgtttgtatttttagtagagatggggtttcaccatgttggccaggctggtctcaaactcctgacctcagaggatccacctgcctcagcctcccaaagtgctgggattacagatgtaggccactgcgcccggccaagtattgctcttatacattaaaaaacaggtgtgagccactgcgcccagccaggtattgctcttatacattaaaaaataggccggtgcagtggctcacgcctgtaatcccagcactttgggaagccaaggcgggcagaacacccgaggtcaggagtccaaggccagcctggccaagatggtgaaaccccgtctctattaaaaatacaaacattacctgggcatgatggtgggcgcctgtaatcccagctactcaggaggctgaggcaggaggatccgcggagcctggcagatctgcctgagcctgggaggttgaggctacagtaagccaagatcatgccagtatacttcagcctgggcgacaaagtgagaccgtaacaaaaaaaaaaaaatttaaaaaaagaaatttagatcaagatccaactgtaaaaagtggcctaaacaccacattaaagagtttggagtttattctgcaggcagaagagaaccatcagggggtcttcagcatgggaatggcatggtgcacctggtttttgtgagatcatggtggtgacagtgtggggaatgttattttggagggactggaggcagacagaccggttaaaaggccagcacaacagataaggaggaagaagatgagggcttggaccgaagcagagaagagcaaacagggaaggtacaaattcaagaaatattggggggtttgaatcaacacatttagatgattaattaaatatgaggactgaggaataagaaatgagtcaaggatggttccaggctgctaggctgcttacctgaggtggcaaagtcgggaggagtggcagtttaggacagggggcagttgaggaatattgttttgatcattttgagtttgaggtacaagttggacacttaggtaaagactggaggggaaatctgaatatacaattatgggactgaggaacaagtttattttattttttgtttcgttttcttgttgaagaacaaatttaattgtaatcccaagtcatcagcatctagaagacagtggcaggaggtgactgtcttgtgggtaagggtttggggtccttgatgagtatctctcaattggccttaaatataagcaggaaaaggagtttatgatggattccaggctcagcagggctcaggagggctcaggcagccagcagaggaagtcagagcatcttctttggtttagcccaagtaatgacttccttaaaaagctgaaggaaaatccagagtgaccagattataaactgtactcttgcattttctctccctcctctcacccacagcctcttgatgaaccggaggaagtttctttaccaattcaaaaatgtccgctgggctaagggtcggcgtgagacctacctgtgctacgtagtgaagaggcgtgacagtgctacatccttttcactggactttggttatcttcgcaataaggtatcaattaaagtcggctttgcaagcagtttaatggtcaactgtgagtgcttttagagccacctgctgatggtattacttccatccttttttggcatttgtgtctctatcacattcctcaaatccttttttttatttctttttccatgtccatgcacccatattagacatggcccaaaatatgtgatttaattcctccccagtaatgctgggcaccctaataccactccttccttcagtgccaagaacaactgctcccaaactgtttaccagctttcctcagcatctgaattgcctttgagattaattaagctaaaagcatttttatatgggagaatattatcagcttgtccaagcaaaaattttaaatgtgaaaaacaaattgtgtcttaagcatttttgaaaattaaggaagaagaatttgggaaaaaattaacggtggctcaattctgtcttccaaatgatttcttttccctcctactcacatgggtcgtaggccagtgaatacattcaacatggtgatccccagaaaactcagagaagcctcggctgatgattaattaaattgatctttcggctacccgagagaattacatttccaagagacttcttcaccaaaatccagatgggtttacataaacttctgcccacgggtatctcctctctcctaacacgctgtgacgtctgggcttggtggaatctcagggaagcatccgtggggtggaaggtcatcgtctggctcgttgtttgatggttatattaccatgcaattttctttgcctacatttgtattgaatacatcccaatctccttcctattcggtgacatgacacattctatttcagaaggctttgattttatcaagcactttcatttacttctcatggcagtgcctattacttctcttacaatacccatctgtctgctttaccaaaatctatttccccttttcagatcctcccaaatggtcctcataaactgtcctgcctccacctagtggtccaggtatatttccacaatgttacatcaacaggcacttctagccattttccttctcaaaaggtgcaaaaagcaacttcataaacacaaattaaatcttcggtgaggtagtgtgatgctgcttcctcccaactcagcgcacttcgtcttcctcattccacaaaaacccatagccttccttcactctgcaggactagtgctgccaagggttcagctctacctactggtgtgctcttttgagcaagttgcttagcctctctgtaacacaaggacaatagctgcaagcatccccaaagatcattgcaggagacaatgactaaggctaccagagccgcaataaaagtcagtgaattttagcgtggtcctctctgtctctccagaacggctgccacgtggaattgctcttcctccgctacatctcggactgggacctagaccctggccgctgctaccgcgtcacctggttcacctcctggagcccctgctacgactgtgcccgacatgtggccgactttctgcgagggaaccccaacctcagtctgaggatcttcaccgcgcgcctctacttctgtgaggaccgcaaggctgagcccgaggggctgcggcggctgcaccgcgccggggtgcaaatagccatcatgaccttcaaaggtgcgaaagggccttccgcgcaggcgcagtgcagcagcccgcattcgggattgcgatgcggaatgaatgagttagtggggaagctcgaggggaagaagtgggcggggattctggttcacctctggagccgaaattaaagattagaagcagagaaaagagtgaatggctcagagacaaggccccgaggaaatgagaaaatggggccagggttgcttctttcccctcgatttggaacctgaactgtcttctacccccatatccccgcctttttttcctttttttttttttgaagattatttttactgctggaatacttttgtagaaaaccacgaaagaactttcaaagcctgggaagggctgcatgaaaattcagttcgtctctccagacagcttcggcgcatccttttggtaaggggcttcctcgctttttaaattttctttctttctctacagtcttttttggagtttcgtatatttcttatattttcttattgttcaatcactctcagttttcatctgatgaaaactttatttctcctccacatcagctttttcttctgctgtttcaccattcagagccctctgctaaggttccttttccctcccttttctttcttttgttgtttcacatctttaaatttctgtctctccccagggttgcgtttccttcctggtcagaattcttttctcctttttttttttttttttttttttttttaaacaaacaaacaaaaaacccaaaaaaactctttcccaatttactttcttccaacatgttacaaagccatccactcagtttagaagactctccggccccaccgacccccaacctcgttttgaagccattcactcaatttgcttctctctttctctacagcccctgtatgaggttgatgacttacgagacgcatttcgtactttgggactttgatagcaacttccaggaatgtcacacacgatgaaatatctctgctgaagacagtggataaaaaacagtccttcaagtcttctctgtttttattcttcaactctcactttcttagagtttacagaaaaaatatttatatacgactctttaaaaagatctatgtcttgaaaatagagaaggaacacaggtctggccagggacgtgctgcaattggtgcagttttgaatgcaacattgtcccctactgggaataacagaactgcaggacctgggagcatcctaaagtgtcaacgtttttctatgacttttaggtaggatgagagcagaaggtagatcctaaaaagcatggtgagaggatcaaatgtttttatatcaacatcctttattatttgattcatttgagttaacagtggtgttagtgatagatttttctattcttttcccttgacgtttactttcaagtaacacaaactcttccatcaggccatgatctataggacctcctaatgagagtatctgggtgattgtgaccccaaaccatctctccaaagcattaatatccaatcatgcgctgtatgttttaatcagcagaagcatgtttttatgtttgtacaaaagaagattgttatgggtggggatggaggtatagaccatgcatggtcaccttcaagctactttaataaaggatcttaaaatgggcaggaggactgtgaacaagacaccctaataatgggttgatgtctgaagtagcaaatcttctggaaacgcaaactcttttaaggaagtccctaatttagaaacacccacaaacttcacatatcataattagcaaacaattggaaggaagttgcttgaatgttggggagaggaaaatctattggctctcgtgggtctcttcatctcagaaatgccaatcaggtcaaggtttgctacattttgtatgtgtgtgatgcttctcccaaaggtatattaactatataagagagttgtgacaaaacagaatgataaagctgcgaaccgtggcacacgctcatagttctagctgcttgggaggttgaggagggaggatggcttgaacacaggtgttcaaggccagcctgggcaacataacaagatcctgtctctcaaaaaaaaaaaaaaaaaaaagaaagagagagggccgggcgtggtggctcacgcctgtaatcccagcactttgggaggccgagccgggcggatcacctgtggtcaggagtttgagaccagcctggccaacatggcaaaaccccgtctgtactcaaaatgcaaaaattagccaggcgtggtagcaggcacctgtaatcccagctacttgggaggctgaggcaggagaatcgcttgaacccaggaggtggaggttgcagtaagctgagatcgtgccgttgcactccagcctgggcgacaagagcaagactctgtctcagaaaaaaaaaaaaaaaagagagagagagagaaagagaacaatatttgggagagaaggatggggaagcattgcaaggaaattgtgctttatccaacaaaatgtaaggagccaataagggatccctatttgtctcttttggtgtctatttgtccctaacaactgtctttgacagtgagaaaaatattcagaataaccatatccctgtgccgttattacctagcaacccttgcaatgaagatgagcagatccacaggaaaacttgaatgcacaactgtcttattttaatcttattgtacataagtttgtaaaagagttaaaaattgttacttcatgtattcatttatattttatattattttgcgtctaatgattttttattaacatgatttccttttctgatatattgaaatggagtctcaaagcttcataaatttataactttagaaatgattctaataacaacgtatgtaattgtaacattgcagtaatggtgctacgaagccatttctcttgatttttagtaaacttttatgacagcaaatttgcttctggctcactttcaatcagttaaataaatgataaataattttggaagctgtgaagataaaataccaaataaaataatataaaagtgatttatatgaagttaaaataaaaaatcagtatgatggaataaacttg[1546]可根据本公开的方面融合至cas9的其他示例性脱氨酶提供于下。在实施方案中,脱氨酶是激活诱导型脱氨酶(aid)。应理解,在一些实施方案中,可使用相应序列的活性结构域,例如灭有定位信号的结构域(核定位序列,没有核输出信号、细胞质定位信号)。[1547]人类aid:[1548][1549](下划线:核定位序列;双下划线:核输出信号)[1550]小鼠aid:[1551][1552](下划线:核定位序列;双下划线:核输出信号)[1553]犬aid:[1554][1555](下划线:核定位序列;双下划线:核输出信号)[1556]牛aid:[1557][1558](下划线:核定位序列;双下划线:核输出信号)[1559]大鼠aid:[1560][1561](下划线:核定位序列;双下划线:核输出信号)[1562]claid(家犬亚种(canislupusfamiliaris)):[1563]mdsllmkqrkflyhfknvrwakgrhetylcyvvkrrdsatsfsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslrifaarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenrektfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1564]btaid(牛(bostaurus)):[1565]mdsllkkqrqflyqfknvrwakgrhetylcyvvkrrdsptsfsldfghlrnkagchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgypnlslriftarlyfcdkerkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1566]maid(小家鼠(musmusculus)):[1567]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkdyfycwntfvenhertfkaweglhensvrlsrqlrrillplyevddlrdafrtlgl[1568]rapobec-1(褐家鼠(rattusnorvegicus)):[1569]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1570]maapobec-1(金仓鼠(mesocricetusauratus)):[1571]mssetgpvvvdptlrrriephefdaffdqgelrketcllyeirwggrhniwrhtgqntsrhveinfiekftseryfypstrcsivwflswspcgecskaiteflsghpnvtlfiyaarlyhhtdqrnrqglrdlisrgvtirimteqeycycwrnfvnyppsnevywprypnlwmrlyalelycihlglppclkikrrhqypltffrlnlqschyqripphilwatgfi[1572]ppapobec-1(猩猩(pongopygmaeus)):[1573]mtsekgpstgdptlrrrieswefdvfydprelrketcllyeikwgmsrkiwrssgknttnhvevnfikkftserrfhssiscsitwflswspcwecsqaireflsqhpgvtlviyvarlfwhmdqrnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhlaffrlhlqnchyqtipphillatglihpsvtwr[1574]ocapobec1(穴兔(oryctolaguscuniculus)):[1575]masekgpsnkdytlrrriepwefevffdpqelrkeacllyeikwgassktwrssgknttnhvevnflekltsegrlgpstccsitwflswspcwecsmaireflsqhpgvtliifvarlfqhmdrrnrqglkdlvtsgvtvrvmsvseycycwenfvnyppgkaaqwprypprwmlmyalelyciilglppclkisrrhqkqltffsltpqychykmippyillatgllqpsvpwr[1576]mdapobec-1(短尾负鼠(monodelphisdomestica):[1577]mnsktgpsvgdatlrrrikpwefvaffnpqelrketcllyeikwgnqniwrhsnqntsqhaeinfmekftaerhfnssvrcsitwflswspcwecskairkfldhypnvtlaifisrlywhmdqqhrqglkelvhsgvtiqimsyseyhycwrnfvdypqgeedywpkypylwimlyvlelhciilglppclkisgshsnqlalfsldlqdchyqkipynvlvatglvqpfvtwr[1578]ppapobec-2(猩猩(pongopygmaeus):[1579]maqkeeaaaateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweeleiqdalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1580]btapobec-2(牛(bostaurus):[1581]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1582]mapobec-3-(1)(小家鼠(musmusculus):[1583]mqpqrlgpragmgpfclgcshrkcyspirnlisqetfkfhfknlgyakgrkdtflcyevtrkdcdspvslhhgvfknkdnihaeicflywfhdkvlkvlspreefkitwymswspcfecaeqivrflathhnlsldifssrlynvqdpetqqnlcrlvqegaqvaamdlyefkkcwkkfvdnggrrfrpwkrlltnfryqdsklqeilrpcyisvpssssstlsnicltkglpetrfwvegrrmdplseeefysqfynqrvkhlcyyhrmkpylcyqleqfngqaplkgcllsekgkqhaeilfldkirsmelsqvtitcyltwspcpncawqlaafkrdrpdlilhiytsrlyfhwkrpfqkglcslwqsgilvdvmdlpqftdcwtnfvnpkrpfwpwkgleiisrrtqrrlrrikeswglqdlvndfgnlqlgppms[1584]小鼠apobec-3-(2):[1585][1586](斜体:核酸编辑结构域)[1587]大鼠apobec-3:[1588][1589][1590](斜体:核酸编辑结构域)[1591]hapobec-3a(智人(homosapiens)):[1592]measpasgprhlmdphiftsnfnngigrhktylcyeverldngtsvkmdqhrgflhnqaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagevraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefkhcwdtfvdhqgcpfqpwdgldehsqalsgrlrailqnqgn([1593]hapobec-3f(智人(homosapiens)):[1594]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrprldakifrgqvysqpehhaemcflswfcgnqlpaykcfqitwfvswtpcpdcvaklaeflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvysegqpfmpwykfddnyaflhrtlkeilrnpmeamyphifyfhfknlrkaygrneswlcftmevvkhhspvswkrgvfrnqvdpethchaercflswfcddilspntnyevtwytswspcpecagevaeflarhsnvnltiftarlyyfwdtdyqeglrslsqegasveimgykdfkycwenfvynddepfkpwkglkynflfldsklqeile[1595]恒河猴apobec-3g:[1596]mvepmdprtfvsnfnnrpilsglntvwlccevktkdpsgppldakifqgkvyskakyhpemrflrwfhkwrqlhhdqeykvtwyvswspctrcansvatflakdpkvtltifvarlyyfwkpdyqqalrilcqkrggphatmkimnynefqdcwnkfvdgrgkpfkprnnlpkhytllqatlgellrhlmdpgtftsnfnnkpwvsgqhetylcykverlhndtwvplnqhrgflrnqapnihgfpkgrhaelcfldlipfwkldgqqyrvtcftswspcfscaqemakfisnnehvslcifaariyddqgryqeglralhrdgakiammnysefeycwdtfvdrqgrpfqpwdgldehsqalsgrlrai[1597](斜体:核酸编辑结构域;下划线:细胞质定位信号)[1598]黑猩猩apobec-3g:[1599][1600](斜体:核酸编辑结构域;下划线:细胞质定位信号)[1601]绿猴apobec-3g:[1602][1603][1604](斜体:核酸编辑结构域;下划线:细胞质定位信号)[1605]人类apobec-3g:[1606][1607](斜体:核酸编辑结构域;下划线:细胞质定位信号)[1608]人类apobec-3f:[1609][1610](斜体:核酸编辑结构域)[1611]人类apobec-3b:[1612][1613](斜体:核酸编辑结构域)[1614]大鼠apobec-3b:[1615]mqpqglgpnagmgpvclgcshrrpyspirnplkklyqqtfyfhfknvryawgrknnflcyevngmdcalpvplrqgvfrkqghihaelcfiywfhdkvlrvlspmeefkvtwymswspcskcaeqvarflaahrnlslaifssrlyyylrnpnyqqklcrliqegvhvaamdlpefkkcwnkfvdndgqpfrpwmrlrinfsfydcklqeifsrmnllredvfylqfnnshrvkpvqnryyrrksylcyqlerangqeplkgyllykkgeqhveilflekmrsmelsqvritcyltwspcpncarqlaafkkdhpdlilriytsrlyfwrkkfqkglctlwrsgihvdvmdlpqfadcwtnfvnpqrpfrpwneleknswriqrrlrrikeswgl[1616]牛apobec-3b:[1617]dgwevafrsgtvlkagvlgvsmtegwagsghpgqgacvwtpgtrntmnllrevlfkqqfgnqprvpapyyrrktylcyqlkqrndltldrgcfrnkkqrhaerfidkinsldlnpsqsykiicyitwspcpncanelvnfitrnnhlkleifasrlyfhwiksfkmglqdlqnagisvavmthtefedcweqfvdnqsrpfqpwdkleqysasirrrlqriltapi[1618]黑猩猩apobec-3b:[1619]mnpqirnpmewmyqrtfyynfenepilygrsytwlcyevkirrghsnllwdtgvfrgqmysqpehhaemcflswfcgnqlsaykcfqitwfvswtpcpdcvaklakflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvynegqpfmpwykfddnyaflhrtlkeiirhlmdpdtftfnfnndplvlrrhqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagqvraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqvrasslcmvphrpppppqspgpclplcsepplgsllptgrpapslpflltasfsfpppaslpplpslslspghlpvpsfhsltscsiqppcssriretegwasvskegrdlg[1620]人类apobec-3c:[1621][1622](斜体:核酸编辑结构域)[1623]大猩猩apobec-3c[1624][1625](斜体:核酸编辑结构域)[1626]人类apobec-3a:[1627][1628](斜体:核酸编辑结构域)[1629]恒河猴apobec-3a:[1630][1631](斜体:核酸编辑结构域)[1632]牛apobec-3a:[1633][1634](斜体:核酸编辑结构域)[1635]人类apobec-3h:[1636][1637](斜体:核酸编辑结构域)[1638]恒河猴apobec-3h:[1639]malltaktfslqfnnkrrvnkpyyprkallcyqltpqngstptrghlknkkkdhaeirfinkiksmgldetqcyqvtcyltwspcpscagelvdfikahrhlnlrifasrlyyhwrpnyqegllllcgsqvpvevmglpeftdcwenfvdhkeppsfnpsekleeldknsqaikrrleriksrsvdvlenglrslqlgpvtpsssirnsr[1640]人类apobec-3d:[1641][1642](斜体:核酸编辑结构域)[1643]人类apobec-1:[1644]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlfwhmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr[1645]小鼠apobec-1:[1646]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[1647]大鼠apobec-1:[1648]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1649]人类apobec-2:[1650]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[1651]小鼠apobec-2:[1652]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1653]大鼠apobec-2:[1654]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvveaqskggqvqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeylwqnfveqeegeskafepwediqenflyyeekladilk[1655]牛apobec-2:[1656]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[1657]海七鳃鳗(petromyzonmarinus)cda1(pmcdal):[1658]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsfmiqvkilhttkspav[1659]人类apobec3gd316rd317r:[1660]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgqvyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedpkvtltifvarlyyfwdpdyqealrslcqkrdgpratmkfnydefqhcwskfvysqrelfepwnnlpkyyillhfmlgeilrhsmdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfiskkhvslciftariyrrqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[1661]人类apobec3ga链:[1662]mdpptftfnfnnepwwgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[1663]人类apobec3ga链d120rd121r:[1664]mdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyrrqgrcqeglrtlaeagakisfmtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[1665]hapobec-4(智人(homosapiens)):[1666]mepiyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttfpqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilysnnspcneanhcciskmynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfisgvsgshvfqpiltgraladrhnayeinaitgvkpyftdvllqtkrnpntkaqealesyplnnafpgqffqmpsgqlqpnlppdlrapvvfvlvplrdlppmhmgqnpnkprnivrhlnmpqmsfqetkdlgrlptgrsveiveiteqfasskeadekkkkkgkk[1667]mapobec-4(小家鼠(musmusculus)):[1668]mdsllmkqkkflyhfknvrwakgrhetylcyvvkrrdsatscsldfghlrnksgchvellflryisdwdldpgrcyrvtwftswspcydcarhvaeflrwnpnlslriftarlyfcedrkaepeglrrlhragvqigimtfkdyfycwntfvenrertfkaweglhensvrltrqlrrillplyevddlrdafrmlgf[1669]rapobec-4(褐家鼠(rattusnorvegicus)):[1670]meplyeeylthsgtivkpyywlsvslnctncpyhirtgeearvpytefhqtfgfpwstypqtkhltfyelrsssgnliqkglasnctgshthpesmlferdgyldslifhdsnirhiilysnnspcdeanhcciskmynflmnypevtlsvffsqlyhtenqfptsawnrealrglaslwpqvtlsaisggiwqsiletfvsgisegltavrpftagrtltdrynayeincitevkpyftdalhswqkenqdqkvwaasenqplhnttpaqwqpdmsqdcrtpavfmlvpyrdlppihvnpspqkprtvvrhlntlqlsaskvkalrkspsgrpvkkeearkgstrsqeanetnkskwkkqtlfiksnichllereqkkigilsswsv[1671]mfapobec-4(食蟹猕猴(macacafascicularis)):[1672]meptyeeylanhgtivkpyywlsfsldcsncpyhirtgeearvsltefcqifgfpygttypqtkhltfyelktssgslvqkghassctgnyihpesmlfemngyldsaiynndsirhiilycnnspcneanhcciskvynflitypgitlsiyfsqlyhtemdfpasawnrealrslaslwprvvlspisggiwhsvlhsfvsgvsgshvfqpiltgraltdrynayeinaitgvkpfftdvllhtkrnpntkaqmalesyplnnafpgqsfqmtsgippdlrapvvfvllplrdlppmhmgqdpnkprniirhlnmpqmsfqetkdlerlptrrsvetveiterfasskqaeektkkkkgkk[1673]pmcda-1(海七鳃鳗(petromyzonmarinus)):[1674]magyecvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtltmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgiplhlftlqtpllsgrvvwwrv[1675]pmcda-2(海七鳃鳗(petromyzonmarinus)):[1676]melrevvdcalascvrheplsrvaflrcfaapsqkprgtvilfyvegagrgvtgghavnynkqgtsihaevlllsavraallrrrrcedgeeatrgctlhcystyspcrdcveyiqefgastgvrvvihccrlyeldvnrrrseaegvlrslsrlgrdfrlmgprdaialllggrlantadgesgasgnawvtetnvveplvdmtgfgdedlhaqvqrnkqireayanyasavslmlgelhvdpdkfpflaeflaqtsvepsgtpretrgrprgassrgpeigrqrpadferalgayglflhprivsreadreeikrdlivvmrkhnyqgp[1677]pmcda-5(海七鳃鳗(petromyzonmarinus)):[1678]magdenvrvsekldfdtfefqfenlhyaterhrtyvifdvkpqsaggrsrrlwgyiinnpnvchaelilmsmidrhlesnpgvyamtwymswspcancssklnpwlknlleeqghtlmmhfsriydrdregdhrglrglkhvsnsfrmgvvgraevkeclaeyveasrrtltwldttesmaakmrrklfcilvrcagmresgmplhlft[1679]ycd(酿酒酵母(saccharomycescerevisiae)):[1680]mvtggmaskwdqkgmdiayeeaalgykeggvpiggclinnkdgsvlgrghnmrfqkgsatlhgeistlencgrlegkvykdttlyttlspcdmctgaiimygiprcvvgenvnfkskgekylqtrghevvvvdderckkimkqfiderpqdwfedige[1681]rapobec-1(δ177-186):[1682]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrglppclnilrrkqpqltfftialqschyqrlpphilwatglk[1683]rapobec-1(δ202-213):[1684]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqhyqrlpphilwatglk[1685]小鼠apobec-3:[1686][1687][1688](斜体:核酸编辑结构域)[1689]本公开的一些方面基于以下认知:例如通过在脱氨酶结构域中作出点突变来调节本文所述的任何融合蛋白的脱氨酶结构域催化活性,将会影响该融合蛋白(例如,碱基编辑器)的持续合成能力。例如,降低但不消除碱基编辑融合蛋白内的脱氨酶结构域的催化活性的突变可以使得该脱氨酶结构域不太可能催化与靶标残基相邻的残基的脱氨基反应,从而缩窄脱氨基窗口。缩窄脱氨基窗口的能力可以防止不希望的与特异性靶标残基相邻的残基的脱氨基反应,这可以降低或预防脱靶效应。[1690]例如,在一些实施方案中,并入碱基编辑器内的apobec脱氨酶可包含选自由以下所组成的群组的一个或多个突变:rapobec1的h121x、h122x、r126x、r126x、r118x、w90x、w90x和r132x,或另一apobec脱氨酶中的一个或多个对应突变,其中x是任何氨基酸。在一些实施方案中,并入碱基编辑器内的apobec脱氨酶可包含选自由以下所组成的群组的一个或多个突变:rapobec1的h121r、h122r、r126a、r126e、r118a、w90a、w90y和r132e,或另一apobec脱氨酶中的一个或多个对应突变。[1691]在一些实施方案中,并入碱基编辑器内的apobec脱氨酶可包含选自由以下所组成的群组的一个或多个突变:hapobec3g的d316x、d317x、r320x、r320x、r313x、w285x、w285x、r326x,或另一apobec脱氨酶中的一个或多个对应突变,其中x是任何氨基酸。在一些实施方案中,本文提供的任何融合蛋白包含apobec脱氨酶,该脱氨酶包含选自由以下所组成的群组的一个或多个突变:hapobec3g的d316r、d317r、r320a、r320e、r313a、w285a、w285y、r326e,或另一apobec脱氨酶的一个或多个对应突变。[1692]在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含rapobec1的h121r和h122r突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的r126a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的r126e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的r118a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的w90a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的w90y突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的w90y和r126e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的r126e和r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的w90y和r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含rapobec1的w90y、r126e和r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。[1693]在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的d316r和d317r突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,本文所提供的任何融合蛋白包含apobec脱氨酶,该脱氨酶包含hapobec3g的r320a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的r320e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的r313a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的w285a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的w285y突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的w2865y和r320e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的r320e和r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的w285y和r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器的apobec脱氨酶可包含apobec脱氨酶,该脱氨酶包含hapobec3g的w285y、r320e和r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。[1694]大量经修饰的胞苷脱氨酶是可商购的,包括但不限于,sabe3、sakkh-be3、vqr-be3、eqr-be3、vrer-be3、ye1-be3、ee-be3、ye2-be3和yee-be3,它们可以从addgene获得(质粒85169、85170、85171、85172、85173、85174、85175、85176、85177)。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec1脱氨酶的全部或一部分。[1695]c到t核碱基编辑蛋白的细节描述于国际pct申请号pct/us2016/058344(wo2017/070632)和komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016)中,其整体内容通过引用并入本文。[1696]胞苷脱氨酶[1697]在一些实施方案中,本发明的融合蛋白包含一个或多个胞苷脱氨酶结构域。在一些实施方案中,本文提供的胞苷脱氨酶能够将胞嘧啶或5-甲基胞嘧啶脱氨基为尿嘧啶或胸腺嘧啶。在一些实施方案中,本文提供的胞苷脱氨酶能够将dna中的胞嘧啶脱氨基。胞苷脱氨酶可以源自任何合适的生物体。在一些实施方案中胞苷脱氨酶是天然存在的胞苷脱氨酶,其包括对应于本文所提供的任何突变的一个或多个突变。本领域技术人员将能够鉴定任何同源蛋白质中的对应残基,通过序列比对并确定同源残基。据此,本领域技术人员将能够生成任何天然存在的胞苷脱氨酶中的对应于本文所述任何突变的突变。在一些实施方案中,胞苷脱氨酶来自原核生物。在一些实施方案中,胞苷脱氨酶来自细菌。在一些实施方案中,胞苷脱氨酶来自哺乳动物(例如,人类)。[1698]在一些实施方案中,胞苷脱氨酶包含氨基酸序列,该氨基酸序列与本文详述的胞苷脱氨酶氨基酸序列中的任一者至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应了解,本文所提供的胞苷脱氨酶可包括一个或多个突变(例如,本文所提供的任何突变)。一些实施方案提供编码任何前述方面或如本文所述的胞苷脱氨酶核碱基编辑器的多核苷酸分子。在一些实施方案中,该多核苷酸经密码子优化。[1699]本公开提供任何具有某一百分比的一致性加上任何本文所述突变或其组合的脱氨酶结构域。在一些实施方案中,胞苷脱氨酶包含氨基酸序列,与参考序列或本文所提供的任何胞苷脱氨酶相比,该氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变。在一些实施方案中,胞苷脱氨酶包含氨基酸序列,与本领域已知或本文所述的氨基酸序列中的任一者相比,该氨基酸序列具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160、或至少170个相同的连续氨基酸残基。[1700]本发明的融合蛋白第二蛋白包含两个或更多个核酸编辑结构域。在一些实施方案中,核酸编辑结构域可以催化c到u的碱基变化。在一些实施方案中,核酸编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白bmrna编辑复合物(apobec)家族脱氨酶。在一些实施方案中,脱氨酶是apobecl脱氨酶。在一些实施方案中,脱氨酶是apobec2脱氨酶。在一些实施方案中,脱氨酶是apobec3脱氨酶。在一些实施方案中,脱氨酶是apobec3a脱氨酶。在一些实施方案中,脱氨酶是apobec3b脱氨酶。在一些实施方案中,脱氨酶是apobec3c脱氨酶。在一些实施方案中,脱氨酶是apobec3d脱氨酶。在一些实施方案中,脱氨酶是apobec3e脱氨酶。在一些实施方案中,脱氨酶是apobec3f脱氨酶。在一些实施方案中,脱氨酶是apobec3g脱氨酶。在一些实施方案中,脱氨酶是apobec3h脱氨酶。在一些实施方案中,脱氨酶是apobec4脱氨酶。在一些实施方案中,脱氨酶是激活诱导型脱氨酶(aid)。在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶结构域是人类、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠脱氨酶。在一些实施方案中,脱氨酶是人类脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶,例如,rapobecl。在一些实施方案中,脱氨酶是海七鳃鳗(petromyzonmarinus)胞苷脱氨酶1(pmcdal)。在一些实施方案中,脱氨酶是人类apobec3g。在一些实施方案中,脱氨酶是人类apobec3g的片段。在一些实施方案中,脱氨酶是包含d316rd317r突变的人类apobec3g变体。在一些实施方案中,脱氨酶是人类apobec3g的片段并且包含对应于d316rd317r突变的突变。在一些实施方案中,核酸编辑结构域与本文所述的任何脱氨酶的脱氨酶结构域至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少99.5%相同。[1701]在某些实施方案中,本文所提供的融合蛋白包含一个或多个改善融合蛋白的碱基编辑活性的特征。例如,本文所提供的任何融合蛋白可包含具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的任何融合蛋白可具有没有核酸酶活性的cas9结构域(dcas9),或切断双螺旋dna分子的一条链的cas9结构域,称为cas9切口酶(ncas9)。[1702]高保真度cas9结构域[1703]本公开的一些方面提供高保真度cas9结构域。在一些实施方案中,高保真度cas9结构域是包含一个或多个突变的经工程改造的cas9结构域,与对应的野生型cas9结构域相比,该突变降低cas9结构域与dna的糖-磷酸酯主链之间的静电相互作用。不受缚于任何特定理论,与dna的糖-磷酸酯主链的静电相互作用降低的高保真度cas9结构域可具有较低的脱靶效应。在一些实施方案中,cas9结构域(例如,野生型cas9结构域)包含一个或多个突变,该突变降低cas9结构域与dna的糖-磷酸酯主链之间的缔合。在一些实施方案中,cas9结构域包含一个或多个突变,该突变将cas9结构域与dna的糖-磷酸酯主链之间的缔合降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、或至少70%。[1704]在一些实施方案中,本文所提供的任何cas9融合蛋白包含n497x、r661x、q695x和/或q926x突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变,其中x是任何氨基酸。在一些实施方案中,本文所提供的任何cas9融合蛋白包含n497a、r661a、q695a和/或q926a突变中的一者或多者,或本文所提供的任何氨基酸序列中的对应突变。在一些实施方案中,cas9结构域包含d10a突变,或本文所提供的任何氨基酸序列中的对应突变。具有高保真度的cas9结构域是本领域中已知的,并且对于熟练技术人员将会是显而易见的。例如,具有高保真度的cas9结构域已经描述于kleinstiver,b.p.,等人“high-fidelitycrispr-cas9nucleaseswithnodetectablegenome-wideoff-targeteffects.”nature529,490-495(2016)和slaymaker,i.m.,等人“rationallyengineeredcas9nucleaseswithimprovedspecificity.”science351,84-88(2015)中,各自的整体内容通过引用并入本文。[1705]在一些实施方案中,经修饰的cas9是高保真度cas9酶。在一些实施方案中,高保真度cas9酶是spcas9(k855a)、espcas9(1.1)、spcas9-hf1或超精确cas9变体(hypacas9)。经修饰的cas9espcas9(1.1)含有丙氨酸置换,该丙氨酸置换削弱hnh/ruvc槽与非靶标dna链之间的相互作用,防止链分离并且在脱靶位点切断。同样,spcas9-hf1通过丙氨酸置换减少脱靶标记,该丙氨酸置换中断cas9与dna磷酸酯主链的相互作用。hypacas9在rec3结构域中含有增加cas9校对和靶标识别的突变(spcas9n692a/m694a/q695a/h698a)。全部三种高保真度酶均产生低于野生型cas9的脱靶编辑。[1706]示例性高保真度cas9提供如下。相对于cas9的高保真度cas9结构域以粗体和下划线显示[1707][1708][1709]包含napdnabp以及胞苷脱氨酶和/或腺苷脱氨酶的融合蛋白[1710]本公开的一些方面提供融合蛋白,该融合蛋白包含cas9结构域或其他核酸可编程dna结合蛋白(例如,cas12)以及一个或多个胞苷脱氨酶或腺苷脱氨酶结构域和/或dna糖基化酶结构域。应了解,cas9结构域可以是本文所提供的任何cas9结构域或cas9蛋白(例如,dcas9或ncas9)。在一些实施方案中,本文所提供的任何cas9结构域或cas9蛋白(例如,dcas9或ncas9)可以与本文所提供的任何胞苷脱氨酶和/或腺苷脱氨酶融合。本文所公开的碱基编辑器的机构与可以以任何次序排列。[1711]在一些实施方案中,融合蛋白包含结构域a-c、a-d或a-e:[1712]nh2-[a-b-c]-cooh;[1713]nh2-[a-b-c-d]-cooh;或[1714]nh2-[a-b-c-d-e]-cooh;[1715]其中a和c或者a、c和e各自包含以下一者或多者:[1716]腺苷脱氨酶结构域或其活性片段,[1717]胞苷脱氨酶结构域或其活性片段,[1718]dna糖基化酶结构域或其活性片段;并且[1719]其中b或者b和d各自包含具有核酸序列特异性结合活性的一个或多个结构域。[1720]在一些实施方案中,融合蛋白包含以下结构:[1721]nh2-[an-bo-cn]-cooh;[1722]nh2-[an-bo-cn-do]-cooh;或[1723]nh2-[an-bo-cp-do-eq]-cooh;[1724]其中a和c或者a、c和e各自包含以下一者或多者:[1725]腺苷脱氨酶结构域或其活性片段,[1726]胞苷脱氨酶结构域或其活性片段,[1727]dna糖基化酶结构域或其活性片段;并且[1728]其中n是整数:1、2、3、4或5,其中p是整数:1、2、3、4或5,其中q是整数:1、2、3、4或5;并且其中b或者b和d各自包含具有核酸序列特异性结合活性的结构域;并且其中o是整数:1、2、3、4或5。[1729]例如但不限于,在一些实施方案中,融合蛋白包含结构:[1730]nh2-[腺苷脱氨酶]-[cas9结构域]-cooh;[1731]nh2-[cas9结构域]-[腺苷脱氨酶]-cooh;[1732]nh2-[胞苷脱氨酶]-[cas9结构域]-cooh;[1733]nh2-[cas9结构域]-[胞苷脱氨酶]-cooh;[1734]nh2-[胞苷脱氨酶]-[cas9结构域]-[腺苷脱氨酶]-cooh;[1735]nh2-[腺苷脱氨酶]-[cas9结构域]-[胞苷脱氨酶]-cooh;[1736]nh2-[腺苷脱氨酶]-[胞苷脱氨酶]-[cas9结构域]-cooh;[1737]nh2-[胞苷脱氨酶]-[腺苷脱氨酶]-[cas9结构域]-cooh;[1738]nh2-[cas9结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-cooh;或[1739]nh2-[cas9结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-cooh。[1740]在一些实施方案中,本文提供的任何cas12结构域或cas12蛋白可以与本文提供的任何胞苷或腺苷脱氨酶融合。例如但不限于,在一些实施方案中,融合蛋白包含结构:[1741]nh2-[腺苷脱氨酶]-[cas12结构域]-cooh;[1742]nh2-[cas12结构域]-[腺苷脱氨酶]-cooh;[1743]nh2-[胞苷脱氨酶]-[cas12结构域]-cooh;[1744]nh2-[cas12结构域]-[胞苷脱氨酶]-cooh;[1745]nh2-[胞苷脱氨酶]-[cas12结构域]-[腺苷脱氨酶]-cooh;[1746]nh2-[腺苷脱氨酶]-[cas12结构域]-[胞苷脱氨酶]-cooh;[1747]nh2-[腺苷脱氨酶]-[胞苷脱氨酶]-[cas12结构域]-cooh;[1748]nh2-[胞苷脱氨酶]-[腺苷脱氨酶]-[cas12结构域]-cooh;[1749]nh2-[cas12结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-cooh;或[1750]nh2-[cas12结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-cooh。[1751]在一些实施方案中,腺苷脱氨酶是tada*8。示例性融合蛋白结构包括下列:[1752]nh2-[tada*8]-[cas9结构域]-cooh;[1753]nh2-[cas9结构域]-[tada*8]-cooh;[1754]nh2-[tada*8]-[cas12结构域]-cooh;或[1755]nh2-[cas12结构域]-[tada*8]-cooh。[1756]在一些实施方案中,融合蛋白的腺苷脱氨酶包含tada*8和胞苷脱氨酶和/或腺苷脱氨酶。在一些实施方案中,tada*8是tada*8.1、tada*8.2、tada*8.3、tada*8.4、tada*8.5、tada*8.6、tada*8.7、tada*8.8、tada*8.9、tada*8.10、tada*8.11、tada*8.12、tada*8.13、tada*8.14、tada*8.15、tada*8.16、tada*8.17、tada*8.18、tada*8.19、tada*8.20、tada*8.21、tada*8.22、tada*8.23或tada*8.24。[1757]示例性融合蛋白结构包括下列:[1758]nh2-[tada*8]-[cas9/cas12]-[腺苷脱氨酶]-cooh;[1759]nh2-[腺苷脱氨酶]-[cas9/cas12]-[tada*8]-cooh;[1760]nh2-[tada*8]-[cas9/cas12]-[胞苷脱氨酶]-cooh;或[1761]nh2-[胞苷脱氨酶]-[cas9/cas12]-[tada*8]-cooh。[1762]在一些实施方案中,融合蛋白的腺苷脱氨酶包含tada*9和胞苷脱氨酶和/或腺苷脱氨酶。示例性融合蛋白结构包括下列:[1763]nh2-[tada*9]-[cas9/cas12]-[腺苷脱氨酶]-cooh;[1764]nh2-[腺苷脱氨酶]-[cas9/cas12]-[tada*9]-cooh;[1765]nh2-[tada*9]-[cas9/cas12]-[胞苷脱氨酶]-cooh;或[1766]nh2-[胞苷脱氨酶]-[cas9/cas12]-[tada*9]-cooh。[1767]在一些实施方案中,融合蛋白可包含脱氨酶,该脱氨酶的侧翼是cas9或cas12多肽的n端片段和c端片段。在一些实施方案中,融合蛋白包含胞苷脱氨酶,该脱氨酶的侧翼是cas9或cas12多肽的n端片段和c端片段。在一些实施方案中,融合蛋白包含腺苷脱氨酶,该脱氨酶的侧翼是cas9或cas12多肽的n端片段和c端片段。[1768]在一些实施方案中,包含胞苷脱氨酶或腺苷脱氨酶和napdnabp(例如,cas9或cas12结构域)的融合蛋白不包括连接子序列。在一些实施方案中,连接子存在于胞苷或腺苷脱氨酶与napdnabp之间。在一些实施方案中上述通用架构中所用的“‑”表示任选的连接子的存在。在一些实施方案中,胞苷或腺苷脱氨酶与napdnabp经由本文所提供的任何连接子融合。例如,在一些实施方案中,胞苷或腺苷脱氨酶与napdnabp经由本文所提供的任何连接子融合。[1769]应了解,本公开的融合蛋白可包含一个或多个额外特征。例如,在一些实施方案中,融合蛋白可包含抑制剂、细胞质定位序列、输出序列诸如核输出序列、或其他定位序列,以及可用于融合蛋白的增溶、纯化或检测的序列标签。本文所提供的合适的蛋白质标签包括但不限于,生物素羧化酶载体蛋白(bccp)标签、myc-标签、钙调蛋白-标签、flag-标签、血细胞凝集素(ha)-标签、聚组氨酸标签(也称为组氨酸标签或his-标签)、麦芽糖结合蛋白(mbp)-标签、nus-标签、谷胱甘肽-s-转移酶(gst)-标签、绿色荧光蛋白(gfp)-标签、硫氧还蛋白-标签、s-标签、softag(例如,softag1、softag3)、strep-标签、生物素连接酶标签、flash标签、v5标签和sbp-标签。其他合适的序列对于本领域技术人员将是显而易见的。在一些实施方案中,融合蛋白包含一个或多个his标签。[1770]示例性但非限制性的融合蛋白在国际pct申请ct/2017/044935、pct/us2019/044935和pct/us2020/016288中描述,其各自通过引用而以其整体并入本文。[1771]包含核定位序列f(nls)的融合蛋白[1772]在一些实施方案中,本文所提供的融合蛋白进一步包含一个或多个(例如,2、3、4、5个)核靶向序列,例如,核定位序列(nls)。在一种实施方案中,使用二分体nls。在一些实施方案中,nls包含氨基酸序列,该氨基酸序列促进包含nls的蛋白质进入细胞核内(例如,通过核转运)。在一些实施方案中,本文所提供的任何融合蛋白进一步包含核定位序列(nls)。在一些实施方案中,nls融合至融合蛋白的n端。在一些实施方案中,nls融合至融合蛋白的c端。在一些实施方案中,nls融合至cas9结构域的n端。在一些实施方案中,nls融合至cas9结构域的c端。在一些实施方案中,nls融合至ncas9结构域或dcas9结构域的c端。在一些实施方案中,nls融合至cas12结构域的n端。在一些实施方案中,nls融合至cas12结构域的c端。在一些实施方案中,nls融合至胞苷或腺苷脱氨酶的n端。在一些实施方案中,nls融合至胞苷或腺苷脱氨酶的c端。在一些实施方案中,nls经由一个或多个连接子融合至融合蛋白。在一些实施方案中,nls融合至融合蛋白而无需连接子。在一些实施方案中,nls包含本文所提供或引用的nls序列中的任一者的氨基酸序列。其他核定位序列是本领域中已知的,并且对于熟练技术人员将会是显而易见的。例如,nls序列在plank等人的pct/ep2000/011690中有所描述,其内容通过引用针对其对示例性核定位序列的公开内容并入本文。在一些实施方案中,nls包含氨基酸序列pkkkrkvegadkrtadgsefespkkkrkv、krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprkpkkkrkv或mdsllmnrrkflyqfknvrwakgrretylc。[1773]在一些实施方案中,包含胞苷或腺苷脱氨酶、cas9结构域和nls的融合蛋白不包含连接子序列。在一些实施方案中,在结构域或蛋白质(例如,胞苷或腺苷脱氨酶、cas9结构域或nls)中的一者或多者之间存在连接子序列。在一些实施方案中,连接子存在于胞苷脱氨酶与腺苷脱氨酶结构域与napdnabp之间。在一些实施方案中下述通用架构中所用的“‑”表示任选的连接子的存在。在一些实施方案中,胞苷脱氨酶与腺苷脱氨酶与napdnabp经由本文所提供的任何连接子融合。例如,在一些实施方案中,胞苷脱氨酶和腺苷脱氨酶与napdnabp经由本文所提供的任何连接子融合。[1774]在一些实施方案中,具有胞苷或腺苷脱氨酶以及napdnabp(例如,cas9或cas12)的示例性napdnabp(例如,cas9或cas12)融合蛋白的通用架构包含以下结构中的任一者,其中nls是核定位序列(例如,本文所提供的任何nls),nh2是融合蛋白的n端,且cooh是融合蛋白的c端。[1775]nh2-nls-[胞苷脱氨酶]-[napdnabp结构域]-cooh;[1776]nh2-nls[napdnabp结构域]-[胞苷脱氨酶]-cooh;[1777]nh2-[胞苷脱氨酶]-[napdnabp结构域]-nls-cooh;[1778]nh2-[napdnabp结构域]-[胞苷脱氨酶]-nls-cooh;[1779]nh2-nls-[腺苷脱氨酶]-[napdnabp结构域]-cooh;[1780]nh2-nls[napdnabp结构域]-[腺苷脱氨酶]-cooh;[1781]nh2-[腺苷脱氨酶]-[napdnabp结构域]-nls-cooh;[1782]nh2-[napdnabp结构域]-[腺苷脱氨酶]-nls-cooh;[1783]nh2-nls-[胞苷脱氨酶]-[napdnabp结构域]-[腺苷脱氨酶]-cooh;[1784]nh2-nls-[腺苷脱氨酶]-[napdnabp结构域]-[胞苷脱氨酶]-cooh;[1785]nh2-nls-[腺苷脱氨酶][胞苷脱氨酶]-[napdnabp结构域]-cooh;[1786]nh2-nls-[胞苷脱氨酶]-[腺苷脱氨酶]-[napdnabp结构域]-cooh;[1787]nh2-nls-[napdnabp结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-cooh;[1788]nh2-nls-[napdnabp结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-cooh;[1789]nh2-[胞苷脱氨酶]-[napdnabp结构域]-[腺苷脱氨酶]-nls-cooh;[1790]nh2-[腺苷脱氨酶]-[napdnabp结构域]-[胞苷脱氨酶]-nls-cooh;[1791]nh2-[腺苷脱氨酶][胞苷脱氨酶]-[napdnabp结构域]-nls-cooh;[1792]nh2-[胞苷脱氨酶]-[腺苷脱氨酶]-[napdnabp结构域]-nls-cooh;[1793]nh2-[napdnabp结构域]-[腺苷脱氨酶]-[胞苷脱氨酶]-nls-cooh;或[1794]nh2-[napdnabp结构域]-[胞苷脱氨酶]-[腺苷脱氨酶]-nls-cooh。在一些实施方案中,nls存在于连接子内,或nls位于连接子侧翼,例如,如本文所述。二分体nls包含两个碱性氨基酸簇,它们通过相对短的间隔序列分隔(因此二分体-2个部分,而单分体nls则不然)。核质蛋白的nls,kr[paatkkagqa]kkkk,是无处不在的二分体信号的原型:两个碱性氨基酸的簇,通过约10个氨基酸的间隔序列分隔。示例性二分体nls的序列如下:[1795]pkkkrkvegadkrtadgsefespkkkrkv[1796]可使用编码包含一个或多个核定位序列(nls)的crispr酶的载体。例如,可使用(约)1、2、3、4、5、6、7、8、9、10个nls。crispr酶可包含在氨基端处或氨基酸附近的nls,在羧基端处或羧基端附件的约或超过约1、2、3、4、5、6、7、8、9、10个nls,或其任意组合(例如,在氨基酸的一个或多个nls以及在羧基端的一个或多个nls)。当存在超过一个nls时,各自可彼此独立地选择,使得单一nls可存在于超过一个拷贝内且/或与一个或多个拷贝中的一个或多个其他nls组合。[1797]该方法中使用的crispr酶可包含约6个nls。当最接近nls的氨基酸沿着从n端到c端在多肽链的约50个氨基酸内(例如,在1、2、3、4、5、10、15、20、25、30、40或50个氨基酸内)时,则该nls视为接近n端或c端。[1798]额外结构域[1799]本文所述的碱基编辑器可包括任何有助于促进核碱基编辑、多核苷酸的核碱基修饰或改变的结构域。在一些实施方案中,碱基编辑器包含多核苷酸可编程核苷酸结合结构域(例如,cas9)、核碱基编辑结构域(例如,脱氨酶结构域)和一个或多个额外结构域。在一些实施方案中,额外结构域可促进碱基编辑器的酶促和催化功能、碱基编辑器的结合功能,或可以是将会干扰所希望的碱基编辑结果的细胞机构(例如,酶)的抑制剂。在一些实施方案中,碱基编辑器可包含核酸酶i、切口酶、重组酶、脱氨酶、甲基转移酶、甲基化酶、乙酰化酶、乙酰转移酶、转录激活因子或转录抑制因子结构域。[1800]在一些实施方案中,碱基编辑器可包含尿嘧啶糖基化酶抑制剂(ugi)结构域。在一些实施方案中,响应u:g异源双链dna的存在的细胞dna修复可能对细胞中核碱基编辑效率的降低负责。在此类实施方案中,尿嘧啶dna糖基化酶(udg)可催化u从细胞中的dna移除,这可能启动碱基切除修复(ber),主要导致u:g对逆转为c:g对。在此类实施方案中,ber可以在包含一个或多个结构域的碱基编辑器中被抑制,这些结构域结合单链,阻断被编辑的碱基,抑制ugi,抑制ber,包含被编辑的碱基,和/或促进对未被编辑的链的修复。因此,本公开设想包含ugi结构域的碱基编辑器融合蛋白。[1801]在一些实施方案中,碱基编辑器包含双链断裂(dsb)结合蛋白的全部或一部分作为结构域。例如,dsb结合蛋白可包括细菌噬菌体μ的gam蛋白,其结合至dsb的末端并且可保护它们免于降解。参见komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其整体内容通过引用并入本文。[1802]此外,在一些实施方案中,gam蛋白可以融合至碱基编辑器的n端。在一些实施方案中,gam蛋白可以融合至碱基编辑器的c端。细菌噬菌体μ的gam蛋白可以结合至双链断裂(dsb)的末端并保护它们免于降解。在一些实施方案中,使用gam结合dsb的游离末端可以减少碱基编辑器期间的插入缺失的形成。在一些实施方案中,将174个残基的gam蛋白融合至碱基编辑器的n端。参见komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)。在一些实施方案中,一个或多个突变可相对于野生型结构域改变碱基编辑器结构域的长度。例如,在至少一个结构域中至少一个氨基酸的缺失可以减少碱基编辑器的长度。在另一种情况下,一个或多个突变相对于野生型结构域不改变结构域的长度。例如,在任何结构域中的置换不改变碱基编辑器的长度。[1803]其中全部结构域的长度均与野生型结构域相同的此类碱基编辑器的非限制性示例包括:[1804]nh2-[核碱基编辑结构域]-连接子1-[apobec1]-连接子2-[核碱基编辑结构域]-cooh;[1805]nh2-[核碱基编辑结构域]-连接子1-[apobec1]-[核碱基编辑结构域]-cooh;[1806]nh2-[核碱基编辑结构域]-[apobec1]-连接子2-[核碱基编辑结构域]-cooh;[1807]nh2-[核碱基编辑结构域]-[apobec1]-[核碱基编辑结构域]-cooh;[1808]nh2-[核碱基编辑结构域]-连接子1-[apobec1]-连接子2-[核碱基编辑结构域]-[ugi]-cooh;[1809]nh2-[核碱基编辑结构域]-连接子1-[apobec1]-[核碱基编辑结构域]-[ugi]-cooh;[1810]nh2-[核碱基编辑结构域]-[apobec1]-连接子2-[核碱基编辑结构域]-[ugi]-cooh;[1811]nh2-[核碱基编辑结构域]-[apobec1]-[核碱基编辑结构域]-[ugi]-cooh;[1812]nh2-[ugi]-[核碱基编辑结构域]-连接子1-[apobec1]-连接子2-[核碱基编辑结构域]-cooh;[1813]nh2-[ugi]-[核碱基编辑结构域]-连接子1-[apobec1]-[核碱基编辑结构域]-cooh;[1814]nh2-[ugi]-[核碱基编辑结构域]-[apobec1]-连接子2-[核碱基编辑结构域]-cooh;或[1815]nh2-[ugi]-[核碱基编辑结构域]-[apobec1]-[核碱基编辑结构域]-cooh。[1816]碱基编辑器系统[1817]本文提供使用碱基编辑器系统来编辑核碱基的系统、组合物和方法。在一些实施方案中,碱基电击器系统包含碱基编辑器(be),该be包含(1)多核苷酸可编程核苷酸结合结构域和用于编辑核碱基的核碱基编辑结构域(例如,脱氨酶结构域),和(2)与该多核苷酸可编程核苷酸结合结构域协同作用的向导多核苷酸(例如,向导rna)。在一些实施方案中,碱基编辑器系统是胞苷碱基编辑器(cbe)。在一些实施方案中,碱基编辑器系统是腺苷碱基编辑器(abe)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶结构域可以是胞苷脱氨酶或胞嘧啶脱氨酶。在一些实施方案中,脱氨酶结构域可以是腺嘌呤脱氨酶或腺苷脱氨酶。在一些实施方案中,腺苷碱基编辑器可以将dna中的腺嘌呤脱氨基。在一些实施方案中,碱基编辑器能够将dna内的胞苷脱氨基。[1818]在一些实施方案中本文所提供的碱基编辑系统提供新的基因组编辑途径,其使用含有催化缺陷型酿脓链球菌cas9、脱氨酶(例如,胞苷或腺苷脱氨酶)、碱基切除修复抑制剂的融合蛋白来诱导dna中的可编程单核苷酸(c→t或a→g)变化而不生成双链dna断裂,不修复供体dna模板,并且不诱导过量的随机插入和缺失。[1819]核碱基编辑蛋白的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用以其整体并入本文。也参见komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);和komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其整体内容通过引用并入本文。[1820]本文所提供的碱基编辑器系统的使用包括以下步骤:(a)使受试者的多核苷酸的靶标核苷酸序列(例如,双链或单链dna或rna)与包含核碱基编辑器(例如,腺苷碱基编辑器或胞苷碱基编辑器)和向导多核酸(例如,grna)的碱基编辑器系统接触,其中靶标核苷酸序列包含被靶向的核碱基对;(b)诱导所述靶标区的链分离;(c)将所述靶标区的单链中的靶标核碱基对的第一核碱基转变为第二核碱基;以及(d)切断所述靶标区的不超过一条链,其中与第一核碱基互补的第三核碱基被替换为与第二核碱基的第四核碱基。应了解,在一些实施方案中,省略了步骤(b)。在一些实施方案中,所述靶向的核碱基对是一个或多个基因中的多个核碱基对。在一些实施方案中,本文所提供的碱基编辑器系统能够对一个或多个基因中的多个核碱基对进行多重编辑。在一些实施方案中,该多个核碱基对位于同一基因内。在一些实施方案中,该多个核碱基对位于一个或多个基因内,其中至少一个基因位于不同的基因座中。[1821]在一些实施方案中,被切断的单链(切口链)杂交至向导核酸。在一些实施方案中,被切断的单链与包含第一核碱基的链相对。在一些实施方案中,碱基编辑器包含cas9结构域。在一些实施方案中,第一碱基是腺嘌呤,且第二碱基不是g、c、a或t。在一些实施方案中,第二碱基是肌苷。[1822]在一些实施方案中,可利用单向导多核苷酸将脱氨酶靶向至靶标核酸序列。在一些实施方案中,可利用一对向导多核苷酸将不同的脱氨酶靶向至靶标核酸序列。[1823]碱基编辑器系统核碱基组分和多核苷酸可编程核苷酸结合组分可以共价地或非共价地彼此缔合。例如,在一些实施方案中,脱氨酶结构域可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可融合或链接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可通过与脱氨酶结构域非共价地相互作用或缔合而将脱氨酶结构域靶向至靶标核苷酸序列。例如,在一些实施方案中,核碱基编辑组分,例如,脱氨酶组分可包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合至向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合至多肽连接子。在一些实施方案中,额外的异源部分可能能够结合至多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[1824]碱基编辑器系统可进一步包含向导多核苷酸组分。应了解,碱基编辑器系统的组分可以经由共价键、非共价相互作用、或其缔合和相互作用的任意组合彼此缔合。在一些实施方案中,脱氨结构域可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组分,例如脱氨酶组分,可包含额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外的异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可融合或链接至脱氨酶结构域。在一些实施方案中,额外的异源部分可能能够与多肽结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合至向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合至多肽连接子。在一些实施方案中,额外的异源部分可能能够结合至多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[1825]在一些实施方案中,碱基编辑器系统可进一步包含碱基切除修复(ber)的抑制剂组分。应了解,碱基编辑器系统的组分可以经由共价键、非共价相互作用、或其缔合和相互作用的任意组合彼此缔合。ber的抑制剂组分可包含碱基切除修复抑制剂。在一些实施方案中,碱基切除修复的抑制剂可以是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,碱基切除修复的抑制剂可以是肌苷碱基切除修复抑制剂。在一些实施方案中,碱基切除修复的抑制剂可以通过多核苷酸可编程核苷酸结合结构域被靶向至靶标核苷酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可融合或链接至碱基切除修复的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可融合或链接至脱氨酶结构域和碱基切除修复的抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可通过与碱基切除修复的抑制剂非共价地相互作用或缔合而将碱基切除修复的抑制剂靶向至靶标核苷酸序列。例如,在一些实施方案中,碱基切除修复的抑制剂组分可包含额外的异源部分或结构域,该异源部分或结构域能够与作为多核苷酸可编程核苷酸结合结构域的一部分的额外异源部分或结构域相互作用、缔合或形成复合物。在一些实施方案中,碱基切除修复的抑制剂可以通过向导多核苷酸被靶向至靶标核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的碱基切除修复的抑制剂组分,可包含额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白),该额外的异源部分或结构域能够与向导多核苷酸的部分或链段(例如,多核苷酸基序)相互作用、缔合或形成复合物。在一些实施方案中,向导多核苷酸的额外的异源部分或结构域(例如,多核苷酸结合结构域诸如rna或dna结合蛋白)可融合或链接至碱基切除修复的抑制剂。在一些实施方案中,额外的异源部分可能能够与多核苷酸结合、相互作用、缔合或形成复合物。在一些实施方案中,额外的异源部分可能能够结合至向导多核苷酸。在一些实施方案中,额外的异源部分可能能够结合至多肽连接子。在一些实施方案中,额外的异源部分可能能够结合至多核苷酸连接子。额外的异源部分可以是蛋白质结构域。在一些实施方案中,额外的异源部分可以是k同源(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白、或rna识别基序。[1826]在一些实施方案中,碱基编辑器抑制被编辑链的碱基切除修复(ber)。在一些实施方案中,碱基编辑器保护或结合未被编辑的链。在一些实施方案中,碱基编辑器包含ugi活性。在一些实施方案中,碱基编辑器包含无催化活性的肌苷特异性核酸酶。在一些实施方案中,碱基编辑器包含切口酶活性。在一些实施方案中,预期编辑的碱基对在pam位点上游。在一些实施方案中,预期编辑的碱基对在pam位点上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期编辑的碱基对在pam位点下游。在一些实施方案中,预期编辑的碱基对在pam位点下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。[1827]在一些实施方案中,该方法不需要标准(例如,ngg)pam位点。在一些实施方案中,核碱基编辑器包含连接子或间隔序列。在一些实施方案中,连接子或间隔序列是1至25个氨基酸的长度。在一些实施方案中,连接子或间隔序列是5至20个氨基酸的长度。在一些实施方案中,连接子或间隔序列是10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。[1828]在一些实施方案中,本文所提供的碱基编辑融合蛋白需要定位在精确位置处,例如,所定义区(例如,“脱氨基窗口”)内的靶标碱基被放置之处。在一些实施方案中,靶标可以在4个碱基区内。在一些实施方案中,这种所定义的靶标区可以是pam上游约15个碱基。参见komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);和komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其整体内容通过引用并入本文。[1829]在一些实施方案中,靶标区包含靶标窗口,其中靶标窗口包含靶标核碱基对。在一些实施方案中,靶标窗口包含1至10个核苷酸。在一些实施方案中,靶标窗口是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方案中,预期编辑的碱基对在靶标窗口内。在一些实施方案中,靶标窗口包含预期编辑的碱基对。在一些实施方案中,该方法使用本文所提供的任何碱基编辑器执行。在一些实施方案中,靶标窗口是脱氨基窗口。脱氨基窗口可以是定义区,其中碱基编辑器作用于靶标核苷酸并将靶标核苷酸脱氨基。在一些实施方案中,脱氨基窗口在2、3、4、5、6、7、8、9或10个碱基区内。在一些实施方案中,脱氨基窗口是pam上游5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基。[1830]本公开的碱基编辑器可包含任何促进对靶标多核苷酸序列进行编辑的结构域、特征或氨基酸序列。例如,在一些实施方案中,碱基编辑器包含核定位序列(nls)。在一些实施方案中,碱基编辑器的nls定位在脱氨酶结构域与多核苷酸可编程核苷酸结合结构域之间。在一些实施方案中,碱基编辑器的nls定位在多核苷酸可编程核苷酸结合结构域的c端。[1831]可存在于本文所公开的碱基编辑器中的其他示例性特征是定位序列诸如细胞质定位序列、输出序列诸如核输出序列、或其他定位序列,以及可用于融合蛋白的增溶、纯化或检测的序列标签。本文所提供的合适的蛋白质标签包括但不限于,生物素羧化酶载体蛋白(bccp)标签、myc-标签、钙调蛋白-标签、flag-标签、血细胞凝集素(ha)-标签、聚组氨酸标签(也称为组氨酸标签或his-标签)、麦芽糖结合蛋白(mbp)-标签、nus-标签、谷胱甘肽-s-转移酶(gst)-标签、绿色荧光蛋白(gfp)-标签、硫氧还蛋白-标签、s-标签、softag(例如,softag1、softag3)、strep-标签、生物素连接酶标签、flash标签、v5标签和sbp-标签。其他合适的序列对于本领域技术人员将是显而易见的。在一些实施方案中,融合蛋白包含一个或多个his标签。[1832]在一些实施方案中,非限制性的示例性胞苷碱基编辑器(cbe)包括be1(apobec1-xten-dcas9)、be2(apobec1-xten-dcas9-ugi)、be3(apobec1-xten-dcas9(a840h)-ugi)、be3-gam、sabe3、sabe4-gam、be4、be4-gam、sabe4或sab4e-gam。be4将apobec1-cas9n(d10a)连接子延长至32个氨基酸并将cas9n-ugi连接子延长至9个氨基酸,并且将第二个ugi拷贝追加至该构建体的c端,其中另一个9个氨基酸的连接子并入单一碱基编辑器构建体内。碱基编辑器sabe3和sabe4中,酿脓链球菌cas9n(d10a)被替换为较小的金黄色葡萄球菌cas9n(d10a)。be3-gam、sabe3-gam、be4-gam和sabe4-gam中,gam蛋白的174个残基经由该16个氨基酸的xten连接子融合至n-terminusofbe3、sabe3、be4和sabe4的n端。[1833]在一些实施方案中,腺苷碱基编辑器(abe)可以将dna中的腺嘌呤脱氨基。在一些实施方案中,通过将be3的apobec1组分替换为天然的或工程化的大肠杆菌tada、人类adar2、小鼠ada或人类adat2,生成了abe。在一些实施方案中,abe包含进化的ada变体。在一些实施方案中,abe是abe1.2(tada*-xten-ncas9-nls)。在一些实施方案中,tada*包含a106v和d108n突变。[1834]在一些实施方案中,abe是第二代abe。在一些实施方案中,abe是abe2.1,其包含tada*中的额外突变d147y和e155v(tada*2.1)。在一些实施方案中,abe是abe2.2,其中abe2.1融合至无催化活性形式的人类烷基腺苷dna糖基化酶(具有e125q突变的aag)。在一些实施方案中,abe是abe2.3,其中abe2.1融合至无催化活性形式的大肠杆菌endov(通过d35a突变失活)。在一些实施方案中,abe是abe2.6,其具有长度为abe2.1中的连接子两倍的连接子(32个氨基酸,(sggs)2-xten-(sggs)2)。在一些实施方案中,abe是abe2.7,它是与额外的野生型tada单体系结的abe2.1。在一些实施方案中,abe是abe2.8,它是与额外的tada*2.1单体系结的abe2.1。在一些实施方案中,abe是abe2.9,它是进化的tada(tada*2.1)至abe2.1的n端的直接融合物。在一些实施方案中,abe是abe2.10,它是野生型tada至abe2.1的n端的直接融合物。在一些实施方案中,abe是abe2.11,它是在tada*单体的n端处具有失活e59a突变的abe2.9。在一些实施方案中,abe是abe2.12,它是在内部tada*单体中具有失活e59a突变的abe2.9。[1835]在一些实施方案中,abe是第三代abe。在一些实施方案中,abe是abe3.1,它是具有三个额外的tada突变(l84f、h123y和i156f)的abe2.3。[1836]在一些实施方案中,abe是第四代abe。在一些实施方案中,abe是abe4.3,它是具有额外的tada突变a142n(tada*4.3)的abe3.1。[1837]在一些实施方案中,abe是第五代abe。在一些实施方案中,abe是abe5.1,它通过将来自存活克隆体的共有突变组(h36l、r51l、s146c和k157n)导入abe3.1内而生成的。在一些实施方案中,abe是abe5.3,它具有异二聚构建体,该构建体含有融合自内部进化的tada*的野生型大肠杆菌tada。在一些实施方案中,abe还abe5.2、abe5.4、abe5.5、abe5.6、abe5.7、abe5.8、abe5.9、abe5.10、abe5.11、abe5.12、abe5.13或abe5.14,如下表12中所示。在一些实施方案中,abe是第六代abe。在一些实施方案中,abe是abe6.1、abe6.2、abe6.3、abe6.4、abe6.5或abe6.6,如下表12中所示。在一些实施方案中,abe是第七代abe。在一些实施方案中,abe是abe7.1、abe7.2、abe7.3、abe7.4、abe7.5、abe7.6、abe7.7、abe7.8、abe7.9或abe7.10,如下表12中所示。[1838]表12.abe的基因型[1839][1840]d”)融合的异二聚构建体。在一些实施方案中,abe8是abe8.1-d,其具有含有野生型大肠杆菌tada与具有y147t突变的tada*7.10(tada*8.1)融合的异二聚构建体。在一些实施方案中,abe8是abe8.2-d,其具有含有野生型大肠杆菌tada与具有y147r突变的tada*7.10(tada*8.2)融合的异二聚构建体。在一些实施方案中,abe8是abe8.3-d,其具有含有野生型大肠杆菌tada与具有q154s突变的tada*7.10(tada*8.3)融合的异二聚构建体。在一些实施方案中,abe8是abe8.4-d,其具有含有野生型大肠杆菌tada与具有y123h突变的tada*7.10(tada*8.4)融合的异二聚构建体。在一些实施方案中,abe8是abe8.5-d,其具有含有野生型大肠杆菌tada与具有v82s突变的tada*7.10(tada*8.5)融合的异二聚构建体。在一些实施方案中,abe8是abe8.6-d,其具有含有野生型大肠杆菌tada与具有t166r突变的tada*7.10(tada*8.6)融合的异二聚构建体。在一些实施方案中,abe8是abe8.7-d,其具有含有野生型大肠杆菌tada与具有q154r突变的tada*7.10(tada*8.7)融合的异二聚构建体。在一些实施方案中,abe8是abe8.8-d,其具有含有野生型大肠杆菌tada与具有y147r、q154r和y123h突变的tada*7.10(tada*8.8)融合的异二聚构建体。在一些实施方案中,abe8是abe8.9-d,其具有含有野生型大肠杆菌tada与具有y147r、q154r和i76y突变的tada*7.10(tada*8.9)融合的异二聚构建体。在一些实施方案中,abe8是abe8.10-d,其具有含有野生型大肠杆菌tada与具有y147r、q154r和t166r突变的tada*7.10(tada*8.10)融合的异二聚构建体。在一些实施方案中,abe8是abe8.11-d,其具有含有野生型大肠杆菌tada与具有y147t和q154r突变的tada*7.10(tada*8.11)融合的异二聚构建体。在一些实施方案中,abe8是abe8.12-d,其具有含有野生型大肠杆菌tada与具有y147t和q154s突变的tada*7.10(tada*8.12)融合的异二聚构建体。在一些实施方案中,abe8是abe8.13-d,其具有含有野生型大肠杆菌tada与具有y123h(y123h从h123y恢复而来)、y147r、q154r和i76y突变的tada*7.10(tada*8.13)融合的异二聚构建体。在一些实施方案中,abe8是abe8.14-d,其具有含有野生型大肠杆菌tada与具有i76y和v82s突变的tada*7.10(tada*8.14)融合的异二聚构建体。在一些实施方案中,abe8是abe8.15-d,其具有含有野生型大肠杆菌tada与具有v82s和y147r突变的tada*7.10(tada*8.15)融合的异二聚构建体。在一些实施方案中,abe8是abe8.16-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y恢复而来)和y147r突变的tada*7.10(tada*8.16)融合的异二聚构建体。在一些实施方案中,abe8是abe8.17-d,其具有含有野生型大肠杆菌tada与具有v82s和q154r突变的tada*7.10(tada*8.17)融合的异二聚构建体。在一些实施方案中,abe8是abe8.18-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y恢复而来)和q154r突变的tada*7.10(tada*8.18)融合的异二聚构建体。在一些实施方案中,abe8是abe8.19-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y恢复而来)、y147r和q154r突变的tada*7.10(tada*8.19)融合的异二聚构建体。在一些实施方案中,abe8是abe8.20-d,其具有含有野生型大肠杆菌tada与具有i76y、v82s、y123h(y123h从h123y恢复而来)、y147r和q154r突变的tada*7.10(tada*8.20)融合的异二聚构建体。在一些实施方案中,abe8是abe8.21-d,其具有含有野生型大肠杆菌tada与具有y147r和q154s突变的tada*7.10(tada*8.21)融合的异二聚构建体。在一些实施方案中,abe8是abe8.22-d,其具有含有野生型大肠杆菌tada与具有v82s和q154s突变的tada*7.10(tada*8.22)融合的异二聚构建体。在一些实施方案中,abe8是abe8.23-d,其具有含有野生型大肠杆菌tada与具有v82s和y123h(y123h从h123y恢复而来)突变的tada*7.10(tada*8.23)融合的异二聚构建体。在一些实施方案中,abe8是abe8.24-d,其具有含有野生型大肠杆菌tada与具有v82s、y123h(y123h从h123y恢复而来)和y147t突变的tada*7.10(tada*8.23)融合的异二聚构建体。[1845]在一些实施方案中,abe8具有含有tada*7.10与tada*8变体融合的异二聚构建体(“abe8.x-7”)。在一些实施方案中,abe8是abe8.1-7,其具有含有具有y147t突变的tada*7.10(tada*8.1)的异二聚构建体。在一些实施方案中,abe8是abe8.2-7,其具有含有具有y147r突变的tada*7.10(tada*8.2)的异二聚构建体。在一些实施方案中,abe8是abe8.3-7,其具有含有具有q154s突变的tada*7.10(tada*8.3)的异二聚构建体。在一些实施方案中,abe8是abe8.4-7,其具有含有具有y123h突变的tada*7.10(tada*8.4)的异二聚构建体。在一些实施方案中,abe8是abe8.5-7,其具有含有具有v82s突变的tada*7.10(tada*8.5)的异二聚构建体。在一些实施方案中,abe8是abe8.6-7,其具有含有具有t166r突变的tada*7.10(tada*8.6)的异二聚构建体。在一些实施方案中,abe8是abe8.7-7,其具有含有具有q154r突变的tada*7.10(tada*8.7)的异二聚构建体。在一些实施方案中,abe8是abe8.8-7,其具有含有tada*7.10与具有y147r、q154r和y123h突变的tada*7.10(tada*8.8)融合的异二聚构建体。在一些实施方案中,abe8是abe8.9-7,其具有含有tada*7.10与具有y147r、q154r和i76y突变的tada*7.10(tada*8.9)融合的异二聚构建体。在一些实施方案中,abe8是abe8.10-7,其具有含有tada*7.10与具有y147r、q154r和t166r突变的tada*7.10(tada*8.10)融合的异二聚构建体。在一些实施方案中,abe8是abe8.11-7,其具有含有tada*7.10与具有y147t和q154r突变的tada*7.10(tada*8.11)融合的异二聚构建体。在一些实施方案中,abe8是abe8.12-7,其具有含有tada*7.10与具有y147t和q154s突变的tada*7.10(tada*8.12)融合的异二聚构建体。在一些实施方案中,abe8是abe8.13-7,其具有含有tada*7.10与具有y123h(y123h从h123y恢复而来)、y147r、q154r和i76y突变的tada*7.10(tada*8.13)融合的异二聚构建体。在一些实施方案中,abe8是abe8.14-7,其具有含有tada*7.10与具有i76y和v82s突变的tada*7.10(tada*8.14)融合的异二聚构建体。在一些实施方案中,abe8是abe8.15-7,其具有含有tada*7.10与具有v82s和y147r突变的tada*7.10(tada*8.15)融合的异二聚构建体。在一些实施方案中,abe8是abe8.16-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y恢复而来)和y147r突变的tada*7.10(tada*8.16)融合的异二聚构建体。在一些实施方案中,abe8是abe8.17-7,其具有含有tada*7.10与具有v82s和q154r突变的tada*7.10(tada*8.17)融合的异二聚构建体。在一些实施方案中,abe8是abe8.18-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y恢复而来)和q154r突变的tada*7.10(tada*8.18)融合的异二聚构建体。在一些实施方案中,abe8是abe8.19-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y恢复而来)、y147r和q154r突变的tada*7.10(tada*8.19)融合的异二聚构建体。在一些实施方案中,abe8是abe8.20-7,其具有含有tada*7.10与具有i76y、v82s、y123h(y123h从h123y恢复而来)、y147r和q154r突变的tada*7.10(tada*8.20)融合的异二聚构建体。在一些实施方案中,abe8是abe8.21-7,其具有含有tada*7.10与具有y147r和q154s突变的tada*7.10(tada*8.21)融合的异二聚构建体。在一些实施方案中,abe8是abe8.22-7,其具有含有tada*7.10与具有v82s和q154s突变的tada*7.10(tada*8.22)融合的异二聚构建体。在一些实施方案中,abe8是abe8.23-7,其具有含有tada*7.10与具有v82s和y123h(y123h从h123y恢复而来)突变的tada*7.10(tada*8.23)融合的异二聚构建体。在一些实施方案中,abe8是abe8.24-7,其具有含有tada*7.10与具有v82s、y123h(y123h从h123y恢复而来)和y147t突变的tada*7.10(tada*8.24)融合的异二聚构建体。[1846]在一些实施方案中,abe是abe8.1-m、abe8.2-m、abe8.3-m、abe8.4-m、abe8.5-m、abe8.6-m、abe8.7-m、abe8.8-m、abe8.9-m、abe8.10-m、abe8.11-m、abe8.12-m、abe8.13-m、abe8.14-m、abe8.15-m、abe8.16-m、abe8.17-m、abe8.18-m、abe8.19-m、abe8.20-m、abe8.21-m、abe8.22-m、abe8.23-m、abe8.24-m、abe8.1-d、abe8.2-d、abe8.3-d、abe8.4-d、abe8.5-d、abe8.6-d、abe8.7-d、abe8.8-d、abe8.9-d、abe8.10-d、abe8.11-d、abe8.12-d、abe8.13-d、abe8.14-d、abe8.15-d、abe8.16-d、abe8.17-d、abe8.18-d、abe8.19-d、abe8.20-d、abe8.21-d、abe8.22-d、abe8.23-d或abe8.24-d,如下表13中所示。[1847]表13:腺苷脱氨酶碱基编辑器8(abe8)变体[1848][1849][1850]在一些实施方案中,abe8是abe8a-m,其具有含有具有r26c、a109s、t111r、d119n、h122n、y147d、f149y、t166i和d167n突变的tada*7.10(tada*8a)的单体构建体。在一些实施方案中,abe8是abe8b-m,其具有含有具有v88a、a109s、t111r、d119n、h122n、f149y、t166i和d167n突变的tada*7.10(tada*8b)的单体构建体。在一些实施方案中,abe8是abe8c-m,其具有含有具有r26c、a109s、t111r、d119n、h122n、f149y、t166i和d167n突变的tada*7.10(tada*8c)的单体构建体。在一些实施方案中,abe8是abe8d-m,其具有含有具有v88a、t111r、d119n和f149y突变的tada*7.10(tada*8d)的单体构建体。在一些实施方案中,abe8是abe8e-m,其具有含有具有a109s、t111r、d119n、h122n、y147d、f149y、t166i和d167n突变的tada*7.10(tada*8e)的单体构建体。[1851]在一些实施方案中,abe8是abe8a-d,其具有含有野生型大肠杆菌tada与具有r26c、a109s、t111r、d119、h122n、y147d、f149y、t166i和d167n突变的tada*7.10(tada*8a)融合的异二聚构建体。在一些实施方案中,abe8是abe8b-d,其具有含有野生型大肠杆菌tada与具有v88a、a109s、t111r、d119n、h122n、f149y、t166i和d167n突变的tada*7.10(tada*8b)融合的异二聚构建体。在一些实施方案中,abe8是abe8c-d,其具有含有野生型大肠杆菌tada与具有r26c、a109s、t111r、d119n、h122n、f149y、t166i和d167n突变的tada*7.10(tada*8c)融合的异二聚构建体。在一些实施方案中,abe8是abe8d-d,其具有含有野生型大肠杆菌tada与具有v88a、t111r、d119n和f149y突变的tada*7.10(tada*8d)融合的异二聚构建体。在一些实施方案中,abe8是abe8e-d,其具有含有野生型大肠杆菌tada与具有a109s、t111r、d119n、h122n、y147d、f149y、t166i和d167n突变的tada*7.10(tada*8e)融合的异二聚构建体。[1852]在一些实施方案中,abe8是abe8a-7,其具有含有tada*7.10与具有r26c、a109s、t111r、d119、h122n、y147d、f149y、t166i和d167n突变的tada*7.10(tada*8a)融合的异二聚构建体。在一些实施方案中,abe8是abe8b-7,其具有含有tada*7.10与具有v88a、a109s、t111r、d119n、h122n、f149y、t166i和d167n突变的tada*7.10(tada*8b)融合的异二聚构建体。在一些实施方案中,abe8是abe8c-7,其具有含有tada*7.10与具有r26c、a109s、t111r、d119n、h122n、f149y、t166i和d167n突变的tada*7.10(tada*8c)融合的异二聚构建体。在一些实施方案中,abe8是abe8d-7,其具有含有tada*7.10与具有v88a、t111r、d119n和f149y突变的tada*7.10(tada*8d)融合的异二聚构建体。在一些实施方案中,abe8是abe8e-7,其具有含有tada*7.10与具有a109s、t111r、d119n、h122n、y147d、f149y、t166i和d167n突变的tada*7.10(tada*8e)融合的异二聚构建体。[1853]在一些实施方案中,abe是abe8a-m、abe8b-m、abe8c-m、abe8d-m、abe8e-m、abe8a-d、abe8b-d、abe8c-d、abe8d-d或abe8e-d,如下表14中所示。在一些实施方案中,abe是abe8e-m或abe8e-d。在与除spcas9以外的cas同源物例如sacas9、sacas9-kkh、cas12a同源物(例如,lbcas12a、enas-cas12a、spcas9-ng)和环状排列的cp1028-spcas9和cp1041-spcas9合用时,abe8e显示有效的腺嘌呤碱基编辑活性和低的插入缺失形成。除了表14中针对abe8e显示的突变以外,通过将v106w置换引入tada结构域内,降低了脱靶rna和dna编辑(如m.richter等人,2020,naturebiotechnology,doi.org/10.1038/s41587-020-0453-z中所述,其整体内容通过引用并入本文)。[1854]表14;其他腺苷脱氨酶碱基编辑器8变体[1855][1856]在一些实施方案中,通过将腺苷脱氨酶变体(例如,tada*8)克隆到支架中来生成碱基编辑器(例如,abe8),该支架包括环状排列的cas9(例如,cp5或cp6)和二分体核定位序列。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是ngcpamcp5变体(酿脓链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是agapamcp5变体(酿脓链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是ngcpamcp6变体(酿脓链球菌cas9或spvrqrcas9)。在一些实施方案中,碱基编辑器(例如,abe7.9、abe7.10或abe8)是agapamcp6变体(酿脓链球菌cas9或spvrqrcas9)。[1857]在一些实施方案中,abe具有如下表15中所示的基因型。[1858]表15.abe的基因型[1859]23263637484951728487105108123125142145147152155156157161abe7.9lrlnalnfsvnygncypvfnkabe7.10rrlnalnfsvnygacypvfnk[1860]如下表16中所示,描述了40种abe8的基因型。指出了abe的在进化的大肠杆菌tada部分中的残基位置。当不同于abe7.10突变时,显示了abe8中的突变改变。在一些实施方案中,abe具有如下表16中所示abe中的一个的基因型。[1861]表16.进化的tada中的残基身份[1862][1863][1864]在一些实施方案中,碱基编辑器是abe8.1,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1865]abe8.1_y147t_cp5_ngcpam_单体[1866][1867][1868]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,且加下划线序列表示二分体核定位序列。[1869]在一些实施方案中,碱基编辑器是abe8.1,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1870]pnmg-b335abe8.1_y147t_cp5_ngcpam_单体[1871][1872][1873]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,且加下划线序列表示二分体核定位序列。[1874]在一些实施方案中,碱基编辑器是abe8.14,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1875]具有ngcpamcp5的pnmg-357_abe8.14[1876][1877][1878]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,且加下划线序列表示二分体核定位序列。[1879]在一些实施方案中,碱基编辑器是abe8.8-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1880]abe8.8-m[1881][1882][1883]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1884]在一些实施方案中,碱基编辑器是abe8.8-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1885]abe8.8-d[1886][1887][1888]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1889]在一些实施方案中,碱基编辑器是abe8.13-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1890]abe8.13-m[1891][1892][1893]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1894]在一些实施方案中,碱基编辑器是abe8.13-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1895]abe8.13-d[1896][1897][1898]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1899]在一些实施方案中,碱基编辑器是abe8.17-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1900]abe8.17-m[1901][1902][1903]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1904]在一些实施方案中,碱基编辑器是abe8.17-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1905]abe8.17-d[1906][1907][1908]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1909]在一些实施方案中,碱基编辑器是abe8.20-m,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1910]abe8.20-m[1911][1912][1913]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1914]在一些实施方案中,碱基编辑器是abe8.20-d,其包含以下序列或其具有腺苷脱氨酶活性的片段或基本上由其组成:[1915]abe8.20-d[1916][1917][1918]在上述序列中,纯文本表示腺苷脱氨酶结构域,粗体序列指示源自cas9的序列,斜体序列表示连接子序列,加下划线序列表示二分体核定位序列,且加双下划线序列指示突变。[1919]在一些实施方案中,本发明的abe8选自以下序列:[1920]01.單abe8.1_bpnls+y147t[1921]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1922]02.單abe8.1_bpnls+y147r[1923]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1924]03.單abe8.1_bpnls+q154s[1925]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1926]04.單abe8.1_bpnls+y123h[1927]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1928]05.單abe8.1_bpnls+v82s[1929]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1930]06.單abe8.1_bpnls+t166r[1931]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1932]07.單abe8.1_bpnls+q154r[1933]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1934]08.單abe8.1_bpnls+y147r_q154r_y123h[1935]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1936]09.單abe8.1_bpnls+y147r_q154r_i76y[1937]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1938]10.單abe8.1_bpnls+y147r_q154r_t166r[1939]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcrffrmprrvfnaqkkaqssrdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1940]11.單abe8.1_bpnls+y147t_q154r[1941]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1942]12.單abe8.1_bpnls+y147t_q154s[1943]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallctffrmprsvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1944]13.單abe8.1_bpnls+h123y123h_y147r_q154r_i76y[1945]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlydatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhhpgmnhrveitegiladecaallcrffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1946]14.單abe8.1_bpnls+v82s+q154r[1947]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlystfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprrvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfvsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasarelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkqyrstkevldatlihqsitglyetridlsqlggdegadkrtadgsefespkkkrkv[1948]在一些实施方案中,碱基编辑器是第九代abe(abe9)。在一些实施方案中,abe9含有tada*9变体。abe9碱基编辑器包括腺苷脱氨酶变体,该腺苷脱氨酶变体包含氨基酸序列,该氨基酸序列含有相对于abe7*10参考序列的改变,如本文所述。如表19中所用,术语“单体”是指单体形式的tada*7.10,其包含如表19中所述的改变。如表19中所用,术语“异二聚体”是指所指定野生型大肠杆菌tada腺苷脱氨酶融合至包含表19中所述改变的tada*7.10,如本文所述。abe9碱基编辑器的细节在国际pct申请号pct/2020/049975中描述,其通过引用以其整体并入本文。[1949]表17.腺苷脱氨酶碱基编辑器9(abe9)变体[1950][1951][1952]在一些实施方案中,碱基编辑器是融合蛋白,该融合蛋白包含多核苷酸可编程核苷酸结合结构域(例如,源自cas9的结构域)融合至核碱基编辑结构域(例如,脱氨酶结构域的全部或一部分)。在某些实施方案中,本文所提供的融合蛋白包含一个或多个改善融合蛋白的碱基编辑活性的特征。例如,本文所提供的任何融合蛋白可包含具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文所提供的任何融合蛋白可具有没有核酸酶活性的cas9结构域(dcas9),或切断双螺旋dna分子的一条链的cas9结构域,称为cas9切口酶(ncas9)。[1953]在一些实施方案中,碱基编辑器进一步包含一个结构域,该结构域包含尿嘧啶糖基化酶抑制剂(ugi)的全部或一部分。在一些实施方案中,碱基编辑器包含结构域,该结构域包含尿嘧啶结合蛋白(ubp)诸如尿嘧啶dna糖基化酶(udg)的全部或一部分。在一些实施方案中,碱基编辑器包含结构域,该结构域包含核酸聚合酶的全部或一部分。在一些实施方案中,碱基编辑器可包含核酸聚合酶(nap)的全部或一部分作为结构域。例如,碱基编辑器可包含真核nap的全部或一部分。在一些实施方案中,并入碱基编辑器内的nap或其部分是dna聚合酶。在一些实施方案中,并入碱基编辑器内的nap或其部分具有跨损伤聚合酶活性。在一些实施方案中,并入碱基编辑器内的nap或其部分是跨损伤dna聚合酶。在一些实施方案中,并入碱基编辑器内的nap或其部分是rev7、rev1复合物、聚合酶ι、聚合酶κ或聚合酶η。在一些实施方案中,并入碱基编辑器内的nap或其部分是真核聚合酶α、β、γ、δ、ε、γ、η、ι、κ、λ、μ或ν组分。在一些实施方案中,并入碱基编辑器内的nap或其部分包含氨基酸序列,该氨基酸序列与核酸聚合酶(例如,跨损伤dna聚合酶)至少75%、80%、85%、90%、95%、96%、97%、98%、99%或99.5%相同。在一些实施方案中,并入碱基编辑器内的核酸聚合酶或其部分是跨损伤dna聚合酶。[1954]在一些实施方案中,碱基编辑器的结构域可包含多个结构域。例如,包含源自cas9的多核苷酸可编程核苷酸结合结构域的碱基编辑器可包含对应于野生型或天然cas9的rec叶和nuc叶的rec叶和nuc叶。在另一示例中,碱基编辑器可包含ruvci结构域、bh结构域、rec1结构域、rec2结构域、ruvcii结构域、l1结构域、hnh结构域、l2结构域、ruvciii结构域、wed结构域、topo结构域或ctd结构域中的一者或多者。在一些实施方案中,碱基编辑器的一个或多个结构域包含相对于包含该结构域的野生型版本的多核苷酸的突变(例如,置换、插入、缺失)。例如,多核苷酸可编程dna结合结构域的hnh结构域可包含h840a置换。在另一示例中,多核苷酸可编程dna结合结构域的ruvci结构域可包含d10a置换。[1955]本文所公开的碱基编辑器的不同结构域(例如,相邻结构域)可以使用或不适用一个或多个连接子结构域(例如,xten连接子结构域)彼此连结。在一些实施方案中,连接子结构域可以是键(例如,共价键)、化学基团或分子,其连接两个分子或部分,例如,融合蛋白的两个结构域,例如,第一结构域(例如,源自cas9的结构域)和第二结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)。在一些实施方案中,连接子是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,连接子是酰胺链接的碳氮键。在某些实施方案中,连接子是环状的或非环状的、取代的或未取代的、分支的或不分支的脂肪族或杂脂族连接子。在某些实施方案中,连接子是聚合性的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接子包含氨基烷酸的单体、二聚体、或聚合物。在一些实施方案中,连接子包含氨基烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在一些实施方案中,连接子包含氨基己酸(ahx)的单体、二聚体或聚合物。在某些实施方案中,连接子基于碳环部分(例如,环戊烷、环己烷)。在其他实施方案中,连接子包含聚乙二醇部分(peg)。在某些实施方案中,连接子包含芳基或杂芳基部分。在某些实施方案中,连接子基于苯基环。连接子可包括经功能化的部分以促使来自肽的亲核基团(例如,巯基、氨基)附接至连接子。任何亲电基团可用作连接子的一部分。示例性亲电基团包括但不限于,活化的酯、michael受体、烷基卤化物、芳基卤化物和异硫氰酸酯。在一些实施方案中,连接子接合rna可编程核酸酶的grna接合结构域(包括cas9核酸酶结构域)与核酸编辑蛋白的催化性结构域。在一些实施方案中,连接子接合dcas9与第二结构域(例如,ugi等)。[1956]连接子[1957]在某些实施方案中,连接子可用于连接本发明的任何肽或肽结构域。连接子可以简单到共价键,或者可以是很多个原子长度的聚合性连接子。在某些实施方案中,连接子是肽或基于氨基酸。在其他实施方案中,连接子不是肽样的。在某些实施方案中,连接子是共价键(例如,碳-碳键、二硫键、碳-杂原子键等)。在某些实施方案中,连接子是酰胺链接的碳氮键。在某些实施方案中,连接子是环状的或非环状的、取代的或未取代的、分支的或不分支的脂肪族或杂脂族连接子。在某些实施方案中,连接子是聚合性的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接子包含氨基烷酸的单体、二聚体、或聚合物。在某些实施方案中,连接子包含氨基烷酸(例如,甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)。在某些实施方案中,连接子包含氨基己酸(ahx)的单体、二聚体、或聚合物。在某些实施方案中,连接子基于碳环部分(例如,环戊烷、环己烷)。在其他实施方案中,连接子包含聚乙二醇部分(peg)。在其他实施方案中,连接子包含氨基酸。在某些实施方案中,连接子包含肽。在某些实施方案中,连接子包含芳基或杂芳基部分。在某些实施方案中,连接子基于苯基环。连接子可包括经功能化的部分以促使来自肽的亲核基团(例如,巯基、氨基)附接至连接子。任何亲电基团可用作连接子的一部分。示例性亲电基团包括但不限于,活化的酯、michael受体、烷基卤化物、芳基卤化物和异硫氰酸酯。[1958]典型地,连接子位于两个基团、分子或其他部分之间或连接子侧翼具有两个基团、分子或其他部分,并且彼此经由共价键联接,从而将两者联接。在一些实施方案中,连接子是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接子是有机分子、基团、聚合物或化学部分。在一些实施方案中,连接子是2至100个氨基酸的长度,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30、30至35、35至40、40至45、45至50、50至60、60至70、70至80、80至90、90至100、100至150或150至200个氨基酸的长度。在一些实施方案中,连接子是约3至约104(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100)个氨基酸的长度。也考虑更长或更短的连接子。[1959]在一些实施方案中,本文所提供的任何融合蛋白包含胞苷或腺苷结构域和cas9结构域,这些结构域经由连接子彼此融合。在胞苷或腺苷脱氨酶与cas9结构域之间可采用任何连接子长度和柔性(例如,范围从非常柔性的(gggs)n、(ggggs)n和(g)n形式的连接子到非常刚性的(eaaak)n、(sggs)n、sgsetpgtsesatpes形式的连接子(参见,例如,guilingerjp,等人fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification.nat.biotechnol.2014;32(6):577-82;整体内容通过引用并入本文)和(xp)n),以便实现用于胞苷或腺苷脱氨酶核碱基编辑器活性的最优长度。在一些实施方案中,n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接子包含(ggs)n基序,其中n是1、3或7。在一些实施方案中,本文所提供的任何融合蛋白的胞苷脱氨酶或腺苷脱氨酶和cas9结构域经由包含氨基酸序列sgsetpgtsesatpes的连接子融合,该连接子也称为xten连接子。在一些实施方案中,连接子包含多个脯氨酸残基并且是5至21、5至14、5至9、5至7个氨基酸的长度,例如,papap、papapa、papapap、papapapa、p(ap)4、p(ap)7、p(ap)10(参见,例如,tanj,zhangf,karcherd,bockr.engineeringofhigh-precisionbaseeditorsforsite-specificsinglenucleotidereplacement.natcommun.2019jan25;10(1):439;其整体内容通过引用并入本文)。此类富含脯氨酸的连接子也称为“刚性”连接子。[1960]在另一实施方案中,碱基编辑器系统包含一种组分(蛋白质),其与脱氨酶(dna脱氨酶)例如腺苷或胞苷脱氨酶非共价地相互作用并且将腺苷或胞苷脱氨酶短暂地附着至靶标多核苷酸序列中的靶标核碱基以进行特异性编辑,且旁观者或靶标邻近效应在最低限度或降低。这种包括脱氨酶相互作用蛋白质的非共价系统和方法发挥作用以将dna脱氨酶附着至特定基因组靶标核碱基并将上靶编辑与靶标邻近编辑事件解耦,因此增强对更精确的单碱基置换突变的实现。在一种实施方案中,脱氨酶相互作用蛋白结合至脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)而不阻断或干扰脱氨酶的活性(催化)位点与靶标核碱基(例如,分别为腺苷或胞苷)衔接。诸如名为“magnedit”的系统包括系结至cas9和grna复合物的相互作用蛋白并且可以附着经共表达的腺苷或胞苷脱氨酶(外源性的或内源性的)以编辑特异性基因组靶标位点,并且描述在mccann,j.等人,2020,“magnedit–interactingfactorsthatrecruitdna-editingenzymestosinglebasetargets,”life-science-alliance,vol.3,no.4(e201900606),(doi10.26508/isa.201900606)中,其内容通过引用以其整体并入本文。在一种实施方案中,dna脱氨酶是本文所述的腺苷脱氨酶变体(例如,tada*8)。[1961]在另一实施方案中,被称为“suntag”的系统包括非共价相互作用组分,该组分用于将碱基编辑器的蛋白质(例如腺苷脱氨酶或胞苷脱氨酶)组分或其多个拷贝招募至多核苷酸靶标位点,以实现在该位点处的碱基编辑且邻近靶标编辑减少,例如,如tanenbaum,m.e.等人,“aproteintaggingsystemforsignalamplificationingeneexpressionandfluorescenceimaging,”cell.2014october23;159(3):635–646.doi:10.1016/j.cell.2014.09.039中和huang,y.-h.等人,2017,“dnaepigenomeeditingusingcrispr-cassuntag-directeddnmt3a,”genomebiol18:176.doi:10.1186/s13059-017-1306-z中所述,其各自的内容通过引用以其整体并入本文。在一种实施方案中,dna脱氨酶是本文所述的腺苷脱氨酶变体(例如,tada*8)。[1962]核酸可编程dna结合蛋白与向导rna[1963]本文提供用于在宿主细胞例如免疫细胞(例如,t细胞或nk细胞)中进行碱基编辑的组合物和方法。本文进一步提供组合物,其包含向导多核酸序列,例如,向导rna序列,或本文所提供的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个rna的组合。在一些实施方案中,本文所提供的用于碱基编辑组合物进一步包含编码碱基编辑器例如c碱基编辑器或a碱基编辑器的多核苷酸。例如,用于碱基编辑的组合物可包含编码be、be4、abe的mrna以及所提供的一种或多种向导rna的组合。用于碱基编辑的组合物可包含碱基编辑器多肽以及本文所提供的一种或多种本文所提供的任何向导rna的组合。该组合物可用来通过不同递送途径例如电穿孔、核转染、病毒转导或转染在免疫细胞中实现碱基编辑。在一些实施方案中,用于碱基编辑的组合物包含编码碱基编辑器的mrna以及本文提供的一种或多种向导rna序列的组合用于电穿孔。[1964]本公开的一些方面提供复合物,其包含本文所提供的任何融合蛋白以及结合至融合蛋白的核酸可编程dna结合蛋白(napdnabp)结构域(例如,cas9(例如,dcas9、核酸酶活性cas9、或cas9切口酶)或cas12)的向导rna。这些复合物也称为核糖核蛋白(rnp)。在一些实施方案中,向导核酸(例如,向导rna)具有15至100个核苷酸的长度且包含与靶标序列互补的至少10个连续核苷酸的序列。在一些实施方案中,向导rna的长度是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方案中,向导rna包含与靶标序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的序列。在一些实施方案中,靶标序列是dna序列。在一些实施方案中,靶标序列是rna序列。在一些实施方案中,靶标序列是细菌、酵母、真菌、昆虫、植物或动物基因组中的序列。在一些实施方案中,靶标序列是人类基因组中的序列。在一些实施方案中,靶标序列的3'末端紧邻标准pam序列(ngg)。在一些实施方案中,靶标序列的3'末端紧邻非标准pam序列(例如,表5中所列的序列或5'-naa-3')。在一些实施方案中,向导核酸(例如,向导rna)与感兴趣的基因(例如,与疾病或疾患相关的基因)中的序列互补。[1965]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包含以下的方法:使dna分子与本文所提供的任何融合蛋白接触并且与至少一种向导rna接触,其中向导rna具有约15至100个核苷酸的长度并且包含与靶标序列互补的至少10个连续核苷酸的序列。在一些实施方案中,靶标序列的3'末端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,靶标序列的3'末端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5'(tttv)序列。在一些实施方案中,靶标序列的3'末端紧邻例如ttn、dttn、gttn、attn、attc、dttnt、wttn、haty、tttn、tttv、tttc、tg、rtr或ytnpam位点。[1966]应理解,相应序列中的具体位置或残基的编号取决于特定蛋白质和所使用的编号方案。编号可以不同,例如,在成熟蛋白质的前体和成熟蛋白质本身中,并且来自物种与物种之间的序列差异可能影响编号。本领域技术人员将能够通过本领域周知的方法鉴定任何同源蛋白质中和相应编码核酸中的相应残基,例如,通过序列比对并确定同源残基。[1967]对本领域技术人员将是显而易见的是,为了将本文所公开的任何融合蛋白靶向至靶标位点,例如,包含待编辑的突变的位点,通常必要的是将该融合蛋白与向导rna共表达。如在本文其他处更详细阐述的,向导rna通常包含允许napdnabp(例如,cas9或cas12)与向导序列结合的tracrrna框架,并且该向导序列赋予napdnabp:核酸编辑酶/结构域融合蛋白以特异性。或者,向导rna和tracrrna可以作为两个核酸分子独立地提供。在一些实施方案中,向导rna包含结构,其中向导序列包含与靶标序列互补的序列。向导序列通常是20个核苷酸的长度。基于本公开,适用于将napdnabp:核酸编辑酶/结构域融合蛋白百香之特异性基因组位点的向导rna的序列对于本领域技术人员将是显而易见的。此类合适的向导rna序列通常包含与待编辑的靶标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。一些适用于将所提供的任何融合蛋白靶向至特异性靶标序列的示例性向导rna提供在本文中。[1968]sgrna的不同部分预计会形成与cas9(例如,spycas9)和/或dna靶标相互作用的各种特征。已经在天然的nativecrrna:tracrrna双螺旋和单向导rna(sgrna)中鉴定出六个引导cas9和us安内切酶活性的保守模块(参见,briner等人,guidernafunctionalmodulesdirectcas9activityandorthogonalitymolcell.2014oct23;56(2):333-339)。六个模块包括负责dna靶向的间隔序列、上部茎、凸起、由crispr重复序列:tracrrna双螺旋形成的下部茎、结点、和来自tracrrna的3'末端的发夹圈。上部茎和下部茎主要通过与磷酸酯主链的序列依赖性相互作用与cas9相互作用。在一些实施方案中,上部茎是可有可无的。在一些实施方案中,在下部茎的基部的保守尿嘧啶核苷酸序列是可有可无的。凸起参与到与cas9的rec1结构域的特异性侧链相互作用中。核碱基u44与tyr325和his328的侧链相互作用,而g43与tyr329相互作用。结点形成sgrna:cas9相互作用的核心,并且位于sgrna与cas9和靶标dna两者之间的插入处。核碱基a51和a52与phe1105的侧链相互作用;u56与arg457和asn459相互作用;核碱基u59插入到由arg74、asn77、pro475、leu455、phe446和ile448的侧链定义的疏水袋中;c60与leu455、ala456和asn459相互作用,且c61与arg70的侧链相互通,继而与c15相互作用。在一些实施方案中,这些突变中的一个或多个在用于cas9(例如,spycas9)的sgrna的凸起和/或结点中作出,以优化sgrna:cas9相互作用。[1969]此外,tracrrna结点和发夹圈对于cas9配对至关重要并且可交换以跨越分离不同cas9蛋白的正交屏障,这有利于进一步利用正交cas9蛋白。在一些实施方案中,结点和发夹圈经交换以靶向正交cas9蛋白。在一些实施方案中,sgrna没有上部茎、发夹圈1、和/或下部茎的柔软性,以设计更紧凑且构象稳定的向导rna。在一些实施方案中,模块经修饰以优化使用具有各种嵌合向导的单cas9进行的或通过同时使用具有不同嵌合sgrna的组合的正交系统进行的多重编辑。关于向导功能模块及其方法的细节描述于例如briner等人,guidernafunctionalmodulesdirectcas9activityandorthogonalitymolcell.2014oct23;56(2):333-339中,其内容通过引用以其整体并入本文。[1970]本文所公开的碱基编辑器的机构与可以以任何次序排列。包含融合蛋白(包含例如多核苷酸可编程核苷酸结合结构域(例如,cas9和cas12)和脱氨酶结构域(例如,胞苷或腺苷脱氨酶))的碱基编辑器的非限制性示例可排列如下:[1971]nh2-[核碱基编辑结构域]-连接子1-[核碱基编辑结构域]-cooh;[1972]nh2-[脱氨酶]-连接子1-[核碱基编辑结构域]-cooh;[1973]nh2-[脱氨酶]-连接子1-[核碱基编辑结构域]-连接子2-[ugi]-cooh;[1974]nh2-[脱氨酶]-连接子1-[核碱基编辑结构域]-cooh;[1975]nh2-[腺苷2-[腺苷脱氨酶]-连接子1-[核碱基编辑结构域]-cooh;[1976]nh2-[核碱基编辑结构域]-[脱氨酶]-cooh;[1977]nh2-[脱氨酶]-[核碱基编辑结构域]-[肌苷ber抑制剂]-cooh;[1978]nh2-[脱氨酶]-[肌苷ber抑制剂]-[核碱基编辑结构域]-cooh;[1979]nh2-[肌苷ber抑制剂]-[脱氨酶]-[核碱基编辑结构域]-cooh;[1980]nh2-[核碱基编辑结构域]-[脱氨酶]-[肌苷ber抑制剂]-cooh;[1981]nh2-[核碱基编辑结构域]-[肌苷ber抑制剂]-[脱氨酶]-cooh;[1982]nh2-[肌苷ber抑制剂]-[核碱基编辑结构域]-[脱氨酶]-cooh;[1983]nh2-[核碱基编辑结构域]-连接子1-[脱氨酶]-连接子2-[核碱基编辑结构域]-cooh;[1984]nh2-[核碱基编辑结构域]-连接子1-[脱氨酶]-[核碱基编辑结构域]-cooh;[1985]nh2-[核碱基编辑结构域]-[脱氨酶]-连接子2-[核碱基编辑结构域]-cooh;[1986]nh2-[核碱基编辑结构域]-[脱氨酶]-[核碱基编辑结构域]-cooh;[1987]nh2-[核碱基编辑结构域]-连接子1-[脱氨酶]-连接子2-[核碱基编辑结构域]-[肌苷ber抑制剂]-cooh;[1988]nh2-[核碱基编辑结构域]-连接子1-[脱氨酶]-[核碱基编辑结构域]-[肌苷ber抑制剂]-cooh;[1989]nh2-[核碱基编辑结构域]-[脱氨酶]-连接子2-[核碱基编辑结构域]-[肌苷ber抑制剂]-cooh;[1990]nh2-[核碱基编辑结构域]-[脱氨酶]-[核碱基编辑结构域]-[肌苷ber抑制剂]-cooh;[1991]nh2-[肌苷ber抑制剂]-[核碱基编辑结构域]-连接子1-[脱氨酶]-连接子2-[核碱基编辑结构域]-cooh;[1992]nh2-[肌苷ber抑制剂]-[核碱基编辑结构域]-连接子1-[脱氨酶]-[核碱基编辑结构域]-cooh;[1993]nh2-[肌苷ber抑制剂]-[核碱基编辑结构域]-[脱氨酶]-连接子2-[核碱基编辑结构域]-cooh;或[1994]nh2-[肌苷ber抑制剂]nh2-[核碱基编辑结构域]-[脱氨酶]-[核碱基编辑结构域]-cooh。[1995]在一些实施方案中,本文所提供的碱基编辑融合蛋白需要定位在精确位置处,例如,所定义区(例如,“脱氨基窗口”)内的靶标碱基被放置之处。在一些实施方案中,靶标可以在4个碱基区内。在一些实施方案中,这种所定义的靶标区可以是pam上游约15个碱基。参见komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);和komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其整体内容通过引用并入本文。[1996]定义的靶标区可以是脱氨基窗口。脱氨基窗口可以是定义区,其中碱基编辑器作用于靶标核苷酸并将靶标核苷酸脱氨基。在一些实施方案中,脱氨基窗口在2、3、4、5、6、7、8、9或10个碱基区内。在一些实施方案中,脱氨基窗口是pam上游5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个碱基。[1997]本公开的碱基编辑器可包含任何促进对靶标多核苷酸序列进行编辑的结构域、特征或氨基酸序列。例如,在一些实施方案中,碱基编辑器包含核定位序列(nls)。在一些实施方案中,碱基编辑器的nls定位在脱氨酶结构域与napdnabp之间。在一些实施方案中,碱基编辑器的nls定位在napdnabp的c端。[1998]可包括在融合蛋白中的蛋白质结构域的非限制性示例包括脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)、尿嘧啶糖基化酶抑制剂(ugi)结构域、表位标签、受体基因序列和/或具有以下一种或多种活性的蛋白质结构域:甲基化酶活性、去甲基酶活性、转录活化活性、转录抑制活性、转录释放因子活性、基因沉默活性、染色质修饰活性、表观遗传修饰活性、组蛋白修饰活性、rna裂解活性和核酸结合活性。另外的结构域恶意是异源功能性结构域。此类异源功能性结构域可赋予功能活性,诸如与靶标dna缔合的靶标多肽(例如,组蛋白、dna结合蛋白等)的修饰,导致例如组蛋白甲基化、组蛋白乙酰化、组蛋白泛素化等。所赋予的其他功能和/或活性可包括转座酶活性、整合酶活性、重组酶活性、连接酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、磺酰化活性、去磺酰化活性或上述的任意组合。[1999]所赋予的其他功能可包括甲基转移酶活性、去甲基酶活性、脱氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光解酶活性或糖基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去腺苷酸化活性、磺酰化活性、去磺酰化活性、核糖基化活性、脱核糖基化活性、肉豆蔻酰化活性、重塑活性、蛋白酶活性、氧化还原酶活性、转移酶活性、水解酶活性、裂解酶活性、异构酶活性、合酶活性、合成酶活性和脱肉豆蔻酰化活性,或其任意组合。[2000]结构域可以经检测或使用表位标签、受体蛋白、其他结合结构域标记。表位标签的非限制性示例包括组氨酸(his)标签、v5标签、flag标签、流感血凝素(ha)标签、myc标签、vsv-g标签和硫氧还蛋白(trx)标签。受体基因的示例包括但不限于,谷胱甘肽-5-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(gfp)、hcred、dsred、青色荧光蛋白(cfp)、黄色荧光蛋白(yfp)、和包括蓝色荧光蛋白(bfp)在内的自发荧光蛋白。另外的蛋白质序列可包括氨基酸序列,其结合dna分子或结合其他细胞分子,包括但不限于,麦芽糖结合蛋白(mbp)、s-tag、lexadna结合结构域(dbd)融合物、gal4dna结合结构域融合物、和单纯疱疹病毒(hsv)bp16蛋白融合物。[2001]使用包含胞苷或腺苷脱氨酶和cas9结构域的融合蛋白的方法[2002]本公开的一些方面提供使用本文所提供的融合蛋白或复合物的方法。例如,本公开的一些方面提供包含以下的方法:使dna分子与本文所提供的任何融合蛋白接触并且与至少一种向导rna接触,其中向导rna具有约15至100个核苷酸的长度并且包含与靶标序列互补的至少10个连续核苷酸的序列。在一些实施方案中,靶标序列的3'末端紧邻标准pam序列(ngg)。在一些实施方案中,靶标序列的3'末端不紧邻标准pam序列(ngg)。在一些实施方案中,靶标序列的3'末端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,靶标序列的3'末端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5'(tttv)序列。[2003]在一些实施方案中,本发明的融合蛋白用于诱变感兴趣的靶标。特别地,本文所述的胞苷脱氨酶或腺苷脱氨酶核碱基编辑器能够在靶标序列内作出多个突变。这些突变可能影响靶标的功能。例如,当使用胞苷脱氨酶或腺苷脱氨酶核碱基编辑器来靶向调节区时,该调节区的功能被改变并且下游蛋白的表达被减少或消除。[2004]应理解,相应序列中的具体位置或残基的编号取决于特定蛋白质和所使用的编号方案。编号可以是不同的,例如,在成熟蛋白质的前体和成熟蛋白质本身中,并且来自物种与物种之间的序列差异可能影响编号。本领域技术人员将能够通过本领域周知的方法鉴定任何同源蛋白质中和相应编码核酸中的相应残基,例如,通过序列比对并确定同源残基。[2005]对本领域技术人员将是显而易见的是,为了将如本文所公开的任何包含cas9结构域和胞苷或腺苷脱氨酶融合蛋白靶向至靶标位点,例如,包含待编辑的突变的位点,通常必要的是将该融合蛋白与向导rna例如sgrna共表达。如在本文其他处更详细阐述的,向导rna通常包含允许cas9与向导序列结合的tracrrna框架,并且该向导序列赋予cas9:核酸编辑酶/结构域融合蛋白以特异性。或者,向导rna和tracrrna可以作为两个核酸分子独立地提供。在一些实施方案中,向导rna包含结构,其中向导序列包含与靶标序列互补的序列。向导序列通常是20个核苷酸的长度。基于本公开,适用于将cas9:核酸编辑酶/结构域融合蛋白百香之特异性基因组位点的向导rna的序列对于本领域技术人员将是显而易见的。此类合适的向导rna序列通常包含与待编辑的靶标核苷酸上游或下游50个核苷酸内的核酸序列互补的向导序列。一些适用于将所提供的任何融合蛋白靶向至特异性靶标序列的示例性向导rna提供在本文中。[2006]碱基编辑器效率[2007]在一些实施方案中,本文所提供的方法的目的是经由基因标记中断基因产物的正常功能。本文所提供的核碱基编辑蛋白质可以在体外用于基于基因编辑的人类疗法。本领域技术人员将理解,本文所提供的核碱基编辑蛋白,例如,包含多核苷酸可编程核苷酸结合结构域(例如,cas9)和核碱基编辑结构域(例如,腺苷脱氨酶结构域和胞苷脱氨酶结构域)的融合蛋白可用来进行a到g或c到t的核苷酸编辑。[2008]crispr-cas9核酸酶已经广泛用于介导靶向基因组编辑。在大多数基因组编辑应用中,cas9与向导多核苷酸(例如,单向导(sgrna))形成复合物并在该sgrna序列特异性的靶标位点处诱导双链dna断裂(dsb)。细胞主要通过非同源性末端接合(nhej)修复途径对这一dsb作出应答,这导致随机插入或缺失(插入缺失),可造成移码突变,从而中断该基因。在具有与dsb侧翼序列具有高度同源性的供体dna模板的存在下,可通过称为同源定向修复(hdr)的替代性途径实现基因校正。不幸的是,在大多数非微扰条件下,hdr是无效的,取决于细胞状态和细胞类型,且更高频率的插入缺失占据优势。由于大多数已知的与人类疾病相关的基因变异是点突变,需要可能更有效且干净地作出精确点突变的方法。本文所提供的碱基编辑系统提供一种新的方式来提供基因组编辑而不生成双链dna断裂,无需供体dna目标,并且不会诱导过量的随机插入和缺失。[2009]在一些实施方案中,本公开提供碱基编辑器,该碱基编辑器有效地在核酸(例如,受试者基因组内的核酸)中生成“期望突变”诸如stop密码子,而不生成大量的非期望突变诸如非期望的点突变。在一些实施方案中,期望突变是通过结合至向导多核苷酸(例如,grna)的经专门设计以生成期望突变的特异性碱基编辑器(例如,腺苷碱基编辑器或胞苷碱基编辑器)生成的突变。在一些实施方案中,预期突变是在与疾病或疾患(例如,t细胞或nk细胞恶性病变)相关靶标抗原缔合的基因内。在一些实施方案中,预期突变是在与疾病或疾患(例如,t细胞或nk细胞恶性病变)相关靶标抗原缔合的基因内的腺嘌呤(a)到鸟嘌呤(g)点突变(例如,snp)。在一些实施方案中,预期突变是基因的编码区或非编码区(例如,调节区或元件)内的腺嘌呤(a)到鸟嘌呤(g)点突变。在一些实施方案中,预期突变是在与疾病或疾患(例如,t细胞或nk细胞恶性病变)相关靶标抗原缔合的基因内的胞嘧啶(c)到胸腺嘧啶(t)点突变(例如,snp)。在一些实施方案中,预期突变是基因的编码区或非编码区(例如,调节区或元件)内的胞嘧啶(c)到胸腺嘧啶(t)点突变。在一些实施方案中,预期突变是点突变,其生成stop密码子,例如,基因的编码区内的提前stop密码子。在一些实施方案中,预期突变是消除终止密码子的突变。[2010]本发明的碱基编辑器有利地修饰特异性核苷酸碱基编码蛋白而不生成显著比例的插入缺失。如本文所用,“插入缺失”是指核苷酸在核酸内的插入或缺失。此类插入或缺失可导致基因的编码区内的框移突变。在一些实施方案中,希望生成碱基编辑器,其有效地修饰(例如,突变)核酸内的特异性核苷酸而不在该核酸内生成大量的插入或缺失(即,插入缺失)。在一些实施方案中,希望生成碱基编辑器,其有效地修饰(例如,突变或甲基化)核酸内的特异性核苷酸而不在该核酸内生成大量的插入或缺失(即,插入缺失)。在某些实施方案中,本文所提供的任何碱基编辑器均可生成与插入缺失相比更高比例的预期修饰(例如,甲基化)。在某些实施方案中,本文所提供的任何碱基编辑器均可生成与插入缺失相比更高比例的预期修饰(例如,突变)。[2011]在一些实施方案中,本文所提供的碱基编辑器能够生成大于1:1的预期突变与插入缺失比率(即,预期点突变:非预期点突变)。在一些实施方案中,本文所提供的碱基编辑器能够生成预期突变与插入缺失的比率,该比率为至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少300:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1、或至少1000:1或更高。可使用任何合适的方法确定预期突变和插入缺失的数量。[2012]在一些实施方案中,本文所提供的碱基编辑器可限制插入缺失在核酸区内的形成。在一些实施方案中,该区在被碱基编辑器编辑的核苷酸处或是与被碱基编辑器编辑的核苷酸相距2、3、4、5、6、7、8、9或10和核苷酸内的区。在一些实施方案中,本文所提供的任何碱基编辑器可将核酸区处的插入缺失形成限制为少于1%、少于1.5%、少于2%、少于2.5%、少于3%、少于3.5%、少于4%、少于4.5%、少于5%、少于6%、少于7%、少于8%、少于9%、少于10%、少于12%、少于15%、或少于20%。在核酸区处形成的插入缺失数量可以取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,插入缺失的数量或比例在将核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器中至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天、或至少14天后确定。[2013]本公开的一些方面是基于以下认知:本文所提供的任何碱基编辑器能够有效地在核酸(例如,受试者基因组内的核酸)中生成预期突变而不生成可观数量的非预期突变(例如,谬误的脱靶编辑或旁观者编辑)。在一些实施方案中,预期突变是通过结合至grna的特异性碱基编辑器产生的,该碱基编辑器经专门设计以生成预期突变。在一些实施方案中,预期突变是生成终止密码子的突变,例如,基因的编码区内的提前终止密码子。在一些实施方案中,预期突变是消除终止密码子的突变。在一些实施方案中,预期突变是改变基因剪接的突变。在一些实施方案中,预期突变是改变基因调节序列(例如,基因启动子或基因受体)的突变。在一些实施方案中,本文所提供的任何碱基编辑器能够生成大于1:1的预期突变与非预期比率(例如,预期突变:非预期突变)。在一些实施方案中,本文所提供的任何碱基编辑器能够生成预期突变与非预期突变的比率,该比率为至少1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1、或至少1000:1或更高。应了解,本文所述碱基编辑器的特征可应用于任何融合蛋白或使用本文所提供的融合蛋白的方法。[2014]碱基编辑通常称为“修饰”,诸如基因的修饰、基因修饰和核酸序列的修饰,并且基于修饰是碱基编辑修饰的语境而可以清楚地理解。因此,碱基编辑修饰是核苷酸碱基水平上的修饰,例如,作为本公开通篇所讨论的脱氨酶活性的结果,其随后导致基因序列的改变,并且可以影响基因产物。因此,本质上,本文所述的基因编辑修饰可导致结构上和/或功能上的接引修饰,其中基因产物的表达可以经修饰,例如,该基因的表达被敲除;或反而被增强,或者在一些情况下,基因功能或活性可以经修饰。使用本文所公开的方法,碱基编辑效率可以确定为在其中进行碱基编辑的基因的敲低效率,其中碱基编辑旨在敲低该基因的表达。敲低水平可以通过下列定量验证:通过任何检测测定法确定表达水平,诸如用于例如通过流式细胞术测定蛋白质表达水平的测定法;用于检测rna表达的测定法,诸如定量rt-pcr、北方印迹分析,或任何其他合适的测定法,诸如焦磷酸测序;并且可以通过核苷酸测序反应来定量验证。[2015]在一些实施方案中,修饰,例如,单碱基编辑导致所靶向的基因的表达降低至少10%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少10%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少20%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少30%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少40%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少50%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少60%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少70%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少80%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少90%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少91%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少92%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少93%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少94%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少95%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少96%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少97%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少98%。在一些实施方案中,碱基编辑效率可导致所靶向的基因的表达降低至少99%。在一些实施方案中,碱基编辑效率可导致被靶向的基因的敲除(基因表达的100%敲低)。[2016]在一些实施方案中,本文所提供的任何碱基编辑器系统在靶标多核苷酸序列中导致少于50%、少于40%、少于30%、少于20%、少于19%、少于18%、少于17%、少于16%、少于15%、少于14%、少于13%、少于12%、少于11%、少于10%、少于9%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%、少于1%、少于0.9%、少于0.8%、少于0.7%、少于0.6%、少于0.5%、少于0.4%、少于0.3%、少于0.2%、少于0.1%、少于0.09%、少于0.08%、少于0.07%、少于0.06%、少于0.05%、少于0.04%、少于0.03%、少于0.02%、或少于0.01%的插入缺失形成。[2017]在一些实施方案中,使用靶向修饰例如单碱基编辑同时将用于碱基编辑的至少4、5、6、7、8、9、10、11、1213、14、15、16、17,18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50种不同的内源性序列与不同的向导rna一起靶向。在一些实施方案中,使用靶向修饰例如单碱基编辑依次将用于碱基编辑的至少4、5、6、7、8、9、10、11、1213、14、15、16、17,18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多种不同的内源性基因序列与不同的向导rna一起靶向。[2018]本公开的一些方面是基于以下认知:本文所提供的任何碱基编辑器能够有效地在核酸(例如,受试者基因组内的核酸)中生成预期突变诸如点突变而不生成显著数量的非预期突变诸如非预期点突变(即,旁观者的突变)。在一些实施方案中,本文所提供的任何碱基编辑器能够生成至少0.01%的预期突变(即,至少0.01%的碱基编辑效率)。在一些实施方案中,本文所提供的任何碱基编辑器能够生成至少0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%或99%的插入缺失突变。[2019]在一些实施方案中,本文所述的任何包含abe8碱基编辑器变体的碱基编辑器系统在靶标多核苷酸序列中导致少于50%、少于40%、少于30%、少于20%、少于19%、少于18%、少于17%、少于16%、少于15%、少于14%、少于13%、少于12%、少于11%、少于10%、少于9%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%、少于1%、少于0.9%、少于0.8%、少于0.7%、少于0.6%、少于0.5%、少于0.4%、少于0.3%、少于0.2%、少于0.1%、少于0.09%、少于0.08%、少于0.07%、少于0.06%、少于0.05%、少于0.04%、少于0.03%、少于0.02%、或少于0.01%的插入缺失形成。在一些实施方案中,包含本文所述abe8碱基编辑器变体中的一个的任何碱基编辑器系统在靶标多核苷酸序列中导致少于0.8%的插入缺失形成。在一些实施方案中,包含本文所述abe8碱基编辑器变体中的一个的任何碱基编辑器系统在靶标多核苷酸序列中导致至多0.8%的插入缺失形成。在一些实施方案中,包含本文所述abe8碱基编辑器变体中的一个的任何碱基编辑器系统在靶标多核苷酸序列中导致少于0.3%的插入缺失形成。在一些实施方案中,在靶标多核苷酸序列中导致更低的插入缺失形成。在一些实施方案中,与包含abe7.10的碱基编辑器系统相比,包含本文所述abe8碱基编辑器变体中的一个的任何碱基编辑器系统在靶标多核苷酸序列中导致更低的插入缺失形成。[2020]在一些实施方案中,与包含abe7碱基编辑器中的一个的碱基编辑器系统相比,包含所述abe8碱基编辑器变体中的一个的任何碱基编辑器系统具有降低的插入缺失频率。在一些实施方案中,与包含abe7碱基编辑器中的一个的碱基编辑器系统相比,包含所述abe8碱基编辑器变体中的一个的任何碱基编辑器系统具有降低至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%的插入缺失频率。在一些实施方案中,与包含abe7.10的碱基编辑器系统相比,包含所述abe8碱基编辑器变体中的一个的碱基编辑器系统具有降低至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%的插入缺失频率。[2021]本发明提供腺苷脱氨酶变体(例如,abe8变体),其具有增加的效率和特异性。特别地,本文所述的腺苷脱氨酶变体更可能编辑多核苷酸内的所希望的碱基,并且更不可能编辑不希望被改变的碱基(例如,“旁观者”)。[2022]在一些实施方案中,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低的旁观者编辑或突变。在一些实施方案中,非预期编辑或突变是旁观者突变或旁观者编辑,例如,在靶标核苷酸序列的靶标窗内的非预期或非靶标位置中的靶标碱基(例如,a或c)的碱基编辑。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低的旁观者编辑或突变。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的旁观者编辑或突变。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9、或至少3.0倍的旁观者编辑或突变。[2023]在一些实施方案中,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低的谬误编辑。在一些实施方案中,非预期编辑或突变是谬误突变或谬误编辑,例如,在基因组的非预期或非靶标区内的靶标碱基(例如,a或c)的非特异性编辑或不依赖于向导的编辑。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低的谬误编辑。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的谬误编辑。在一些实施方案中,与包含abe7碱基编辑器例如abe7.10的碱基编辑器系统相比,包含本文所述abe碱基编辑器变体中的一个的任何碱基编辑系统具有降低至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9、或至少3.0倍的谬误编辑。[2024]在一些实施方案中,本文所述的任何abe8碱基编辑器变体的碱基编辑效率为至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%。在一些实施方案中,通过计算细胞群中经编辑的核碱基的百分比来测量碱基编辑效率。在一些实施方案中,本文所述的任何abe8碱基编辑器变体的碱基编辑效率为至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%,如通过细胞群中经编辑的核碱基所测量。[2025]在一些实施方案中,与abe7碱基编辑器相比,本文所述的任何abe8碱基编辑器变体的碱基编辑效率更高。在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器变体的碱基编辑效率高出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%、或至少500%。[2026]在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器变体的碱基编辑效率高出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍、或至少5.0倍。[2027]在一些实施方案中,本文所述的任何abe8碱基编辑器变体的上靶碱基编辑效率为至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%。在一些实施方案中,本文所述的任何abe8碱基编辑器变体的上靶碱基编辑效率为至少0.01%、至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%,如通过细胞群中经编辑的靶标核碱基所测量。[2028]在一些实施方案中,与abe7碱基编辑器相比,本文所述的任何abe8碱基编辑器变体的上靶碱基编辑效率更高。在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器变体的上靶碱基编辑效率高出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%、或至少500%。[2029]在一些实施方案中,与abe7碱基编辑器例如abe7.10相比,本文所述的任何abe8碱基编辑器变体的上靶碱基编辑效率高出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍、或至少5.0倍。[2030]本文所述的abe8碱基编辑器变体可经由质粒、载体、lnp复合物或mrna递送至宿主细胞。在一些实施方案中,本文所述的任何abe8碱基编辑器变体作为mrna递送至宿主细胞。.在一些实施方案中,经由基于核酸的递送系统例如mrna递送的abe8碱基编辑器具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的上靶编辑效率,如通过经编辑的核碱基所测量。在一些实施方案中,与通过质粒或载体系统递送的abe8碱基编辑器相比,通过mrna系统递送的abe8碱基编辑器具有更高的甲基编辑效率。在一些实施方案中,与通过质粒或载体系统递送相比,本文所述的任何abe8碱基编辑器变体在通过mrna递送时具有至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%、至少300%高、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%、或至少500%的上靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送相比,本文所述的任何abe8碱基编辑器变体在通过mrna递送时具有至少高出1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少3.6倍、至少3.7倍、至少3.8倍、至少3.9倍、至少4.0倍、至少4.1倍、至少4.2倍、至少4.3倍、至少4.4倍、至少4.5倍、至少4.6倍、至少4.7倍、至少4.8倍、至少4.9倍、或至少5.0倍的上靶编辑效率。[2031]在一些实施方案中,本文所述的任何包含abe8碱基编辑器变体的碱基编辑器系统在靶标多核苷酸序列中导致少于50%、少于40%、少于30%、少于20%、少于19%、少于18%、少于17%、少于16%、少于15%、少于14%、少于13%、少于12%、少于11%、少于10%、少于9%、少于8%、少于7%、少于6%、少于5%、少于4%、少于3%、少于2%、少于1%、少于0.9%、少于0.8%、少于0.7%、少于0.6%、少于0.5%、少于0.4%、少于0.3%、少于0.2%、少于0.1%、少于0.09%、少于0.08%、少于0.07%、少于0.06%、少于0.05%、少于0.04%、少于0.03%、少于0.02%、或少于0.01%的脱靶编辑。[2032]在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体当通过mrna系统递送时具有较低的向导依赖性脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体当通过mrna系统递送时具有降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的向导依赖性脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体当通过mrna系统递送时具有降低至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、或至少3.0倍的向导依赖性脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体当通过mrna系统递送时的向导依赖性脱靶编辑效率下降至少约2.2倍。[2033]在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体当通过mrna系统递送时具有较低的不依赖于向导的脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送时相比,本文所述的任何abe8碱基编辑器变体当通过mrna系统递送时具有降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或至少99%的不依赖于向导的脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送相比,本文所述的任何abe8碱基编辑器变体在通过mrna递送时具有降低至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少5.0倍、至少10.0倍、至少20.0倍、至少50.0倍、至少70.0倍、至少100.0倍、至少120.0倍、至少130.0倍、或至少150.0倍的不依赖于向导的脱靶编辑效率。在一些实施方案中,与通过质粒或载体系统递送相比,本文所述的abe8碱基编辑器变体在通过mrna递送时具有降低134.0倍的不依赖于向导的脱靶编辑效率(例如,谬误rna脱氨基)。在一些实施方案中,本文所述的abe8碱基编辑器变体不跨基因组增加不依赖于向导的突变率。[2034]在一些实施方案中,单个基因递送事件(例如,通过转导、转染、电穿孔或任何其他方法)可用于细胞基因组内5个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内6个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内7个序列的靶标碱基编辑。在一些实施方案中,单个电穿孔事件可用于细胞基因组内8个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内9个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内10个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内20个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内30个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内40个序列的靶标碱基编辑。在一些实施方案中,单个基因递送事件可用于细胞基因组内50个序列的靶标碱基编辑。[2035]在一些实施方案中,本文所述的方法,例如,碱基编辑方法具有极低到没有的脱靶效应。[2036]在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少50%已经被成功地编辑(即,细胞已经成功地工程改造)。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少55%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少60%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少65%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少70%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少75%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少80%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少85%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少90%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的至少95%已经被成功地编辑。在一些实施方案中,本文所述的碱基编辑方法导致细胞群的约91%、92%、93%、94%、95%、96%、97%、98%、99%或100%已经被成功地编辑。[2037]在一些实施方案中,在碱基编辑干预后的肝细胞恢复率是在碱基编辑事件开始时细胞群的超过至少60%、70%、80%、90%。在一些实施方案中,上述肝细胞恢复率是约70%。在一些实施方案中,上述肝细胞恢复率是约75%。在一些实施方案中,上述肝细胞恢复率是约80%。在一些实施方案中,上述肝细胞恢复率是约85%。在一些实施方案中,上述肝细胞恢复率是在碱基编辑事件的时间该细胞群中约90%、或约91%、92%、93%、94%95%、96%、97%、98%、或99%、或100%的细胞。[2038]在一些实施方案中,经工程改造的细胞群可进一步在体外扩张约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍、约10倍、约15倍、约20倍、约25倍、约30倍、约35倍、约40倍、约45倍、约50倍、或约100倍。[2039]预期突变和插入缺失的数量可使用任何合适方法确定,例如,如国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632);komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);和komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)中所述,其整体内容通过引用并入本文。[2040]在一些实施方案中,为了计算插入缺失频率,扫描了测序读数,以将其确切匹配至位于可能出现插入缺失的窗口两侧的两个10-bp序列。如果没有定位到确切匹配,则将该读数从分析中排除。如果这一插入缺失窗口的长度与参考序列确切匹配,则将该读数归类为不含插入缺失。如果插入缺失窗口比参考序列长或短两个或更多个碱基,则将该测序读数分别归类为插入或缺失。在一些实施方案中,本文所提供的碱基编辑器可限制插入缺失在核酸区内的形成。在一些实施方案中,该区在被碱基编辑器编辑的核苷酸处或是与被碱基编辑器编辑的核苷酸相距2、3、4、5、6、7、8、9或10和核苷酸内的区。[2041]在靶标核苷酸区处形成的插入缺失数量可以取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,插入缺失的数量或比例在将靶标核苷酸序列(例如,细胞基因组内的核酸)暴露于碱基编辑器中至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时、至少48小时、至少3天、至少4天、至少5天、至少7天、至少10天、或至少14天后确定。应了解,本文所述碱基编辑器的特征可应用于任何融合蛋白或使用本文所提供的融合蛋白的方法。[2042]碱基编辑器效率的细节在国际pct申请号pct/2017/045381(wo2018/027078)和pct/us2016/058344(wo2017/070632)中描述,其各自通过引用以其整体并入本文。也参见komor,a.c.,等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble-strandeddnacleavage”nature533,420-424(2016);gaudelli,n.m.,等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464-471(2017);和komor,a.c.,等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g-to-t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其整体内容通过引用并入本文。在一些实施方案中,使用本文所提供的方法在一个或多个基因中编辑多个核碱基对导致至少一个预期突变的形成。在一些实施方案中,所述至少一个预期突变的所述形成导致基因正常功能的中断。在一些实施方案中,所述至少一个预期突变的所述形成导致基因编码的蛋白质的表达下降或消除。应了解,多重编辑可使用本文所提供的任何方法或方法组合实施。[2043]多重编辑[2044]在一些实施方案中,本文所提供的碱基编辑器系统能够对一个或多个基因中的多个核碱基对进行多重编辑。在一些实施方案中,该多个核碱基对位于同一基因内。在一些实施方案中,该多个核碱基对位于一个或多个基因内,其中至少一个基因位于不同的基因座中。在一些实施方案中,多重编辑可包含一个或多个向导多核苷酸。在一些实施方案中,多重编辑可包含一个或多个碱基编辑器系统。在一些实施方案中,多重编辑可包含一个或多个碱基编辑器系统和一个或多个向导多核苷酸。在一些实施方案中,多重编辑可包含一个或多个碱基编辑器系统和多个向导多核苷酸。在一些实施方案中,多重编辑可包含一个或多个向导多核苷酸和单个碱基编辑器系统。在一些实施方案中,多重编辑可包含至少一个不需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸。在一些实施方案中,多重编辑可包含至少一个需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸。在一些实施方案中,多重编辑可包含至少一个不需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸与至少一个需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸的混合物。应了解,使用本文所述的任何碱基编辑器进行的多重编辑特征可应用于使用本文所提供的任何碱基编辑器的方法的任意组合。也应了解,使用本文所述的任何碱基编辑器进行的多重编辑可包括对多个核碱基对的依次编辑。[2045]在一些实施方案中,多个核碱基对在一个或多个基因中。在一些实施方案中,该多个核碱基对在同一基因内。在一些实施方案中,一个或多个基因中的至少一个基因定位在不同基因座中。[2046]在一些实施方案中,编辑是对至少一个蛋白质编码区内的多个核碱基对的编辑。在一些实施方案中,编辑是对至少一个非蛋白质编码区内的多个核碱基对的编辑。在一些实施方案中,编辑是对至少一个蛋白质编码区和至少一个非蛋白质编码区内的多个核碱基对的编辑。[2047]在一些实施方案中,编辑与一个或多个向导多核苷酸协同作用。在一些实施方案中,该碱基编辑器系统可包含一个或多个碱基编辑器系统。在一些实施方案中,该碱基编辑器系统可包含一个或多个碱基编辑器系统与一个或多个向导多核苷酸系统作用。在一些实施方案中,该碱基编辑器系统可包含一个或多个碱基编辑器系统与多个向导多核苷酸系统作用。在一些实施方案中,该编辑与一个或多个向导多核苷酸和单个碱基编辑器系统协同作用。在一些实施方案中,该编辑与至少一个不需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸协同作用。在一些实施方案中,该编辑与至少一个需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸协同作用。在一些实施方案中,该编辑与至少一个不需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸与至少一个需要pam序列来靶向结合至靶标多核苷酸序列的向导多核苷酸的混合物协同作用。应了解,使用本文所述的任何碱基编辑器进行的多重编辑特征可应用于使用本文所提供的任何碱基编辑器的方法的任意组合。也应了解,编辑可包括对多个核碱基对的依次编辑。[2048]在一些实施方案中,能够对一个或多个基因中的多个核碱基对进行多重编辑的碱基编辑器系统包含abe9碱基编辑器中的一个。在一些实施方案中,能够对一个或多个基因中的多个核碱基对进行多重编辑的碱基编辑器系统包含本文所述的abe8碱基编辑器变体中的一个。在一些实施方案中,能够对一个或多个基因中的多个核碱基对进行多重编辑的碱基编辑器系统包含abe7碱基编辑器中的一个。在一些实施方案中,与能够进行多重编辑的包含abe7碱基编辑器中的一个的碱基编辑器系统相比,能够进行多重编辑的包含本文所述abe8碱基编辑器变体中的一个的碱基编辑器系统具有更高的多重编辑效率。在一些实施方案中,与能够进行多重编辑的包含abe7碱基编辑器中的一个的碱基编辑器系统相比,能够进行多重编辑的包含本文所述abe8碱基编辑器变体中的一个的碱基编辑器系统具有高出至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少155%、至少160%、至少165%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%、至少220%、至少230%、至少240%、至少250%、至少260%、至少270%、至少280%、至少290%,atleast300%higher、至少310%、至少320%、至少330%、至少340%、至少350%、至少360%、至少370%、至少380%、至少390%、至少400%、至少450%、或至少500%的多重编辑效率。在一些实施方案中,与能够进行多重编辑的包含abe7碱基编辑器中的一个的碱基编辑器系统相比,能够进行多重编辑的包含本文所述abe8碱基编辑器变体中的一个的碱基编辑器系统具有高出至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3.0倍、至少3.1倍、至少3.2倍、至少3.3倍、至少3.4倍、至少3.5倍、至少4.0倍、至少4.5倍、至少5.0倍、至少5.5倍、或至少6.0的多重编辑效率。[2049]递送系统[2050]如本文所述,评定了核碱基编辑器靶向基因(例如,cd2)中的一个或多个核苷酸的适用性。在一种实施方案中,将感兴趣的单细胞用编码本文所述的碱基编辑系统的一个或多个核酸分子与少量的编码受体(例如,gfp)的载体一起转染、转导或以其他方式修饰。这些细胞可以是本领域已知的任何细胞,包括免疫细胞(例如,t细胞或nk细胞),或永生化的人类细胞系诸如293t、k562或u20s。或者,可使用原代细胞(例如,人类)。细胞也可获自受试者或个体,诸如来自组织活检样品、手术、血液、徐诶请或其他生物学流体。此类细胞可以与最终的细胞靶标相关。[2051]可使用病毒载体执行递送。在一个实施方案中,可使用液体转染(诸如lipofectamine或fugene)或通过电穿孔执行转染。转染后,可通过荧光显微镜或通过流式细胞术确定受体(例如,gfp)的表达,以证实一致且高水平的转染。这些初步转染可以由不同的碱基编辑组成,以确定哪些编辑组合具有最大的活性。系统可包含一种或多种不同的载体。在一种实施方案中,针对所希望的细胞类型的表达对碱基编辑器进行密码子优化,该细胞类型优先是真核细胞,优选哺乳动物细胞或人类细胞。[2052]如本文所述评估和碱基编辑器的活性,即,通过将细胞基因组测序以监测靶标序列中的改变。对于sanger测序,将经纯化的pcr扩增子克隆到质粒主链中,转化,小规模制备并使用单引物测序。测序可以使用下一代测序(ngs)技术执行。当使用下一代测序时,扩增子可以是300-500bp,具有不对称设置的预期切断位点。在pcr后,可以将下一代测序衔接子和条码(例如,illumina多重衔接子和指标物)添加到扩增子的末端,例如,用于高通量测序(例如,在illuminamiseq上)。可以选择在初始测试中诱导最高水平的靶标特异性改变的融合蛋白进行进一步评定。[2053]在特定实施方案中,使用核碱基编辑器来靶向感兴趣的多核苷酸。在一种实施方案中,本发明的核碱基编辑器被递送至细胞(例如,免疫细胞(例如,t细胞或nk细胞)),与用于靶向细胞基因组内一个或多个感兴趣的核酸序列的一个或多个向导rna协同使用,从而改变基因(例如,cd2)。在一些实施方案中,通过一个或多个向导rna将碱基编辑器靶向至一个或多个感兴趣的基因(例如,cd2、trac、b2m、ciita、trbc1、trbc2、pd-1、cd52)。在一些实施方案中,对一种或多种感兴趣基因的序列的一个或多个编辑降低或消除由该基因编码的蛋白质在宿主细胞(例如,免疫细胞(例如,t细胞或nk细胞))内的表达。在一些实施方案中,在宿主细胞(例如,免疫细胞(例如,t细胞或nk细胞))内,由一种或多种感兴趣基因(例如,cd2)编码的一种或多种蛋白质的表达被完全消除或消除。[2054]在一些实施方案中,宿主细胞是哺乳动物细胞。在一些实施方案中,宿主细胞是人类细胞。在一些实施方案中,宿主细胞是免疫细胞。在一些实施方案中,免疫细胞是t细胞。在一些实施方案中,免疫细胞是nk细胞。在一些实施方案中,将一个或多个编辑引入选自cd2、cd3、cd5、cd7、cd52、b2m、ciita、trbc1、trbc2、trac和pd-1或其组合的一种或多种基因中。在一些实施方案中,将一个或多个编辑引入cd2基因中。在一些实施方案中,将一个或多个编辑引入cd5基因中。在一些实施方案中,将一个或多个编辑引入cd7基因中。在一些实施方案中,将一个或多个编辑引入cd2、cd5、trac和pd_1基因中。在一些实施方案中,将一个或多个编辑引入cd5、cd5、trac和pd_1基因中。在一些实施方案中,将一个或多个编辑引入cd7、cd3、cd52和pd_1基因中。[2055]核碱基编辑器和grna的基于核酸的递送[2056]可以通过本领域已知方法或如本文所述将根据本公开的编码胞苷或腺苷脱氨酶的核酸给药至受试者或在体外或体内递送至细胞内。例如,可以通过例如载体(例如,病毒或非病毒载体)、基于非载体的方法(例如,使用裸dna、dna复合物、脂质纳米颗粒)或其组合递送胞苷或腺苷脱氨酶。[2057]编码胞苷或腺苷脱氨酶核碱基编辑器的核酸可以作为裸dna或rna直接递送至细胞(例如,免疫细胞),例如通过转染或电穿孔的手段,或可以缀合至促进被靶标细胞吸收的分子(例如,n-乙酰基半乳糖胺)。也可使用核酸载体,诸如本文所述的载体。在特定实施方案中,多核苷酸,例如,编码碱基编辑器或其功能性组分的mrna,可以与本文所述多个向导rna的组合共电穿孔。[2058]核酸载体可包含一个或多个编码本文所述融合蛋白的结构域的序列。载体也可包含编码单个肽(例如,用于核定位、核仁定位或线粒体定位)的序列,与编码蛋白的序列缔合(例如,插入至该序列内或与该序列融合)。作为一个示例,核酸载体可包括包括一个或多个核定位序列(例如,来自sv40的核定位序列)的cas9编码序列,和一个或多个脱氨酶。[2059]核酸载体也可包括任何合适数量的调节/控制元件,例如,启动子、增强子、内含子、聚腺苷酸化信号、kozak共有序列或内部核糖体进入位点(ires)。这些元件是本领域中周知的。[2060]根据本公开的核酸载体包括重组病毒载体。示例性病毒载体在上文详述。也可使用本领域已知的其他病毒载体。此外,病毒颗粒可用来递送核酸和/或肽形式的基因组编辑系统组分。例如,“空”病毒颗粒可以经组装以含有任何合适的载舱。病毒载体和病毒颗粒也可经工程改造以并入靶向配体,从而改变靶标组织特异性。[2061]除了病毒载体外,非病毒载体也可用来递送编码根据本公开的基因组编辑系统的核酸。一个重要的非病毒核酸载体类别是纳米颗粒,其可以是有机的或无机的。纳米颗粒是本领域中周知的。任何合适的纳米粒子设计可以用来递送基因组编辑系统组分或编码此类组分的核酸。例如,在本公开的某些实施方案中,有机(例如,脂质和/或聚合物)纳米颗粒可适用于用作递送媒介物。用于纳米颗粒调配物和/或基因转移中的示例性脂质显示在表18(下)中。[2062]表18[2063][2064][2065]表19列出了用于基因转移和/或纳米颗粒调配物的示例性聚合物。[2066]表19[2067][2068]表20总结了用于编码本文所述融合蛋白的多核苷酸的的递送方法。[2069]表20[2070][2071]在另一方面,基因组编辑系统组分或编码此类组分的核酸(例如,核酸结合蛋白诸如,举例而言,cas9或其变体)以及靶向感兴趣的基因组核酸序列的grna的递送,可以通过递送核糖核蛋白(rnp)至细胞而得以实现。rnp包含核酸结合蛋白,例如,cas9,其与靶向grna复合。rnp可以使用已知方法递送至细胞,诸如电穿孔、核转染或阳离子脂质介导的方法,例如,如zuris,j.a.等人,2015,nat.biotechnology,33(1):73-80所报导。rnp有利于在crispr碱基编辑系统中使用,特别是用于难以转染的细胞诸如原代细胞。此外,rnp也可以缓解细胞中蛋白质表达可能出现的困难,尤其是当真核启动子(例如,cmv或ef1a,其可以用于crispr之中)没有被良好表达时。有利的是,rnp的使用不需要将外来dna递送至细胞内。此外,因为包含核酸结合蛋白和grna复合物的rnp随时间推移被降解,rnp的使用具有限制脱靶效应的潜力。以类似于用于基于质粒的技术的方式,rnp可用来递送结合蛋白(例如,cas9变体)和引导同源定向修复(hdr)。[2072]用于驱动碱基编辑器编码核酸分子表达的启动子可包括aavitr。这可能有利于消除对另外的启动子元件的需求,该元件占据载体内的空间。释放出来的另外空间可用于驱动另外元素的表达,诸如向导核酸或可选标志物。itr活性相对较弱,所以它可以用来降低所选核酸酶过表达带来的潜在毒性。[2073]任何合适的启动子可用来驱动碱基编辑器(并且若适用,向导核酸)的表达。对于普遍表达,可使用的启动子包括cmv、cag、cbh、pgk、sv40、铁蛋白重链或轻链等。对于大脑或其他cns细胞表达,合适的启动子可包括:适用于所有神经元的synapsini,适用于兴奋性神经元的camkiα,适用于gaba能神经元的gad67或gad65或vgat等。对于肝细胞表达,合适的启动子包括白蛋白启动子。对于肺细胞表达,合适的启动子可包括sp-b。对于内皮细胞,合适的启动子可包括icam。对于造血细胞,合适的启动子可包括ifnβ或cd45。对于成骨细胞,合适的启动子可包括og-2。[2074]在一些实施方案中,本公开的碱基编辑器的尺寸足够小,以至于允许独立的启动子驱动在同一核酸分子内的碱基编辑器和相容向导核酸的表达。例如,载体或病毒载体可以包含可操作地链接至编码碱基编辑器的核酸的第一启动子以及可操作地链接至向导核酸的第二启动子。[2075]用来驱动向导核酸的表达的启动子可包括:poliii启动子,诸如u6或h1。使用polii启动子和内含子匣来表达grna腺相关病毒(aav)。[2076]在特定实施方案中,本发明的融合蛋白由病毒载体(例如,腺相关病毒(aav)、aav3、aav3b、aav4、aav5、aav6、aav7、aav8、aav9、aavrh8、aav10及其变体)中存在的多核苷酸或任何病毒载体的合适衣壳蛋白编码。因此,在一些方面,本公开涉及融合蛋白的病毒递送。病毒载体的示例包括逆转录病毒载体(例如,maloney鼠白血病病毒,mml-v)、腺病毒载体(例如,ad100)、慢病毒载体(基于hiv和fiv的载体)、疱疹病毒载体(例如,hsv-2)。[2077]在一些方面,本文所述的用于编辑免疫细胞中特异性基因的方法可用于在基因上修饰car-t细胞。此类car-t细胞和生产此类car-t细胞的方法描述在国际申请号pct/us2016/060736、pct/us2016/060734、pct/us2016/034873、pct/us2015/040660、pct/ep2016/055332、pct/ib2015/058650、pct/ep2015/067441、pct/ep2014/078876、pct/ep2014/059662、pct/ib2014/061409、pct/us2016/019192、pct/us2015/059106、pct/us2016/052260、pct/us2015/020606、pct/us2015/055764、pct/cn2014/094393、pct/us2017/059989、pct/us2017/027606和pct/us2015/064269中,各自的内容以其整体并入本文。[2078]病毒载体[2079]本文所述的碱基编辑器因此可使用病毒载体递送。在一些实施方案中,本文所公开的碱基编辑器可编码在病毒载体中所包含的核酸上。在一些实施方案中,碱基编辑器系统的一个或多个组分可以被编码在一种或多种病毒载体上。例如,碱基编辑器和向导核酸可以编码在单个病毒载体上。在其他实施方案中,碱基编辑器和向导核酸编码在不同病毒载体上。在每种情况下,碱基编辑器和向导核酸可以各自可操作地链接至启动子和终止子。被编码在病毒载体上的组分的组合可以通过所选病毒载体的载荷尺寸约束条件确定。[2080]使用基于rna或dna病毒的系统来递送碱基编辑器利用高度进化的过程,该过程将病毒靶向至培养物或宿主中的特异性细胞,并将病毒有效载荷运输到细胞核或宿主细胞基因组。病毒载体可以直接给药至培养物中的细胞、患者(体内),或它们可以处理细胞(体外),并且经修饰的细胞可任选地给药至患者(间接体内)。传统的基于病毒的系统将会包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。可以使用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合到宿主基因组中,经常导致被插入的转基因的长期表达。此外,已经在很多不同的细胞类型和靶标组织中观察到了高转导效率。[2081]病毒载体可包括慢病毒(例如,基于hiv和fiv的载体)、腺病毒(例如,ad100)、逆转录病毒(例如,maloney鼠白血病病毒,mml-v)、疱疹病毒(例如,hsv-2)和腺相关病毒(aav),或者其他质粒或病毒载体类型,特别是使用来自美国专利号8,454,972(适用于腺病毒的调配物、剂量)、美国专利号8,404,658(适用于aav的调配物、剂量)和美国专利号5,846,946(适用于dna质粒的调配物、剂量)和来自临床试验以及关于前述慢病毒aav和腺病毒的临床试验的出版物的调配物和剂量。例如,对于aav,给药途径、调配物和剂量可以如美国专利号8,454,972和牵涉aav的临床试验中所用。对于腺病毒,给药途径、调配物和剂量可以如美国专利号8,404,658和牵涉腺病毒的临床试验中所用。对于质粒递送,给药途径、调配物和剂量可以如美国专利号5,846,946和牵涉质粒的临床研究中所用。剂量可以基于平均70kg的个体(例如,成年男性人类)或自其外推,并且可针对不同体重和物种的患者、受试者、哺乳动物调整。给药频率处于医疗或兽医从业者(例如,医师、兽医)的能力范围内,取决于常规因素(包括患者或受试者的年龄、性别、一般健康状况、其他情况)和正在处理的特定病症或症状。病毒载体可以注射至感兴趣的组织内。对于细胞类型特异性碱基编辑,碱基编辑器和任选使用的向导核酸的表达可以由细胞类型特异性启动子驱动。[2082]逆转录病毒的向性可以通过加入外来包膜蛋白来改变,从而扩大靶标细胞的潜在靶标细胞群。慢病毒载体是能够转导或感染非分裂细胞并典型产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将会取决于靶标组织。逆转录病毒载体由顺式作用的长末端重复序列构成,该重复序列对外来序列的封装能力为至多6-10kb。最小的顺式作用ltr足以复制并封装载体,该载体然后用于将治疗基因整合到靶标细胞中,以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猴免疫缺陷病毒(siv)、人类免疫缺陷病毒(hiv)的那些及其组合(参见,例如,buchscher等人,j.virol.66:2731-2739(1992);johann等人,j.virol.66:1635-1640(1992);sommnerfelt等人,virol.176:58-59(1990);wilson等人,j.virol.63:2374-2378(1989);miller等人,j.virol.65:2220-2224(1991);pct/us94/05700)。[2083]逆转录病毒载体,尤其是慢病毒载体,可能需要多核苷酸序列小于用于有效整合到靶标细胞内的给定长度。例如,与使用较小尺寸的那些相比,长度大于9kb的逆转录病毒载体可导致低病毒滴度。在一些方面,本公开的碱基编辑器的尺寸足以能有效封装并经由逆转录病毒载体递送至靶标细胞。在一些实施方案中,即便当与向导核酸和/或可靶向的核酸酶系统的其他组分一起被表达时,碱基编辑器的尺寸也允许进行有效封装和递送。[2084]封装细胞典型永安里形成能够感染宿主细胞的病毒颗粒。此类细胞包括封装慢病毒的293细胞,以及封装逆转录病毒的ψ2细胞或pa317细胞。用于基因疗法中的病毒载体经常通过生产将核酸载体封装到病毒颗粒内的细胞系来生成。载体典型含有封装和后续整合到宿主内所需的最小病毒序列,其他病毒序列由用于待表达的多核苷酸的表达匣替换。缺失的病毒功能典型通过封装细胞系反式供给。例如,用于基因疗法中的腺相关病毒(“aav”)典型仅具备来自aav基因组的itr序列,它们是封装和整合到宿主基因组内所需要的。病毒dna可以封装在细胞系中,该细胞系含有编码其他aav基因(即rep和cap,但缺乏itr序列)的辅助质粒。细胞系也可以用腺病毒作为辅助进行转染。辅助病毒可促进aav载体的复制和来自辅助质粒的aav基因的表达。在一些情况下,辅助质粒由于缺乏tr序列而不以显著量被封装。腺病毒的污染可以通过例如腺病毒比aav更敏感的热处理来减少。[2085]在优选瞬时表达的应用中,可使用基于腺病毒的系统。基于腺病毒的载体能够在很多细胞类型中实现非常高的转导效率且不需要细胞分裂。已经使用此类载体获得了高滴度和高水平的表达。该载体可在相对简单的系统中以大数量生产。腺相关病毒(“aav”)载体也可用来施用靶标核酸转导细胞,例如,在核酸和肽的体外生产中,以及用于体内和间接体内基因疗法过程(参见,例如,west等人,virology160:38-47(1987);美国专利号4,797,368;wo93/24641;kotin,humangenetherapy5:793-801(1994);muzyczka,j.clin.invest.94:1351(1994))。重组aav载体的构建在大量出版物中描述,包括美国专利号5,173,414;tratschin等人,mol.cell.biol.5:3251-3260(1985);tratschin,等人,mol.cell.biol.4:2072-2081(1984);hermonat&muzyczka,pnas81:6466-6470(1984);和samulski等人,j.virol.63:03822-3828(1989)。[2086]aav是小的、单链dna依赖性病毒,属于细小病毒科。4.7kb野生型(wt)aav基因组由两个基因构成,这两个基因分别编码四个复制蛋白质和三个质粒蛋白质,并且每一侧各具有145-bp反向末端重复序列(itr)。病毒体由三个质粒蛋白vp1、vp2和vp3构成,它们以1:1:10的比率从同一开放阅读框产生但来自差异剪接位点(vp1)和替代性翻译起始位点(分别为vp2和vp3)。vp3是病毒体中丰度最高的亚基并且参与到定义该病毒向性的细胞表面处的受体识别中。已经在vp1的独特的n端鉴定出了在病毒感染性中发挥作用的磷脂酶结构域。[2087]类似于wtaav,重组aav(raav)利用顺式作用145-bpitr填充病毒转基因匣的侧翼,提供至多4.5kb用于封装外来dna。转染后,raav可表达本发明的融合蛋白并且通过以环状头到尾连环体作为游离基因存在而保持不整合到宿主基因组内。尽管存在大量在体外和体内成功使用该系统的raav示例,但当基因的编码序列的长度在尺寸上大于或等于wtaav基因组时,其有限的封装能力仍限制了aav介导的基因疗法的使用。[2088]可基于应用来选择病毒载体。例如,对于体内基因递送,aav可能比其他病毒载体有利。在一些实施方案中,aav导致低毒性,者可能是由于纯化方法不需要对细胞颗粒进行可能激活免疫应答的超离心。在一些实施方案中,aav不整合到宿主基因组中,因此导致插入突变的可能性较低。腺病毒是常用的疫苗,因为它们诱导强免疫应答。病毒载体的封装能力可能限制可以被封装在该载体内的碱基编辑器的尺寸。[2089]aav的封装能力为约4.5kb或4.75kb,包括两个145碱基的反向末端重复序列(itr)。这意味着所公开的碱基编辑器以及启动子和转录终止子可以配合到单个病毒载体中。大于4.5或4.75kb的构建体可导致显著降低的病毒产生。例如,spcas9相当大,该基因自身超过4.1kb,这使得它难以封装到aav中。因此,本公开的实施方案包括利用在长度上比传统碱基编辑器短的所公开的碱基编辑器t。在一些示例中,碱基编辑器小于4kb。所公开的碱基编辑器可能小于4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb或1.5kb。在一些实施方案中,所公开的碱基编辑器是4.5kb或更小的长度。[2090]aav可以是aav1、aav2、aav5或其任意组合。可以根据目标细胞选择aav的类型;例如,针对靶向脑或神经细胞,可以选择aav血清型1、2、5或混合衣壳aav1、aav2、aav5或其任何组合;针对靶向心脏组织,可以选择aav4。aav8可用于递送至肝脏。关于这些细胞的某些aav血清型的列表可见于grimm,d.etal,j.virol.82:5887-5911(2008)中。[2091]在一些实施方案中,使用慢病毒载体来转导经嵌合抗原受体修饰的免疫细胞(例如,t细胞或nk细胞)。慢病毒是复合逆转录病毒,其具有感染并在有丝分裂细胞和有丝分裂后细胞两者中表达其基因的能力。最常见的慢病毒是人类免疫缺陷病毒(hiv),其使用其他病毒的包膜糖蛋白来靶向广泛范围的细胞类型。[2092]慢病毒可如下制备。在克隆pcases10(其含有慢病毒转移质粒主链)后,在用10%胎牛血清且不使用抗生素在dmem转染前一天,将低传代(p=5)的hek293ft接种到t-75烧瓶中直到50%融合度。20小时后,将培养基更换为optimem(无血清)培养基,并在4小时后进行转染。细胞用10μg的慢病毒转移质粒(pcases10)和以下封装质粒转染:5μg的pmd2.g(vsv-g甲型)和7.5μg的pspax2(gag/pol/rev/tat)。转染可以在4mloptimem中使用阳离子脂质递送剂(50μllipofectamine2000和100μlplus试剂)进行。6小时后,将培养基更换为具有10%胎牛血清的无抗生素dmem。这些方法在细胞培养期间使用血清,但优选无血清方法。[2093]慢病毒可如下纯化。在48小时后收获病毒上清液。上清液首先进行碎片澄清,并通过0.45μm低蛋白质结合(pvdf)过滤器过滤。然后将它们在超离心机中以24,000rpm旋转2小时。在4℃将病毒沉淀物重新悬浮在50μl的dmem中过夜。然后将它们分为等分小样并立即在-80℃冷冻。[2094]在另一实施方案中,也预期基于马传染性贫血病毒(eiav)的最小非灵长类慢病毒载体。在另一实施方案中,预期通过视网膜下注射递送一种基于马传染性贫血病毒的慢病毒基因治疗载体,其表达血管抑制蛋白内皮抑素和血管抑素。在另一实施方案中,预期使用自灭活慢病毒载体。[2095]该系统的任何rna,例如向导rna或碱基编辑器编码mrna,可以rna的形式递送。碱基编辑器编码mrna可使用体外转录来生成。例如,核酸酶mrna可使用含有以下元件的pcr匣来合成:t7启动子、任选的kozak序列(gccacc)、核酸酶序列、和3'utr诸如来自β球蛋白-polya尾部的3'utr。该匣可用于通过t7核酸酶进行的转录。向导多核苷酸(例如,grna)也可使用体外转录从含有t7启动子以及后面的序列“gg”和向导多核苷酸序列的匣转录。[2096]为了增强表达并降低可能的毒性,碱基编辑器编码序列和/或向导核酸可经修饰以包括一个或多个经修饰的核苷酸,例如,使用假-u或5-甲基-c。[2097]aav载体的封装能力小使得大量超出这一尺寸的基因的递送和/或大生理调节元件的使用具有挑战性。这些挑战例如可以通过将待递送的蛋白分为两个或更多个片段解决,其中n端片段融合至分体内含肽-n且c端片段融合至分体内含肽-c。这些片段随后被封装到两个或更多个aav载体内。如本文所用,“内含肽”是指自剪接蛋白质内含子(例如,肽),其连接侧翼n端和c端外显肽(例如,待接合的片段)。使用某些内含肽来接合异源蛋白片段在例如wood等人,j.biol.chem.289(21);14512-9(2014)中描述。例如,当融合至独立的蛋白质片段时,内含肽intn和intc彼此识别,将其自身剪出并同时连接它们所融合至的蛋白质片段的侧翼n端和c端外显肽,从而从两个蛋白质片段重构全长蛋白质。其他合适的内含肽对于本领域技术人员将是显而易见的。[2098]本发明的融合蛋白的片段的长度可变。在一些实施方案中,蛋白质片段的长度在2个氨基酸到约1000个氨基酸的范围。在一些实施方案中,蛋白质片段的长度在约5个氨基酸到约500个氨基酸的范围。在一些实施方案中,蛋白质片段的长度在约20个氨基酸到约200个氨基酸的范围。在一些实施方案中,蛋白质片段的长度在约10个氨基酸到约100个氨基酸的范围。合适的其他长度的蛋白质片段对于本领域技术人员将是显而易见的。[2099]在一种实施方案中,通过将大的转基因盒剪接为独立的两半(5'和3'末端,或头部和尾部)而产生双aav载体,其中该盒的每一半都被封装到单个aav载体(尺寸《5kb)中。全长转基因表达匣的再组装随后在通过双重aav载体对相同细胞进行共转染然后进行以下项时实现:(1)5'与3'基因组(双重aav重叠载体)之间的同源重组(hr);(2)5'和3'基因组(双重aav反式剪接载体)的itr介导的尾到头连环化;或(3)这两种机制(双重aav杂交载体)的组合。在体内使用双重aav载体导致全长蛋白质的表达。使用双重aav载体平台代表用于尺寸》4.7kb的转基因的有效且可用的基因转移策略。[2100]内含肽[2101]内含肽(干预蛋白质)是见于多种不同生物体中的自加工结构域,其进行倍称为蛋白质剪接的过程。蛋白质剪接是由肽键的切割和形成所构成的多步生化反应。尽管蛋白质剪接的内源性底物是见于含内含肽生物体中的蛋白质,但内含肽也可用来在化学上操纵几乎任何多肽主链。[2102]在蛋白质剪接中,内含肽通过切割两个肽键将其自身从前体多肽切除,从而经由形成新肽键来连接侧翼外显肽(外部蛋白质)。这一重排发生在翻译后(或可能在翻译时)。内含肽介导的蛋白质剪接自发地发生,仅需要内含肽结构域的折叠。[2103]约5%的内含肽是分体内含肽,其被转录并翻译为两个独立的多肽,n-内含肽和c-内含肽,各自融合至一个外显肽。翻译时,内含肽片段自发地且非共价地组装为经典内含肽结构,以进行反式蛋白质剪接。蛋白质剪接的机制牵涉一系列酰基转移反应,这些翻译导致两个肽键在内含肽-外显肽连接处切割,并在n-外显肽和c-外显肽之间形成一个新的肽键。这一过程通过接合n-外显肽与内含肽n端的肽键的激活来启动。几乎全部内含肽均在其n端具有半胱氨酸或丝氨酸,该氨基酸附接至c端n-外显肽残基的羰基碳。这一n到o/s的酰基位移由保守的苏氨酸和组氨酸(称为txxh基序)以及常见的天冬氨酸一起促成,导致线性(硫代)酯中间体的形成。接着,这一中间体经历通过第一个c-外显肽残基(+1)的亲核性攻击进行的反式-(硫代)酯化,该残基是半胱氨酸、丝氨酸或苏氨酸。所得支链(硫代)酯中间体通过独特的转化分解,该转化是内含肽的高度保守的c端天冬酰胺的环化。这一过程由组氨酸(见于高度保守的hnf基序中)和倒数第二个组氨酸促成,并且也可可能牵涉天冬氨酸盐。这一琥珀酰亚胺形成反应将内含肽从反应性复合物切除并留下通过非肽链接附接的外显肽。这一结构快速重排为不依赖于内含肽模式的稳定肽键t。[2104]在一些实施方案中,核酸酶(例如,cas9)的一部分或片段融合至内含肽。核酸酶可以融合至内含肽的n端或c端。在一些实施方案中,融合蛋白的一部分或片段融合至内含肽并且融合至aav衣壳蛋白。内含肽、核酸酶和衣壳蛋白可以任何排列融合在一起(例如,核酸酶-内含肽-衣壳、内含肽-核酸酶-衣壳、衣壳-内含肽-核酸酶等)。在一些实施方案中,碱基编辑器(例如,abe、cbe)的n端片段融合至分体内含肽-n,且c端片段融合至分体内含肽-c。这些片段随后被封装到两个或更多个aav载体中。在一些实施方案中,内含肽的n端融合之融合蛋白的c端,且内含肽的c端融合至aav衣壳蛋白的n端。[2105]在一种实施方案中,利用内含肽来接合接枝到aav衣壳蛋白上的胞苷或腺苷脱氨酶碱基编辑器蛋白的片段或部分。使用某些内含肽来接合异源蛋白片段在例如wood等人,j.biol.chem.289(21);14512-9(2014)中描述。例如,当融合至独立的蛋白质片段时,内含肽intn和intc彼此识别,将其自身剪出并同时连接它们所融合至的蛋白质片段的侧翼n端和c端外显肽,从而从两个蛋白质片段重构全长蛋白质。其他合适的内含肽对于本领域技术人员将是显而易见的。[2106]在一些实施方案中,abe在spcas9的所选区内的ala、ser、thr或cys残基处分体为n端片段和c端片段。这些区对应于通过cas9晶体结构分析鉴定的环区。每个片段的n端融合至内含肽-n,且每个片段的c端融合至内含肽-c,融合位点是氨基酸位置s303、t310、t313、s355、a456、s460、a463、t466、s469、t472、t474、c574、s577、a589和s590,这些位点在下述序列中以加粗大写字母表示。[2107][2108][2109]核碱基编辑器的使用[2110]与肿瘤细胞相关的靶标抗原也可以在健康免疫细胞上表达。因此,使用经修饰的免疫细胞(例如,car-t细胞)来靶向肿瘤细胞上的抗原也可导致杀死也表达该抗原的健康免疫细胞,这称为同类相杀或自杀。使用经修饰的免疫细胞与可降低或消除靶标抗原(例如,cd2)在经修饰的免疫细胞上的表达的碱基编辑器组合来提供同类相杀抗性,为使用在治疗性和基础研究中的应用进行基因校正提供了新的策略。[2111]本公开提供用于生产抗同类相杀的经修饰的免疫细胞的方法。在一些实施方案中,提供一种方法,其包括使用核碱基编辑器(例如,腺苷脱氨酶碱基编辑器或胞苷脱氨酶碱基编辑器)和一种或多种向导rna编辑获自健康受试者或供体的免疫细胞(例如,t细胞或nk细胞)以降低或消除靶标抗原(例如,cd2)在该免疫细胞(例如,t细胞或nk细胞)上的表达。然后,用被引导至靶标抗原(例如,cd2)的嵌合抗原受体转导免疫细胞。所得经修饰的免疫细胞(例如,car-t)是抗同类相杀的,并且能够靶向肿瘤细胞而不靶向健康免疫细胞。在一些实施方案中,抗同类相杀的经修饰的免疫细胞如实施例2中提供的生产。在一些实施方案中,提供一种生产抗同类相杀的cd2car-t细胞的方法。[2112]本公开也提供使用本文所提供的免疫细胞治疗被诊断为患有疾病(例如,t细胞或nk细胞恶性病变)的受试者的方法。在一些实施方案中,提供一种方法,其包括向患有或易患疾病(例如,t细胞或nk细胞恶性病变)的受试者给药有效量的如本文所提供生产的经修饰的免疫细胞。本公开提供用于治疗与可通过脱氨酶介导的基因编辑来校正的靶标抗原相关的t细胞或nk细胞恶性病变的方法。基于本公开,可使用本文所提供的策略和经修饰的免疫细胞治疗的合适疾病对于本领域技术人员将是显而易见的。[2113]本文提供使用碱基编辑器或碱基编辑器系统来编辑靶标核苷酸序列中的核碱基。在一些实施方案中,碱基编辑器系统(例如,包含脱氨酶、cas9结构域和一个或多个向导rna)的活性导致剪接位点的中断或导致提前stop密码子被引入靶标核苷酸序列内。[2114]在一些实施方案中,本文提供的脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)能够将dna的脱氧腺苷残基脱氨基。本公开的其他方面提供融合蛋白,该融合蛋白包含脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶)和能够结合至特异性核苷酸序列的结构域(例如,cas9或cpf1蛋白)。例如,腺苷可以被转变为肌苷残基,而肌苷残基通常与胞苷残基进行碱基配对。此类融合蛋白尤其可用于核酸序列的靶向编辑。此类融合蛋白可用于dna的体外靶向编辑,例如,用于生成突变型细胞或动物;用于引入靶向突变,例如,用于细胞中的基因缺陷的剪接体内校正,例如,在获自受试者且后续被重新引入同一受试者或另一受试者体内的细胞中;以及用于靶向突变的体内引入,例如,可以使用本文所提供的核碱基编辑器来进行基因缺陷的校正或将引入的疾病相关基因中的去活性突变处理为g到a或t到c突变。本公开提供经修饰的免疫细胞、融合蛋白、核酸、载体、组合物、方法、试剂盒、系统等,它们利用脱氨酶和核碱基编辑器。[2115]用于编辑核酸的方法[2116]本公开的一些方面提供用于编辑核酸的方法。在一些实施方案中,该方法是用于编辑核酸的核碱基(例如,双链dna序列的碱基对)的方法。在一些实施方案中,该方法包括以下步骤:a)使核酸(例如,双链dna序列)的靶标区与包含碱基编辑器(例如,cas9结构域融合至胞苷或腺苷脱氨酶)和向导核酸(例如,grna)的复合物接触,其中靶标区包含被靶向的核碱基对,b)诱导所述靶标区的链分离;c)将所述靶标区的单链中的靶标核碱基对的第一核碱基转变为第二核碱基,以及d)切断所述靶标区的不超过一条链,其中与第一核碱基互补的第三核碱基被替换为与第二核碱基的第四核碱基。在一些实施方案中,该方法导致在核酸中形成少于20%的插入缺失。应了解,在一些实施方案中,省略了步骤b。在一些实施方案中,该方法导致少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%的插入缺失。在一些实施方案中,该方法进一步包括将第二核碱基替换为与第四核碱基互补的第五核碱基,从而生成预期的经编辑的碱基对(例如,c·g到t·a)。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。[2117]在一些实施方案中,靶标核苷酸中预期产物与非预期产物的比率为至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1或更高。在一些实施方案中,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1或1000:1或更高。在一些实施方案中,被切断的单链(切口链)杂交至向导核酸。在一些实施方案中,被切断的单链与包含第一核碱基的链相对。在一些实施方案中,碱基编辑器包含cas9结构域。在一些实施方案中,碱基编辑器保护或结合未被编辑的链。在一些实施方案中,碱基编辑器包含切口酶活性。在一些实施方案中,预期经编辑的碱基对在pam位点上游。在一些实施方案中,预期经编辑的碱基对在pam位点上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期经编辑的碱基对在pam位点下游。在一些实施方案中,预期经编辑的碱基对在pam位点下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,该方法不需要标准(例如,ngg)pam位点。在一些实施方案中,核碱基编辑器包含连接子。在一些实施方案中,连接子是1至25个氨基酸的长度。在一些实施方案中,连接子是5至20个氨基酸的长度。在一些实施方案中,连接子是10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。在一种实施方案中,连接子是32个氨基酸的长度。在另一实施方案中,“长连接子”是至少60个氨基酸的长度。在其他实施方案中,连接子是约3至100个氨基酸之间的长度。在一些实施方案中,靶标区包含靶标窗口,其中靶标窗口包含靶标核碱基对。在一些实施方案中,靶标窗口包含1至10个核苷酸。在一些实施方案中,靶标窗口是1至9、1至8、1至7、1至6、1至5、1至4、1至3、1至2或1个核苷酸的长度。在一些实施方案中,靶标窗口是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方案中,预期经编辑的碱基对在靶标窗口内。在一些实施方案中,靶标窗口包含预期经编辑的碱基对。在一些实施方案中,该方法使用本文所提供的任何碱基编辑器执行。在一些实施方案中,靶标窗口是甲基化窗口。[2118]在一些实施方案中,本公开提供用于编辑核苷酸的方法。在一些实施方案中,本发明提供用于编辑双链dna序列的核碱基对的方法。在一些实施方案中,该方法包括:a)使双链dna序列的靶标区与包含碱基编辑器和向导核酸(例如,grna)的复合物接触,其中靶标区包含靶标核碱基对,b)诱导所述靶标区的链分离,c)将靶标区的单链中的所述靶标核碱基对的第一核碱基转变为第二核碱基,d)切断所述靶标区的不超过一条链,其中与第一核碱基互补的第三核碱基被替换为与第二核碱基互补的第四核碱基,并且第二核碱基被替换为与第四核碱基互补的第五核碱基,从而生成预期经编辑的碱基对,其中生成预期经编辑的碱基对的效率是至少5%。应了解,在一些实施方案中,省略了步骤b。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。在一些实施方案中,通过本文所述方法进行的碱基编辑在任何特定基因位点可具有至少10%的碱基转变效率。在一些实施方案中,通过本文所述方法进行的碱基编辑在任何特定基因位点可具有至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%或至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%、96%、97%、98%或至少99%的碱基转变效率。在一些实施方案中,通过本文所述方法进行的碱基编辑在任何特定基因位点可具有至少70%的碱基转变效率。在一些实施方案中,通过本文所述方法进行的碱基编辑在任何特定基因位点可具有至少80%的碱基转变效率。在一些实施方案中,通过本文所述方法进行的碱基编辑在任何特定基因位点可具有至少90%的碱基转变效率。[2119]在一些实施方案中,该方法造成少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%的插入缺失。在一些实施方案中,在靶标核苷酸处预期产物与非预期产物的比率为至少2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或200:1或更高。在一些实施方案中,预期突变与插入缺失形成的比率大于1:1、10:1、50:1、100:1、500:1或1000:1或更高。在一些实施方案中,被切断的单链杂交至向导核酸。在一些实施方案中,被切断的单链与包含第一核碱基的链相对。在一些实施方案中,核碱基编辑器包含切口酶活性。在一些实施方案中,预期经编辑的碱基对在pam位点上游。在一些实施方案中,预期经编辑的碱基对在pam位点上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期经编辑的碱基对在pam位点下游。在一些实施方案中,预期经编辑的碱基对在pam位点下游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,该方法不需要标准(例如,ngg)pam位点。在一些实施方案中,核碱基编辑器包含连接子。在一些实施方案中,连接子是1至25个氨基酸的长度。在一些实施方案中,连接子是5至20个氨基酸的长度。在一些实施方案中,连接子是10、11、12、13、14、15、16、17、18、19或20个氨基酸的长度。例如,在一些实施方案中,靶标区包含靶标窗口,其中靶标窗口包含靶标核碱基对。在一些实施方案中,靶标窗口包含1至10个核苷酸。在一些实施方案中,靶标窗口是1至9、1至8、1至7、1至6、1至5、1至4、1至3、1至2或1个核苷酸的长度。在一些实施方案中,靶标窗口是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的长度。在一些实施方案中,预期经编辑的碱基对出现在靶标窗口内。在一些实施方案中,靶标窗口包含预期经编辑的碱基对。在一些实施方案中,核碱基编辑器是本文所提供的任一种碱基编辑器。[2120]药物组合物[2121]在一些方面,本发明提供一种药物组合物,其包含本文所述的经基因修饰的免疫细胞、碱基编辑器、融合蛋白或融合蛋白-向导多核苷酸复合物中的任一者。更具体地,本文提供药物组合物,其包含表达嵌合抗原受体(car)的经基因修饰的免疫细胞或此类免疫细胞群,其中所述经修饰的免疫细胞或其群具有至少一个经编辑的基因以提供同类相杀抗性,增强经修饰的免疫细胞的功能,或降低经修饰的免疫细胞的免疫阻遏或抑制,其中经编辑的基因的表达被敲除或敲低。在一些实施方案中,该至少一个经编辑的基因是cd3、cd5、cd7、cd33、cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m、pdcd1/pd1、cblb、tgfbr2、zap70、nfatc1、tet2或其组合。在一些实施方案中,cd3、cd5、cd7、cd33或cd123被编辑。在一些实施方案中,cd3、cd5、cd7、cd33或cd123与选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pdcd1/pd1中的一种或多种基因组合被编辑。[2122]在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd5并且表达cd5嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd7并且表达cd7嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd33并且表达cd33嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd3并且表达cd3嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd123并且表达cd123嵌合抗原受体。[2123]在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd5和选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和pdcd1/pd1的至少一种经编辑的基因并且表达cd5嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd7和选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因并且表达cd7嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd33和选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因并且表达cd33嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd3和选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因并且表达cd3嵌合抗原受体。在一些实施方案中,药物组合物包含经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd123和选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因并且表达cd123嵌合抗原受体。[2124]本发明的药物组合物可以根据已知技术制备。参见,例如,《雷明顿药物科学(第二十一版)》(remington,thescienceandpracticeofpharmacy(21sted.2005))。通常,在给药或储存之前将免疫细胞或其群与合适的载体混合,并且在一些实施方案中,药物组合物进一步包含药学上可接受的载体。合适的药学上可接受的载体通常包含惰性物质,其辅助将药物组合物给药至受试者,辅助将药物组合物加工为可递送的制剂,或辅助在给药前储存药物组合物。药学上可接受的载体可包括可以稳定化、优化或以其他方式改变调配物的形式、粘稠度、粘性、ph、药代动力学、溶解度的试剂。此类试剂包括缓冲剂、润湿剂、乳化剂、稀释剂、成胶囊剂和皮肤渗透增强剂。例如,载体可包括但不限于,盐水、缓冲盐水、葡萄糖、精氨酸、蔗糖、水、甘油、乙醇、山梨醇、葡聚糖、羧甲基纤维素钠及其组合。[2125]可用作药学上可接受的载剂的材料的非限制性示例包括:(1)糖类,诸如乳糖、葡萄糖和蔗糖;(2)淀粉类,诸如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,诸如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素;(4)粉末化黄芪胶;(5)麦芽;(6)明胶;(7)润滑剂,诸如硬脂酸镁、月桂基硫酸钠和滑石;(8)赋形剂,诸如可可脂和栓蜡;(9)油类,诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和豆油;(10)二醇类,诸如丙二醇;(11)多元醇类,诸如甘油、山梨醇、甘露醇和聚乙二醇(peg);(12)酯类,诸如油酸乙酯和月桂酸乙酯;(13)瓜尔胶;(14)缓冲剂,诸如氢氧化镁和氢氧化铝;(15)藻酸;(16)无热原水;(17)等渗生理盐水;(18)林格溶液;(19)乙醇;(20)ph缓冲溶液;(21)聚酯类、聚碳酸酯类和/或聚酐类;(22)填充剂,诸如多肽和氨基酸;(23)血清醇类,诸如乙醇;和(23)其他用于药物调配物中的无毒相容性物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、风味剂、芳香剂、防腐剂和抗氧化剂也可以存在于调配物中。[2126]药物组合物可包含一种或多种ph缓冲化合物以将调配物的ph维持在预设水平,该预设水平反映生理ph,诸如在约5.0至约8.0的范围。用于水性液体调配物中的ph缓冲化合物可以是氨基酸或氨基酸的混合物,诸如组氨酸,或者氨基酸诸如组氨酸与甘氨酸的混合物。或者,ph缓冲化合物优选是将调配物的ph维持在预设水平(诸如约5.0至约8.0的范围)并且不螯合钙离子的试剂。此类ph缓冲化合物的示例性示例包括但不限于,咪唑和醋酸根离子。ph缓冲化合物可以任何适合将调配物的ph维持在预设水平的量存在。[2127]药物组合物也可含有一种或多种渗透调控剂,例如,将调配物的渗透性质(例如,紧张性、渗透度和/或渗透压)调控在接纳者个体的血流和血细胞可接受水平的试剂。渗透调控剂可以是不螯合钙离子的试剂。渗透调控剂可以是本领域技术人员已知或可获得的调控调配物的渗透性质的任何化合物。本领域技术人员可以经验性地确定给定渗透调控剂用于本发明调配物中的适用性。合适类型的渗透调控剂的示例性示例包括但不限于:盐类,诸如氯化钠和醋酸钠;糖类,诸如蔗糖、葡萄糖和甘露醇;氨基酸类,诸如甘氨酸;以及这些试剂和/或这些类型的试剂中一种或多种的混合物。渗透调控剂可以以足以调控调配物渗透性质的任何浓度存在。[2128]本发明的药物组合物除了包括经修饰的免疫细胞或其群以及载体外,还可包括至少一种可用于治疗疾病的另外治疗剂。例如,本文所述药物组合物的一些实施方案进一步包含化疗剂。在一些实施方案中,药物组合物进一步包含细胞因子肽或编码细胞因子肽的核酸序列。在一些实施方案中,包含经修饰的免疫细胞或其群的药物组合物可以独立于另外治疗剂给药。[2129]在一些实施方案中,该至少一种另外治疗剂是一种或多种另外的经修饰的免疫细胞或其经修饰的免疫细胞的一个或多个群。在一些实施方案中,该一种或多种另外的经修饰的免疫效应细胞包含至少一个经编辑的基因以敲除或敲低该经编辑的基因的表达。在一些实施方案中,该至少一个经编辑的基因是cd3、cd5、cd7、cd33、cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m、pd1或其组合。在一些实施方案中,cd3、cd5、cd7、cd33或cd123被编辑。在一些实施方案中,cd3、cd5、cd7、cd33或cd123与选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和/或pd1中的一种或多种基因组合被编辑。[2130]在一些实施方案中,药物组合物包含其经修饰的免疫细胞的两个或更多个群。在一些实施方案中,药物组合物包含1)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd5以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd5嵌合抗原受体;和2)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd7以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd7嵌合抗原受体。[2131]在一些实施方案中,药物组合物包含1)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd55以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd55嵌合抗原受体;和2)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd123以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd123嵌合抗原受体。[2132]本发明的药物组合物可用来治疗任何对于自体或同种异体免疫细胞免疫疗法有应答的疾病或病症。例如,在一些实施方案中,药物组合物可用于治疗瘤形成。在一些实施方案中,瘤形成是实体肿瘤。在其他实施方案中,瘤形成是液态肿瘤。在一些实施方案中,瘤形成是血液学癌症。在一些实施方案中,血液学癌症是b细胞癌症,且在一些实施方案中,b细胞癌症是多发性骨髓瘤。在一些实施方案中,b细胞癌症是复发性/难治性多发性骨髓瘤。在一些实施方案中,血液学癌症是白血病、骨髓瘤和/或淋巴瘤。在一些情况下,白血病是急性白血病。急性白血病包括,例如,急性骨髓性白血病(aml)。急性白血病也包括,例如,急性淋巴性白血病或急性淋巴细胞性白血病(all);all包括b谱系all、t谱系all和t细胞急性淋巴细胞性白血病(t-all)。[2133]瘤形成的非限制性示例包括t细胞急性成淋巴细胞性白血病(t-all)、蕈样肉芽肿(mf)、sézary综合征(ss)、外周t/nk细胞淋巴瘤、间变性大细胞淋巴瘤alk+、原发性皮肤t细胞淋巴瘤、t细胞大颗粒淋巴细胞型白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+淋巴增生性疾病、结外nk/t细胞淋巴瘤、成人t细胞白血病/淋巴瘤、t细胞幼淋巴细胞白血病、皮下脂膜炎样t细胞淋巴瘤、原发性皮肤γδt细胞淋巴瘤、侵袭性nk细胞白血病和肠病相关t细胞淋巴瘤。在一些实施方案中,瘤形成是t细胞急性成淋巴细胞性白血病(t-all)。在一些实施方案中,瘤形成是t细胞急性骨髓性白血病(aml)。[2134]在一些实施方案中,向患有或易患瘤形成(例如,白血病)的受试者给药有效量以下一项或多项:1)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd5以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd5嵌合抗原受体;2)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd7以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd7嵌合抗原受体;3)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd33以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd33嵌合抗原受体;和4)经修饰的免疫效应细胞(例如,car-t细胞)或其群,其缺乏或具有降低水平的cd123以及选自trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m的至少一种经编辑的基因,并且表达cd123嵌合抗原受体。[2135]一种关于本发明的基因上经修饰的免疫细胞的治疗性用途的考量是实现最优或令人满意的效果所必需的细胞数量。待给药的细胞数量针对待治疗的受试者可变。在一种实施方案中,向人类受试者给药介于104到1010之间、介于105到109之间、或介于106到108之间的本发明的基因上经修饰的免疫应答细胞。在一些实施方案中,向人类受试者给药至少约1x108、2x108、3x108、4x108和5x108的本发明的基因上经修饰的免疫细胞。可以基于多种因素,包括其尺寸、年龄、性别、体重和病症,针对每个个体受试者确定精确的有效剂量。本领域技术人员可以从本发明和本领域知识容易地确定剂量。[2136]本领域技术人员可以容易地确定将在本发明方法中给药的组合物中的细胞数量和任选使用的添加剂、媒介物和/或载体的量。典型地,添加剂(除了活性免疫细胞之外)以0.001%至50%(重量)溶液的量存在于磷酸盐缓冲盐水中,并且活性成分以微克到毫克的数量级存在,诸如约0.0001至约5wt%,优选约0.0001至约1wt%,在再更优选约0.0001至约0.05wt%或约0.001至约20wt%,优选约0.01至约10wt%,且在更优选约0.05至约5wt%。当然,对于待给药至动物或人类的任何组合物,以及对于任何特定给药方法,优选因此确定:毒性,诸如通过在合适动物模型(例如,啮齿动物诸如小时)中确定致死剂量(ld)和ld50;以及引起合适应答的组合物的剂量、其中组分的浓度和给药组合物的时机。此类确定不需要根据本领域技术人员的知识、本公开和本文引用的文件进行不必要的实验。而且,不需要进行不必要的实验即可确定依次给药的时间。[2137]在一种实施方案中,本文所述方法和组合物可用于生成经工程改造的t细胞,其表达car并且可具有一个或多个经碱基编辑的修饰,使得经工程改造的t细胞可表现针对靶标的免疫应答。可以将car特异性地引导向抗原靶标,该抗原可以由宿主体内的细胞呈递。在一些实施方案中,免疫应答涵盖细胞毒性。在一些实施方案中,经工程改造的t细胞具有增强的针对其靶标的细胞毒性应答。在一些实施方案中,与未经工程改造的t细胞相比,经工程改造的t细胞诱导增强的细胞毒性应答。在一些实施方案中,与未经工程改造的细胞相比,经工程改造的t细胞表现处增强至少1.1倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍或更多的细胞毒性应答。在一些实施方案中,经工程改造的t细胞可以比未经工程改造的细胞多杀死至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少200%、至少500%或至少1000%的靶标细胞。在一些实施方案中,t细胞可以诱导较高的记忆应答。在一些实施方案中,t细胞可能诱导比未经工程改造的细胞更低水平的炎症细胞因子,换言之,经工程改造的细胞不造成细胞因子风暴应答。[2138]在一些实施方案中,将经工程改造的t细胞给药至同种异体宿主,其中经工程改造的t细胞不被该宿主排异。在一些实施方案中,同种异体t细胞诱导可忽略的或最低限度的宿主排异。在一些实施方案中,经工程改造t细胞具有同类相杀抗性。[2139]在一些实施方案中,将药物组合物配置为用于递送至受试者。给药本文所述的药物组合物的合适途径包括但不限于:外用、皮下、透皮、皮内、病灶内、关节内、腹腔内、膀胱内、跨粘膜、牙龈、牙内、耳蜗内、经鼓室、器官内、硬膜外、鞘内、肌肉内、静脉内、血管内、骨内、眼周、肿瘤内、脑内和脑室内给药。[2140]在一些实施方案中,将本文所述的药物组合物局部给药至患病位点(例如,肿瘤位点)。在一些实施方案中,通过注射、通过导管、通过栓剂或通过植入物将本文所述的药物组合物给药至受试者,该植入物是多孔的、无孔的或胶冻样材料,包括膜如硅橡胶膜或纤维。[2141]在其他实施方案中,本文所述的药物组合物在控释系统中递送。在一种实施方案中,可以使用泵(参见,例如,langer,1990,science249:1527-1533;sefton,1989,crccrit.ref.biomed.eng.14:201;buchwald等人,1980,surgery88:507;saudeketal,1989,n.engl.j.med.321:574)。在另一实施方案中,可使用聚合物材料。(参见,例如,medicalapplicationsofcontrolledrelease(langerandwiseeds.,crcpress,bocaraton,fla.,1974);controlleddrugbioavailability,drugproductdesignandperformance(smolenandballeds.,wiley,newyork,1984);rangerandpeppas,1983,macromol.sci.rev.macromol.chem.23:61。也参见levy等人,1985,science228:190;during等人,1989,ann.neurol.25:351;howard等人,1989,j.neurosurg.71:105。)其他控释系统例如在上文的langer中讨论。[2142]在一些实施方案中,根据常规过程将药物组合物配置为适用于静脉内或皮下给药至受试者例如人类的组合物。在一些实施方案中,用于通过注射给药的药物组合物是用作增溶剂和局部麻醉剂的无菌等渗溶液,诸如利多卡因,用于缓解注射部位的疼痛。通常,成分或单独提供或混合在一起以单位剂型提供,例如作为干燥的冻干粉或无水浓缩物提供在指示活性剂数量的气密密封的容器诸如安瓿或小袋内。若药物组合物待通过输液给药,它可以用含有无菌药用级水或盐水的输液瓶分配。若药物组合物通过注射给药,可提供无菌注射用水或盐水的安瓿,使得成分可在给药之前混合。[2143]用于全身给药的药物组合物可以是液态,例如无菌盐水、乳酸化林格溶液或汉克溶液。此外,药物组合物可以是固体形式,并且在重新溶解或悬浮后立即使用。也设想了冻干的形式。药物组合物可以包含在液体颗粒或媒介物诸如脂质体或微晶中,且也适用于肠胃外给药。颗粒可以是任何合适的结构,诸如单层或多层,只要组合物包含在其中即可。化合物可以入陷在“稳定化质粒-脂质颗粒(splp)”中,该颗粒含有融合性脂质二油酰基磷脂酰乙醇胺(dope)、低水平(5-10mol%)的阳离子脂质,并且通过聚乙二醇(peg)涂层稳定化(zhangy.p.等人,genether.1999,6:1438-47)。带正电的脂质诸如n-[l-(2,3-二油酰氧基)丙基]-n,n,n-三甲基-甲基硫酸铵或“dotap”对于此类颗粒和囊泡是特佳的。此类脂质颗粒的制备是周知的。参见,例如,美国专利号4,880,635、4,906,477、4,911,928、4,917,951、4,920,016和4,921,757,其各自通过引用并入本文。[2144]本文所述的药物组合物可以例如作为单位剂量给药或包装。当术语“单位剂量”关于本公开的药物组合物使用时,是指适合作何用于受试者的单一剂量的物理上离散的单元,每个单元含有经计算以产生所希望治疗效果的预设数量的活性材料联合所需的稀释剂;即,载体或媒介物。[2145]再者,药物组合物可提供为药物试剂盒,其包含(a)含有冻干形式的本发明化合物的容器和(b)含有药学上可接受的稀释剂(例如,用于重构或稀释冻干的本发明化合物的无菌稀释剂)的第二容器。任选地与此类容器相关联的可以是政府机构预设形式的关于制造、使用或销售药品或生物产品的注意事项,该注意事项反映了该机构对制造、使用或销售用于人体给药的批准。[2146]另一方面,包括了含有可用于治疗上述疾病的材料的制品。在一些实施方案中,制品包含容器和标记。合适的容器包括,例如,瓶、小瓶、注射器和试管。容器可以由多种材料诸如玻璃或塑料形成。在一些实施方案中,容器容纳本文所述还可有效治疗疾病的组合物并且可具有无菌出入口。例如,容器可以是具有可被皮下注射针刺穿的塞子的静脉内溶液袋或小瓶。组合物中的活性剂是本发明的化合物。在一些实施方案中,容器上或与容器关联的标记指示组合物用于治疗所选择的疾病。制品可进一步包含第二容器,该第二容器包含药学上可接受的缓冲液,诸如磷酸盐缓冲盐水、林格溶液或葡萄糖溶液。它可以进一步包括来自商用和使用者观点的其他所希望的材料,包括其他缓冲剂、稀释剂、过滤器、针、注射器和具有使用说明的包装插页。[2147]在一些实施方案中,提供本文所述的任何融合蛋白、grna和/或复合物作为药物组合物的一部分。在一些实施方案中,药物组合物包含本文所提供的任何融合蛋白。在一些实施方案中,药物组合物包含本文所提供的任何复合物。在一些实施方案中,药物组合物包含一种核糖核蛋白复合物,该复合物包含rna引导的核酸酶(例如,cas9),其与grna和阳离子脂质形成复合物。在一些实施方案中,药物组合物包含grna、核酸可编程dna结合蛋白、阳离子脂质和药学上可接收的赋形剂。药物组合物可任选地包含一种或多种另外的治疗活性剂。[2148]在一些实施方案中,将本文所提供的组合物给药至受试者例如人类受试者,以便在受试者内实现靶向基因组修饰。在一些实施方案中,细胞获自受试者并且与本文所提供的任何药物组合物接触。在一些实施方案中,从受试者去除并在间接体内与药物组合物接触的细胞被重新引入该受试者体内,任选地在已经在细胞中实现或检测到所希望的基因组修饰之后。递送包含核酸酶的药物组合物的方法是已知的,并且在例如美国专利号6,453,242、6,503,717、6,534,261、6,599,692、6,607,882、6,689,558、6,824,978、6,933,113、6,979,539、7,013,219和7,163,824中描述,其全部的公开内容通过引用以其整体并入本文。尽管本文所提供的药物组合物的描述主要针对适于给药至人类的药物组合物,但本领域技术人员将理解,此类组合物通常适于给药至动物或各种生物体,例如用于兽医用途。[2149]对适用于给药至人类的药物组合物进行修饰以便使该组合物适用于给药至各种动物很好理解,并且兽医药理学领域一般技术人员可以使用极常规(如果有)的实验来设计并/或执行修饰。药物组合物所给药至的受试者预期包括但不限于,人类和/或其他灵长动物;哺乳动物、驯养动物、宠物和商用相关哺乳动物,诸如牛、猪、马、绵羊、狗、小鼠和/或大鼠;和/或鸟类,包括商用相关鸟类诸如鸡、鸭、鹅和/或火鸡。[2150]本文所述药物组合物的调配物可以通过任何已知方法或此后制药领域开发的方法制备。通常,此类制备方法包括将活性成分带至与赋形剂和/或一种或多种其他辅助成分联合的步骤,且随后,若必要及/或希望,将产品成形且/或包装o为所希望的单或多剂量单位。药物调配物可另外包含药学上可接受的赋形剂,如本文所用,该赋形剂包括任何和全部溶剂、分散介质、稀释剂或其他液体媒介物、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂、固体粘合剂、润滑剂等,如适合所希望的剂型。《雷明顿药物科学与实践(第二十一版)》(remington'sthescienceandpracticeofpharmacy,21stedition,a.r.gennaro(lippincott,williams&wilkins,baltimore,md,2006);通过引用以其整体并入本文)公开了用于配置药物组合物的各种赋形剂和用于其制备的已知技术。关于用于生产包含核酸酶的药物组合物的另外的合适方法、试剂、赋形剂和溶剂,也参见pct申请pct/us2010/055131(公开号wo2011/053982a8,2010年11月2日提交),通过引用以其整体并入本文。[2151]除非任何常规赋形剂介质与物质或其衍生物不相容,诸如通过产生任何不良生物效应或以其他有害方式与药物组合物的任何其他组分相互作用,否则其使用预期在本发明的范围内。[2152]上文所述的组合物以有效量给药。有效量将取决于给药模式、待治疗的特定病症和所希望的结果。它也可能取决于病症的阶段、受试者的年龄和身体状况、并行疗法的属性(如果有)和医疗从业人员周知的类似因素。对于治疗性应用,它是足以实现医学上所希望的结果的量。[2153]在一些实施方案中,根据本公开的组合物可用于治疗多种疾病、疾患和/或病症中的任一者。[2154]治疗方法[2155]本发明的一些方面提供治疗有此需要的受试者的方法,该方法包括向有此需要的受试者给药有效治疗量的本文所述药物组合物。更具体地,治疗方法包括向有此需要的受试者给药一种或多种药物组合物,该药物组合物包含表达嵌合抗原受体(car)且具有至少一个经编辑的基因的经修饰的免疫细胞群,其中该至少一个经编辑的基因提供同类相杀抗性,增强经修饰的免疫细胞的功能或降低其免疫阻遏或抑制,并且其中该至少一种经编辑的基因的表达被敲除或敲低。在一些实施方案中,该治疗方法是自体免疫细胞疗法。在其他实施方案中,该治疗方法是同种异体免疫细胞疗法。[2156]在某些实施方案中,通过在基因上修饰免疫细胞以表达本文预期的嵌合抗原受体,免疫细胞的特异性被重新引导至子啊受试者的患病细胞或被改变的细胞表面上表达的标志物。在一些实施方案中,治疗方法包括向受试者给药本文所述的免疫细胞,其中免疫细胞已经在基因上经修饰以将其特异性重新引导至在肿瘤细胞上表达的标志物。在一些实施方案中,瘤形成是b细胞癌症;例如,b细胞癌症诸如淋巴瘤、白血病或骨髓瘤,例如,多发性骨髓瘤。在一些实施方案中,瘤形成是实体肿瘤。在其他实施方案中,瘤形成是液态肿瘤。在一些实施方案中,瘤形成是血液学癌症。在一些实施方案中,血液学癌症是白血病、骨髓瘤和/或淋巴瘤。在一些情况下,白血病包括白血病前期。在一些情况下,白血病是急性白血病。急性白血病包括,例如,急性骨髓性白血病(aml)。急性白血病也包括,例如,急性淋巴性白血病或急性淋巴细胞性白血病(all);all包括b谱系all、t谱系all和t细胞急性淋巴细胞性白血病(t-all)。[2157]瘤形成的非限制性示例包括t细胞急性成淋巴细胞性白血病(t-all)、蕈样肉芽肿(mf)、sézary综合征(ss)、外周t/nk细胞淋巴瘤、间变性大细胞淋巴瘤alk+、原发性皮肤t细胞淋巴瘤、t细胞大颗粒淋巴细胞型白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+淋巴增生性疾病、结外nk/t细胞淋巴瘤、成人t细胞白血病/淋巴瘤、t细胞幼淋巴细胞白血病、皮下脂膜炎样t细胞淋巴瘤、原发性皮肤γδt细胞淋巴瘤、侵袭性nk细胞白血病和肠病相关t细胞淋巴瘤。在一些实施方案中,瘤形成是t细胞急性成淋巴细胞性白血病(t-all)。在一些实施方案中,瘤形成是t细胞急性骨髓性白血病(aml)。因此,本公开的一些方面提供治疗受试者的瘤形成的方法。[2158]在一些实施方案中,治疗方法包括向患有瘤形成(例如,白血病)或具有发展出瘤形成倾向的受试者给药有效量的经修饰的免疫细胞(例如,car-t细胞),该免疫细胞缺乏或具有降低水平的功能性t细胞受体α恒定区(trac)、分化簇33(cd33)、分化簇3(cd3)、分化簇5(cd5)、分化簇7(cd7)、分化簇52(cd52)、分化簇123(cd123)、程序性细胞死亡1(pd-1)、β-2微球蛋白(b2m)、fas细胞表面死亡受体(fas)、淋巴细胞激活基因3(lag-3)、ii类主要组织相容性复合物、反式激活因子(ciita)、t细胞受体β恒定区1(trbc1)、t细胞受体β恒定区2(trbc2)、或其组合。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd123并且表达cd123嵌合抗原受体。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd5并且表达cd5嵌合抗原受体。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd7并且表达cd7嵌合抗原受体。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd33并且表达cd33嵌合抗原受体。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd3并且表达cd3嵌合抗原受体。[2159]在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的功能性trac。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的功能性b2m。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的功能性fas。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的功能性lag-3。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的功能性trbc1和/或trbc2。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的功能性ciita。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd52。在一些方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的pd-1。[2160]在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞)或其群,该细胞缺乏或具有降低水平的cd123并且缺乏或具有降低水平的trac、lag-3、fas、cd52、b2m、ciita、trbc1、trbc2或/或pd-1或其组合,并且表达cd123嵌合抗原受体。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd5并且缺乏或具有降低水平的trac、lag-3、fas、cd52、b2m、ciita、trbc1、trbc2或/或pd-1或其组合,并且表达cd5嵌合抗原受体。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd7并且缺乏或具有降低水平的trac、lag-3、fas、cd52、b2m、ciita、trbc1、trbc2或/或pd-1或其组合,并且表达cd7嵌合抗原受体。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd33并且缺乏或具有降低水平的trac、lag-3、fas、cd52、b2m、ciita、trbc1、trbc2或/或pd-1或其组合,并且表达cd33嵌合抗原受体。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者给药有效量的经修饰的免疫效应细胞(例如,car-t细胞),该细胞缺乏或具有降低水平的cd3并且缺乏或具有降低水平的trac、lag-3、fas、cd52、b2m、ciita、trbc1、trbc2或/或pd-1或其组合,并且表达cd3嵌合抗原受体。[2161]在一些实施方案中,治疗受试者的瘤形成的方法包括向受试者给药本文所述的免疫细胞和一种或多种另外治疗剂。例如,本发明的免疫细胞可以与一种或多种另外的经修饰的免疫细胞或其群共同给药。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者共同给药:有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd123并且表达cd123嵌合抗原受体;以及有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd33并且表达cd33嵌合抗原受体。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者共同给药:有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd5并且表达cd5嵌合抗原受体;以及有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd7并且表达cd7嵌合抗原受体。在一些实施方案中,任何免疫细胞进一步包含在cd3、cd5、cd7、cd33、cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和/或pd1或其组合中的一者或多者中的突变。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者共同给药:有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd3并且表达cd3嵌合抗原受体;以及有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd7并且表达cd7嵌合抗原受体。在一些实施方案中,向患有瘤形成(例如,t或nk细胞恶性病变)或具有发展出瘤形成潜力的受试者共同给药:有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd3并且表达cd3嵌合抗原受体;以及有效量的经修饰的免疫效应细胞(例如,car-t细胞),其缺乏或具有降低水平的cd123并且表达cd123嵌合抗原受体。[2162]在一些实施方案中,本发明的免疫细胞可以与细胞因子共同给药。在一些实施方案中,细胞因子是il-2、ifn-α、ifn-γ或其组合。在一些实施方案中,免疫细胞与化疗剂共同给药。化疗剂可以是环磷酰胺、阿霉素、长春新碱、强的松或利妥昔单抗或其组合。其他化疗剂包括奥妥珠单抗、苯达莫司汀、苯丁酸氮芥、环磷酰胺、依鲁替尼、氨甲蝶呤、阿糖胞苷、地塞米松、顺铂、硼替佐米、氟达拉滨、艾代拉里斯(idelalisib)、阿卡替尼(acalabrutinib)、来那度胺、维奈托克、换新酰胺、异环磷酰胺、依托泊苷、喷司他丁、美法仑、卡非佐米、伊沙佐米、帕比司他、达雷木单抗、埃罗妥珠单抗、沙利度胺、来那度胺或泊马度胺或其组合。“共同给药”是指在疗程期间给药两种或更多种治疗剂或药物组合物。该共同给药可以是同时给药或依次给药。较晚给药的治疗剂或药物组合物的依次给药可能在给药第一种药物组合物或治疗剂后在疗程期间的任何时间发生。[2163]在本发明的一些实施方案中,所给药的免疫细胞在体内增殖并且可在受试者体内长期持续存在。在一些实施方案中,本发明的免疫细胞可以成熟为记忆免疫细胞并且保留在受试者的循环中,从而生成能对表达被嵌合抗原受体识别的标志物的患病或被改变细胞的重现作出主动应答的细胞群。[2164]本文提供使用经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞通过以下方法产生:在免疫细胞中表达核碱基编辑器多肽或将核碱基编辑器多肽引入免疫细胞中,并且使该细胞与能够靶向编码至少一个多肽的核酸分子的两个或更多个向导rna接触,其中第一多肽是cbl原癌基因b(cblb)且第二多肽选自由t细胞受体α恒定区(trac)、β-2微球蛋白(b2m)和程序性细胞死亡蛋白1(pd1)多肽所组成的群组,其中核碱基编辑器多肽包含核酸可编程dna结合蛋白(napdnabp)和胞苷脱氨酶。在该方法的一个实例中,三种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac、pdcd1或cblb多核苷酸。在该方法的另一实例中,四种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac、pdcd1和cblb多核苷酸中的一个。在一个实例中,两种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m或trac多核苷酸。在另一实例中,三种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac、pdcd1或cblb多核苷酸。在另一实例中,四种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac、pdcd1和cblb多核苷酸中的一个。在另一实例中,三种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac和pdcd1多核苷酸。在另一实例中,向导rna靶向trac外显子4剪接受体位点、b2m外显子1剪接供体位点、或pdcd1外显子1剪接供体位点。在另一实施方案中,生成经修饰的免疫细胞的方法进一步包括在该细胞中表面向导rna,该向导rna靶向细胞毒性t淋巴细胞相关蛋白4(ctla4)多核苷酸。[2165]本文提供使用经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞通过以下方法产生:在免疫细胞中表达核碱基编辑器多肽或将核碱基编辑器多肽引入免疫细胞中,并且使该细胞与能够靶向编码至少一个多肽的核酸分子的两个或更多个向导rna接触,该多肽选自由cbl原癌基因b(cblb)、t细胞受体α恒定区(trac)、β-2微球蛋白(b2m)和程序性细胞死亡蛋白1(pd1)多肽所组成的群组,其中核碱基编辑器多肽包含核酸可编程dna结合蛋白(napdnabp)和腺苷脱氨酶。在一个实例中,两种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m或trac多核苷酸。在另一实例中,三种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac、pdcd1或cblb多核苷酸。在另一实例中,四种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac、pdcd1和cblb多核苷酸中的一个。在另一实例中,三种向导rna被表达在该细胞中或与该细胞接触,各自靶向b2m、trac和pdcd1多核苷酸。在另一实例中,向导rna靶向trac外显子4剪接受体位点、b2m外显子1剪接供体位点、或pdcd1外显子1剪接供体位点。在另一实施方案中,生成经修饰的免疫细胞的方法进一步包括在该细胞中表面向导rna,该向导rna靶向细胞毒性t淋巴细胞相关蛋白4(ctla4)多核苷酸。[2166]本文提供使用经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒性t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞通过以下方法生产:在免疫细胞中表达核碱基编辑器多肽或将核碱基编辑器多肽引入免疫细胞中,并且使该细胞与能够靶向编码至少一种多肽的核酸分子的两个或更多个向导rna接触;该至少一个多肽选自由以下所组成的群组:v-set免疫调节受体(vista)、t细胞免疫球蛋白粘蛋白3(tim-3)、具有ig和itim结构域的t细胞免疫受体(tigit)、转化生长因子β受体ii(tgfbrii)、含有调节因子x相关锚蛋白的蛋白质(rfxank)、含pvr相关免疫球蛋白结构域(pvrig)、淋巴细胞激活基因3(lag3)、细胞毒性t淋巴细胞相关蛋白4(ctla-4)、几丁质酶3样1(chi3l1)、分化簇96(cd96)、b和t淋巴细胞相关(btla)、tet甲基胞苷双加氧酶2(tet2)、sproutyrtk信号传导拮抗剂1(spry1)、sproutyrtk信号传导拮抗剂2(spry2)、ii类主要组织相容性复合物反式激活因子(ciita)、分化簇3(cd3)、分化簇7(cd7)、分化簇33(cd33)、分化簇52(cd52)、分化簇123(cd123)、t细胞受体β恒定区1(trbc1)、t细胞受体β恒定区2(trbc2)、细胞因子诱导型含sh2蛋白质(cish)、乙酰辅酶a乙酰转移酶1(acat1)、细胞色素p450家族11亚家族a成员1(cyp11a1)、gata结合蛋白3(gata3)、核受体亚家族4a组成员1(nr4a1)、核受体亚家族4a组成员2(nr4a2)、核受体亚家族4a组成员3(nr4a3)、甲基化控制的j蛋白(mcj)、fas细胞表面死亡受体(fas)、和选择蛋白p配体体/p-选择蛋白糖蛋白配体-1(selpg/psgl1)多肽;其中核碱基编辑器多肽包含核酸可编程dna结合蛋白(napdnabp)和腺苷或胞苷脱氨酶。一种实施方案中,生产细胞的方法进一步包括使细胞与能够靶向编码核酸分子的两个或更多个向导rna接触,该核酸分子选自由t细胞受体α恒定区(trac)、β-2微球蛋白(b2m)和程序性细胞死亡蛋白1(pd1)多肽所组成的群组。在另一实施方案中,生成经修饰的免疫细胞的方法进一步包括在该细胞中表面向导rna,该向导rna靶向细胞毒性t淋巴细胞相关蛋白4(ctla4)多核苷酸。[2167]本文提供一种如本文所述使用经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒性t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞具有抗瘤形成活性,通过包含在从患有瘤形成的受试者分离的免疫细胞内表达一个或多个向导rna和和碱基编辑器多肽的方法产生,该向导rna靶向编码选自由cblb、pd1、ctla4、tgfbr2、tigit或最小组织相容性多肽所组成的群组的多肽的多核苷酸,且该核碱基编辑器多肽包含核酸可编程dna结合蛋白(napdnabp)和胞苷脱氨酶或腺苷脱氨酶。在一种情况下,向导rna各自靶向cblb和pdcd1多核苷酸。在一种情况下,向导rna各自靶向pdcd1和ctla4多核苷酸。在一种情况下,向导rna各自靶向cblb、pdcd1和ctla4多核苷酸。在一种情况下,向导rna各自靶向cblb、pd1和ctla4多核苷酸。[2168]在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,向导rna靶向靶标多核苷酸中的剪接受体位点或剪接供体位点。在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,核碱基编辑器多肽在靶标多核苷酸中生成终止密码子。在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,核碱基编辑器多肽在pdcd1外显子2中生成终止密码子。在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,核碱基编辑器多肽进一步包含表达一种或多种核定位信号(nls)诸如二分体nls、n端nls、c端nls、或一种或多种尿嘧啶糖基化酶抑制剂。[2169]在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,napdnabp选自由cas9、casx、casy、cpfl、cas12b/c2c1、cas12c/c2c3,、cas12j/casφ和bvcas12b或其活性片段所组成的群组。在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,napdnabp结构域包含核酸酶死亡的cas9(dcas9)、cas9切口酶(ncas9)或核酸酶活性cas9。在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,胞苷脱氨酶是海七鳃鳗胞嘧啶脱氨酶1(pmcda1)或激活诱导型胞苷脱氨酶(aicda),并且腺苷脱氨酶是tada。[2170]在上述任何产生经修饰的免疫细胞的方法中,在一种情况下,该方法进一步包括在免疫细胞中表达一个或多个靶向tigit多核苷酸、tgfbr2多核苷酸、zap70多核苷酸、nfatc1多核苷酸和tet2多核苷酸的向导rna。[2171]应理解,在一些情况下,待给药至受试者的经修饰的免疫细胞不包含可检测的易位。[2172]本文提供一种使用具有降低的免疫原性和增加的抗瘤形成活性的经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒性t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞包含在trac、b2m、cblb或pd1多核苷酸或其组合中的突变。在一种情况下,经修饰的免疫细胞包含在b2m和trac多核苷酸中的突变。在另一种情况下,经修饰的免疫细胞包含在b2m、trac和pdcd1多核苷酸中的突变。在另一种情况下,经修饰的免疫细胞包含在b2m、trac和cblb多核苷酸中的突变。在另一种情况下,经修饰的免疫细胞包含在b2m、trac、cblb和pd1多核苷酸中的突变。在另一种情况下,经修饰的免疫细胞包含在一种或多种编码tigit、tgfbr2、zap70、nfatc1或tet2的多核苷酸中的突变。在另一种情况下,经修饰的免疫细胞包含在编码以下项的一种或多种多核苷酸中的突变:v-set免疫调节受体(vista)、t细胞免疫球蛋白粘蛋白3(tim-3)、具有ig和itim结构域的t细胞免疫受体(tigit)、转化生长因子β受体ii(tgfbrii)、含有调节因子x相关锚蛋白的蛋白质(rfxank)、含pvr相关免疫球蛋白结构域(pvrig)、淋巴细胞激活基因3(lag3)、细胞毒性t淋巴细胞相关蛋白4(ctla-4)、几丁质酶3样1(chi3l1)、分化簇96(cd96)、b和t淋巴细胞相关(btla)、tet甲基胞苷双加氧酶2(tet2)、,sproutyrtk信号传导拮抗剂1(spry1)、sproutyrtk信号传导拮抗剂2(spry2)、ii类主要组织相容性复合物反式激活因子(ciita)、分化簇3(cd3)、分化簇7(cd7)、分化簇33(cd33)、分化簇52(cd52)、分化簇123(cd123)、t细胞受体β恒定区1(trbc1)、t细胞受体β恒定区2(trbc2)、细胞因子诱导型含sh2蛋白质(cish)、乙酰辅酶a乙酰转移酶1(acat1)、细胞色素p450家族11亚家族a成员1(cyp11a1)、gata结合蛋白3(gata3)、核受体亚家族4a组成员1(nr4a1)、核受体亚家族4a组成员2(nr4a2)、核受体亚家族4a组成员3(nr4a3)、甲基化控制的j蛋白(mcj)、fas细胞表面死亡受体(fas)、或选择蛋白p配体体/p-选择蛋白糖蛋白配体-1(selpg/psgl1)。在另一种情况下,经修饰的免疫细胞表达嵌合抗原受体,该嵌合抗原受体包含,例如,具有对于与瘤形成相关的标志物(例如,b细胞成熟抗原(bcma))的亲和性的细胞外结构域。[2173]本文提供一种使用具有降低的免疫原性和增加的抗瘤形成活性的经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒性t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞包含在cd33、pd-1、cd2、trac多核苷酸或其组合中的一者或多者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd33、pd-1、cd52、trac或其组合中的两者或更多者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd33、pd-1、cd52、trac或其组合中的三者或更多者中的突变。在一种情况下,经修饰的免疫细胞包含在cd33、pd-1、cd52和trac中的突变。[2174]本文提供一种使用具有降低的免疫原性和增加的抗瘤形成活性的经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒性t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞包含在cd3、pd-1、cd2、trac、cd7多核苷酸或其组合中的一者或多者中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd3、pd-1、cd52、trac、cd7或其组合中的两者或更多者中的突变。在一种情况下,经修饰的免疫细胞包含在cd3和cd7中的突变。在各种实施方案中,经修饰的免疫细胞包含在cd3、pd-1、cd52、trac、cd7或其组合中的三者或更多者中的突变。在一种情况下,经修饰的免疫细胞包含在cd3、pd-1、cd52、trac和cd7中的突变。[2175]本文提供使用经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞通过在免疫细胞中表达以下项或将以下项引入免疫细胞中的方法产生:核碱基编辑器多肽;两个或更多个向导rna能够靶向编码选自由β-2微球蛋白(b2m)和程序性细胞死亡蛋白1(pd1)多肽所组成的群组的至少一个多肽的核酸分子;cas12多肽;能够靶向编码trac的核酸分子的向导rna;和编码嵌合抗原受体(car)或t细胞受体的dna供体模板,其中中核碱基编辑器多肽包含核酸可编程dna结合蛋白(napdnabp)和胞苷脱氨酶。[2176]本文提供一种使用具有降低的免疫原性和增加的抗瘤形成活性的经修饰的免疫细胞(例如,获自健康受试者的免疫细胞,或者t细胞诸如细胞毒性t细胞、调节t细胞或t辅助细胞)治疗瘤形成或液态癌症的方法,该经修饰的免疫细胞包含在b2m或pd-1中的突变、编码嵌合抗原受体(car)的核酸在trac基因座处的插入以及在免疫细胞表面上表达car。[2177]在本发明的一些实施方案中,本文提供一种治疗有此需要的受试者的液态癌症,包括向有此需要的受试者给药有效治疗量的本文所述药物组合物。待通过此类方法治疗的液态癌症包括但不限于,淋巴瘤、白血病、骨髓瘤或其组合。[2178]在一种情况下,本文提供一种治疗有此需要的受试者的液态癌症,包括向有此需要的受试者给药有效治疗量的本文所述药物组合物,其中液态癌症包含淋巴瘤。待使用本文所述方法治疗的液态淋巴瘤包括但不限于,恶性浆细胞肿瘤,霍奇金淋巴瘤;结节性淋巴细胞为主的霍奇金淋巴瘤;真性红细胞增多症,霍奇金淋巴瘤;小淋巴细胞性淋巴瘤(sll);弥散性大b细胞淋巴瘤;免疫母细胞性大细胞淋巴瘤;前体b成淋巴细胞性淋巴瘤;套细胞淋巴瘤;边缘带淋巴瘤;蕈样肉芽肿病;间变性大细胞淋巴瘤;sezary综合征;前体t成淋巴细胞性淋巴瘤;和具有弥散性大b细胞淋巴瘤与经典霍奇金淋巴瘤之间的中间特征的未归类b细胞淋巴瘤;b细胞非霍奇金淋巴瘤(nhl);滤泡性淋巴瘤;伯基特淋巴瘤;伯基特样淋巴瘤;边缘带淋巴瘤;讨套细胞淋巴瘤;弥漫性大b细胞淋巴瘤(dlbcl、原发性纵膈b细胞淋巴瘤;大b细胞淋巴瘤;前体b成淋巴细胞性淋巴瘤;具有弥散性大b细胞淋巴瘤与伯基特淋巴瘤之间的中间特征的未归类b细胞淋巴瘤;边缘带淋巴瘤;粘膜相关淋巴组织淋巴瘤;小细胞淋巴细胞性淋巴瘤;套细胞淋巴瘤;原发性纵隔(胸腺)大b细胞淋巴瘤;淋巴浆细胞性淋巴瘤(诸如华氏巨球蛋白血症);结节边缘区b细胞淋巴瘤;脾边缘带淋巴瘤;血管内大b细胞淋巴瘤;原发性渗出性淋巴瘤;淋巴瘤样肉芽肿病;富含t细胞/组织细胞的大b细胞淋巴瘤;原发性中枢神经系统淋巴瘤;原发性皮肤弥漫性大b细胞淋巴瘤(腿型);老年性ebv阳性弥漫性大b细胞淋巴瘤;与炎症相关的弥漫性大b细胞淋巴瘤;血管内大b细胞淋巴瘤;alk阳性大b细胞淋巴瘤;浆母细胞性淋巴瘤;在hhv8相关的多中心castleman病中发生的大b细胞淋巴瘤;纵膈(胸腺)大b细胞淋巴瘤;血管内大b细胞淋巴瘤;原发性渗出性淋巴瘤;鼻型、肠病型t细胞淋巴瘤;肝脾t细胞淋巴瘤;母细胞nk细胞淋巴瘤;原发皮肤间变性大细胞淋巴瘤;淋巴瘤样丘疹病;血管免疫母细胞性t细胞淋巴瘤;外周t细胞淋巴瘤;未指明的间变性大细胞淋巴瘤;经典霍奇金淋巴瘤(结节性硬化症,混合细胞结构,淋巴细胞丰富的,淋巴细胞耗尽或未耗尽);结节性淋巴细胞为主的霍奇金淋巴瘤;成人t细胞淋巴瘤;b细胞淋巴瘤-dlbcl、b细胞淋巴瘤-dlbcl-生发中心样;b细胞淋巴瘤-dlbcl-激活的b细胞样;非霍奇金淋巴瘤;原发性中枢神经系统(cns)淋巴瘤;t细胞淋巴瘤;外周t细胞淋巴瘤,皮肤t细胞淋巴瘤(ctcl);间变性大细胞淋巴瘤(alcl);aids相关淋巴瘤;肠病型t细胞淋巴瘤;肝脾t细胞淋巴瘤;母细胞nk细胞淋巴瘤;原发皮肤间变性大细胞淋巴瘤;淋巴瘤样丘疹病,血管免疫母细胞性t细胞淋巴瘤;外周t细胞淋巴瘤;未指明的间变性大细胞淋巴瘤;经典霍奇金淋巴瘤(结节性硬化症,混合细胞结构,淋巴细胞丰富的,淋巴细胞耗尽或未耗尽);和结节性淋巴细胞为主的霍奇金淋巴瘤;其他淋巴瘤;及此类淋巴瘤的组合。[2179]在一种情况下,本文提供一种治疗有此需要的受试者的液态癌症,包括向有此需要的受试者给药有效治疗量的本文所述药物组合物,其中液态癌症包含白血病。在一些情况下,白血病包括白血病前期。白血病前期包括,例如,骨髓增生异常综合征(mds)。在一些情况下,白血病是急性白血病。急性白血病包括,例如,急性骨髓性白血病(aml)。急性白血病也包括,例如,急性淋巴性白血病或急性淋巴细胞性白血病(all);all包括b谱系all、t谱系all和t细胞急性淋巴细胞性白血病(t-all)。其他待使用本文所述方法治疗的白血病包括但不限于,毛细胞白血病(hcl);慢性粒细胞白血病(civil);慢性粒单核细胞白血病(cmml);慢性淋巴细胞白血病(cll);b细胞幼淋巴细胞白血病,粒细胞白血病;伯基特白血病;t细胞幼淋巴细胞白血病;t细胞大大颗粒淋巴细胞白血病;侵略性自然杀手(nk)细胞白血病;成人t细胞白血病(atl);急性早幼粒细胞白血病(apml);幼淋巴细胞白血病(pll);成红细胞白血病;急性巨核细胞白血病;大颗粒淋巴细胞白血病(lgf);慢性粒细胞白血病(cml);其他白血病;及此类白血病的组合。[2180]在一种情况下,本文提供一种治疗有此需要的受试者的液态癌症,包括向有此需要的受试者给药有效治疗量的本文所述药物组合物,其中液态癌症包含骨髓瘤。但使用本文所述方法治疗的骨髓瘤包括但不限于多发性骨髓瘤;阴燃多发性骨髓瘤;浆细胞骨髓瘤;非分泌性骨髓瘤,igd骨髓瘤;骨硬化性骨髓瘤;其他骨髓瘤;以及此类骨髓瘤的组合。[2181]在一种情况下,本文提供一种治疗有此需要的受试者的液态癌症的方法,包括向有此需要的受试者给药有效治疗量的本文所述药物组合物,其中液态癌症包含卡勒氏病;骨髓性白血病;浆细胞瘤;骨孤立性浆细胞瘤;髓外浆细胞瘤霉菌病真菌病/sezary综合征;原发性皮肤cd30阳性t细胞淋巴增殖性疾病;嗜酸性粒细胞增多症;慢性嗜酸性粒细胞增多症;和其他造血细胞相关癌症。[2182]在一种实施方案中,向受试者给药至少0.1×105细胞、至少0.5×105细胞、至少1×105细胞、至少5×105细胞、至少1×106细胞、至少0.5×107细胞、至少1×107细胞、至少0.5×108细胞、至少1×108细胞、至少0.5×109细胞、至少1×109细胞、至少2×109细胞、至少3×109细胞、至少4×109细胞、至少5×109细胞、或至少1×1010细胞。在特定实施方案中,向受试者给药约1×107细胞至约1×109细胞、约2×107细胞至约0.9×109细胞、约3×107细胞至约0.8×109细胞、约4×107细胞至约0.7×109细胞、约5×107细胞至约0.6×109细胞、或约5×107细胞至约0.5×109细胞。[2183]在一些实施方案中,向受试者给药至少0.1×104细胞/kg体重、至少0.5×104细胞/kg体重、至少1×104细胞/kg体重、至少5×104细胞/kg体重、至少1×105细胞/kg体重、至少0.5×106细胞/kg体重、至少1×106细胞/kg体重、至少0.5×107细胞/kg体重、至少1×107细胞/kg体重、至少0.5×108细胞/kg体重、至少1×108细胞/kg体重、至少2×108细胞/kg体重、至少3×108细胞/kg体重、至少4×108细胞/kg体重、至少5×108细胞/kg体重、或至少1×109细胞/kg体重。在特定实施方案中,向受试者给药约1×106细胞/kg体重至约1×108细胞/kg体重、约2×106t细胞/kg体重至约0.9×108细胞/kg体重、约3×106细胞/kg体重至约0.8×108细胞/kg体重、约4×106细胞/kg体重至约0.7×108细胞/kg体重、约5×106细胞/kg体重至约0.6×108细胞/kg体重、或约5×106细胞/kg体重至约0.5×108细胞/kg体重。[2184]本领域技术人员将会了解,在特定实施方案中可能需要设想的多次给药t来实现所希望的治疗。例如,组合物可以在历时1周、2周、3周、1个月、2个月、3个月、4个月、5个月、6个月、1年、2年、5年、10年或更久的时间跨度内向受试者给药1、2、3、4、5、6、7、8、9或10次或更多次。在任何此类方法中,该方法可包括向受试者给药有效量的经修饰的免疫细胞,并且该方法增加或降低免疫应答。在任何此类方法中,该方法可包括每天给药一个或多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每天给药两个或更多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每天给药三个或更多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每周给药一个或多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每周给药两个或更多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每周给药三个或更多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每个月给药一个或多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每个月给药两个或更多个剂量的有效量的经修饰的免疫细胞。在任何此类方法中,该方法可包括每个月给药三个或更多个剂量的有效量的经修饰的免疫细胞。[2185]在某些实施方案中,可能希望向受试者给药激活的药物组合物,然后重新抽血(或已经执行血液成分单采),激活来自其的t细胞,并将这些激活且扩张的t细胞回输给患者。这一过程每数周可进行多次。在某些实施方案中,t细胞可从来自10cc至400cc的抽取血液激活。在某些实施方案中,t细胞可从来自20cc、30cc、40cc、50cc、60cc、70cc、80cc、90cc、100cc、150cc、200cc、250cc、300cc、350cc、或400cc或更多的抽取血液激活。[2186]本文设想的药物组合物给药可以使用传统技术进行,包括但不限于输液、输血或肠胃外地。在一些实施方案中,肠胃外给药包括血管内、静脉内、肌肉内、动漫、鞘内、肿瘤内、皮内、腹膜内、透过器官、皮下、表皮下、关节内、包膜下、蛛网膜下和胸骨内输液或注射。[2187]个体受试者的应答可以表征为完全缓解、部分缓解、病情稳定和病情进展。在一些实施方案中,应答是完全缓解(cr)。完全缓解定义为全部循环肿瘤细胞(ctc)或单核血细胞(mnbc)的消失,即,任何病理淋巴结(无论靶标或非靶标)必须具有减少至《10mm的短轴。在一些示例(例如,aml)中,完全缓解可以定义如下:骨髓原始细胞《5%;不存在具有奥氏小体棒的原始细胞;不存在髓外疾病;绝对中性粒细胞计数》1.0x109/l(1000/μl);血小板计数》100x109/l(100000/μl);和红细胞输血的非依赖性。在某些实施方案中,应答是伴有不完全恢复的cr(cri)。在一些示例(例如,aml)中,伴有不完全恢复的cr可以定义为包括全部cr评判标准,但残余中性粒细胞减少(《1.0x109/l[1000/μl])或血小板减少症(《100x109/l[100000/μl])除外。在某些实施方案中,应答是形态学无白血病状态。在一些示例(例如,aml)中,形态学无白血病状态可以定义为包括骨髓原始细胞《5%;不存在具有奥氏小体棒的原始细胞;不存在髓外疾病;以及不需要血液学恢复。在某些实施方案中,应答是部分缓解(pr)。部分缓解可以定义为血清中循环肿瘤细胞(ctc)或单核血细胞(mnbc)的直径总和平均减少至少30%,以基线直径总和作为参考。在一些示例(例如,aml)中,部分缓解可以定义为包括cr的全部血液学评判标准;骨髓原始细胞百分比降低到5%至25%;以及治疗前骨髓原始细胞百分比减少至少50%。在某些实施方案中,应答是形态学无白血病状态。在一些示例(例如,aml)中,形态学无白血病状态可以定义为包括骨髓原始细胞《5%;不存在具有奥氏小体棒的原始细胞;不存在髓外疾病;以及不需要血液学恢复。在某些实施方案中,应答是复发。[2188]在一些示例(例如,aml)中,复发可以定义为包括骨髓原始细胞《5%;不存在具有奥氏小体棒的原始细胞;不存在髓外疾病;以及不需要血液学恢复。在一些实施方案中,应答是病情进展(pd)。病情进展可以定义为循环肿瘤细胞(ctc)或单核血细胞(mnbc)的数量增加至少20%,以研究期间的最小数量为参考(这包括基线数量,如果基线数量是最小的);以及循环肿瘤细胞(ctc)或单核血细胞(mnbc)的绝对数量增加至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、或至少100个或更多个。[2189]一个或多个新病灶的出现也视为进展。在一些实施方案中,疾病可以是病情稳定(sd)。病情稳定的特征可以在于,液态癌症细胞数量既没有足够降低到符合pr标准也没有足够增加到符合pd标准,以ctc和/或mnbc在研究期间的最小数量为参考。在某些实施方案中,应答是病理完全缓解。病理完全缓解,例如,如由病理学家在检查在手术或活检时间去除的组织后所确定,一般是指手术标本中不存在侵袭性和/或非侵袭性液态癌症细胞的组织学证据。[2190]在一些实施方案中,药物组合物每周给药两次或三次。在另一实施方案中,药物组合物每周给药两次。在另一实施方案中,药物组合物每2或3周给药一次。在另一实施方案中,药物组合物每1或2周给药一次。在另一实施方案中,药物组合物在21天周期的第1、4、8和11天给药。在另一实施方案中,药物组合物在28天周期的第1、8和15天给药。[2191]在一些实施方案中,所给药化合物的量是约0.5-30mg每千克人类受试者体重。在另一实施方案中,所给药化合物的量是约0.5-20mg每千克人类受试者体重。在另一实施方案中,所给药化合物的量是约0.5-10mg每千克人类受试者体重。在另一实施方案中,所给药化合物的量是约0.04mg、约0.08mg、约0.16mg、约0.32mg、约0.64mg、约1.25mg、约1.28mg、约1.92mg、约2.5mg、约3.56mg、约3.75mg、约5.0mg、约7.12mg、约7.5mg、约10mg、约14.24mg、约15mg、约20mg、或约30mg每千克人类受试者体重。在另一实施方案中,所给药化合物的量是约1.92mg、约3.75mg、约7.5mg、约15.0mg、或约30.0mg每千克人类受试者体重,且该药物每周给药两次。在另一实施方案中,所给药化合物的量是约1.28mg、约2.56mg、约5.0mg、约10mg、或约20mg每千克人类受试者体重,且该药物每周给药两次。在另一实施方案中,所给药化合物的量是约1.92mg、约3.75mg、约7.5mg、约15.0mg、或约30.0mg每千克人类受试者体重,且该药物每周给药一次。在另一实施方案中,所给药化合物的量是约1.28mg、约2.56mg、约5.0mg、约10mg、或约20mg每千克人类受试者体重,且该药物每周给药一次。在另一实施方案中,所给药化合物的量是约1.92mg、约3.75mg、约7.5mg、约15.0mg、或约30.0mg每千克人类受试者体重,且该药物每天给药一次,在每个七天时间内执行三次、五次或七次。在另一实施方案中,化合物经静脉内每天给药一次,在七天时间内执行七次。在另一实施方案中,所给药化合物的量是约1.28mg、约2.56mg、约5.0mg、约10mg、或约20mg每千克人类受试者体重,且该药物每天给药一次,在每个七天时间内执行三次、五次或七次。在另一实施方案中,化合物经静脉内每天给药一次,在七天时间内执行七次。[2192]在一些实施方案中,化合物历经0.25h、0.5h、1h、2h、3h、4h、5h、6h、7h、8h、9h、10h、11h或12h的时间给药。在另一实施方案中,化合物历经0.25至2h的时间给药。在另一实施方案中,化合物历经1h的时间逐步给药。在另一实施方案中,化合物历经2h的时间逐步给药。[2193]在一些实施方案中,化合物的体内循环半衰期是约1h、2h、3h、4h、5h、6h、7h、8h、9h、10h或12h。在另一实施方案中,化合物的体内循环半衰期是约4h。在另一实施方案中,化合物的体内循环半衰期是约6h。在一些实施方案中,化合物的生物组织半衰期是约1h、2h、3h、4h、5h、6h、7h、8h、9h、10h或12h。在另一实施方案中,化合物的生物组织半衰期是约10h。[2194]在一些实施方案中,自治疗开始后1个月的时间内,治疗导致液态癌症细胞的数量降低约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约45%、约40%、约35%、约30%、约25%、约20%、约15%、约10%、或约5%。在另一实施方案中,自治疗开始后1个月的时间内,治疗导致液态癌症细胞的数量降低至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、或至少约95%。在另一实施方案中,自治疗开始后1年的时间内,治疗导致液态癌症细胞的数量降低约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约45%、约40%、约35%、约30%、约25%、约20%、约15%、约10%、或约5%。在另一实施方案中,自治疗开始后1年的时间内,治疗导致液态癌症细胞的数量降低至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、或至少约95%。在另一实施方案中,自治疗开始后6个月的时间内,治疗导致液态癌症细胞的数量降低约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约45%、约40%、约35%、约30%、约25%、约20%、约15%、约10%、或约5%。在另一实施方案中,自治疗开始后6个月的时间内,治疗导致液态癌症细胞的数量降低至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、或至少约95%。在另一实施方案中,自治疗开始后3个月的时间内,治疗导致液态癌症细胞的数量降低约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约45%、约40%、约35%、约30%、约25%、约20%、约15%、约10%、或约5%。在另一实施方案中,自治疗开始后3个月的时间内,治疗导致液态癌症细胞的数量降低至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、或至少约95%。[2195]在一些实施方案中,治疗导致人类受试者的存活时间比该人类受试者未使用该化合物治疗时该人类受试者的预期存活时间增加。在另一实施方案中,人类受试者的存活时间增加至少30天。在另一实施方案中,人类受试者的存活时间增加至少3个月。在另一实施方案中,人类受试者的存活时间增加至少6个月。在另一实施方案中,人类受试者的存活时间增加至少1年。[2196]在一些实施方案中,人类受试者是难治性的和/或对于一种或多种液体癌症的治疗不耐受。在另一实施方案中,人类受试者已经进行至少一种不成功的液态癌症既往治疗和/或疗法。[2197]在一些实施方案中,待使用所述方法治疗的人类受试者是儿童(例如,年龄为0至18岁)。在其他实施方案中,待使用所述方法治疗的人类受试者是成人(例如,年龄为18+岁)。[2198]试剂盒[2199]本发明提供用于治疗受试者的瘤形成的试剂盒。在一些实施方案中,试剂盒用于治疗实体肿瘤。在其他实施方案中,试剂盒用于治疗液态肿瘤。在一些实施方案中,试剂盒用于治疗血液学癌症。在一些实施方案中,血液学癌症是b细胞癌症。在一些实施方案中,血液学癌症是白血病、骨髓瘤和/或淋巴瘤。在一些实施方案中,试剂盒用于治疗选自由以下所组成的群组的瘤形成:t细胞急性成淋巴细胞性白血病(t-all)、蕈样肉芽肿(mf)、sézary综合征(ss)、外周t/nk细胞淋巴瘤、间变性大细胞淋巴瘤alk+、原发性皮肤t细胞淋巴瘤、t细胞大颗粒淋巴细胞型白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+淋巴增生性疾病、结外nk/t细胞淋巴瘤、成人t细胞白血病/淋巴瘤、t细胞幼淋巴细胞白血病、皮下脂膜炎样t细胞淋巴瘤、原发性皮肤γδt细胞淋巴瘤、侵袭性nk细胞白血病和肠病相关t细胞淋巴瘤。在一些实施方案中,试剂盒用于治疗t细胞急性成淋巴细胞性白血病(t-all)。在一些实施方案中,试剂盒用于治疗急性骨髓性白血病(aml)。在一些实施方案中,试剂盒用于治疗人类受试者。[2200]在一些实施方案中,试剂盒包含本文所提供的任何嵌合抗原受体。在一些实施方案中,试剂盒包含编码本文所提供的任何嵌合抗原受体的核酸。在一些实施方案中,试剂盒包含本文所提供的经修饰的免疫细胞。在一些实施方案中,试剂盒包括表达cd3car、cd5car、cd7car、cd33car和/或cd123car的经修饰的免疫细胞。在一些实施方案中,任何免疫细胞进一步包含在cd3、cd5、cd7、cd33、cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和/或pd1或其组合中的一者或多者中的突变。[2201]在一些实施方案中,试剂盒包括本文所提供的经修饰的免疫细胞群。在一些实施方案中,试剂盒包含本文所提供的药物组合物。在一些实施方案中,试剂盒包括经cd123修饰的免疫细胞群或者药物组合物,该药物组合物包含经cd123修饰的免疫细胞或经修饰的免疫细胞群。在一些实施方案中,试剂盒包括经cd5修饰的免疫细胞群或者药物组合物,该药物组合物包含经cd5修饰的免疫细胞或经修饰的免疫细胞群。在一些实施方案中,试剂盒包括经cd7修饰的免疫细胞群或者药物组合物,该药物组合物包含经cd7修饰的免疫细胞或经修饰的免疫细胞群。在一些实施方案中,试剂盒包括经cd33修饰的免疫细胞群或者药物组合物,该药物组合物包含经cd33修饰的免疫细胞或经修饰的免疫细胞群。在一些实施方案中,试剂盒包括经cd3修饰的免疫细胞群或者药物组合物,该药物组合物包含经cd3修饰的免疫细胞或经修饰的免疫细胞群。[2202]在一些实施方案中,试剂盒进一步包括碱基编辑器多肽或编码碱基编辑器多肽的多核苷酸,其中碱基编辑器多肽包含核酸可编程dna结合蛋白(napdnabp)和脱氨酶。在一些实施方案中,napdnabp是cas9或cas12。在一些实施方案中,编码碱基编辑器的多核苷酸是mrna序列。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。[2203]本发明提供包含核酸构建体的试剂盒,该核酸构建体包含编码胞苷或腺苷脱氨酶核碱基编辑器的核苷酸序列和至少一个向导rna,每个向导rna具有核酸序列,该核酸序列与编码trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m、pd1、cblb和/或ctla4的基因的核酸序列至少85%互补。在一些实施方案中,编码胞苷或腺苷脱氨酶的核苷酸序列包含异源启动子,该异源启动子驱动胞苷或腺苷脱氨酶核碱基编辑器的表达。[2204]本公开的一些方面提供包含核酸构建体的试剂盒,该核酸构建体包含编码和碱基编辑器的核苷酸和向导rna。在一些实施方案中,核酸构建体包含异源启动子,该异源启动子驱动核碱基编辑器的表达。在一些实施方案中,本公开提供包含核酸构建体的试剂盒,该核酸构建体包含(a)编码本文所提供的融合至胞苷或腺苷脱氨酶的(a)cas9结构域的核苷酸序列;和(b)异源启动子,其驱动(a)的序列的表达。在一些实施方案中,cas9结构域融合至胞苷脱氨酶。在一些实施方案中,cas9结构域融合至腺苷脱氨酶。[2205]在一些实施方案中,试剂盒包含胞苷脱氨酶核碱基编辑器和向导rna。在一些实施方案中,试剂盒包含腺苷脱氨酶核碱基编辑器和向导rna。在一些实施方案中,试剂盒进一步包含一个或多个向导核酸序列。在一些实施方案中,该一个或多个向导核酸序列靶向cd3、cd5、cd7、cd33或cd123。在一些实施方案中,该一个或多个向导核酸序列各自靶向cd3、cd5、cd7、cd33、cd123、trac、lag-3、fas、ciita、trbc1、trbc2、cd52、b2m和/或pd1中的一者。在一些实施方案中,向导rna具有核酸序列,该核酸序列与编码cd5的基因的核酸序列至少85%互补。在一些实施方案中,试剂盒包含核碱基编辑器和cd5向导rna。在一些实施方案中,向导rna具有核酸序列,该核酸序列与编码cd7的基因的核酸序列至少85%互补。在一些实施方案中,试剂盒包含核碱基编辑器和cd7向导rna。在一些实施方案中,向导rna具有核酸序列,该核酸序列与编码cd33的基因的核酸序列至少85%互补。在一些实施方案中,试剂盒包含核碱基编辑器和cd33向导rna。在一些实施方案中,向导rna具有核酸序列,该核酸序列与编码cd3的基因的核酸序列至少85%互补。在一些实施方案中,试剂盒包含核碱基编辑器和cd3向导rna。在一些实施方案中,向导rna具有核酸序列,该核酸序列与编码cd123的基因的核酸序列至少85%互补。在一些实施方案中,试剂盒包含胞苷脱氨酶核碱基编辑器和cd123向导rna。在一些实施方案中,试剂盒可进一步包括一个或多个另外的向导rna,每个向导rna具有核酸序列,该核酸序列与编码trac、lag-3、fas、pd1、b2m、ciita、trbc1、trbc2和/或cd52的基因的核酸序列至少85%互补。[2206]瘤形成治疗试剂盒可进一步包括关于使用经修饰的免疫细胞治疗瘤形成的书面使用说明。在其他实施方案中,使用说明包括以下至少一项:注意事项;警告;临床研究;和/或参考资料。使用说明可以直接印刷在容器(当存在时)上,或作为标签施加到容器上,或作为独立的纸张、小册子、卡片或折页提供在容器内或随容器提供。在进一步的实施方案中,试剂盒可包括标签或独立插页(包装插页)形式的针对合适的操作参数的使用说明。在又一实施方案中,试剂盒可包含一个或多个具有一种或多种适当阳性和阴性对照样品的容器,这些对照样品待用作标品用于检测、校正或归一化。试剂盒可进一步包含第二容器,该第二容器包含药学上可接受的缓冲液,诸如(无菌)磷酸盐缓冲盐水、林格溶液或葡萄糖溶液。它可以进一步包括来自商用和使用者观点的其他所希望的材料,包括其他缓冲剂、稀释剂、过滤器、针、注射器和具有使用说明的包装插页。[2207]除非另外指定,否则本发明的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的传统技术,这些技术完全在该领域技术人员的权限之内。此类技术在文献中有完整阐述,例如,《分子克隆:实验室手册(第二版)》(molecularcloning:alaboratorymanual,secondedition(sambrook,1989));《寡核苷酸合成》(oligonucleotidesynthesis(gait,1984));《动物细胞培养》(animalcellculture(freshney,1987));《酶学方法:实验免疫学手册》(methodsinenzymologyhandbookofexperimentalimmunology(weir,1996));《用于哺乳动物细胞的转基因载体》(genetransfervectorsformammaliancells(millerandcalos,1987));《分子生物学现代方法》(currentprotocolsinmolecularbiology(ausubel,1987));《pcr:聚合酶链反应》(pcr:thepolymerasechainreaction,(mullis,1994));《免疫学现代方法》(currentprotocolsinimmunology(coligan,1991))。这些技术可用于生产本发明的多核苷酸和多肽,并因此可视为作出并实践本发明。尤其可用于具体实施方案的技术将在以下章节中讨论。[2208]详述以下实施例以向该领域技术人员提供对如何制备和使用本发明的检验、筛选和治疗性方法的完全公开和说明,并且以下实施例不试图限制发明人所认为的本发明的范畴。[2209][实施例][2210]实施例1:在免疫细胞中表达的基因中剪接位点的中断和终止密码子的引入[2211]使用核碱基编辑器be4来中断剪接位点并将终止密码子插入到在免疫细胞中表面的基因子集中。质粒构建体pcmv_be4max编码be4,其包含具有胞苷脱氨酶活性的apobec-1胞苷脱氨酶结构域、包含d10a突变且具有切口酶活性的cas9结构域、和两个尿嘧啶dna糖基化酶抑制剂(ugi)结构域。ugi是一种83个氨基酸残基的蛋白质,其源自枯草芽孢杆菌噬菌体pbs1,有效地阻断以编辑在免疫细胞中表达的某些基因的剪接位点。be4进一步包含n端和c端核定位序列(nls)。[2212]》pcmv_be4max[2213]atatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctcctcagagactgggcctgtcgccgtcgatccaaccctgcgccgccggattgaacctcacgagtttgaagtgttctttgacccccgggagctgagaaaggagacatgcctgctgtacgagatcaactggggaggcaggcactccatctggaggcacacctctcagaacacaaataagcacgtggaggtgaacttcatcgagaagtttaccacagagcggtacttctgccccaataccagatgtagcatcacatggtttctgagctggtccccttgcggagagtgtagcagggccatcaccgagttcctgtccagatatccacacgtgacactgtttatctacatcgccaggctgtatcaccacgcagacccaaggaataggcagggcctgcgcgatctgatcagctccggcgtgaccatccagatcatgacagagcaggagtccggctactgctggcggaacttcgtgaattattctcctagcaacgaggcccactggcctaggtacccacacctgtgggtgcgcctgtacgtgctggagctgtattgcatcatcctgggcctgcccccttgtctgaatatcctgcggagaaagcagccccagctgaccttctttacaatcgccctgcagtcttgtcactatcagaggctgccaccccacatcctgtgggccacaggcctgaagtctggaggatctagcggaggatcctctggcagcgagacaccaggaacaagcgagtcagcaacaccagagagcagtggcggcagcagcggcggcagcgacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgacagcggcgggagcggcgggagcggggggagcactaatctgagcgacatcattgagaaggagactgggaaacagctggtcattcaggagtccatcctgatgctgcctgaggaggtggaggaagtgatcggcaacaagccagagtctgacatcctggtgcacaccgcctacgacgagtccacagatgagaatgtgatgctgctgacctctgacgcccccgagtataagccttgggccctggtcatccaggattctaacggcgagaataagatcaagatgctgagcggaggatccggaggatctggaggcagcaccaacctgtctgacatcatcgagaaggagacaggcaagcagctggtcatccaggagagcatcctgatgctgcccgaagaagtcgaagaagtgatcggaaacaagcctgagagcgatatcctggtccataccgcctacgacgagagtaccgacgaaaatgtgatgctgctgacatccgacgccccagagtataagccctgggctctggtcatccaggattccaacggagagaacaaaatcaaaatgctgtctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacactcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatc[2214]为了查明be4在敲低或敲除免疫细胞中的蛋白质表达中的有效性,将第一个免疫细胞群用编码be4的mrna和sgrna共转染,该sgrna靶向与trac外显子2、trac外显子4或b2m外显子1的供体或受体剪接位点的g碱基互补的c碱基,取决于特异性靶标位点。mrna通过体外转录产生(trilinbiotechnologies)。简而言之,将4g的be4mrna和2g的合成grna电穿孔到1mcd3+t细胞内(nucleofectortm平台,lonzabioscience)。然后将细胞培养3天以进行足够时间的碱基编辑。为了进行比较,将第二个免疫细胞群用编码cas9核酸酶和靶向b2m外显子1的供体剪接位点的g碱基的sgrna共转染。未观察到be4编辑与cas9编辑之间的明显差异,每个经编辑的基因的敲低率均大于90%,而未经电穿孔的对照细胞没有明显的敲低(图2)。[2215]假设如果用编码be4的mrna(其催化单链缺口)或用cas9核酸酶(其催化双链断裂)转染细胞,则造成观察到的靶向基因敲低的基因修饰将会有所不同。为了测试这一假设,用编码be4的2gbe4/1gsgrna(中)或4gbe4/2gsgrna(高)rna和靶向b2m外显子1的供体剪接位点的g碱基的sgrna共转染免疫细胞。在孵育3、5和7天后,收集dna并测序。参考图3,大多数碱基编辑表明了仅中断剪接位点并且以预期方式进行(即,并入了反义链中的c到t转换,导致有义链中的g到a转换)。这些结果与从用cas9核酸酶转染的细胞中获得的结果形成对比,后者显示,在用cas9转染的细胞中,大多数编辑是插入缺失(图3)。[2216]剪接位点的中断和终止密码子的插入可能在敲低靶标基因的表达中有效。be4介导的对trac外显子4中剪接受体以及b2m外显子1和pdcd1外显子1中剪接供体的编辑导致全长蛋白质的表达减少(图4和5)。在剪接位点中观察到的be4介导的改变是c到t转换,但也观察到了插入缺失和c到g转换。将赭色终止密码子插入到pdcd1基因的外显子2中(其中该外显子中的连续胞苷残基被靶向并编辑为胸苷残基),也导致基因表达的显著敲低,尽管敲低程度低于关于trac和b2m基因所见(图4)。这些结果进一步表明,be4介导的对免疫细胞中表达的基因的单个或连续胞苷碱基的编辑导致基因表达的有效减少。[2217]实施例2:剪接位点中断和终止密码子插入的计算机模拟分析[2218]为了确定所设计的grna是否会结合至非位点靶标,使用cas-offinder分析grna的核酸序列。参考图6,“x”凸起类型指示grna与基因dna对齐并且任何矛盾之处均为误配。随着误配数从一增加到四,潜在的非位点结合增加。例如,关于trac外显子4剪接受体的结果显示,当存在三个误配时,存在26种非位点结合可能性,而存在四个误配时则存在164种可能性。[2219]如果grna具有凸起,其中grna具有二十个碱基对但与基因组dna的十九个碱基对对齐,则导致凸起。再参考图6,当trac外显子4剪接受体grna具有一个碱基对的凸起时,非位点结合可能性的数量随着误配的增加而增加;然而,当不存在凸起(即,当凸起尺寸为零时)时,该可能性的数量显著降低。[2220]实施例3:免疫细胞内的多重碱基编辑[2221]为了确定be4是否将会介导多个基因的碱基编辑以生成多敲低细胞,用编码be4碱基编辑器的mrna连同靶向b2m、trac、pd1或其组合中的靶标特异性位点的sgrna一起共转染免疫细胞。参考图7,be4系统引起有效的敲低,如通过流式细胞术所测量,以鉴定在单、双、三基因编辑中蛋白质生产降低的细胞百分比。将细胞基于b2m和cd3表达进行选通,其中cd3表达充当trac表达的指标。因为pd1染色效率低下,并未执行对表达这一蛋白质的细胞的直接测量。在具有单、双和三基因编辑的细胞群之间未观察到差异,且经修饰以敲低b2m、trac和pd1(三基因编辑)的表达的免疫细胞可检测地不同于未经修饰的免疫细胞(图8)。[2222]造成蛋白质表达降低的基因修饰总结在图9中。具体地且类似于实施例1中所述的导致在单基因修饰中表达降低的机制,c到t转换构成了在经修饰的b2m单修饰基因细胞群中和b2m+pd1、b2m+trac和b2m+trac+pd1多修饰基因细胞群中观察到的大量编辑。插入缺失和转换构成了在经编辑的基因中的基因改变的不显著的很小一部分。[2223]因此,通过碱基编辑对三个基因座进行同步修饰产生了高效敲除而没有可检测的易位事件,如通过单向靶向测序(uditas;giannoukos等人,bmcgenomics.2018mar21;19(1):212.doi:10.1186/s12864-018-4561-9)所评估。此外,在经be4编辑的基因中未检测到易位。采用微滴式数字聚合酶链反应(ddpcr)策略(图10)来检测经be4编辑的b2m、trac和pd1基因之间的易位。使用qx200微滴式数字仪器(bio-rad),用下一代测序(ngs)来分析从经be4或cas9编辑以生成b2m+trac+pd1编辑的细胞提取的dna,以确定be4和cas9编辑的确切序列。如图11的左图所示,在大多数细胞中,b2m、trac和pd1基因被修饰。ddpcr分析显示,在经be4编辑的细胞中不存在易位,但在大约1.7%的经cas9编辑的细胞中观察到了易位(图11,右图)。表21进一步示例性说明在经be4编辑的细胞中没有观察到易位。[2224]表21[2225]碱基编辑器易位对照扩增子微滴实验扩增子微滴cas9核酸酶b2m-trac61,206585b2m-pdcd155,970291pdcd1-trac59,600112be4b2m-trac90,7170b2m-pdcd189,0280pdcd1-trac83,5010[2226]实施例4:be4介导的对cbl原癌基因b(cblb)的编辑[2227]cbl-b是一种t细胞受体(tcr)信号传导蛋白,其负向调节tcr复合物信号传导(图12)。因为t细胞在cbl-b信号传导被抑制时具有较低的活化阈值,敲除或敲低这一基因将会显著改善t细胞或表达car的t细胞的有效性。为了确定cbl-b基因是否对胞苷脱氨基介导的修饰敏感,用编码be4的mrna和sgrna(其靶向外显子8和16的剪接位点受体、外显子8、10、11和12的剪接位点供体,或者将会促进stop密码子插入到外显子1、4和8中)转染细胞。所得细胞使用流式细胞术分析。[2228]参考图13,中断外显子12的剪接位点供体和外显子8的剪接位点受体导致cbl-b表达的最大减少(分别为67.2%和57.4%)。在用外显子8剪接位点受体和外显子12剪接位点供体sgrna转染的细胞中,略微超过60%的细胞被成功地编辑(图13,柱状图)。[2229]实施例5:免疫细胞中的cas12b核酸酶表征[2230]cas12b/c2c1位点特异性地靶向并切割双链核酸分子的两条链。通过确定两种不同的cas12b/c2c1蛋白(bhcas12b和bvcas12b)介导靶标核酸分子中的插入缺失的倾向性,表征了这两种酶。将编码cas12b/c2c1蛋白的mrna连同向导rna电穿孔到t细胞中,该向导rna对于grin2b基因中的基因座和dnmt1基因中的基因座具有特异性。将细胞培养3至5天,然后分离细胞dna。通过下一代测序来确定插入缺失率。参考图14,关于所具有的在grin2b基因中的插入缺失百分比,与分离自经bvcas12b蛋白处理的细胞的dna(大约20%)相比,分离自经bhcas12b蛋白处理的细胞的dna中要高得多(大约75%)。也观察到,关于dnmt1基因中的插入缺失,与分离自经bvcas12b处理的细胞的dna(大约0%)相比,分离自经bhcas12b处理的细胞的dna中要高得多(大约20%)。[2231]使用bhcas12b(v4)蛋白中断trac基因。经由使用编码bhcas12b(v4)蛋白的mrna连同对grin2b、dnmt1和trac基因中的基因座具有特异性的向导rna进行电穿孔来转导t细胞。在电穿孔后96小时,使用荧光辅助细胞分选(facs)分析来评估细胞,其中将细胞针对cd3(trac的指标)选通。参考图15,用编码gfp的质粒或者用bhcas12b(v4)和对grin2b或dnmt1具有特异性的rna转导的t细胞中的大约95%是cd3+。那些经转导以表达bhcas12b(v4)和对trac基因中的基因座具有特异性的向导rna的细胞较不可能是cd3+(大约2%到大约50%,取决于所使用的向导rna)。所测试的十一种trac向导rna中有三种导致大约100%的bhcas12b(v4)介导的插入缺失。[2232]实施例6:car-p2a-mcherry慢病毒表达表征[2233]使用car-p2a-mcherry慢病毒将细胞转导以表达嵌合抗原受体(car),并使用荧光辅助细胞分选(facs)进行针对car表达的分析。将细胞脱色,与缀合至r-藻红蛋白(pe)或异硫氰酸荧光素酯(fitc)的bcma蛋白一起孵育。因为bcma是car的靶标抗原,表达car的细胞将会结合染料标记的bcma。参考图16,对于未染色的细胞,facs分析仅检测经转导的样品中mcherry的存在,其中一些溢出到pe通道内。bcma-pe通道显示超出在溢出效应中所见的高度阳性信号,并且这些结果在与bcma-fitc一起孵育的细胞中被证实。染料标记的bcma蛋白检测结果表明了几乎与针对mcherry所见相同的car表达。参考图17,经由facs分析在经聚(1,8-辛二醇柠檬酸酯)(poc)慢病毒载体转导的细胞中检测到85%car表达。[2234]实施例7:be4产生有效、持久的基因敲除且具有高产物纯度[2235]be4介导多个基因的碱基编辑以生成多敲低细胞。用编码be4碱基编辑器的mrna连同靶向b2m、trac、pd1或其组合中的靶标特异性位点的sgrna一起共转染免疫细胞。如测序资料所示,碱基编辑在修饰细胞中有效并且持续长达至少7天(图18)。观察到了高产物纯度,因为c到t转换构成了大量的所观察到的编辑。插入缺失以及c到g和c到a转换构成了在经编辑的基因中的基因改变的不显著的很小一部分。在生成所希望的修饰方面,碱基编辑与spcas9核酸酶一样有效。[2236]be4系统引起了有效敲低,如通过流式细胞术所测量,这鉴定了具有降低的表面表达的细胞百分比(图19a)。针对b2m表达选通的细胞展示出细胞表面上b2m蛋白的丧失。如通过流式细胞术所测量,在生成b2m蛋白敲除方面,碱基编辑也与spcas9核酸酶一样有效。[2237]实施例8:正交易位检测测定不能检测be4介导的经三重编辑的t细胞中的重排[2238]用编码be4碱基编辑器的mrna连同靶向b2m、trac和pd1中的靶标特异性位点的sgrna一起共转染免疫细胞。使用易位检测测定来评定经三重编辑的t细胞,该测定能够检测b2m、trac和pd1靶标基因之间的不希望的特异性易位(图20)。注意,这些特异性易位无一在任何经be4编辑的基因中检出(表22)。相比之下,经cas9处理的细胞展示出低但可检测水平的易位。因此,使用be4碱基编辑器对t细胞进行的多重编辑并未生成易位,与使用cas9核酸酶的多重编辑形成对比。[2239]表22[2240][2241]llodbe4=0.1%[2242]*如果易位包括在b2m基因座处的局部重排,则在该实验中仅测量b2m-b[2243]实施例9:多重碱基编辑不显著破坏细胞表达[2244]使用be4和spcas9两种sgrna执行了跨b2m、trac和pd1基因的广泛向导筛选。基于单定位点测试,选择高边际效率和扩张的向导。最终细胞产率在使用be4和spcas9进行的1、2和3重编辑之间进行比较并归一化至仅电穿孔对照。经be4编辑的具有所希望编辑的细胞当作出高达3重编辑时展示高产率(图21)。相比之下,经spcas9编辑细胞当作出递增数量的多重编辑时显示降低的产率。因此,经多重碱基编辑的细胞即使当作出高达3重编辑时仍未知高细胞扩张。因此,be4生成经多重编辑的t细胞,与经spcas9处理的样品相比,该细胞没有可检测的基因组重排,同时也维持高细胞扩张。[2245]实施例10:be4以与spcas9类似的上靶编辑效率和细胞表型生成经三重编辑的t细胞[2246]用编码be4碱基编辑器的mrna连同靶向b2m、trac和pd1中的靶标特异性位点的sgrna一起共转染t细胞。如测序资料所示,碱基编辑在全部三个位点处修饰细胞(图22)。通过碱基编辑进行的基因修饰类似于使用spcas9核酸酶进行的基因修饰。流式细胞术也显示b2m和cd3的表面表达降低(图23,上图)。与仅电穿孔对照细胞相比,经be4和cas9多重编辑的细胞展示细胞表面上的b2m和cd3蛋白显著减少(》95%cd3-/b2m-)。尽管pd1染色效率不高,但与仅电穿孔对照细胞相比,仍在经be4和cas9多重编辑的细胞中的观察到了pd1的显著减少(~90%)(图23,下图)。[2247]实施例11:be4编辑不改变car表达或抗原依赖性细胞杀死[2248]用编码be4碱基编辑器的mrna连同靶向b2m、trac和pd1中的靶标特异性位点的sgrna一起共转染t细胞。通过整合编码抗bcmacar的慢病毒载体,引入靶向bcma的嵌合抗原受体(car)。通过流式细胞术在经be4和cas9编辑的细胞中观察到了car表达(图24),与未接受慢病毒载体的未经处理的细胞比较。通过对表达bcma的细胞进行核染色并检测核染色的丧失(指示细胞死亡),评定car-t细胞的细胞杀死。在经载体转导并表达car的细胞中,包括经be4和cas9编辑的t细胞中,观察到了抗原依赖性细胞杀死(图25)。相比之下,未使用载体转导的未经处理的细胞不展示细胞杀死活性。因此,与它们的仅核酸酶对应物相比,经be4生成的car-t细胞表明可比较的基因中断、细胞表型和抗原依赖性细胞杀死。[2249]实施例12:cas12b和be4可经配对以在t细胞中进行高效的多重编辑[2250]仅使用be4或者使用be4和cas12b生成cd3-b2m-t细胞。对于仅使用be4生成的t细胞,用编码be4碱基编辑器的mrna连同靶向b2m和trac中的靶标特异性位点的sgrna一起共转染t细胞。对于使用be4和cas12b生成的t细胞,用编码be4碱基编辑器的mrna以及靶向b2m中特异性位点的sgrna、编码bhcas12b(v4)的mrna、和靶向trac基因外显子4的cas12bsgrna(其用来中断trac基因)共转染t细胞。使用荧光辅助细胞分选(facs)分析来评估所得的t细胞,以检测b2m和cd3细胞表面表达。仅使用be4的敲除展示出与使用be4和cas12b的那些类似的情况。特别地,高该百分比的t细胞是cd3-b2m-:86%(仅be4)和88%(be4+cas12b),而其他可能表型cd3-b2m+;cd3+b2m+t细胞;和cd3+b2m-在细胞群中占比较少(图26)。相比之下,仅电穿孔对照显示群体具有高百分比(97.8%)的cd3+b2m+细胞和非常低百分比的cd3-b2m-细胞。[2251]使用cas12b生成cd3-car+t细胞。用编码bhcas12b(v4)的mrna,靶向trac基因外显子4的cas12bsgrna和编码抗bcmacar的双链dna(dsdna)供体模板共转染t细胞。使用荧光辅助细胞分选(facs)分析来评估t细胞,以检测cd3和bcma细胞表面表达。当在sgrna存在下将递增量的cas12b引入细胞内时,cd3表达降低,如通过细胞群向cd3-象限的转移所见(图27)。当在相同条件下将递增量的供体模板引入细胞内时,观察到细胞群向cd3-car+象限的转移。[2252]因此,cas12b可以与be4配对以生成经多重编辑的t细胞,将由多个双链断裂造成的基因组重排降至最低。[2253]实施例13:在动物模型中的体内功效[2254]为了确定本文所述化合物在体内的抗致癌活性,将化合物例如单独给予(ip、iv、po、通过吸入或鼻途径)或与次优剂量的相关化疗剂(例如,环磷酰胺、阿霉素、依托泊苷)组合。在一个示例中,在nod-scid小鼠已经经历全身辐射后3小时(hrs),将5x106个稳定地表达荧光素酶的rs4;11细胞(从具有急性成淋巴细胞性白血病的受试者的骨髓建立)通过尾静脉注射到该小鼠体内。如果不做处理,在这一模型中,这种形式的白血病在3周内致命。例如,通过向小鼠注射d-荧光素(60mg/kg)并对经麻醉的动物成像(例如,xenogen体外成像系统,caliperlifesciences,hopkinton,ma),容易地监测白血病。通过活体成像软件(caliperlifesciences,hopkinton,ma)对光子通量(光子/秒)积分,将全身生物发光定量。将本文所述化合物单独地或与次优剂量的相关化疗剂例如通过尾静脉或ip途径以0.1mg/kg至50mg/kg的剂量给药至白血病小时(注射后10天/实验的第1天,在14-16的生物发光范围内),持续7至21天。任选地,在整个实验过程中每两天对小鼠成像,并在实验持续期间每天监测存活。在实验结束时,可选择对死去的小鼠进行尸检。另一动物模型是将dohh2(一种源自人类滤泡性白血病的细胞系,其稳定地表达荧光素酶的)移植到nod-scid小鼠体内。这些体内测试任选地生成初步药代动力学、药效学和毒理学数据。[2255]实施例14:临床试验[2256]为了确定本文所述化合物用于治疗人类的适用性,执行了临床试验。例如,可以选择被诊断为患有液态癌症并且需要治疗的受试者并分为治疗组和一个或多个对照组,其中向治疗组给药本文所述化合物,同时对照组接受安慰剂或已知的抗癌药物。因此,可通过对受试者组执行关于多种因素诸如存活和生命品质的比较,评定本文所述化合物的治疗安全性和功效。本实施例中,与使用安慰剂治疗的受试者对照组相比,用本文所述化合物治疗的受试者组可显示改善的长期存活。[2257]研究设计[2258]本研究包括一项剂量递增、2臂研究,经设计为评定在表达wtp53蛋白的晚期液态癌症(例如,白血病、骨髓瘤或液态淋巴瘤)受试者中,采用28天或21天周期的2种不同给药方案,通过iv输液给药的化合物的安全性、耐受性、pk、pd和抗液态癌症细胞效果。例如,本文所述化合物可用于患有复发性/难治性急性髓性白血病(aml)和/或急性淋巴性白血病(all)的受试者。受试者接受本文所述化合物,对于28天周期,每周一次,持续连续的三周;或者对于21天周期,每周两次,持续连续的两周。很多患有液态淋巴瘤的受试者在外周血中呈现循环肿瘤细胞(ctc),这些细胞可以使用流式细胞术检测并分析。因此,在这些细胞中检测研究药物-特异性靶标衔接是可能的。[2259]研究由剂量递增期(dep)和扩展期(exp)组成。dep是一种“3+3”剂量递增设计,以建立本文所述化合物的mtd或obd。exp纳入至多2个不同的在mtd或obd具有特异性液态癌症的受试者组,以进一步探索该剂量水平的临床安全性和潜在功效水平。对进行exp的受试者的选择是基于dep结果以及来自另外的非临床药理学研究数据确定的。后者包括对多个液态癌症细胞系(例如,白血病、液体淋巴瘤、骨髓瘤等)的研究,这些细胞系有助于在不同类型的液态癌症中比较细胞系对本文所述化合物的敏感性。[2260]在研究的剂量递增和剂量扩展阶段,受试者的治疗将继续进行,直到记录疾病进展、不可接受的毒性,或受试者或医生决定停止治疗。[2261]在mtd或obd建立后,另外的受试者可以被纳入最多两个单独的扩展队列(每个扩展队列大约30名受试者),以获得在该剂量水平以及在特定受试者或液态癌症细胞类型中的进一步经验。对受试者或液态癌症细胞类型的选择部分地基于在该研究的剂量递增期作出的观察结果来确定。[2262]基于负面事件(ae)的发生率、严重程度、持续时间、因果性、严重性和类型以及受试者身体检查、生命体征和临床实验室结果的改变来评定安全性。研究人员使用ncictcae4.0版来评估ae的严重程度。[2263]因为这一研究的主要目标是基于安全性和pk,统计分析本质上是描述性的并说明全部研究剂量和全部观察到的应答,包括根据iwg(2014)标准获得完全缓解(cr)或部分缓解(pr)或保持病情稳定(sd)的受试者。接受至少一个剂量的本文所述化合物的受试者构成了安全性群体并且包括在全部安全性分析中。完成本文所述化合物的至少一个周期并经历治疗后目标疾病评估的受试者构成了功效可评定受试者群体。[2264]实施例15:鉴定并沉默基因的示例性方法[2265]在本实施例中,提供用于对car-t的靶标进行基因沉默的方法。图28a提供待靶向的基因的示意图以及关于该基因的注意事项。靶标包括,例如,cd4、cd5、cd7、cs-1、trac、car、fas、lag-3、pd-1、β2m、cd52和tcr中的一者或多者。[2266]有两种使用碱基编辑器进行沉默的策略。第一种策略访问靶标蛋白并随后改变终止密码子的谷氨酰胺、精氨酸或色氨酸中的一者或多者,以沉默蛋白表达(参见,图28b的项目1)。第二种策略包括用cbe中断剪接(参见,图28b的项目2)以沉默蛋白表达。[2267]实施例16:使用多个car-t群来解决aml或t-all中的疾病克隆性[2268]据推测,白血病由于肿瘤微环境中的选择压力,通过克隆扩张和选择的反复过程而进化,在某些治疗中会产生耐药性或复发。作为示例,aml癌细胞的不同克隆体可以表现出各种抗原,诸如cd33+cd123-;cd33+cd123+或cd33-cd123+。靶向cd33+癌细胞的治疗剂不会访问缺乏这一特定抗原诸如cd33-cd123+的细胞。因此,预期本文所述的多个car-t细胞群将会解决疾病克隆性。[2269]在示例性方法中,如图29中所述生成cd33和cd123car-t细胞。将cd33和cd123car-t细胞给药至具有cd33+cd123+aml标志物的aml患者。cd33和cd123car-t细胞消除了患者体内的表现为cd33+cd123-、cd33+cd123+和cd33-cd123+的aml癌细胞。[2270]在另一示例性方法中,通过本文所述的方法,如图30中所述,生成cd3和cd7car-t细胞。将cd3和cd7car-t细胞给药至具有cd3+cd7+t-all标志物的t-all患者。cd3和cd7car-t细胞消除了表现为cd3+cd7-、cd3+cd7+和cd3-cd7+的t-all癌细胞。[2271]实施例17:修饰多个car-t群以消除同类相杀[2272]传统t细胞和car-t疗法的主要限制是,激活的细胞可能在细胞制造、储存期间或当输注到患者体内时经历自杀或同类相杀。为了避免同类相杀,本文所述的car-t细胞经修饰以在编码该细胞的car对其具有特异性的抗原的多核苷酸中包含突变。作为示例,cd7car-t细胞经修饰以在cd7多核苷酸中包含突变,从而阻止同类相杀。作为领难以示例,cd3car-t细胞经修饰以在cd3多核苷酸中包含突变,从而阻止同类相杀。在多个car-t群中,执行另外的修饰以阻止交叉同类相杀(即,在两个car-t群中的cd3和cd7两种多核苷酸中的突变)。另外的修饰包括对基因的突变,该基因可能牵涉到免疫抑制、移植物抗宿主、宿主抗移植物等中。[2273]在示例性方法中,如图29中所述生成用于治疗aml的cd33和cd123car-t细胞。cd33和cd123car-t细胞两者均经修饰以在cd33中具有突变,使得细胞不靶向它们自身。在pd-1、cd52和trac中的突变分别降低或阻止免疫抑制、宿主抗移植物和移植物抗宿主。[2274]在示例性方法中,如图30中所述生成用于治疗t-all的cd3和cd7car-t细胞。cd3和cd7car-t细胞两者均经修饰以在cd3(trac)和cd7中具有突变,使得细胞不靶向它们自身或其他群。在pd-1、cd52和trac中的突变分别降低或阻止免疫抑制、宿主抗移植物和移植物抗宿主。[2275]实施例18:与核酸酶相比,对于t-allcar细胞的四重同时碱基编辑不影响产率[2276]在四重t-all编辑情况下的理论产率在测试一下组分的测定中确定。对照是无电穿孔(无ep)、仅ep、cbe变体1、cbe变体2、和cas9。结果显示在图31a中,并且对应的活力结果显示在图31b中。确定了与核酸酶相比,对于t-allcar细胞的四重同时碱基编辑不影响产率。[2277]实施例19:扩大lonza电穿孔诱导t-allcar-t细胞程序的高效、多重t细胞碱基编辑。[2278]将t细胞在激活后培养3天。用10μg用于编辑器(cbe1、cbe2或spcas9)的mrna和5μg用于t-all向导(trac、cd52、cd7、pd1)的sgrna将5×106个细胞电穿孔。合适的向导提供在下表23中:[2279]表23.用于t-allcar-t的向导rna[2280][2281]2'-o-甲基类似物和3'硫代磷酸酯核苷酸间链接用在前三个5'和3'末端rna残基处,在每个末端处的化学修饰以后接该核苷酸的“s”指示。[2282]cbe1是指大鼠-apobec-be4,且cbe2是指红毛猩猩“be4”(ppapobec)。无ep和仅ep是对照,其要么没有受到攻击(zap)要么受到攻击但不使用编辑器/向导。[2283]理论产率测量如下:每天计数细胞,并使用ao/dapi染色进行活力测量(活力读数也使用计数-aml数字和ep后数小时活力读数执行)。每天将细胞分割回0.5×106细胞/ml(理论上因为分割,事实上并没有扩张全部细胞)。随后进行计算以确定,如果培养物没有被分割,理论产率将会是多少。确定了基因修饰的百分比(图32)。[2284]通过ngs获取细胞并确定理论细胞产率(图33)。[2285]细胞杀死通过模型肿瘤细胞中的荧光标志物的丧失表明(图34)。[2286]所测试的全部car均包含结合剂克隆物,要么是重到轻(h2l)取向要么是轻到重(l2h)取向,后面是cd8a铰链、cd8跨膜结构域、和cd28z信号传导结构域。[2287]实施例20:示例性car-t细胞工序流程和定制[2288]获得来自健康供体的冷冻单采样品(apheresis)leukopak并根据制造商的使用说明解冻。根据制造商的使用说明,使用例如clinimacsprodigy分离cd4和cd8细胞。然后,根据制造商的使用说明,使用transact激活t细胞。根据制造商的使用说明,使用lonza4dnucleofactor进行mrna/rnp碱基编辑器的电穿孔递送,以敲除cd3、cd7、cd52和/或pd1。使用本领域公认的技术执行tcrα/β的耗竭。扩张t细胞,并进行car和7car的慢病毒转导。用程序冷冻仪(crf)将car-t细胞低温保存。[2289]实施例21:用car-t细胞治疗t-all[2290]t细胞急性成淋巴细胞性白血病(t-all)是一种侵袭性的骨髓恶性肿瘤。约12-15%的all病例在儿童中诊出。复发后5年存活率低于25%。治疗标准是使用化疗来诱导第二次缓解,然后进行同种异体造血干细胞移植(allohsct)。然而,很多患者是化疗难治性的或具有高肿瘤负荷并且不能诱导作为allohsct桥梁的深度缓解。此外,先前进行深度治疗的患者一般不适合进行自体car-t治疗。因此,需要替代性治疗选项来治疗t-all。[2291]为了检查经编辑的car-t细胞是否可在患者体内诱导深度缓解以便架设allohsct治疗的桥梁,使用多重编辑癌创建抗同类相杀的car-t细胞。如图35中所示,表达cd7嵌合抗原受体的t细胞经编辑以减少或消除cd7、trac、cd52和pd-1的表达,用于靶向cd3-cd7+或cd3+cd7+t-all肿瘤细胞。如图36中所示,在第-7天,使用cy/flu/campath在20至30名t-all患者中执行淋巴细胞删除。在第0天,向患者输注cd7car-t细胞。然后,在第65天,使用cy/flu/tbi/atg对患者进行预调理。在第70天,患者接受allohsct治疗。预期使用cd7car-t细胞进行的治疗诱导t细胞发育不全并允许t-all患者在没有桥梁治疗的情况下用allohsct治疗。[2292]实施例22:产生cd7car-t细胞[2293]为了产生如图37a中所示的tall017cd7car-t细胞,接收了来自健康供体的冷冻单采样品。然后用plasmatherm(barkeygmbh&co.kg)解冻单采样品。使用clinimacsprodigy(miltenyibiotec)从解冻的单采样品分离cd4和cd8细胞。在第2天,使用lonzasdnucleofector通过电穿孔将mrna碱基编辑器和向导rna递送至t细胞内。碱基编辑后,经由慢病毒转导(7car8)将cd7嵌合抗原受体(car)递送至t细胞内。然后在第2-8天,将t细胞在培养物中扩张。扩张后,随后将收获的car-t细胞(》1b)低温保存。当解冻时,tall017过程产生异源细胞群。[2294]在解冻后24小时,将未经转导的(utd)与经转导的tall017细胞进行比较。通过将细胞针对cd2+和cd4+细胞进行选通,使用流式细胞术验证了car激活(图37c)。如图37c中所述,由抗cd7car诱导的中间过程同类相杀导致7cart在tall017冷冻保存时仍被激活。在冷冻保存时中间激活的7car-t解冻极差。[2295]为了产生如图37b中所示的tall038cd7car-t细胞,接收了来自健康供体的冷冻单采样品。然后用plasmatherm(barkeygmbh&co.kg)解冻单采样品。使用clinimacsprodigy(miltenyibiotec)从解冻的单采样品分离cd4和cd8细胞。在第2天,使用lonzasdnucleofector通过电穿孔将mrna碱基编辑器和向导rna递送至t细胞内。碱基编辑后,经由慢病毒转导(7car8)将cd7嵌合抗原受体(car)递送至t细胞内。然后在第2-10天,将t细胞在培养物中扩张。扩张后,将crα/β+细胞耗竭。然后在第10-12天,将t细胞在培养物中进一步扩张。随后在第12天将收获的car-t细胞(》2b)低温保存。当解冻时,tall038过程产生同源单分散细胞群。[2296]实施例23:tall017和tall038cd7car-t细胞的评定[2297]使用下一代测序(ngs)来比较在tall017和tall038cd7car-t细胞中的编辑效率。如图38中所示,在两种类型的cd7car-t细胞中,cd52、cd7、trac和pd-1的编辑均在80-99%效率范围内。使用未转导的(utd)细胞作为对照。[2298]在蛋白融化后24小时,检查tall017和tall038cd7car-t细胞中的tcrα/β、cd52和cd7的表达(图39a和39b)。tall038细胞表明了《0.4%的tcrα/β+细胞。对于tall017和tall038cd7car-t两者,蛋白质表达数据均与冷冻前指标和融化后ngs数据匹配。使用未转导的(utd)细胞作为对照。[2299]为了评定cd7car-t细胞群体中的细胞身份,使用了如图40中所示的选通方案。细胞按以下秩序选通:fsc/ssc,单细胞,活/死,cd45(全部白血球),cd19-(b细胞排除),cd56-/cd14-(nk/单核细胞排除),cd2+(t细胞),和cd2+的cd4:cd8。如图41中所示,tall017和tall038cd7car-t细胞群体的身份是cd2+/-和cd56+/-细胞的混合物。没有可检测的单核细胞或b细胞。[2300]最后,评定了car表达。如图42中所示,tall017和tall038cd7car-t细胞群体两者均维持car+细胞表达,直至融化后48小时。使用未转导的(utd)细胞作为对照。[2301]也在融化后24小时和48小时评定了tall017和tall038cd7car-t细胞中的cd25和cd69表达。如图43中所示,与tall017细胞相比,tall038细胞中的融化后的cd25表达较低。cd25是中期t细胞激活的标志物。不同于大多数car,抗cd7car诱导中间培养物同类相杀,这进一步激活7cart。冷冻激活状态的tall017细胞对细胞健康有害。与tall017相比,tall038细胞具有剧烈降低的cd25表达,这可能暗示了更高的抗冷冻性。[2302]实施例24:tall038cd7car-t细胞的体外表征[2303]为了在体外表征tall038cd7car-t细胞,开发了基于珠的效价法(图44)。在第0天,将cd7与dynabeads偶联,并将cd7car-t细胞和未转导的(utd)细胞融化。在第1天,将cd7珠纯化并与cd7car-t细胞共培养,铺板,并在37℃孵育。在第2天,收集上清液并使用酶联凝集素测定(ella)获得读数。[2304]使用该测定,评定了tall038cd7car-t细胞的ifnγ、tnfα、il-10和il-2释放。对cd7抗原作出应答,tall038cd7car-t细胞释放了ifnγ、tnfα和il-2(图45a和45b)。使用未转导的(utd)细胞作为对照。[2305]为了进一步在体外表征tall038cd7car-t细胞,开发了共培养方法来测量靶标肿瘤细胞的car引导的t细胞杀死。图46提供了该测定的概述。首先,接种肿瘤细胞。然后将car-t细胞添加到接种的肿瘤细胞中。然后使用扫描系统分析细胞。最后,使用软件获得读数。[2306]将tall038cd7car-t细胞添加到接种的ccrf-cemgfp+肿瘤细胞中。以4:1car:ccrf、2:1car:ccrf或1:1car:ccrf的e:t比率测试表24中的t细胞批次:[2307]表24.t细胞批次[2308]批次%car+tall017utd0%car+tall0177car8~50%car+tall038utd0%car+tall0387car8~50%car+[2309]如图47a和47b中所示,与tall017cart相比,tall038cd7car-t细胞在再次挑战时表现出增加的ccrf。[2310]实施例25:tall038cd7car-t细胞的体内表征[2311]先前研究已经表明,ccrf模型显示对cd7引导的car-t疗法产生应答(参见,例如,gomes-silvad.,等人,cd7-editedtcellsexpressingacd7-specificcarforthetherapyoft-cellmalignancies.blood.2017;130:285–296)。[2312]为了在体内表征tall038cd7car-t细胞,开发了一种研究来评估tall038药物产品在t-all的ccrf模型中对于体内生长的功效。表25总结了研究策略。[2313]表25.ccrf模型体内研究leukemia.j.hematology&oncology.13:30(2020);robbieg.majznerandcrystall.mackall,tumorantigenescapefromcart-celltherapy.cancerdiscov.2018oct;8(10):1219-1226)。[2319]已经在t和nk细胞恶性肿瘤中鉴别出了cd5表达,这些恶性肿瘤包括但不限于t-all、mf/ss、原发性皮肤t细胞淋巴瘤(nos)、t细胞大颗粒淋巴细胞性白血病、血管免疫母细胞性t/nk细胞淋巴瘤、肝脾t细胞淋巴瘤、原发性皮肤cd30+lpd、成人t细胞白血病/淋巴瘤和t细胞前淋巴细胞性白血病。将cd5与cd7组合将解锁液态癌症疗法用于某些癌症诸如t-all、mf/ss、原发性皮肤t细胞淋巴瘤(nos)、血管免疫母细胞性t/nk细胞淋巴瘤和成人t细胞白血病/淋巴瘤的更大潜力。[2320]为了减少或消除t细胞内的cd5表达,生成了如下表26中提供的42种胞苷碱基编辑器单向导rna(sgrna)(agilent)。[2321]表26.cd5向导rna[2322]向导名向导分组向导序列rcmsgrna102ex1sd(pos6)acucacccagcauccccagcrcmsgrna103ex2sa(pos6)agcgacugcagaaagaagagrcmsgrna104ex2stop(pos5/6)cauaccagcugagccguccgrcmsgrna105ex3sa(pos8)uggaaaucugggggucagaarcmsgrna106ex3sd(pos9)guuacccaccuaagcaggucrcmsgrna107ex3stop(pos5)cugccagcggcugaacugugrcmsgrna108ex3stop(pos5/6)ccucccacugcuuggagcucrcmsgrna109ex3stop(pos6)ucugccagcggcugaacugurcmsgrna110ex3stop(pos7)gucugccagcggcugaacugrcmsgrna111ex3stop(pos8)gaagugccagggccagcuggrcmsgrna112ex3stop(pos8/9)ccaugugccauccguccuugrcmsgrna113ex3stop(pos9)uuugcagccagagcuggggcrcmsgrna114ex4sa(pos5)gguucugcaaugagacacucrcmsgrna115ex5sa(pos5)gagcuaggagaggagagagcrcmsgrna116ex5sd(pos8)ucacuuaccugagcaaaggarcmsgrna117ex5sd(pos9)cucacuuaccugagcaaaggrcmsgrna118ex5stop(pos4)cugcagcugguggcacagucrcmsgrna119ex5stop(pos5)cggccagcacugugccggcgrcmsgrna120ex5stop(pos6/7)aucuuccauuggauuggcaarcmsgrna121ex5stop(pos7/8)gaucuuccauuggauuggcarcmsgrna122ex6sa(pos4)aaccugagaggggaagcaaurcmsgrna123ex6sa(pos5)aaaccugagaggggaagcaarcmsgrna124ex6stop(pos4)gugcagagccgucuggugggrcmsgrna125ex6stop(pos4/5)cucccaccgcagcgagcuccrcmsgrna126ex6stop(pos4/5)cucccaaaguucguggcacurcmsgrna127ex6stop(pos5)aggugcagagccgucuggugrcmsgrna128ex6stop(pos5)ggugcagagccgucugguggrcmsgrna129ex6stop(pos5/6)ucucccaaaguucguggcacrcmsgrna130ex6stop(pos6)ugucccagugccacgaacuurcmsgrna131ex6stop(pos7)aaggugcagagccgucuggurcmsgrna132ex6stop(pos7)uccuaucgagugcuggacgcrcmsgrna133ex6stop(pos8)caaggugcagagccgucuggrcmsgrna134ex6stop(pos8)ggugcgccagggggcucagurcmsgrna135ex6stop(pos8/9)gggcugcccacugagcccccrcmsgrna136ex6stop(pos9)aggugcgccagggggcucagrcmsgrna137ex7stop(pos4)ggccaggauccaaaccccgcrcmsgrna138ex8stop(pos4)cgccaguggauuggcccaacrcmsgrna139ex8stop(pos7)aagaagcagcgccaguggaurcmsgrna140ex9sa(pos8)aaagacacugggcagauggurcmsgrna141ex9sd(pos6)gcuuaccuggauaagcugacrcmsgrna142ex10sa(pos9)uuccagagcuggggaaagaarcmsgrna143ex10stop(pos9)auggggcucagaggcuguaa[2323]通过在电穿孔72小时后,使用流式细胞术、下一代测序(ngs)、rna和西方印迹分析,筛选针对最少n=3个供体和最少n=5个抗体克隆物的向导,验证cd5编辑(图53)。使用仅电穿孔(ep)作为阴性对照。将胞苷碱基编辑器与cd5向导rna结合使用有效地减少或消除t细胞中的cd5表达。[2324]选择了两个候选向导sgrna103(剪接中断)和sgrna104(stop密码子),用于经由ngs进一步测试当与be4结合使用时的碱基编辑效率。sgrna103和sgrna104两者均表现出约85%的编辑效率。下表27提供使用sgrna103和sgrna104执行的计算机模拟ot分析的结果。[2325]表27.计算机模拟ot分析[2326][2327]实施例27:产生靶向cd5的car-t[2328]为了产生靶向cd5的car-t细胞,将慢病毒载体(lvv)工程改造为编码cd5car(图55)。用该cd5carlvv转导患者t细胞。对car-t细胞执行7至14天的体外扩张,再回输给患者。图55显示了示例性cd5car构建体设计。示例性cd5car构建体设计包括抗cd5scfv、铰链/间隔序列、跨膜结构域、信号2共刺激结构域和cd3ζ共刺激结构域。铰链/间隔序列区可包括ch3、cd8α或cd28。跨膜结构域可包括cd8α或cd28。共刺激结构域可包括41bb或cd28。[2329]生成了三十种lvv。下表28提供各种lvvcd5car构建体。[2330]表28.cd5carlvv构建体[2331]id序列pcar_btx063mnd-5car-ch3-cd28tm-cd28-cd3z-wpre密码子opt1pcar_btx064mnd-5car-ch3-cd28tm-cd28-cd3z-wpre密码子opt2pcar_btx065mnd-5car-ch3-cd28tm-cd28-cd3z-wpre密码子opt3pcar_btx066mnd-5car-cd8ah-cd28tm-cd28-cd3z-wpre密码子opt1pcar_btx067mnd-5car-cd8ah-cd28tm-cd28-cd3z-wpre密码子opt2pcar_btx068mnd-5car-cd8ah-cd28tm-cd28-cd3z-wpre密码子opt3pcar_btx069mnd-5car-cd28h-cd28tm-cd28-cd3z-wpre密码子opt1pcar_btx070mnd-5car-cd28h-cd28tm-cd28-cd3z-wpre密码子opt2pcar_btx071mnd-5car-cd28h-cd28tm-cd28-cd3z-wpre密码子opt3pcar_btx072mnd-5car-ch3-cd8atm-41bb-cd3z-wpre密码子opt1pcar_btx073mnd-5car-ch3-cd8atm-41bb-cd3z-wpre密码子opt2pcar_btx074mnd-5car-ch3-cd8atm-41bb-cd3z-wpre密码子opt3pcar_btx075mnd-5car-cd8ah-cd8atm-41bb-cd3z-wpre密码子opt1pcar_btx076mnd-5car-cd8ah-cd8atm-41bb-cd3z-wpre密码子opt2pcar_btx077mnd-5car-cd8ah-cd8atm-41bb-cd3z-wpre密码子opt3pcar_btx078pgk-5car-ch3-cd28tm-cd28-cd3z-wpre密码子opt1pcar_btx079pgk-5car-ch3-cd28tm-cd28-cd3z-wpre密码子opt2pcar_btx080pgk-5car-ch3-cd28tm-cd28-cd3z-wpre密码子opt3pcar_btx081pgk-5car-cd8ah-cd28tm-cd28-cd3z-wpre密码子opt1pcar_btx082pgk-5car-cd8ah-cd28tm-cd28-cd3z-wpre密码子opt2pcar_btx083pgk-5car-cd8ah-cd28tm-cd28-cd3z-wpre密码子opt3pcar_btx084pgk-5car-cd28h-cd28tm-cd28-cd3z-wpre密码子opt1pcar_btx085pgk-5car-cd28h-cd28tm-cd28-cd3z-wpre密码子opt2pcar_btx086pgk-5car-cd28h-cd28tm-cd28-cd3z-wpre密码子opt3pcar_btx087pgk-5car-ch3-cd8atm-41bb-cd3z-wpre密码子opt1pcar_btx088pgk-5car-ch3-cd8atm-41bb-cd3z-wpre密码子opt2pcar_btx089pgk-5car-ch3-cd8atm-41bb-cd3z-wpre密码子opt3pcar_btx090pgk-5car-cd8ah-cd8atm-41bb-cd3z-wpre密码子opt1pcar_btx091pgk-5car-cd8ah-cd8atm-41bb-cd3z-wpre密码子opt2pcar_btx092pgk-5car-cd28h-cd28tm-cd28-cd3z-wpre密码子opt1[2332]使用sgrna103和sgrna104筛选来自表27的具有mnd启动子或pgk启动子的每一种cd5carlvv构建体,以检查在原代人类t细胞中的car表达。使用未转导的(utd)细胞作为对照。如图56中所示,cd5carlvv构建体导致具有0%至82%的car表达。在10天培养期结束时,二十四种构建体显示可检测的在t细胞表面上的car表达。[2333]为了确定铰链/间隔序列car构建体序列是否影响car表达,检查了表29中的含有不同铰链/间隔序列(以加粗字体表示)的car构建体与sgrna103和sgrna104的组合。使用未转导的(utd)细胞作为对照。如图57中所示,铰链/间隔序列确实影响car表达。[2334]表29.cd5car构建体[2335]id序列utd未经转导(无慢病毒)pcar_btx063mnd-5car-ch3-cd28tm-cd28-cd3z-wprepcar_btx067mnd-5car-cd8ah-cd28tm-cd28-cd3z-wprepcar_btx071mnd-5car-cd28h-cd28tm-cd28-cd3z-wpre[2336]为了进一步在体外表征cd5lvvcar-t细胞,执行了活体成像细胞杀死测定。将cd5lvvcar-t细胞(lv66、lv67、lv68和lv69)添加到ccrf肿瘤细胞中。如图57a-57d中所示,经编辑和未经编辑的构建体对于cd5+ccrf细胞都是细胞毒性的。[2337]使用sgrna103和sgrna104在单独的t细胞中或在ccrf细胞中在体外评定cd5car构建体(lv63至lv69)的ifnγ产生(图59a和59b)。在cd5+ccrf-cem白血病细胞系存在下,全部cd5car构建体均释放ifnγ。[2338]实施例28:使用多修饰的免疫效应细胞的组合疗法[2339]为了检查使用经多重基因修饰的car-t细胞是否可增强对具有t细胞或nk细胞恶性病变诸如液态癌症的患者的治疗,向患者给药一种或多种基于其免疫表型的经修饰的car-t细胞。使用流式细胞术和/或序列分析,对患者样品中的免疫细胞进行针对cd5、cd7、cd33和cd123存在或不存在的免疫分型。通过电穿孔将mrna碱基编辑器和向导rna递送至免疫细胞内,以编辑cd5、cd7、cd33或cd123与trac、lag-3、fas、cd52、b2m、ciita、trbc1、trbc2和pd-1中的一者或多者组合,从而减少或消除这些基因在免疫细胞中的表达。在碱基编辑后,经由慢病毒转导将cd5car、cd7car、cd33car或cd123car递送至经修饰的免疫细胞内,以分别创建cd5、cd7、cd33和cd123car-t细胞。[2340]经免疫分型为cd5+cd7-的患者用cd5car-t细胞或其群治疗。经免疫分型为cd5-cd7+的患者用cd7car-t细胞或其群治疗。经免疫分型为cd5+cd7+的患者用cd5car-t细胞或其群和/或cd7car细胞或其群治疗。经免疫分型为cd33-cd123+的患者用cd123car-t细胞或其群治疗。经免疫分型为cd33+cd123-的患者用cd33car-t细胞或其群治疗。经免疫分型为cd33+cd123+的患者用cd3car-t细胞或其群和/或cd123car细胞或其群治疗。经免疫分型为cd5+cd7+cd33+cd123+的患者用cd33car-t细胞或其群、cd5car-t细胞或其群、cd7car-t细胞或其群和/或cd123car-t细胞或其群的任意组合治疗。[2341]其他等效物[2342]从前述说明书明显可见,可对本文所述的发明作出变更和修饰以使其适用于各种用途和条件。此类实施方案也处于权利要求书的范畴内。[2343]本文中的任何变量定义中对一系列元件的叙述包括该变量作为任何单一元件或所列元件的组合(亚组合)的定义。本文中对于实施方案的叙述包括该实施方案作为任何单一实施方案或与其他实施方案或其部分组合。[2344]本说明书中提及的全部出版物、专利和专利申请通过引用以与各独立出版物、专利或专利申请被具体且独立地指明为通过引用并入相同的程度并入本文。除非另有说明,否则本说明书中提及的出版物、专利和专利申请通过引用而以其整体并入本文。当前第1页12当前第1页12









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部