有机化合物处理,合成应用技术1.本公开总体上涉及细菌学、微生物学、遗传学、分子生物学、酶学、工业蛋白生产等领域。因此,本公开的某些实施例涉及用于构建具有增强的蛋白产生表型的地衣芽孢杆菌细胞/菌株的组合物和方法。2.相关申请的交叉引用3.本技术要求于2020年1月15日提交的美国临时专利申请号62/961,234的权益,将该申请通过引用以其整体并入本文。4.序列表的引用5.命名为“nb41684-wo-pct_sequencelisting.txt”的文本文件序列表的电子提交的内容创建于2021年1月7日,并且大小为425kb,将其通过引用以其整体并入本文。背景技术:::6.革兰氏阳性细菌如枯草芽孢杆菌(bacillussubtilis)、地衣芽孢杆菌和解淀粉芽孢杆菌(bacillusamyloliquefaciens)由于其优异的发酵特性和高产率(例如,高达25克/升培养物;vandijl和hecker,2013年),经常被用作微生物工厂,用于产生工业相关蛋白。例如,枯草芽孢杆菌因其产生食品、纺织品、洗衣、医疗器械清洁、制药工业等所必需的α-淀粉酶(jensen等人,2000;raul等人,2014)和蛋白酶(brode等人,1996)而为人熟知(westers等人,2004)。由于这些非致病性革兰氏阳性细菌产生完全不含毒性副产物(例如脂多糖;lps,也称为内毒素)的蛋白,因此它们已经获得了欧洲食品安全局的“安全资格认定”(qps)状态,并且其许多产品获得了美国食品和药品管理局的“通常认为安全”(gras)状态(olempska-beer等人,2006;earl等人,2008;caspers等人,2010)。7.因此,微生物宿主细胞中蛋白(例如,酶、抗体、受体等)的产生在生物技术领域::中是特别有意义的。同样,用于产生和分泌一种或多种目的蛋白的芽孢杆菌属宿主细胞的优化具有高度相关性,特别是在如下工业生物技术环境中,其中当蛋白以大的工业产量生产时该蛋白产率的微小改善具有重大意义。更特别地,地衣芽孢杆菌是具有高工业重要性的芽孢杆菌属物种宿主细胞,因此,对于构建新的和改善的地衣芽孢杆菌产生菌株,高度希望具有修饰和工程化地衣芽孢杆菌宿主细胞以获得增强的/增加的蛋白表达/产生的能力。因此,本公开涉及对于获得和构建具有增加的蛋白产生能力的地衣芽孢杆菌细胞(例如,蛋白产生型宿主细胞)的高度希望和未满足的需求。技术实现要素:8.本公开总体上涉及用于获得包含增强的蛋白产生能力的地衣芽孢杆菌细胞(例如,蛋白产生型宿主)的组合物和方法。因此,本公开的某些实施例涉及用于构建此类经修饰的地衣芽孢杆菌细胞/菌株的方法,所述细胞/菌株产生增加量的一种或多种目的蛋白。9.因此,本公开的某些实施例涉及在经修饰的地衣芽孢杆菌细胞中产生增加量的内源目的蛋白(poi)的方法,所述方法包括(a)获得表达poi的亲本地衣芽孢杆菌细胞并通过在亲本细胞中引入包含与天然prsa可读框(orf)可操作地连接的天然prsa启动子的多核苷酸来修饰亲本细胞,和(b)在适于产生所述poi的条件下发酵步骤(a)的经修饰的细胞,其中当在相同条件下发酵时,经修饰的细胞相对于亲本细胞产生增加量的poi。在方法的特定实施例中,步骤(a)的引入的多核苷酸包含与seqidno:100具有至少95%序列同一性的天然prsa启动子。在方法的其他实施例中,步骤(a)的引入的多核苷酸包含与seqidno:101具有至少90%序列同一性的天然prsaorf。在其他实施例中,引入的多核苷酸编码与seqidno:155具有约90%序列同一性的天然prsa蛋白。在某些优选的实施例中,亲本细胞包含编码天然prsa蛋白的内源(野生型)prsa基因,其中引入的多核苷酸由此编码与seqidno:155具有约90%序列同一性的prsa蛋白的第二(第2)拷贝。在其他实施例中,步骤(a)中引入的多核苷酸整合到经修饰的地衣芽孢杆菌细胞的基因组中。在方法的又其他实施例中,目的蛋白(poi)是蛋白酶或淀粉酶。在其他实施例中,经修饰的细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏。在其他实施例中,经修饰的细胞包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。在其他实施例中,经修饰的细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏和与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。10.在某些其他实施例中,本公开涉及在经修饰的地衣芽孢杆菌细胞中产生增加量的异源目的蛋白(poi)的方法,所述方法包括(a)向亲本地衣芽孢杆菌细胞中引入(i)编码poi的表达盒和(ii)包含可操作地连接到天然prsa可读框(orf)的天然prsa启动子的多核苷酸,和(b)在适于产生所述poi的条件下发酵步骤(a)的经修饰的细胞,其中当在相同条件下发酵时,经修饰的细胞相对于亲本细胞产生增加量的poi。在方法的特定实施例中,步骤(a)(ii)的引入的多核苷酸包含与seqidno:100具有至少95%序列同一性的天然prsa启动子。在某些其他实施例中,步骤(a)(ii)的引入的多核苷酸包含与seqidno:101具有至少90%序列同一性的天然prsaorf。在方法的又其他实施例中,内源prsa基因编码与seqidno:155具有约90%序列同一性的天然prsa蛋白。在某些其他实施例中,步骤(a)(ii)中引入的多核苷酸整合到经修饰的地衣芽孢杆菌细胞的基因组中。在某些优选的实施例中,亲本细胞包含编码天然prsa蛋白的内源(野生型)prsa基因,其中引入的多核苷酸步骤(a)(ii)由此编码与seqidno:155具有约90%序列同一性的prsa蛋白的第二(第2)拷贝。在特定实施例中,目的蛋白(poi)是蛋白酶或淀粉酶。在其他实施例中,经修饰的细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏。在其他实施例中,经修饰的细胞包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。在某些优选的实施例中,经修饰的细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏和与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。11.本公开的其他实施例涉及经修饰的地衣芽孢杆菌细胞/菌株,其衍生自包含编码天然prsa蛋白的内源prsa基因的亲本地衣芽孢杆菌细胞/菌株。因此,在某些实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含引入的多核苷酸,所述多核苷酸包含可操作地连接至天然prsa可读框(orf)的天然prsa启动子。在特定实施例中,引入的多核苷酸包含与seqidno:100具有至少95%序列同一性的天然prsa启动子。在其他实施例中,引入的多核苷酸包含与seqidno:101具有至少90%序列同一性的天然prsaorf。在又其他实施例中,引入的多核苷酸编码与seqidno:155具有约90%序列同一性的天然prsa蛋白。在某些其他实施例中,引入的编码天然prsa蛋白的多核苷酸整合到经修饰的地衣芽孢杆菌细胞的基因组中。在另一个实施例中,经修饰的细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏。在另一个实施例中,经修饰的细胞包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。在一个优选的实施例中,经修饰的细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏和与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。在某些其他实施例中,经修饰的细胞包含编码异源目的蛋白(poi)的引入的表达构建体。在其他实施例中,异源poi是蛋白酶或淀粉酶。因此,本公开的某些实施例涉及获得、分离、纯化以及类似地处理由本公开的经修饰的地衣芽孢杆菌细胞产生的目的蛋白。12.因此,本公开的某些其他实施例涉及经修饰的地衣芽孢杆菌细胞,其相对于衍生它们的亲本地衣芽孢杆菌细胞产生增加量的目的蛋白(poi)。因此,在某些实施例中,本公开涉及相对于亲本地衣芽孢杆菌细胞产生增加量的目的蛋白(poi)的经修饰的地衣芽孢杆菌细胞,其中经修饰的细胞衍生自表达poi的亲本地衣芽孢杆菌细胞,其中经修饰的细胞包含引入的包含可操作地连接到天然prsa可读框(orf)的天然prsa启动子的多核苷酸并且包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏,其中当在相同条件下发酵时,经修饰的细胞相对于亲本菌株产生增加量的poi。在另一个实施例中,经修饰的地衣芽孢杆菌细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏。在又另一个实施例中,天然prsa启动子与seqidno:100具有至少95%序列同一性。在某些其他实施例中,天然prsaorf与seqidno:101具有至少90%序列同一性。在另一个实施例中,天然prsa蛋白与seqidno:155具有约90%序列同一性。在特定实施例中,目的蛋白(poi)是蛋白酶或淀粉酶。因此,本公开的某些其他实施例涉及获得、分离、纯化以及类似地处理由经修饰的地衣芽孢杆菌细胞产生的目的蛋白。13.在其他实施例中,本公开涉及相对于亲本地衣芽孢杆菌细胞产生增加量的目的蛋白(poi)的经修饰的地衣芽孢杆菌细胞,其中经修饰的细胞衍生自表达poi的亲本地衣芽孢杆菌细胞,其中经修饰的细胞包含引入的包含可操作地连接到天然prsa可读框(orf)的天然prsa启动子的多核苷酸并且包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏,其中当在相同条件下发酵时,经修饰的细胞相对于亲本菌株产生增加量的poi。在其他实施例中,经修饰的细胞进一步包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。在又另一个实施例中,天然prsa启动子与seqidno:100具有至少95%序列同一性。在某些其他实施例中,天然prsaorf与seqidno:101具有至少90%序列同一性。在另一个实施例中,天然prsa蛋白与seqidno:155具有约90%序列同一性。在特定实施例中,目的蛋白(poi)是蛋白酶或淀粉酶。因此,本公开的某些其他实施例涉及获得、分离、纯化以及类似地处理由经修饰的地衣芽孢杆菌细胞产生的目的蛋白。14.生物序列说明15.seqidno:1是编码天然化脓链球菌cas9蛋白的氨基酸序列。16.seqidno:2是编码seqidno:1的cas9蛋白的核酸序列,该核酸序列已针对在芽孢杆菌属物种细胞中表达进行了密码子优化。17.seqidno:3是合成的n-末端核定位信号(nls)的氨基酸序列。18.seqidno:4是合成的c-末端核定位信号(nls)的氨基酸序列。19.seqidno:5是合成的十组氨酸标签的氨基酸序列。20.seqidno:6是枯草芽孢杆菌apre启动子序列。21.seqidno:7是合成的终止子核酸序列。22.seqidno:8是正向引物核酸序列。23.seqidno:9是反向引物核酸序列。24.seqidno:10是合成的pkb320骨架核酸序列。25.seqidno:11是合成的pkb320核酸序列。26.seqidno:12是引物核酸序列。27.seqidno:13是引物核酸序列。28.seqidno:14是引物核酸序列。29.seqidno:15是引物核酸序列。30.seqidno:16是引物核酸序列。31.seqidno:17是引物核酸序列。32.seqidno:18是引物核酸序列。33.seqidno:19是引物核酸序列。34.seqidno:20是引物核酸序列。35.seqidno:21是引物核酸序列。36.seqidno:22是引物核酸序列。37.seqidno:23是引物核酸序列。38.seqidno:24是引物核酸序列。39.seqidno:25是合成的prf694核酸序列。40.seqidno:26是合成的prf801核酸序列。41.seqidno:27是合成的prf806核酸序列。42.seqidno:28是地衣芽孢杆菌靶位点1(ts1)核酸序列。43.seqidno:29是地衣芽孢杆菌靶位点2(ts2)核酸序列。44.seqidno:30是地衣芽孢杆菌sera1可读框(orf)序列。45.seqidno:31是包含核苷酸“agg”的靶位点1pam序列。46.seqidno:32是编码可变靶向(vt)位点1的核酸序列。47.seqidno:33是编码cer结构域的合成的核酸序列。48.seqidno:34是靶向位点1的合成的指导rna(grna)序列。49.seqidno:35是合成的spac启动子核酸序列。50.seqidno:36是合成的t0终止子核酸序列。51.seqidno:37是地衣芽孢杆菌sera1同源臂1核酸序列。52.seqidno:38是合成的sera1同源臂1正向引物序列。53.seqidno:39是合成的sera1同源臂1反向引物序列。54.seqidno:40是地衣芽孢杆菌sera1同源臂2核酸序列。55.seqidno:41是合成的sera1同源臂2正向引物序列。56.seqidno:42是合成的sera1同源臂2正向引物序列。57.seqidno:43是编码靶位点1(ts1)grna的表达盒。58.seqidno:44是合成的sera1缺失编辑模板。59.seqidno:45是地衣芽孢杆菌rghr1可读框(orf)序列。60.seqidno:46是包含核苷酸“cgg”的靶位点2pam序列。61.seqidno:47是靶向位点2的合成的指导rna(grna)序列。62.seqidno:48是地衣芽孢杆菌rghr1同源臂1核酸序列。63.seqidno:49是合成的rghr1同源臂1正向引物序列。64.seqidno:50是合成的rghr1同源臂1反向引物序列。65.seqidno:51是地衣芽孢杆菌rghr1同源臂2核酸序列。66.seqidno:52是合成的rghr1同源臂2正向引物序列。67.seqidno:53是合成的rghr1同源臂2反向引物序列。68.seqidno:54是编码靶位点2(ts2)grna的表达盒。69.seqidno:55是合成的rghr1缺失编辑模板。70.seqidno:56是编码cas9(y155h)变体蛋白的氨基酸序列。71.seqidno:57是合成的y155h正向引物序列。72.seqidno:58是合成的y155h反向引物序列。73.seqidno:59是合成的prf827核酸序列。74.seqidno:60是编码seqidno:56的变体cas9(y155h)蛋白的表达盒。75.seqidno:61是合成的prf856核酸序列。76.seqidno:62是合成的prf862核酸序列。77.seqidno:63是合成的y155h片段序列。78.seqidno:64是合成的y155h片段正向引物序列。79.seqidno:65是合成的y155h片段反向引物序列。80.seqidno:66是合成的prf694片段序列。81.seqidno:67是合成的prf694片段正向引物序列。82.seqidno:68是合成的prf694片段反向引物序列。83.seqidno:69是合成的prf869核酸序列。84.seqidno:70是地衣芽孢杆菌rghr2可读框(orf)序列。85.seqidno:71是合成的rghr2终止片段。86.seqidno:72是合成的rghr2终止编辑模板。87.seqidno:73是编码rghr2grna的表达盒。88.seqidno:74是合成的片段正向引物。89.seqidno:75是合成的片段反向引物。90.seqidno:76是合成的prf862骨架正向引物。91.seqidno:77是合成的prf862骨架反向引物。92.seqidno:78是合成的prf879核酸序列。93.seqidno:79是地衣芽孢杆菌prf879靶位点和pam核酸序列。94.seqidno:80是合成的prf879编辑模板序列。95.seqidno:81是合成的prf946核酸序列。96.seqidno:82是地衣芽孢杆菌pr946靶位点和pam核酸序列。97.seqidno:83是合成的pr946编辑模板序列。98.seqidno:84是合成的pzm221核酸序列。99.seqidno:85是合成的pzm221靶位点和pam核酸序列。100.seqidno:86是合成的pzm221编辑模板序列。101.seqidno:87是地衣芽孢杆菌lysa可读框(orf)序列。102.seqidno:88是合成的pbl.comk核酸序列。103.seqidno:89是合成的壮观霉素标记核酸序列。104.seqidno:90是枯草芽孢杆菌xylr核酸序列。105.seqidno:91是枯草芽孢杆菌xylap核酸序列。106.seqidno:92是合成的comk核酸序列。107.seqidno:93是合成的cat_prsa核酸序列。108.seqidno:94是地衣芽孢杆菌cat上游核酸序列。109.seqidno:95是地衣芽孢杆菌cat启动子核酸序列。110.seqidno:96是地衣芽孢杆菌cath核酸序列。111.seqidno:97是合成的双终止子核酸序列。112.seqidno:98是地衣芽孢杆菌cath终止子核酸序列。113.seqidno:99是枯草芽孢杆菌spovg终止子核酸序列。114.seqidno:100是地衣芽孢杆菌prsa启动子核酸序列。115.seqidno:101是地衣芽孢杆菌prsa可读框(orf)序列。116.seqidno:102地衣芽孢杆菌amyl终止子核酸序列。117.seqidno:103是地衣芽孢杆菌cat下游核酸序列。118.seqidno:104是合成的正向引物核酸序列。119.seqidno:105是合成的反向引物核酸序列。120.seqidno:106是合成的prsa(第2拷贝)验证核酸序列。121.seqidno:107是合成的引物序列。122.seqidno:108是合成的引物序列。123.seqidno:109是合成的引物序列。124.seqidno:110是地衣芽孢杆菌缺失的cathp和cath编码核酸序列。125.seqidno:111是catcath缺失中的合成prsa(第2拷贝)表达盒126.seqidno:112是合成的cath(第2拷贝)缺失验证pcr产物。127.seqidno:113是合成的正向引物序列。128.seqidno:114是合成的反向引物序列。129.seqidno:115是合成的dlta-2验证pcr产物。130.seqidno:116是合成的dlta-2亲本验证pcr产物。131.seqidno:117是合成的正向引物序列。132.seqidno:118是合成的反向引物序列。133.seqidno:119是合成的rghr2缺失验证pcr产物。134.seqidno:120是地衣芽孢杆菌亲本rghr2缺失验证pcr产物。135.seqidno:121是地衣芽孢杆菌亲本rghr2基因座。136.seqidno:122是地衣芽孢杆菌亲本dlta基因座。137.seqidno:123是地衣芽孢杆菌亲本cat基因座。138.seqidno:124是合成的cat2xprsa基因座139.seqidno:125是合成的dlta-2基因座。140.seqidno:126是地衣芽孢杆菌淀粉酶1蛋白的氨基酸序列。141.seqidno:127是合成的sera1淀粉酶1盒。142.seqidno:128是合成的p3启动子序列。143.seqidno:129是合成的经修饰的apre5'-utr序列。144.seqidno:130是编码amyl信号序列的地衣芽孢杆菌核酸序列。145.seqidno:131是编码seqidno:126的淀粉酶1蛋白的地衣芽孢杆菌核酸序列。146.seqidno:132是合成的lysa淀粉酶1盒。147.seqidno:133是合成的lysa亲本基因座核酸序列。148.seqidno:134是编码lysa的地衣芽孢杆菌核酸序列。149.seqidno:135是合成的p2启动子序列。150.seqidno:136是淀粉酶2蛋白的氨基酸序列。151.seqidno:137是合成的sera1淀粉酶2盒。152.seqidno:138是枯草芽孢杆菌rrni启动子序列。153.seqidno:139是枯草芽孢杆菌apre5'-utr序列。154.seqidno:140是编码seqidno:136的淀粉酶2蛋白的合成核酸序列。155.seqidno:141是合成的amyl或lysa淀粉酶2盒。156.seqidno:142是合成的amyl亲本基因座。157.seqidno:143是淀粉酶3蛋白的氨基酸序列。158.seqidno:144是合成的sera1淀粉酶3盒。159.seqidno:145是编码seqidno:143的淀粉酶3蛋白的合成的核酸序列。160.seqidno:146是合成的lysa淀粉酶3盒。161.seqidno:147是淀粉酶4蛋白的氨基酸序列。162.seqidno:148是合成的sera1淀粉酶4盒。163.seqidno:149是编码seqidno:147的淀粉酶4蛋白的合成的核酸序列。164.seqidno:150是合成的lysa淀粉酶4盒。165.seqidno:151是淀粉酶5蛋白的氨基酸序列。166.seqidno:152是合成的sera1淀粉酶5盒。167.seqidno:153是编码seqidno:151的淀粉酶5蛋白的合成的核酸序列。168.seqidno:154是合成的lysa淀粉酶5盒。169.seqidno:155是天然地衣芽孢杆菌prsa蛋白的氨基酸序列。170.seqidno:156是天然地衣芽孢杆菌rghr2蛋白的氨基酸序列。171.seqidno:157是变体地衣芽孢杆菌rghr2蛋白的氨基酸序列。172.seqidno:158是编码seqidno:157的变体rghr2蛋白的变体地衣芽孢杆菌rghr2基因的核酸序列。具体实施方式173.本公开总体上涉及用于获得包含增强的蛋白产生能力的地衣芽孢杆菌细胞(例如,蛋白产生型宿主)的组合物和方法。本公开的某些实施例涉及衍生自亲本地衣芽孢杆菌细胞/菌株的遗传修饰的地衣芽孢杆菌细胞/菌株。因此,本公开的某些其他实施例涉及用于构建此类经修饰的地衣芽孢杆菌细胞/菌株的方法,所述细胞/菌株产生增加量的一种或多种目的蛋白。174.例如,本公开的某些实施例涉及在经修饰的地衣芽孢杆菌细胞中产生增加量的目的蛋白(poi)的方法,所述细胞包括(a)通过在表达poi的亲本地衣芽孢杆菌细胞中引入包含与天然prsa可读框(orf)可操作地连接的天然prsa启动子的多核苷酸来修饰所述表达poi的亲本地衣芽孢杆菌细胞以及(b)在用于产生所述poi的合适条件下发酵所述经修饰的细胞,其中当在相同条件下发酵时,相对于所述亲本细胞,所述经修饰的细胞产生增加量的所述poi。在某些实施例中,经修饰的细胞进一步包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏和/或与seqidno:121具有至少90%序列同一性的rghr2基因的缺失或破坏。在某些实施例中,目的蛋白(poi)是酶。在某些实施例中,酶是蛋白酶或淀粉酶。175.本公开的其他实施例涉及经修饰的地衣芽孢杆菌细胞/菌株,其衍生自包含编码天然prsa蛋白的内源prsa基因的亲本地衣芽孢杆菌细胞/菌株。因此,在某些实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含引入的多核苷酸,所述多核苷酸包含可操作地连接至天然prsa可读框(orf)的天然prsa启动子。在特定实施例中,引入的多核苷酸编码与seqidno:155具有约90%序列同一性的天然prsa蛋白。在其他实施例中,经修饰的细胞包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏和/或与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。176.因此,本公开的某些实施例涉及获得、分离、纯化以及类似地处理由本公开的经修饰的地衣芽孢杆菌细胞产生的目的蛋白。177.i.定义178.鉴于本公开的经修饰的地衣芽孢杆菌细胞及本文所述的其方法,定义了以下术语和短语。本文未定义的术语应当符合如本领域使用的其常规含义。179.除非另外定义,否则本文使用的所有技术和科学术语都具有与本发明组合物和方法应用的领域的普通技术人员通常所理解的相同的含义。尽管在本发明组合物和方法的实践或测试中也可以使用与本文所述的那些方法和材料类似或等效的任何方法和材料,但现在描述代表性的说明性方法和材料。将本文引用的所有出版物和专利都通过引用以其全文而并入。180.应进一步注意,可以撰写权利要求书以排除任何任选的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定的前提基础(或其条件)。181.在阅读本公开后,如将对于本领域技术人员应显而易见的,本文描述和说明的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与其他若干个实施例中的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。182.如本文所用,“芽孢杆菌属”包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于:枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌(b.lentus)、短芽孢杆菌(b.brevis)、嗜热脂肪芽孢杆菌(b.stearothermophilus)、嗜碱芽孢杆菌(b.alkalophilus)、解淀粉芽孢杆菌、克劳氏芽孢杆菌(b.clausii)、耐盐芽孢杆菌(b.halodurans)、巨大芽孢杆菌(b.megaterium)、凝结芽孢杆菌(b.coagulans)、环状芽孢杆菌(b.circulans)、灿烂芽孢杆菌(b.lautus)和苏云金芽孢杆菌(b.thuringiensis)。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于诸如嗜热脂肪芽孢杆菌(其现在名为“嗜热脂肪土芽孢杆菌(geobacillusstearothermophilus)”)等的生物体。183.如本文所用,“亲本细胞”是指“未修饰的细胞”(例如,比如未修饰的地衣芽孢杆菌亲本细胞)。184.如本文所用,“经修饰的细胞”或“子细胞”可互换地使用,并且是指包含至少一个遗传修饰的重组地衣芽孢杆菌细胞,该遗传修饰不存在于经修饰的(子)细胞所来源的“亲本细胞”中。185.在某些实施例中,“未经修饰的”地衣芽孢杆菌(亲本)细胞可以被称为“对照细胞”,特别是当与“经修饰的”的地衣芽孢杆菌(子代)细胞进行比较或相对于“经修饰的”的地衣芽孢杆菌(子代)细胞时。186.如本文所用,当将“未经修饰的”(亲本)细胞中目的蛋白(poi)的表达和/或产生与“经修饰的”(子代)细胞中相同poi的表达和/产生相比较时,应理解,在相同条件(例如,相同条件如培养基、温度、ph等)下生长/培养/发酵“经修饰的”和“未经修饰的”细胞。187.如本文所用,“宿主细胞”是指具有作为新引入的dna序列的宿主或表达媒介物的能力的细胞。在本公开的某些实施例中,宿主细胞是芽孢杆菌属物种或大肠杆菌(e.coli)细胞。188.如本文所用,本公开的“天然地衣芽孢杆菌prsa启动子”与seqidno:100具有约95%序列同一性。在某些实施例中,天然地衣芽孢杆菌prsa启动子与seqidno:100具有约95%、96%、97%、98%、99%或100%序列同一性。189.如本文所用,“天然地衣芽孢杆菌prsa可读框(orf)”与seqidno:101具有约90%或更高序列同一性。在某些实施例中,天然地衣芽孢杆菌prsaorf与seqidno:101具有约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。190.枯草芽孢杆菌的prsa基因已在kontinen和sarvas(1993)以及pct公开号wo1994/019471中进行了描述,这些公开表明prsa基因参与蛋白分泌(即,编码细胞分泌机构的组成部分),其中prsa基因产物是膜相关脂蛋白。191.如本文所用,“天然地衣芽孢杆菌prsa蛋白”与seqidno:155具有约90%或更高序列同一性并包含肽基-脯氨酰顺-反异构酶活性(ec5.2.1.8)。在某些实施例中,天然地衣芽孢杆菌prsa蛋白与seqidno:155具有约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。192.如本文所用,“亲本地衣芽孢杆菌细胞包含编码天然prsa蛋白的内源(野生型)prsa基因”,因此,当编码与seqidno:155具有约90%序列同一性的prsa蛋白的多核苷酸被引入本公开的经修饰的地衣芽孢杆菌细胞中时,引入的多核苷酸在本文中可称为作为第二(第2)prsa拷贝。例如,包含编码与seqidno:155具有约90%序列同一性的prsa蛋白的引入的多核苷酸的本公开的经修饰的地衣芽孢杆菌细胞在本文中可称为二(2)拷贝prsa(经修饰的)地衣芽孢杆菌细胞,其包含编码天然prsa蛋白的第一(第1)内源(野生型)prsa基因,以及编码prsa蛋白的第二(第2)引入的多核苷酸。193.在枯草芽孢杆菌中,dlt操纵子包含分别编码名为dlta、dltb、dltc、dltd和dlte的蛋白的五(5)个orf(dlta、dltb、dltc、dltd和dlte)(may等人,2005)。例如,如may等人(2005)所述,dlta蛋白是d-丙氨酸:d-丙氨酰载体蛋白连接酶,其参与将d-ala掺入细胞壁的脂磷壁酸中。194.如本文所用,“dlta基因”与seqidno:122具有约90%序列同一性。在某些实施例中,dlta基因与seqidno:155具有约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。195.枯草芽孢杆菌rghr基因编码称为rghr的转录调节蛋白,其在本领域中已被描述为rapg、raph(hayashi等人,2006)和rapd(ogura和fujita,2007)的阻遏物。相比之下,如最近在pct公开号wo2018/156705中所述,地衣芽孢杆菌编码rghr转录调节蛋白的两(2)个同源物,称为rghr1和rghr2。如下文所述,本公开的某些实施例涉及地衣芽孢杆菌细胞,其包含经修饰的(例如,缺失或破坏)rghr2基因。196.如本文所用,适用于本文所述遗传修饰的“地衣芽孢杆菌rghr2基因”可以是野生型地衣芽孢杆菌rghr2基因(seqidno:121),其编码与seqidno:156具有约90%的序列同一性的天然rhgr2蛋白(例如与seqidno:156具有约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性),或者它可以是变体地衣芽孢杆菌rghr2基因(seqidno:158),其编码与seqidno:157具有约90%序列同一性的变体rhgr2蛋白(例如与seqidno:156具有约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性)。例如,如seqidno:157所示,变体rhgr2蛋白在seqidno:157的氨基酸残基36-41处包含“ala-ala-ala-ile-ser-arg”的六(6)氨基酸残基重复,其中六(6)氨基酸重复不存在于天然rghr2蛋白中(即,seqidno:156的氨基酸残基1-134)。197.因此,在某些其他实施例中,rghr2基因或其可读框与天然rghr2基因具有约90%的序列同一性(例如与seqidno:121具有约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性);或与变体rghr2基因具有约90%的序列同一性(例如,与seqidno:158具有约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性)。198.如本文所用,名为“bf140”或“bf140(δsera_δlysa)”的亲本地衣芽孢杆菌菌株包含sera基因缺失(δsera)和lysa基因缺失(δlysa)。199.如本文所用,名为“bf561”或“bf561(第2拷贝prsa)”的经修饰的地衣芽孢杆菌菌株衍生自亲本菌株bf140,其中经修饰的bf561菌株包含编码天然prsa蛋白的野生型地衣芽孢杆菌prsa基因的引入的第2拷贝。200.如本文所用,经修饰的地衣芽孢杆菌菌株命名为“bf598”或“bf598(δdlta_第2拷贝prsa)”衍生自bf561菌株,其中经修饰的bf598进一步包含地衣芽孢杆菌dlta基因的缺失。201.如本文所用,经修饰的地衣芽孢杆菌菌株命名为“bf602”或“bf602(δrghr2_第2拷贝prsa)”衍生自bf561菌株,其中经修饰的bf602进一步包含地衣芽孢杆菌rghr2基因的缺失。202.如本文所用,命名为“bf613”或“bf613”的经修饰的地衣芽孢杆菌菌株(δrghr2_δdlta_第2拷贝prsa)”衍生自bf598(δdlta_第2拷贝prsa)菌株,其中经修饰的bf613进一步包含地衣芽孢杆菌rghr2基因的缺失。203.如本文所用,“淀粉酶1”是本领域通常称为amyl的天然地衣芽孢杆菌α-淀粉酶并且包含seqidno:126的氨基酸序列。204.如本文所用,“淀粉酶2”是包含seqidno:136的变体芽孢杆菌属物种α-淀粉酶,如国际pct公开号wo2018/184004(通过引用以其整体并入本文)中一般描述的。205.如本文所用,“淀粉酶3”是包含seqidno:143的噬细胞菌属物种α-淀粉酶,如国际pct公开号wo2014/164777;wo2012/164800和wo2014/164834(各自通过引用以其整体并入本文)中一般描述的。206.如本文所用,“淀粉酶4”是包含seqidno:147的噬细胞菌属物种α-淀粉酶,如国际pct公开号wo2014/164777;wo2012/164800和wo2014/164834(各自通过引用以其整体并入本文)中一般描述的。207.如本文所用,“淀粉酶5”是包含seqidno:151的芽孢杆菌属物种707碱性α-淀粉酶,如国际pct公开号wo2008/153805和美国专利公开号us2014/0057324(自通过引用以其整体并入本文)中一般描述的。208.如本文所用,本文名为“cas9y155h”的变体cas9蛋白已在pct公开号wo2019/118463(通过引用以其整体并入本文)中进行了描述。209.如本文所用,术语“修饰”和“遗传修饰”可互换地使用,并且包括:(a)引入、取代、或去除基因(或其orf)中的一个或多个核苷酸,或者引入、取代、或去除基因或其orf的转录或翻译所需要的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)特异性诱变,和/或(g)随机诱变本文公开的任何一个或多个基因。210.如本文所用,当在短语如“相对于(未经修饰的)亲本宿主细胞,经修饰的宿主细胞‘表达/产生增加量’的一种或多种目的蛋白”中使用时,“增加量”特别是指在经修饰的宿主细胞中表达/产生的任何“增加量”的目的蛋白(poi),所述“增加量”总是相对于表达/产生相同poi的(未经修饰的)亲本地衣芽孢杆菌细胞而言,其中所述经修饰的和未经修饰的细胞在相同的条件下(例如,相同的条件如培养基、温度、ph等)生长/培养/发酵。例如,增加量的poi可以是在本公开的经修饰的芽孢杆菌属物种细胞中表达的内源芽孢杆菌属物种poi或异源poi。211.如本文所用,“增加”蛋白产生或“增加的”蛋白产生意指产生的蛋白(例如,目的蛋白)的量增加。蛋白可以在宿主细胞内产生,或分泌(或转运)到培养基中。在某些实施例中,目的蛋白被产生(被分泌)到培养基中。与亲本宿主细胞相比,增加的蛋白产生可以被检测为例如蛋白或酶活性(例如像蛋白酶活性、淀粉酶活性、纤维素酶活性、半纤维素酶活性等)或者所产生的总细胞外蛋白的更高的最大水平。212.如本文所用,术语“表达”是指衍生自本公开的核酸分子的有义(mrna)或反义rna的转录和稳定积累。表达也可指将mrna翻译成多肽。因此,术语“表达”包括涉及多肽的产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。213.如本文所用,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合成起点的dna、cdna和rna,其可能是双链或单链,无论代表正义或反义链。应理解,由于遗传密码的简并性,许多核苷酸序列可以编码给定的蛋白。214.应理解,本文所述的多核苷酸(或核酸分子)包括“基因”、“载体”和“质粒”。215.因此,术语“基因”是指编码氨基酸的特定序列的多核苷酸,其包含所有或部分蛋白编码序列,并且可以包括调控(非转录的)dna序列,如启动子序列,该启动子序列决定例如基因在其下表达的条件。基因的转录区可以包括非翻译区(utr)(包括内含子、5'-非翻译区(utr)和3'-utr)以及编码序列。216.如本文所用,术语“编码序列”是指直接指定其(所编码的)蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界一般由通常以atg起始密码子开始的可读框(在下文质,“orf”)决定。编码序列典型地包括dna、cdna和重组核苷酸序列。217.如本文使用的,术语“启动子”是指能够控制编码序列或功能性rna表达的核酸序列。通常,编码序列位于启动子序列3'(下游)。启动子可以全部衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同元件构成,或者甚至包含合成核酸片段。本领域技术人员应理解,不同启动子可以指导基因在不同细胞类型中、或在不同发育阶段、或响应于不同环境或生理条件而表达。使基因在大多数细胞类型中在大多数时间表达的启动子通常被称为“组成型启动子”。应进一步认识到,由于在大多数情况下,尚未完全界定调节序列的确切边界,因此不同长度的dna片段可以具有相同启动子活性。218.如本文使用的术语“可操作地连接”是指核酸序列在单个核酸片段上的缔合,使得一者的功能受到另一者影响。例如,当能够实现该编码序列的表达(即,编码序列在启动子的转录控制下)时,启动子与该编码序列(例如orf)可操作地连接。编码序列可以在有义或反义方向上可操作地连接到调节序列。219.当核酸被放置成与另一个核酸序列具有功能关系时,该核酸与另一个核酸序列“可操作地连接”。例如,如果编码分泌性前导序列(即,信号肽)的dna被表达为参与多肽分泌的前蛋白,则该编码分泌性前导序列(即,信号肽)的dna可操作地连接到该多肽的dna;如果启动子或增强子影响编码序列的转录,则该启动子或增强子可操作地连接到该序列;或者如果核糖体结合位点被定位以便促进翻译,则该核糖体结合位点可操作地连接到编码序列。通常,“可操作地连接”意指被连接的dna序列是连续的,并且在分泌性前导序列的情况下,是连续的并且处于阅读相中。然而,增强子不必是连续的。通过在方便的限制位点处连接来实现连接。如果此类位点不存在,则按照常规实践使用合成的寡核苷酸衔接子或接头。220.如本文所用,“控制目的基因(或其可读框)的表达的与目的基因的蛋白编码序列连接的功能性启动子序列”是指控制编码序列在芽孢杆菌属中的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含5′启动子(或5′启动子区、或串联5′启动子等)的多核苷酸,其中启动子区可操作地连接到编码蛋白的核酸序列(例如,orf)。221.如本文所用,“合适的调节序列”是指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码序列的转录、rna加工或稳定性或者翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、rna加工位点、效应子结合位点和茎环结构。222.如本文所用,术语“引入”,如短语中所使用的,如“向细菌细胞中引入”或“向地衣芽孢杆菌中引入”至少一种多核苷酸可读框(orf)、或其基因、或其载体,包括本领域已知用于将多核苷酸引入细胞的方法,这些方法包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染、缀合等(例如,参见ferrari等人,1989)。223.如本文所用,“转化的”或“转化”意指通过使用重组dna技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、orf或基因)插入细胞中而发生。所插入的核苷酸序列可以是异源核苷酸序列(即在待转化的细胞中不是天然存在的序列)。因此,转化通常是指将外源dna引入宿主细胞中,使得dna保持为染色体整合体或自我复制的染色体外载体。224.如本文所用,“转化dna”、“转化序列”和“dna构建体”是指用于将序列引入宿主细胞或生物体中的dna。转化dna是用于将序列引入宿主细胞或生物体中的dna。可以通过pcr或任何其他合适的技术在体外产生dna。在一些实施例中,转化dna包含输入序列,而在其他实施例中,它进一步包含侧翼为同源盒的输入序列。在又另一个实施例中,转化dna包含其他非同源序列,添加到末端(即,填充序列或侧翼)。末端可以闭合,使得转化dna形成闭环,例如像插入载体中。225.如本文所用,“基因的破坏”或“基因破坏”可互换使用,并且广泛地是指基本上防止宿主细胞产生功能性基因产物(例如,蛋白)的任何遗传修饰。因此,如本文所用,基因破坏包括但不限于移码突变、过早终止密码子(即使得不产生功能性蛋白)、消除或降低蛋白活性的取代、内部缺失(使得不产生功能性蛋白)、破坏编码序列的插入、去除转录所需的天然启动子和可读框之间的可操作连接的突变等。226.如本文使用的,“输入序列”是指引入芽孢杆菌属物种染色体中的dna序列。在一些实施例中,输入序列是dna构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以已经或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因和/或经突变的或经修饰的基因。在可替代的实施例中,输入序列编码功能性野生型基因或操纵子、功能性突变型基因或操纵子或者非功能性基因或操纵子。在一些实施例中,可以将非功能性序列插入基因中以破坏基因的功能。在另一个实施例中,输入序列包括选择性标记。在进一步的实施例中,输入序列包括两个同源盒。227.如本文所用,“同源盒”是指与芽孢杆菌属染色体中的序列同源的核酸序列。更具体地,根据本发明,同源盒是上游或下游区,该上游或下游区与被缺失、破坏、灭活的、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导在芽孢杆菌属染色体中,dna构建体被整合,并且指导哪一部分芽孢杆菌属染色体被输入序列替代。虽然不意在限制本公开,但同源盒可以包括约1个碱基对(bp)至200千碱基(kb)之间。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间;以及0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5'和3'端的侧翼为同源盒,其中同源盒包含紧密侧翼基因的编码区的核酸序列。228.如本文所用,术语“编码可选择性标记的核苷酸序列”是指核苷酸序列,所述核苷酸序列能够在宿主细胞中表达并且其中可选择性标记的表达赋予含有表达的基因的细胞在不存在对应的选择性试剂或缺乏必需营养素的情况下生长的能力。229.如本文所用,术语“可选择标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择包含载体的那些宿主。此类可选择性标记的实例包括但不限于抗微生物剂。因此,术语“可选择标记”是指提供宿主细胞已经摄取了输入性目的dna或者已经发生了一些其他反应的指示的基因。典型地,可选择性标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将含有外源dna的细胞与未接受任何外源序列的细胞区分开来。[0230]“驻留可选择性标记(residingselectablemarker)”是位于待转化微生物的染色体上的标记。驻留可选择性标记编码与转化dna构建体上的可选择性标记不同的基因。选择性标记是本领域技术人员熟知的。如上所述,标记可以是抗微生物抗性标记(例如,ampr、phleor、specr、kanr、eryr、tetr、cmpr和neor)(参见例如,guerot-fleury,1995;palmeros等人,2000;和trieu-cuot等人,1983)。在一些实施例中,本发明提供氯霉素抗性基因(例如,存在于pc194上的基因,以及存在于地衣芽孢杆菌基因组中的抗性基因)。此抗性基因在本发明中以及涉及染色体整合的盒和整合质粒的染色体扩增的实施例中特别有用(参见例如,albertini和galizzi,1985;stahl和ferrari,1984)。根据本发明有用的其他标记包括但不限于营养缺陷型标记,如丝氨酸、赖氨酸、色氨酸;和检测标记,如β-半乳糖苷酶。[0231]如本文定义的,宿主细胞“基因组”、细菌(宿主)细胞“基因组”、或芽孢杆菌属物种(宿主)细胞“基因组”包括染色体基因和染色体外基因。[0232]如本文所用,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈环状双链dna分子的形式。此类元件可以是源自任何来源的单链或双链dna或rna的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和dna序列连同适当3'未翻译序列引入到细胞中。[0233]如本文所用,术语“质粒”是指用作克隆载体,并且在许多细菌和一些真核生物中形成染色体外自我复制遗传元件的环状双链(ds)dna构建体。在一些实施例中,将质粒掺入宿主细胞的基因组中。在一些实施例中,质粒存在于亲本细胞中并且在子代细胞中丢失。[0234]如本文使用的,“转化盒”是指包含基因(或其orf)并且除了外源基因之外还具有促进特定宿主细胞的转化的元件的特定载体。[0235]如本文所用,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或dna区段到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括为“附加体”(即,其自主复制或可以整合到宿主生物体的染色体中)的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子、和人工染色体如yac(酵母人工染色体)、bac(细菌人工染色体)、plac(植物人工染色体)等。[0236]“表达载体”是指具有在细胞中掺入并且表达异源dna能力的载体。许多原核和真核表达载体可商购获得并且是本领域技术人员已知的。适当的表达载体的选择在本领域技术人员的知识范围内。[0237]如本文所用,术语“表达盒”和“表达载体”是指重组或合成生成的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件(即,这些是载体或载体元件,如上所述)的核酸构建体。可以将重组表达盒掺入质粒、染色体、线粒体dna、质体dna、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括(除了其他序列之外)待转录的核酸序列和启动子。在一些实施例中,dna构建体还包括允许特定核酸在靶细胞中转录的一系列指定核酸元件。在某些实施例中,本公开的dna构建体包含如本文定义的选择性标记和失活染色体或基因或dna区段。[0238]如本文所用,“靶向载体”是这样的载体,该载体包括与该靶向载体转化至其中的宿主细胞的染色体中的区同源的多核苷酸序列,并且该载体可以驱动在该区处的同源重组。例如,靶向载体可用于通过同源重组将突变引入宿主细胞的染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端(即,填充序列或侧翼序列)。末端可以闭合,使得靶向载体形成闭环,例如像插入载体中。例如,在某些实施例中,通过在其中引入一个或多个“靶向载体”来修饰(例如,转化)亲本地衣芽孢杆菌(宿主)细胞。[0239]如本文所用,术语“目的蛋白”或“poi”是指期望在经修饰的地衣芽孢杆菌(子代)宿主细胞中表达的目的多肽,其中所述poi优选地以增加的水平表达(即,相对于“未经修饰的”(亲本)细胞)。因此,如本文所用,poi可以是酶、底物结合蛋白、表面活性蛋白、结构蛋白、受体蛋白等。在某些实施例中,相对于亲本细胞,本公开的经修饰的细胞产生增加量的异源目的蛋白或内源目的蛋白。在特别地实施例中,由本公开的经修饰的细胞产生的目的蛋白的增加量是相对于亲本细胞,至少0.5%增加、至少1.0%增加、至少5.0%增加、或超过5.0%增加。[0240]类似地,如本文定义的,“目的基因”或“goi”是指编码poi的核酸序列(例如,多核苷酸、基因、或orf)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、经突变的基因或合成基因。[0241]如本文所用,术语“多肽”和“蛋白”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。在本文中使用氨基酸残基的常规单(1)字母或三(3)字母代码。多肽可以是线性的或支化的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖已经天然地或通过干预修饰;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,诸如与标记组分缀合而修饰的氨基酸聚合物。这些定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。[0242]在某些实施例中,本公开的基因编码商业上相关的工业目的蛋白,例如酶(例如,乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。[0243]如本文所用,“变体”多肽是指典型地通过重组dna技术,通过取代、添加或缺失一个或多个氨基酸,衍生自亲本(或参考)多肽的多肽。变体多肽与亲本多肽可以相差小数量的氨基酸残基,并且可以通过它们与亲本(参考)多肽的一级氨基酸序列同源性/同一性的水平来定义。[0244]优选地,变体多肽与亲本(参考)多肽序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%氨基酸序列同一性。如本文所用,“变体”多核苷酸是指编码变体多肽的多核苷酸,其中“变体多核苷酸”与亲本多核苷酸具有指定程度的序列同源性/同一性,或者与亲本多核苷酸(或其互补序列)在严格杂交条件下杂交。优选地,变体多核苷酸与亲本(参考)多核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%核苷酸序列同一性。[0245]如本文所用,“突变”是指核酸序列中的任何变化或改变。存在几种类型的突变,包括点突变、缺失突变、沉默突变、移码突变、剪接突变等。突变可以特异性地(例如,经由定点诱变)或随机地(例如,经由化学试剂、通过修复减去细菌菌株传代)进行。[0246]如本文所用,在多肽或其序列的上下文中,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。[0247]如本文定义的,“内源基因”是指位于生物体基因组的其天然位置中的基因。[0248]如本文定义的,“异源”基因、“非内源”基因或“外源”基因是指通常不在宿主生物体中被发现,但是通过基因转移引入宿主生物体中的基因(或orf)。如本文所用,术语一个或多个“外源”基因包括插入非天然生物体中的天然基因(或orf)和/或插入天然或非天然生物体中的嵌合基因。[0249]如本文定义的,“异源控制序列”是指在自然界中不起调节(控制)目的基因表达的作用的基因表达控制序列(例如,启动子或增强子)。通常,异源核酸序列对于它们存在的细胞或基因组的一部分而言不是内源(天然)的,并且已通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源”核酸构建体可以含有与在天然宿主细胞中发现的控制序列/dna编码序列组合相同或不同的控制序列/dna编码(orf)序列组合。[0250]如本文所用,术语“信号序列”和“信号肽”是指可以参与成熟蛋白或蛋白的前体形式的分泌或定向转运的氨基酸残基的序列。典型地,信号序列位于前体或成熟蛋白序列的n-末端。信号序列可以是内源的或外源的。成熟蛋白中通常不存在信号序列。典型地,在蛋白被转运后,信号序列通过信号肽酶从蛋白上切割下来。[0251]术语“衍生的”涵盖术语“起源的”、“获得的”“可获得的”和“产生的”,并且通常指示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源,或者具有可以参考另一种指定的材料或组合物描述的特征。[0252]如本文所用,术语“同源性”涉及同源多核苷酸或多肽。如果两个或更多个多核苷酸或者两个或更多个多肽是同源的,则这意味着同源多核苷酸或多肽具有至少60%、更优选至少70%、甚至更优选至少85%、仍更优选至少90%、更优选至少95%、最优选至少98%的“同一性程度”。两个多核苷酸或多肽序列是否具有如本文定义的同源程度足够高的同一性,可以通过使用本领域已知的计算机程序比对两个序列来适当地研究,该计算机程序如gcg程序包中提供的“gap”(威斯康星程序包手册(programmanualforthewisconsinpackage),第8版,1994年8月,遗传学计算机集团(geneticscomputergroup),科学大道575号(575sciencedrive),麦迪逊,威斯康星州,美国53711)(needleman和wunsch,(1970))。使用具有以下设置的gap进行dna序列比较:gap产生罚分5.0和gap扩展罚分0.3。[0253]如本文所用,术语“百分比(%)同一性”是指当使用序列比对程序进行比对时,编码多肽的核酸序列或多肽的氨基酸序列之间的核酸或氨基酸序列同一性的水平。[0254]如本文所用,“比生产力”是在给定时间段内产生的蛋白的总量/细胞/时间。[0255]如本文定义的,术语“纯化的”、“分离的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通过将其与它在自然界中相关联的天然存在的成分中的一些或所有分离而从其天然状态改变。这样的分离或纯化可以通过本领域公认的分离技术如离子交换色谱法、亲和色谱法、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其他蛋白盐沉淀、离心、尺寸排阻色谱法、过滤、微量过滤、凝胶电泳或梯度分离完成,以去除最终组合物中所不希望的全细胞、细胞碎片、杂质、外来蛋白或酶。然后可以进一步向纯化的或分离的生物分子组合物中添加提供另外益处的成分,例如活化剂、抗抑制剂、期望的离子、控制ph的化合物或者其他酶或化学品。[0256]如本文所用,术语“comk多肽”定义为comk基因的产物;一种转录因子,在感受态发展之前充当最终的自动调节控制开关;参与激活参与dna结合和摄取以及重组的晚期感受态基因的表达(liu和zuber,1998,hamoen等人,1998)。示例性comk核酸如seqidno:92所示。[0257]如本文所用,“重组体”包括提及细胞或载体,其已通过引入异源核酸序列而被修饰,或者该细胞衍生自如此修饰的细胞。因此,例如,重组细胞表达未在细胞的天然(非重组)形式内发现的相同形式的基因或表达以其他方式异常表达的、低表达的或根本不表达的天然基因(由于故意的人为干预)。“重组(recombination、recombining)”或产生“重组的(recombined)”核酸通常是两个或更多个核酸片段的组装,其中所述组装产生嵌合基因。[0258]如本文所用,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,针对基因a-b-c,基因b以a和c基因序列为侧翼)。在某些实施例中,输入序列在每侧的侧翼为同源盒。在另一个实施例中,输入序列和同源盒包含在每侧的侧翼为填充序列的单元。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),但是在优选的实施例中,它在被侧翼的序列的每侧。每个同源盒的序列与芽孢杆菌属染色体中的序列同源。这些序列指导在芽孢杆菌属染色体中新构建体的整合位置以及芽孢杆菌属染色体的哪部分将被输入序列替代。在其他实施例中,选择性标记的5'和3'端的侧翼为包含失活染色体区段的部分的多核苷酸序列。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),而在其他实施例中,它存在于被侧翼的序列的每侧。[0259]ii.包含增强的蛋白产生表型的经修饰的地衣芽孢杆菌细胞[0260]如以下实例部分中一般阐述的,申请人构建了一系列宿主修饰并将其引入亲本地衣芽孢杆菌菌株中。更具体地,如以下实例中所示(例如,参见表18),本实例中使用的亲本地衣芽孢杆菌菌株包含sera1基因(seqidno:30)和lysa基因(seqidno:87)的缺失,并命名为bf140(δsera_δlysa)。申请人随后将某些遗传修饰引入亲本地衣芽孢杆菌菌株(bf140),包括引入(1)编码天然prsa蛋白的野生型地衣芽孢杆菌prsa基因的第2拷贝(命名为bf561;第2拷贝prsa),(2)地衣芽孢杆菌dlta基因的缺失(命名为bf598;δdlta_第2拷贝prsa),(3)地衣芽孢杆菌rghr2基因的缺失(命名为bf602;δrghr2_第2拷贝prsa)和(4)地衣芽孢杆菌rghr2基因和dlta基因的组合缺失(命名为bf613;δrghr2_δdlta_第2拷贝prsa)。[0261]在构建上述经修饰的菌株之后,将一系列α-淀粉酶表达盒引入经修饰的地衣芽孢杆菌菌株(bf561、bf598、bf602和bf613)和亲本地衣芽孢杆菌菌株(bf140)。更具体地,如下文实例4中所示,将五(5)个不同的α-淀粉酶表达盒(即,“淀粉酶1”、“淀粉酶2”、“淀粉酶3”、“淀粉酶4”和“淀粉酶5”)的两个(2)拷贝引入地衣芽孢杆菌菌株。[0262]如下文实例5中进一步描述的,测定了亲本(bf140)和含有淀粉酶1-5表达盒的两(2)个拷贝的经修饰(bf561、bf598、bf602和bf613)的地衣芽孢杆菌菌株的淀粉酶产生(例如,参见表19)。例如,从不同的α-淀粉酶组中测试的所有五(5)种淀粉酶都证明了与未修饰的亲本宿主bf140相比在bf613修饰的背景(δrghr2_δdlta_第2拷贝prsa)(其包括dlta-2等位基因(seqidno:125)缺失(δdlta-2),rghr2等位基因(seqidno:80)缺失(δrghr2)和由天然prsa启动子(seqidno:124)控制的天然prsa基因的第二拷贝的插入)中α-淀粉酶产生的改善。对于淀粉酶2和淀粉酶3,在bf602修饰的背景(δrghr2_第2拷贝prsa)(其包含rghr2(δrghr2)等位基因(seqidno:80)缺失和由天然prsa启动子(seqidno:124)控制的天然prsa基因的第二拷贝)中α-淀粉酶产生方面的改善几乎与在bf613修饰的宿主中观察到的生产力改善一样好。这一观察表明,对于某些淀粉酶,生产力的提高只需要存在这两个(2)等位基因(即,δrghr2_第2拷贝prsa),并且δdlta-2等位基因的存在对这种改善没有害处。[0263]iii.分子生物学[0264]如上文一般阐述的,本公开的某些实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌(子代)细胞。更特别地,本公开的某些实施例涉及经修饰的芽孢杆菌属(子代)细胞及其用于产生和构建此类具有增加的蛋白产生能力、增加的次级代谢产物产生能力等的经修饰的芽孢杆菌属(宿主)细胞(例如,蛋白产生宿主细胞、细胞工厂)的方法。[0265]在某些实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含编码天然prsa蛋白的基因或orf的引入的第2拷贝。在其他实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含dlta基因的缺失。在某些其他实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含编码天然prsa蛋白的基因或orf的引入的第2拷贝和dlta基因的缺失。在其他实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含rghr2基因的缺失。在某些其他实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含编码天然prsa蛋白的基因或orf的引入的第2拷贝和rghr2基因的缺失。在其他实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含dlta基因的缺失和rghr2基因的缺失。在某些其他实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含编码天然prsa蛋白的基因或orf的引入的第2拷贝、dlta基因的缺失和rghr2基因的缺失。[0266]因此,本公开的某些实施例提供了用于遗传修饰(改变)本公开的亲本芽孢杆菌属细胞以产生其经修饰的芽孢杆菌属细胞的组合物和方法,并且更特别地,经修饰的芽孢杆菌属细胞相对于(未经修饰的)亲本地衣芽孢杆菌细胞,产生增加量的内源和/或异源目的蛋白。[0267]因此,本公开的某些实施例涉及用于遗传修饰芽孢杆菌属细胞的方法,其中所述修饰包括(a)引入、取代、或去除基因(或其orf)中的一个或多个核苷酸,或者引入、取代、或去除基因或其orf的转录或翻译所需要的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)下调基因,(f)位点特异性诱变,和/或(g)随机诱变。[0268]在某些实施例中,通过使用本领域熟知的方法(例如,插入、破坏、替换、或缺失)减少或消除上述基因的表达来构建本公开的经修饰的芽孢杆菌属细胞。待修饰或失活的基因的部分可以是例如编码区或编码区表达所需的调节元件。[0269]此类调控或控制序列的实例可以是启动子序列或其功能部分(即,足以影响核酸序列表达的部分)。用于修饰的其他控制序列包括但不限于前导序列、前肽序列、信号序列、转录终止子、转录激活子等。[0270]在某些其他实施例中,通过基因缺失构建经修饰的芽孢杆菌属细胞以消除或减少本公开的至少一种前述基因的表达。基因缺失技术使得能够部分或完全去除一个或多个基因,从而消除它们的表达,或者表达非功能性(或活性降低的)蛋白产物。在此类方法中,一个或多个基因的缺失可以通过使用已构建为连续含有侧翼于该基因的5'和3'区的质粒进行同源重组来完成。可以将连续的5'和3'区引入芽孢杆菌属细胞中,例如,在温度敏感的质粒(如pe194)上,在允许温度下与第二可选择标记缔和以允许质粒在细胞中建立。然后将细胞移至非允许温度,以选择在同源侧翼区之一处具有整合到染色体中的质粒的细胞。通过选择第二可选择性标记来实现质粒整合的选择。在整合后,通过将细胞移至允许温度持续几代而不进行选择来刺激第二同源侧翼区处的重组事件。将细胞铺板以获得单菌落,并检查菌落是否损失两种可选择标记(参见例如,perego,1993)。因此,本领域的技术人员可容易地鉴定在基因的编码序列和/或基因的非编码序列中的核苷酸区(适于完全或部分缺失)。[0271]在其他实施例中,通过在基因或其转录或翻译所需的调控元件中引入、取代、或去除一个或多个核苷酸来构建本公开的经修饰的芽孢杆菌属细胞。例如,可以插入或去除核苷酸,以便导致终止密码子的引入、起始密码子的去除或可读框的移码。此种修饰可以根据本领域已知的方法通过定点诱变或pcr产生的诱变来完成(例如,参见botstein和shortle,1985;lo等人,1985;higuchi等人,1988;shimada,1996;ho等人,1989;horton等人,1989;以及sarkar和sommer,1990)。因此,在某些实施例中,通过完全或部分缺失使本公开的基因失活。[0272]在另一个实施例中,通过基因转换的过程构建经修饰的芽孢杆菌属细胞(例如,参见iglesias和trautner,1983)。例如,在基因转换方法中,对应于一个或多个基因的核酸序列在体外诱变以产生缺陷核酸序列,然后将所述核酸序列转化到亲本芽孢杆菌属细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列替代内源基因。可能期望的是,缺陷基因或基因片段也编码可以用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择标记缔和引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。通过检查菌落是否丢失可选择性标记和是否获得经突变的基因来实现导致基因替代的第二重组事件的选择(perego,1993)。可替代地,缺陷核酸序列可以含有基因的一个或多个核苷酸的插入、取代或缺失,如下文所述。[0273]在其他实施例中,通过确立已久的反义技术使用与基因的核酸序列互补的核苷酸序列来构建经修饰的芽孢杆菌属细胞(parish和stoker,1997)。更具体地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除芽孢杆菌属细胞的基因的表达,该核苷酸序列可以在细胞中转录并且能够与细胞中产生的mrna杂交。在允许互补的反义核苷酸序列与mrna杂交的条件下,由此降低或消除所翻译的蛋白的量。此类反义方法包括但不限于rna干扰(rnai)、小干扰rna(sirna)、微小rna(mirna)、反义寡核苷酸等,所有这些都是熟练技术人员熟知的。[0274]在其他实施例中,经由crispr-cas9编辑产生/构建经修饰的芽孢杆菌属细胞。例如,编码目的蛋白的基因可以通过核酸指导的内切核酸酶的方式编辑或破坏(或缺失或下调),所述核酸指导的内切核酸酶通过结合指导rna(例如,cas9)和cpf1或指导dna(例如,ngago)发现其靶dna,这将内切核酸酶募集到dna上的靶序列上,其中所述内切核酸酶可以在dna中产生单链或双链断裂。此靶向dna断裂成为dna修复的底物,并且可以与所提供的编辑模板重组以使基因破坏或缺失。例如,编码核酸指导的内切核酸酶(出于此目的,来自化脓链球菌的cas9)的基因或编码cas9核酸酶的密码子优化的基因可操作地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子,从而产生芽孢杆菌cas9表达盒。同样,本领域技术人员容易地鉴定目的基因特有的一个或多个靶位点。例如,为了构造编码grna的dna构建体-指向目的基因内的靶位点,可变的靶向结构域(vt)将包含靶位点的核苷酸,所述核苷酸为(pam)前间区序列邻近基序(tgg)的5′,所述核苷酸与编码化脓链球菌cas9的cas9核酸内切酶识别结构域(cer)的dna融合。将编码vt结构域的dna和编码cer结构域的dna组合,从而产生编码grna的dna。因此,通过将编码grna的dna可操作地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子来产生grna的芽孢杆菌属表达盒。[0275]在某些实施例中,将由核酸内切酶诱导的dna断裂用输入序列修复/替代。例如,为了精确修复由上述cas9表达盒和grna表达盒产生的dna断裂,提供了核苷酸编辑模板,使得细胞的dna修复机器可以利用编辑模板。例如,靶基因的约500bp5'可以与靶基因的约500bp3'融合以产生编辑模板,所述模板由芽孢杆菌宿主的机器用于修复由rgen产生的dna断裂。[0276]可以使用许多不同的方法(例如,原生质体融合、电穿孔、自然感受态或诱导感受态)将cas9表达盒、grna表达盒、和编辑模板共同递送至丝状真菌细胞。通过用正向和反向引物扩增基因座,通过pcr扩增靶基因座来筛选经转化的细胞。这些引物可以扩增野生型基因座或已由rgen编辑的经修饰的基因座。然后使用测序引物对这些片段进行测序以鉴定经编辑的菌落。[0277]在又其他实施例中,使用本领域已知的方法(包括但不限于,化学诱变(参见例如,hopwood,1970)和转座(参见例如,youngman等人,1983)),通过随机或特异性诱变构建经修饰的芽孢杆菌属细胞。可以通过使亲本细胞经受诱变并且筛选基因表达已减少或消除的突变型细胞来进行基因的修饰。可以例如通过使用合适的物理或化学诱变剂、使用合适的寡核苷酸或使dna序列经受pcr产生的诱变来进行可以是特异性的或随机的诱变。此外,诱变可以通过使用这些诱变方法的任何组合来进行。[0278]适用于本发明目的的物理或化学诱变剂的实例包括紫外线(uv)照射、羟胺、n-甲基-n'-硝基-n-亚硝基胍(mnng)、n-甲基-n'-亚硝基胍(ntg)、邻甲基羟胺、亚硝酸、甲烷磺酸乙酯(ems)、亚硫酸氢钠、甲酸、和核苷酸类似物。当使用此类试剂时,典型地通过如下方式来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并且选择展现出基因的表达降低或无表达的突变型细胞。[0279]在某些其他实施例中,经修饰的芽孢杆菌属细胞包含内源基因的缺失。在其他实施例中,经修饰的芽孢杆菌属细胞包含内源基因的破坏。在某些实施例中,本公开的多核苷酸破坏盒包含标记基因。[0280]在其他实施例中,经修饰的芽孢杆菌属细胞包含内源基因的下调。例如,在某些实施例中,下调上述一个或多个基因包含缺失或破坏基因的上游或下游调控元件。[0281]pct公开号wo2003/083125公开了用于修饰芽孢杆菌属细胞的方法,如使用pcr融合来产生芽孢杆菌属缺失菌株和dna构建体以绕过大肠杆菌。[0282]pct公开号wo2002/14490公开了用于修饰芽孢杆菌属细胞的方法,这些方法包括(1)构建和转化整合的质粒(pcomk),(2)随机诱变编码序列、信号序列和前肽序列,(3)同源重组,(4)通过向转化dna添加非同源侧翼提高转化效率,(5)优化双交叉整合,(6)定向诱变和(7)无标记缺失。[0283]本领域技术人员熟知用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌和芽孢杆菌属物种)中的合适方法(例如ferrari等人,1989;saunders等人,1984;hoch等人,1967;mann等人,1986;holubova,1985;chang等人,1979;vorobjeva等人,1980;smith等人,1986;fisher等人,1981;以及mcdonald,1984)。实际上,包括原生质体转化和中板集合、转导和原生质体融合在内的诸如转化等的方法是已知的并且适合用于本公开。转化方法特别优选地用于将本公开的dna构建体引入宿主细胞中。[0284]除了常用方法之外,在一些实施例中,直接转化宿主细胞(即,在引入宿主细胞之前,中间细胞不用于扩增dna构建体或以其他方式处理dna构建体)。将dna构建体引入宿主细胞中包括本领域已知的将dna引入宿主细胞中而不插入质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸dna、脂质体等。在另外的实施例中,将dna构建体与质粒一起共转化而不插入该质粒中。在另外的实施例中,通过本领域已知的方法,将选择性标记从经修饰的芽孢杆菌属菌株中缺失或基本上切除(例如,stahl等人,1984和palmeros等人,2000)。在一些实施例中,载体从宿主染色体上分解下来,将侧翼区留在染色体上,而将固有的染色体区去除。[0285]用于在芽孢杆菌属细胞中表达基因、其可读框(orf)和/或其变体序列的启动子和启动子序列区通常是本领域技术人员已知的。通常选择本公开的启动子序列,使得它们在芽孢杆菌属细胞(例如,地衣芽孢杆菌细胞、枯草芽孢杆菌属细胞等)中起作用。某些示例性芽孢杆菌属启动子序列呈现于表6中。同样地,用于驱动芽孢杆菌属细胞中基因表达的启动子包括但不限于枯草芽孢杆菌碱性蛋白酶(apre)启动子(stahl等人,1984)、枯草芽孢杆菌的α-淀粉酶启动子(yang等人,1983)、解淀粉芽孢杆菌的α-淀粉酶启动子(tarkinen等人,1983)、来自枯草芽孢杆菌的中性蛋白酶(npre)启动子(yang等人,1984)、突变体apre启动子(pct公开号wo2001/51643)或来自地衣芽孢杆菌或其他相关的芽孢杆菌属的任何其他启动子。在某些其他实施例中,启动子是美国专利公开号2014/0329309中公开的核糖体蛋白启动子或核糖体rna启动子(例如,rrni启动子)。在pct公开号wo2003/089604中描述了用于在芽孢杆菌属细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。[0286]iv.培养用于产生目的蛋白的芽孢杆菌属细胞[0287]在其他实施例中,本公开提供了与未经修饰的(亲本)细胞相比(即,相对于),用于提高经修饰的细菌细胞的蛋白生产力的方法。在某些实施例中,本公开内容针对产生目的蛋白(poi)的方法,这些方法包括发酵培养经修饰的细菌细胞,其中经修饰的细胞将poi分泌到培养基中。本领域熟知的发酵方法可用于发酵本公开的经修饰的和未经修饰的芽孢杆菌属细胞。[0288]在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的系统,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,将培养基用一种或多种所希望的生物体接种。在这种方法中,允许发酵发生而不向系统中添加任何组分。典型地,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(如ph和氧浓度)进行尝试。分批系统的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,并且最后进入生长速率减小或停止的静止期。如果不经处理,处于静止期的细胞最终死亡。通常,处于对数期的细胞负责产物的大量产生。[0289]标准分批系统的合适的变体是“补料分批发酵”系统。在典型分批系统的这种变体中,随着发酵的进展,以增量添加底物。当分解代谢物阻遏可能抑制细胞的代谢时并且在培养基中希望具有有限量的底物的情况下,补料分批系统是有用的。在补料分批系统中实际底物浓度的测量是困难的并且因此基于可测量因素(如ph、溶解氧和废气(如co2)的分压)的变化对其进行估计。分批和补料分批发酵在本领域中是常用并且已知的。[0290]连续发酵是开放的系统,其中将确定的发酵培养基连续添加到生物反应器中,同时去除等量的条件培养基以用于处理。连续发酵通常将培养物保持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对影响细胞生长和/或产物浓度的一种或多种因素进行调节。例如,在一个实施例中,将限制营养素(如碳源或氮源)保持在固定的速率,并且允许调控所有其他参数。在其他系统中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续系统努力保持稳态生长条件。因此,由于转移培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养素和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域中熟知的。[0291]因此,在某些实施例中,可以通过常规程序从培养基中回收由转化的(经修饰的)宿主细胞产生的poi,所述常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。典型地,在澄清后,将上清液或滤液的蛋白组分借助盐(例如,硫酸铵)沉淀。然后将沉淀出的蛋白溶解,并且可以通过各种色谱程序(例如,离子交换色谱法、凝胶过滤)进行纯化。[0292]v.经修饰的(宿主)细胞产生的目的蛋白[0293]本公开的目的蛋白(poi)可以是任何内源或异源蛋白,并且它可以是此种poi的变体。蛋白可以包含一个或多个二硫桥,或者是其功能形式是单体或多聚体的蛋白,即蛋白具有四级结构并且由多个相同(同源的)或不相同的(异源的)亚基构成,其中poi或其变体poi优选是具有目的特性的poi。[0294]例如,如在以下实例中所述,本公开的经修饰的芽孢杆菌属细胞产生增加量的内源和/或异源目的蛋白。因此,在某些实施例中,本公开的经修饰的细胞表达内源poi、异源poi或一种或多种此类poi的组合。例如,在某些实施例中,本公开的经修饰的芽孢杆菌属(子代)细胞相对于亲本芽孢杆菌属细胞产生增加量的内源poi。在其他实施例中,本公开的经修饰的芽孢杆菌属(子代)细胞相对于亲本芽孢杆菌属细胞产生增加量的异源poi。[0295]因此,在某些实施例中,本公开的经修饰的芽孢杆菌属(子代)细胞相对于亲本芽孢杆菌(对照)细胞产生增加量的poi,其中所述增加量的poi是至少约0.01%增加、至少约0.10%增加、至少约0.50%增加、至少约1.0%增加、至少约2.0%增加、至少约3.0%增加、至少约4.0%增加、至少约5.0%增加、或超过5.0%增加。在某些实施例中,增加量的poi通过测定其酶活性和/或通过测定/定量其比生产力(qp)来确定。同样地,本领域技术人员可以利用本领域已知的其它规方法和技术来检测、测定、测量等一种或多种目的蛋白的表达或产生。[0296]在某些实施例中,相对于(未经修饰的)亲本芽孢杆菌属细胞,本公开的经修饰的芽孢杆菌属细胞展示poi的增加的比生产力(qp)。例如,比生产力(qp)的检测是用于评价蛋白产生的合适方法。比生产力(qp)可以使用以下等式确定:[0297]“qp=gp/gdcw·hr”[0298]其中,“gp”是罐中产生的蛋白的克数;“gdcw”是罐中的干细胞重量(dcw)的克数;并且“hr”是从接种时间开始的以小时计的发酵时间,其包括生产时间以及生长时间。[0299]因此,在某些其他实施例中,相比于未经修饰的(亲本)细胞,本公开的经修饰的芽孢杆菌属细胞包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产力(qp)增加。[0300]在某些实施例中,poi或其变体poi选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。[0301]因此,在某些实施例中,poi或其变体poi是选自酶学委员会(ec)编号ec1、ec2、ec3、ec4、ec5或ec6的酶。[0302]例如,在某些实施例中,poi是包括但不限于选自以下的ec1(氧化还原酶)酶的氧化还原酶:ec1.10.3.2(例如,漆酶)、ec1.10.3.3(例如,l-抗坏血酸氧化酶)、ec1.1.1.1(例如,醇脱氢酶)、ec1.11.1.10(例如,氯化物过氧化物酶)、ec1.11.1.17(例如,过氧化物酶)、ec1.1.1.27(例如,l-乳酸脱氢酶)、ec1.1.1.47(例如,葡萄糖1-脱氢酶)、ec1.1.3.x(例如,葡萄糖氧化酶)、ec1.1.3.10(例如,吡喃糖氧化酶)、ec1.13.11.x(例如,加双氧酶)、ec1.13.11.12(例如,亚油酸13s-脂氧合酶(lineolate13s-lipozygenase))、ec1.1.3.13(例如,醇氧化酶)、ec1.14.14.1(例如,单加氧酶)、ec1.14.18.1(例如,单酚单加氧酶(monophenolmonooxigenase))、ec1.15.1.1(例如,超氧化物歧化酶)、ec1.1.5.9(先前,ec1.1.99.10,例如,葡萄糖脱氢酶)、ec1.1.99.18(例如,纤维二糖脱氢酶)、ec1.1.99.29(例如,吡喃糖脱氢酶)、ec1.2.1.x(例如,脂肪酸还原酶)、ec1.2.1.10(例如,乙醛脱氢酶)、ec1.5.3.x(例如,果糖基胺还原酶)、ec1.8.1.x(例如,二硫还原酶)和ec1.8.3.2(例如,硫醇氧化酶)。[0303]在某些实施例中,poi是包括但不限于ec2(转移酶)酶的转移酶,所述ec2(转移酶)酶选自ec2.3.2.13(例如,转谷氨酰胺酶)、ec2.4.1.x(例如,己糖基转移酶)、ec2.4.1.40(例如,交替蔗糖酶(alternasucrase))、ec2.4.1.18(例如,1,4α-葡聚糖分支酶)、ec2.4.1.19(例如,环麦芽糖糊精葡聚糖转移酶)、ec2.4.1.2(例如,糊精葡聚糖酶)、ec2.4.1.20(例如,纤维二糖磷酸化酶)、ec2.4.1.25(例如,4-α-葡聚糖转移酶)、ec2.4.1.333(例如,1,2-β-低聚葡糖磷酸转移酶)、ec2.4.1.4(例如,淀粉蔗糖酶)、ec2.4.1.5(例如,葡聚糖蔗糖酶)、ec2.4.1.69(例如,半乳糖苷2-α-l-岩藻糖基转移酶)、ec2.4.1.9(例如,菊粉蔗糖酶(inulosucrase))、ec2.7.1.17(例如,木酮糖激酶)、ec2.7.7.89(原名ec3.1.4.15,例如,[谷氨酰氨合成酶]-腺苷-l-酪氨酸磷酸化酶)、ec2.7.9.4(例如,α葡聚糖激酶)和ec2.7.9.5(例如,磷酸葡聚糖激酶)。[0304]在其他实施例中,poi是水解酶,包括但不限于选自以下的ec3(水解酶)酶:ec3.1.x.x(例如,酯酶)、ec3.1.1.1(例如,果胶酶)、ec3.1.1.14(例如,叶绿素酶)、ec3.1.1.20(例如,鞣酸酶)、ec3.1.1.23(例如,甘油酯酰基水解酶)、ec3.1.1.26(例如,半乳糖脂酶)、ec3.1.1.32(例如,磷脂酶a1)、ec3.1.1.4(例如,磷脂酶a2)、ec3.1.1.6(例如,乙酰酯酶)、ec3.1.1.72(例如,乙酰木聚糖酯酶)、ec3.1.1.73(例如,阿魏酸酯酶)、ec3.1.1.74(例如,角质酶)、ec3.1.1.86(例如,鼠李糖半乳糖醛酸乙酰酯酶)、ec3.1.1.87(例如,伏马菌素b1酯酶)、ec3.1.26.5(例如,核糖核酸酶p)、ec3.1.3.x(例如,磷酸单酯水解酶)、ec3.1.30.1(例如,曲霉属核酸酶s1)、ec3.1.30.2(例如,粘质沙雷氏菌(serratiamarcescens)核酸酶)、ec3.1.3.1(例如,碱性磷酸酶)、ec3.1.3.2(例如,酸性磷酸酶)、ec3.1.3.8(例如,3-植酸酶)、ec3.1.4.1(例如,磷酸二酯酶i)、ec3.1.4.11(例如,磷酸肌醇磷脂酶c)、ec3.1.4.3(例如,磷脂酶c)、ec3.1.4.4(例如,磷脂酶d)、ec3.1.6.1(例如,芳基硫酸酯酶)、ec3.1.8.2(例如,二异丙基-氟磷酸酶)、ec3.2.1.10(例如,寡-1,6-葡糖苷酶)、ec3.2.1.101(例如,甘露聚糖内切-1,6-α-甘露糖苷酶)、ec3.2.1.11(例如,α-1,6-葡聚糖-6-葡聚糖水解酶)、ec3.2.1.131(例如,木聚糖α-1,2-葡萄糖醛酸苷酶(glucuronosidase))、ec3.2.1.132(例如,壳聚糖n-乙酰葡糖氨基水解酶)、ec3.2.1.139(例如,α-葡萄糖醛酸酶)、ec3.2.1.14(例如,几丁质酶)、ec3.2.1.151(例如,木葡聚糖特异性内切-β-1,4-葡聚糖酶)、ec3.2.1.155(例如,木葡聚糖特异性外切-β-1,4-葡聚糖酶)、ec3.2.1.164(例如,半乳聚糖内切-1,6-β-半乳糖苷酶)、ec3.2.1.17(例如,溶菌酶)、ec3.2.1.171(例如,鼠李半乳糖醛酸聚糖水解酶)、ec3.2.1.174(例如,鼠李半乳糖醛酸聚糖鼠李糖水解酶)、ec3.2.1.2(例如,β-淀粉酶)、ec3.2.1.20(例如,α-葡糖苷酶)、ec3.2.1.22(例如,α-半乳糖苷酶)、ec3.2.1.25(例如,β-甘露糖苷酶)、ec3.2.1.26(例如,β-果糖呋喃糖苷酶)、ec3.2.1.37(例如,木聚糖1,4-β-木糖苷酶)、ec3.2.1.39(例如,葡聚糖内切-1,3-β-d-葡糖苷酶)、ec3.2.1.40(例如,α-l-鼠李糖苷酶)、ec3.2.1.51(例如,α-l-岩藻糖苷酶)、ec3.2.1.52(例如,β-n-乙酰己糖胺酶)、ec3.2.1.55(例如,α-n-阿拉伯呋喃糖苷酶)、ec3.2.1.58(例如,葡聚糖1,3-β-葡糖苷酶)、ec3.2.1.59(例如,葡聚糖内切-1,3-α-葡糖苷酶)、ec3.2.1.67(例如,半乳糖醛酸1,4-α-半乳糖醛酸酶)、ec3.2.1.68(例如,异淀粉酶)、ec3.2.1.7(例如,1-β-d-果聚糖果糖水解酶)、ec3.2.1.74(例如,葡聚糖1,4-β-葡糖苷酶)、ec3.2.1.75(例如,葡聚糖内切-1,6-β-葡糖苷酶)、ec3.2.1.77(例如,甘露聚糖1,2-(1,3)-α-甘露糖苷酶)、ec3.2.1.80(例如,果聚糖β-果糖苷酶)、ec3.2.1.82(例如,外切-聚-α-半乳糖醛酸苷酶)、ec3.2.1.83(例如,κ-角叉菜胶酶)、ec3.2.1.89(例如,阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶)、ec3.2.1.91(例如,纤维素1,4-β-纤维二糖苷酶)、ec3.2.1.96(例如,甘露糖基-糖蛋白内切-β-n-乙酰葡糖胺糖苷酶)、ec3.2.1.99(例如,阿拉伯聚糖内切-1,5-α-l-阿拉伯糖苷酶)、ec3.4.x.x(例如,肽酶)、ec3.4.11.x(例如,氨肽酶)、ec3.4.11.1(例如,亮氨酰氨肽酶)、ec3.4.11.18(例如,甲硫氨酰氨肽酶)、ec3.4.13.9(例如,xaa-pro二肽酶)、ec3.4.14.5(例如,二肽基-肽酶iv)、ec3.4.16.x(例如,丝氨酸型羧肽酶)、ec3.4.16.5(例如,羧肽酶c)、ec3.4.19.3(例如,焦谷氨酰肽酶i)、ec3.4.21.x(例如,丝氨酸内肽酶)、ec3.4.21.1(例如,胰凝乳蛋白酶)、ec3.4.21.19(例如,谷氨酰内肽酶)、ec3.4.21.26(例如,脯氨酰寡肽酶)、ec3.4.21.4(例如,胰蛋白酶)、ec3.4.21.5(例如,凝血酶)、ec3.4.21.63(例如,蜂蜜曲霉蛋白酶)、ec3.4.21.65(例如,热霉菌素)、ec3.4.21.80(例如,链霉菌素a)、ec3.4.22.x(例如,半胱氨酸内肽酶)、ec3.4.22.14(例如,猕猴桃蛋白酶(actinidain))、ec3.4.22.2(例如,木瓜蛋白酶)、ec3.4.22.3(例如,无花果蛋白酶)、ec3.4.22.32(例如,茎菠萝蛋白酶)、ec3.4.22.33(例如,水果菠萝蛋白酶)、ec3.4.22.6(例如,木瓜凝乳蛋白酶)、ec3.4.23.1(例如,胃蛋白酶a)、ec3.4.23.2(例如,胃蛋白酶b)、ec3.4.23.22(例如,栗疫霉胃蛋白酶)、ec3.4.23.23(例如,毛霉胃蛋白酶)、ec3.4.23.3(例如,胃亚蛋白酶)、ec3.4.24.x(例如,金属内肽酶)、ec3.4.24.39(例如,氘代溶素(deuterolysin))、ec3.4.24.40(例如,舍雷肽酶)、ec3.5.1.1(例如,天冬酰胺酶)、ec3.5.1.11(例如,青霉素酰胺酶)、ec3.5.1.14(例如,n-酰基-脂族-l-氨基酸酰胺水解酶)、ec3.5.1.2(例如,l-谷氨酰胺酰胺水解酶)、ec3.5.1.28(例如,n-乙酰胞壁酰-l-丙氨酸酰胺酶)、ec3.5.1.4(例如,酰胺酶)、ec3.5.1.44(例如,蛋白-l-谷氨酰胺酰胺水解酶)、ec3.5.1.5(例如,脲酶)、ec3.5.1.52(例如,肽-n(4)-(n-乙酰基-β-葡糖胺基)天冬酰胺酰胺酶)、ec3.5.1.81(例如,n-酰基-d-氨基酸脱酰基酶)、ec3.5.4.6(例如,amp脱氨酶)、和ec3.5.5.1(例如,腈水解酶)。[0305]在其他实施例中,poi是包括但不限于选自以下的ec4(裂解酶)酶的裂解酶:ec4.1.2.10(例如,苯乙醇腈裂解酶)、ec4.1.3.3(例如,n-乙酰神经氨酸裂解酶)、ec4.2.1.1(例如,碳酸脱水酶)、ec4.2.2.-(例如,鼠李半乳糖醛酸聚糖裂解酶)、ec4.2.2.10(例如,果裂解酶)、ec4.2.2.22(例如,果胶三糖-裂解酶)、ec4.2.2.23(例如,鼠李半乳糖醛酸聚糖内切裂解酶)和ec4.2.2.3(例如,甘露糖醛特异性海藻酸裂解酶)。[0306]在某些其他实施例中,poi是包括但不限于选自以下的ec5(异构酶)酶的异构酶:ec5.1.3.3(例如,醛糖1-差向异构酶)、ec5.1.3.30(例如,d-阿洛酮糖3-差向异构酶)、ec5.4.99.11(例如,异麦芽酮糖合酶)和ec5.4.99.15(例如,(1→4)-α-d-葡聚糖1-α-d-葡萄糖基变位酶((1→4)-α-d-glucan1-α-d-glucosylmutase))。[0307]在又其他实施例中,poi是连接酶,该连接酶包括但不限于选自以下的ec6(连接酶)酶:ec6.2.1.12(例如,4-香豆酸:辅酶a连接酶)和ec6.3.2.28(例如,l-氨基酸α-连接酶)9[0308]因此,在某些实施例中,产生工业蛋白酶的芽孢杆菌属宿主细胞提供特别优选的表达宿主。同样地,在某些其他实施例中,产生工业淀粉酶的芽孢杆菌属宿主细胞提供特别优选的表达宿主。[0309]例如,存在两种一般类型的蛋白酶通常由芽孢杆菌属物种分泌,即中性(或“金属蛋白酶”)和碱性(或“丝氨酸”)蛋白酶。例如,芽孢杆菌枯草杆菌蛋白酶蛋白(酶)是可用于在本公开中使用的示例性丝氨酸蛋白酶。已经鉴定并测序了多种枯草芽孢杆菌蛋白酶,例如枯草杆菌蛋白酶168、枯草杆菌蛋白酶bpn’、枯草杆菌蛋白酶carlsberg、枯草杆菌蛋白酶dy、枯草杆菌蛋白酶147和枯草杆菌蛋白酶309(例如,wo1989/06279和stahl等人,1984)。在本公开的一些实施例中,经修饰的芽孢杆菌属细胞产生突变体(即,变体)蛋白酶。许多参考文献提供变体蛋白酶的实例,如pct公开号wo1999/20770;wo1999/20726;wo1999/20769;wo1989/06279;usre34,606;us专利号4,914,031;4,980,288;5,208,158;5,310,675;5,336,611;5,399,283;5,441,882;5,482,849;5,631,217;5,665,587;5,700,676;5,741,694;5,858,757;5,880,080;6,197,567和6,218,165。因此,在某些实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码蛋白酶的表达构建体。[0310]在某些其他实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码淀粉酶的表达构建体。多种淀粉酶及其变体是本领域技术人员已知的。例如,国际pct公开号wo2006/037484和wo2006/037483描述了具有改善的溶剂稳定性的变体α-淀粉酶,公开号wo1994/18314公开了氧化稳定的α-淀粉酶变体,公开号wo1999/19467、wo2000/29560和wo2000/60059公开了termamyl-样α-淀粉酶变体,公开号wo2008/112459公开了衍生自芽孢杆菌属物种编号707的α-淀粉酶变体,公开号wo1999/43794公开了麦芽生成的α-淀粉酶变体,公开号wo1990/11352公开了超热稳定的(hyper-thermostable)α-淀粉酶变体,公开号wo2006/089107公开了具有颗粒淀粉水解活性的α-淀粉酶变体。[0311]在其他实施例中,在本公开的经修饰细胞中表达和产生的poi或变体poi是肽、肽激素、生长因子、凝血因子、趋化因子、细胞因子、淋巴因子、抗体、受体、粘附分子、微生物抗原(例如,hbv表面抗原、hpve7等)、其变体、其片段等。其他类型的目的蛋白(或其变体)可以是能够为食品或作物提供营养价值的蛋白或变体。非限制性实例包括可以抑制抗营养因子形成的植物蛋白和具有更理想的氨基酸组成的植物蛋白(例如比非转基因植物具有更高的赖氨酸含量)。[0312]存在本领域普通技术人员已知的用于检测和测量细胞内和细胞外表达的蛋白的活性的各种测定。特别地,对于蛋白酶,存在基于来自酪蛋白或血红蛋白的酸溶性肽的释放的测定,其作为280nm下的吸光度测量或使用folin方法进行比色测定(例如bergmeyer等人,1984)。其他测定涉及生色底物的溶解(参见例如,ward,1983)。其他示例性测定包括琥珀酰-ala-ala-pro-phe-对-硝基苯胺测定(saapfpna)和2,4,6-三硝基苯磺酸钠盐测定(tnbs测定)。本领域技术人员已知的许多另外的参考文献提供了适合的方法(参见例如,wells等人,1983;christianson等人,1994和hsia等人,1999)。[0313]国际pct公开号wo2014/164777公开了可用于本文所述淀粉酶活性的ceralphaα-淀粉酶活性测定。[0314]用于确定宿主细胞中目的蛋白的分泌水平并且检测所表达的蛋白的手段包括使用对蛋白具有特异性的多克隆或单克隆抗体的免疫测定。实例包括酶联免疫吸附测定(elisa)、放射免疫测定(ria)、荧光免疫测定(fia)以及荧光激活细胞分选术(facs)。[0315]vi.示例性实施例[0316]本公开的非限制性实施例包括但不限于:[0317]1.一种用于在经修饰的地衣芽孢杆菌细胞中产生增加量的目的蛋白(poi)的方法,所述方法包括:(a)通过在表达poi的亲本地衣芽孢杆菌细胞中引入包含与天然prsa可读框(orf)序列可操作地连接的天然prsa启动子序列的多核苷酸来修饰所述表达poi的亲本地衣芽孢杆菌细胞,以及(b)在用于产生所述poi的合适条件下发酵所述经修饰的细胞,其中当在相同条件下发酵时,相对于所述亲本细胞,所述经修饰的细胞产生增加量的所述poi。[0318]2.一种用于在经修饰的地衣芽孢杆菌细胞中产生增加量的目的蛋白(poi)的方法,所述方法包括:(a)通过向亲本地衣芽孢杆菌细胞中引入以下来修饰所述亲本地衣芽孢杆菌细胞(i)编码poi的表达盒和(ii)包含可操作地连接到天然prsa可读框(orf)序列的天然prsa启动子序列的多核苷酸,以及(b)在用于产生所述poi的合适条件下发酵所述经修饰的细胞,其中当在相同条件下发酵时,相对于所述亲本细胞,所述经修饰的细胞产生增加量的所述poi。[0319]3.如实施例1或实施例2所述的方法,其中所述引入的多核苷酸包含与seqidno:100具有至少95%序列同一性的天然prsa启动子序列。[0320]4.如实施例1或实施例2所述的方法,其中所述引入的多核苷酸包含与seqidno:101具有至少90%序列同一性的天然prsaorf。[0321]5.如实施例1或实施例2所述的方法,其中所述亲本细胞包含编码天然prsa蛋白的内源prsa基因。[0322]6.如实施例5所述的方法,其中所述内源prsa基因编码与seqidno:155具有约90%序列同一性的天然prsa蛋白。[0323]7.如实施例1或实施例2所述的方法,其中将所述引入的多核苷酸整合到所述经修饰的地衣芽孢杆菌细胞的基因组中。[0324]8.如实施例1或实施例2所述的方法,其中所述经修饰的细胞进一步包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏。[0325]9.如实施例1或实施例2所述的方法,其中所述经修饰的细胞进一步包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。[0326]10.如实施例1或实施例2所述的方法,其中所述经修饰的细胞进一步包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏和与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。[0327]11.如实施例1或实施例2所述的方法,其中所述poi是酶。[0328]12.如实施例11所述的方法,其中所述酶是蛋白酶或淀粉酶。[0329]13.一种衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,其中所述经修饰的细胞包含含有可操作地连接到天然prsa可读框(orf)序列的天然prsa启动子序列的引入的多核苷酸。[0330]14.一种衍生自包含编码天然prsa蛋白的内源prsa基因的亲本地衣芽孢杆菌的经修饰的地衣芽孢杆菌细胞,其中所述经修饰的细胞包含含有可操作地连接到天然prsa可读框(orf)序列的天然prsa启动子序列的引入的多核苷酸。[0331]15.如实施例13或实施例14所述的经修饰的细胞,其中所述引入的多核苷酸包含与seqidno:100具有至少95%序列同一性的天然prsa启动子。[0332]16.如实施例13或实施例14所述的经修饰的细胞,其中所述引入的多核苷酸包含与seqidno:101具有至少90%序列同一性的天然prsaorf。[0333]17.如实施例13或实施例14所述的经修饰的细胞,其中所述引入的多核苷酸编码与seqidno:155具有约90%序列同一性的天然prsa蛋白。[0334]18.如实施例13或实施例14所述的经修饰的细胞,其中将所述引入的多核苷酸整合到所述经修饰的地衣芽孢杆菌细胞的基因组中。[0335]19.如实施例13或实施例14所述的经修饰的细胞,其包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏。[0336]20.如实施例13或实施例14所述的经修饰的细胞,其包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。[0337]21.如实施例13或实施例14所述的经修饰的细胞,其包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏和与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。[0338]22.如实施例13或实施例14所述的经修饰的细胞,其包含编码异源目的蛋白(poi)的引入的表达盒。[0339]23.如实施例22所述的经修饰的细胞,其中所述poi是酶。[0340]24.如实施例13或实施例14所述的经修饰的细胞,其中所述亲本细胞表达内源poi。[0341]25.一种目的蛋白,所述目的蛋白由如实施例22或实施例24所述的经修饰的细胞产生。[0342]26.一种相对于亲本地衣芽孢杆菌细胞产生增加量的目的蛋白(poi)的经修饰的地衣芽孢杆菌细胞,其中所述经修饰的细胞衍生自表达poi的亲本地衣芽孢杆菌细胞,其中所述经修饰的细胞包含含有可操作地连接到天然prsa可读框(orf)序列的天然prsa启动子序列的引入的多核苷酸并且包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏,其中当在相同条件下发酵时,经修饰的细胞相对于亲本菌株产生增加量的poi。[0343]27.如实施例26所述的经修饰的细胞,其进一步包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏。[0344]28.一种相对于亲本地衣芽孢杆菌细胞产生增加量的目的蛋白(poi)的经修饰的地衣芽孢杆菌细胞,其中经修饰的细胞衍生自表达poi的亲本地衣芽孢杆菌细胞,其中所述经修饰的细胞包含含有可操作地连接到天然prsa可读框(orf)的天然prsa启动子的引入的多核苷酸并且包含与seqidno:122具有至少90%序列同一性的dlta基因的缺失或破坏,其中当在相同条件下发酵时,所述经修饰的细胞相对于所述亲本菌株产生增加量的所述poi。[0345]29.如实施例28所述的经修饰的细胞,其进一步包含与seqidno:121或seqidno:158具有至少90%序列同一性的rghr2基因的缺失或破坏。idno:42)引物扩增此片段。所述引物在第二片段的5'末端并入了与第一片段3'末端同源的28bp,在第二片段的3'末端并入了与prf694同源的21bp。[0376]表5[0377]正向和反向引物对[0378]正向atgacgcttatttaggaggaaatcttacacagaagctgcggaacctseqidno:41反向cagaagaaaatggaggaattcgaatatcgaccggaacccacseqidno:42[0379]使用标准分子生物学技术将编码靶位点1grna表达盒(seqidno:43)、第一(seqidno:37)和第二同源臂(seqidno:40)的dna组装到prf694(seqidno:25)中,产生prf801(seqidno:26),包含以下的大肠杆菌-地衣芽孢杆菌穿梭质粒:cas9表达盒(seqidno:2)、编码靶向sera1可读框内的靶位点1的grna的grna表达盒(seqidno:43)和由第一(seqidno:37)和第二(seqidno:40)同源臂构成的编辑模板(seqidno:44)。用表3中列出的寡核苷酸通过桑格测序验证质粒。[0380]地衣芽孢杆菌的rghr1可读框(seqidno:45)在反向链上含有唯一的靶位点,即靶位点2(ts2;seqidno:29)。靶位点与反向链上的原间隔子邻近基序(seqidno:46)相邻。编码靶位点的dna序列(seqidno:29)可操作地融合到编码cas9核酸内切酶识别结构域(cer,seqidno:33)的dna序列,使得当被细菌细胞的rna聚合酶转录时,它产生靶向靶位点2的功能性grna(seqidno:47)。编码grna的dna可操作地连接到在芽孢杆菌属物种细胞中有效的启动子(例如来自枯草芽孢杆菌的spac启动子;seqidno:35)和在芽孢杆菌属物种细胞中有效的终止子(例如噬菌体λ的t0终止子;seqidno:36),使得该启动子位于编码grna的dna(seqidno:47)的5',并且该终止子位于编码grna的dna(seqidno:47)的3'。[0381]通过扩增地衣芽孢杆菌基因组dna(gdna)的两个同源臂,构建了编辑模板,用以响应cas9/grna切割而修饰rghr1基因。第一片段对应于rghr1可读框(seqidno:48)直接上游500bp。使用q5dna聚合酶(根据制造商的说明书)和下面表6中列出的引物扩增该片段。所述引物在第一片段的3'末端并入了与第二片段5'末端同源的23bp,在第一片段的5'末端并入了与prf694同源的20bp。[0382]表6[0383]正向和反向引物对[0384]正向tgagtaaacttggtctgacattgatattcagcaccctgcgseqidno:49反向tgtgccgcggagaagtatggccaaaacctcgcaatctcseqidno:50[0385]第二片段对应于rghr1可读框(seqidno:51)的3'末端直接下游的500bp。使用q5dna聚合酶(根据制造商的说明书)和下面表7中列出的引物扩增该片段。所述引物在第二片段的5'末端并入了与第一片段3'末端同源的20bp,在第二片段的3'末端并入了与prf694同源的21bp。[0386]表7[0387]正向和反向引物对[0388]正向gagattgcgaggttttggccatacttctccgcggcacaseqidno:52反向cagaagaaaatggaggaattcatttctcgggtttaaacagccacseqidno:53[0389]使用标准分子生物学技术将编码靶位点2grna表达盒(seqidno:54)、第一(seqidno:48)和第二同源臂(seqidno:51)的dna组装到prf694(seqidno:25)中,产生prf806(seqidno:27),包含以下的大肠杆菌-地衣芽孢杆菌穿梭质粒:cas9表达盒(seqidno:2)、编码靶向rghr1可读框内的靶位点2的grna的grna表达盒(seqidno:54)和由第一(seqidno:48)和第二(seqidno:51)同源臂构成的编辑模板(seqidno:55)。用表3列出的寡核苷酸通过桑格序列验证质粒。[0390]实例2[0391]cas9y155h变体和相关靶向质粒的构建[0392]在本例中,在prf801(seqidno:26)和prf806质粒(seqidno:27)中构建化脓链球菌cas9的y155h变体(seqidno:56)。为了在prf801质粒(seqidno:26)或prf806质粒(seqidno:27)中引入y155h变体,使用quikchange诱变试剂盒(按照制造商说明书)和下表8中的寡核苷酸,使用prf801(seqidno:26)或prf806(seqidno:27)作为模板dna进行定点诱变。[0393]表8[0394]正向和反向引物对[0395]正向gatctgcgtttaatccatcttgcgttagcgcacseqidno:57反向gtgcgctaacgcaagatggattaaacgcagatcseqidno:58[0396]所产生的反应产物,prf827(seqidno:59)包含cas9y155h变体表达盒(seqidno:60)、grna表达盒(seqidno:43)(其编码靶向sera1可读框内的靶位点1的grna)和由第一(seqidno:37)和第二(seqidno:40)同源臂构成的编辑模板(seqidno:44),或者prf856(seqidno:61),其含有cas9y155h变体表达盒(seqidno:60)、靶向rghr1可读框内的靶位点2的grna表达盒(seqidno:54)和由第一(seqidno:48)和第二(seqidno:51)同源臂构成的编辑模板(seqidno:55)。使用表3中列出的测序引物对质粒dna进行桑格测序以验证正确组装。[0397]质粒prf862的构建[0398]质粒prf862(seqidno:62)通过以下来构建:从prf827(seqidno:59)移出cas9可读框的含有y155h取代的片段(seqidno:63),使用表9中所列引物扩增。[0399]表9[0400]正向和反向引物对[0401]正向cacgtcgtaaaaatcgtattseqidno:64反向caaacagaccatttttctttseqidno:65[0402]从prf694(seqidno:25)扩增第二片段(seqidno:66),这样使得它包含整个质粒,除了以上prf827片段(seqidno:63)上含有的片段。该片段与prf827片段(seqidno:60)的5'和3'末端具有同源性用于组装,并使用表10中列出的引物进行扩增。[0403]表10[0404]正向和反向引物对[0405]正向aaagaaaaatggtctgtttgseqidno:67反向aatacgatttttacgacgtgseqidno:68[0406]根据制造商的说明书,使用nebuilder组装两个片段,并且转化到大肠杆菌感受态细胞中。如表3中列出通过桑格的方法验证质粒序列。经序列验证的分离物以质粒prf862存储(seqidno:62)。[0407]使用两个部分构建prf869(seqidno:69),它是靶向rghr2orf(seqidno:70)并且插入三个(3)框内终止密码子的质粒。通过idt合成第一部分(seqidno:71),其包含用来修饰rghr2orf(seqidno:70)的编辑模板(seqidno:72),和靶向rghr2orf(seqidno:70)的grna表达盒(seqidno:73),并且使用表11中列出的引物扩增该第一部分。[0408]表11[0409]正向和反向引物对[0410]正向cgtgcggccgcgaattcseqidno:74反向cctgataccgggagacggcattcgtaatcseqidno:75[0411]通过使用表12中列出的引物扩增prf862,将合成的片段插入prf862(seqidno:62)。[0412]表12[0413]正向和反向引物对[0414]正向gaattcgcggccgcacgseqidno:76反向gattacgaatgccgtctcccggtatcaggseqidno:77[0415]根据制造商的说明书,使用nebuilder组装这两个部分并且转化到大肠杆菌中。如表3中列出通过桑格的方法验证质粒序列。经序列验证的分离物以prf869(seqidno:69)存储。[0416]如以上实例1和2中所述组装几个另外的cas9质粒。下表13中列出了那些质粒,连同靶位点序列和编辑模板效应。[0417]表13[0418]用于编辑地衣芽孢杆菌细胞的另外的cas9质粒[0419][0420]对于所有质粒,使用滚环扩增(rca)扩增质粒并使质粒适合使用truprimerca试剂盒(sygnis)进行转化。[0421]实例3[0422]经修饰的宿主菌株的构建[0423]在本实例中,将一系列宿主修饰引入亲本地衣芽孢杆菌菌株。亲本地衣芽孢杆菌菌株含有sera1(seqidno:30)和lysa基因(seqidno:87)的缺失,并命名为bf140。[0424]将含有pbl.comk质粒(seqidno:88)的bf140版本(liu和zuber,1998,hamoen等人,1998)(该质粒含有壮观霉素标志物(seqidno:89)、编码枯草芽孢杆菌的xylr阻遏物(seqidno:90)和xyla启动子(seqidno:91)的dna(其可操作地连接到编码地衣芽孢杆菌comk蛋白(seqidno:92)的dna上)用靶向cath基因座的线性pcr产物转化,该基因座用于整合地衣芽孢杆菌的prsa基因(seqidno:93)的第二拷贝。该构建体含有与cath启动子(seqidno:95)可操作地连接的cath基因座(seqidno:94)的上游同源臂、编码与双终止子(seqidno:97)可操作地连接的cath蛋白的dna(seqidno:96)(双终止子由与枯草芽孢杆菌的spovg终止子(seqidno:99)可操作地连接的cath终止子(seqidno:98)构成)。[0425]然后该构建体包含以下:地衣芽孢杆菌的prsa启动子(seqidno:100),其可操作地连接至prsa编码序列(seqidno:101),其可操作地连接至地衣芽孢杆菌的amyl基因的终止子(seqidno:102),其可操作地连接至cath基因座的下游同源臂(seqidno:103)。简而言之,产生了bf140/pbl.comk感受态细胞。在37℃和250rpm振荡下,在含有一百(100)ppm壮观霉素的l培养液中将bf140/pbl.comk菌株生长过夜。第二天在含有一百(100)ppm壮观霉素的新鲜l培养液中将培养物稀释至0.7的od600。这种新的培养物在37℃、250rpm振荡下生长一(1)小时。将d-木糖添加至0.1%w·v-1。将培养物在37℃和250rpm振荡下再生长四(4)小时。将细胞以1700·g收获七(7)分钟。将细胞重新悬浮在1/4体积的含有10%v·v-1dmso的用过的培养基中。一百(100)μl细胞与十(10)μlcath::[cathprsap-prsa]整合片段(seqidno:94)混合。将细胞/dna混合物在1400rpm、37℃孵育一个半(1.5)小时。然后将混合物铺在含有十(10)ppm氯霉素的l琼脂板上。将接种的板在37℃孵育四十八(48)小时。[0426]使用菌落pcr筛选在含有十(10)ppm氯霉素的l琼脂上形成的菌落,以使用表14中列出的引物和标准pcr技术确认cath基因座的修饰。[0427]表14[0428]正向和反向引物对[0429]正向tcgttctgaatgagcaagcaseqidno:104反向tgttaatcaggccgacgatcseqidno:105[0430]将该pcr产物,2676bp片段(seqidno:106),使用桑格的方法和表15中列出的引物进行测序。[0431]表15[0432]桑格测序引物[0433]1915aacctatatgacagccggagseqidno:1071916ggcaaaatccacttaagccacseqidno:1081054aacgagttggaacggcttgcseqidno:109[0434]具有正确cath::[cathprsap-prsa]整合(seqidno:93)的分离株作为菌株bf547储存。[0435]如上所述,使含有pbl.comk质粒(seqidno:88)的bf547版本成为感受态。将一百(100)μl感受态细胞与五(5)μlprf946(seqidno:81)rca混合,并在1400rpm、37℃孵育一个半(1.5)小时。将混合物铺在含有二十(20)ppm卡那霉素的l琼脂平板上,以选择质粒转化。将板在37℃孵育四十八(48)小时。[0436]筛选在含有二十(20)ppm卡那霉素的l琼脂上形成的菌落进行菌落pcr,以使用标准pcr技术和上表14中列出的引物确认编码cath启动子3’末端的dna和编码cath蛋白的dna(seqidno:110)的缺失,同时保留cath::[prsap-prsa]盒(seqidno:111)。[0437]含有cath::[prsap-prsa]盒(seqidno:111)的正确菌落产生1990bp(seqidno:112)的pcr产物,而含有cath::[cathprsap-prsa]盒(seqidno:93)的亲本菌落产生pcr产物长度为2676bp(seqidno:106)。使用标准凝胶电泳技术目测评估差异。使用上面表15中的引物1915(seqidno:107)和引物1916(seqidno:108)对具有正确大小的pcr产物的分离株进行测序。[0438]含有cath::[prsap-prsa]盒(seqidno:111)并且对氯霉素(10ppm)表型敏感的经序列验证的分离株被储存为bf561。[0439]如上所述,使含有pbl.comk质粒(seqidno:88)的bf561版本成为感受态。将一百(100)μl感受态细胞与五(5)μlpzm221(seqidno:84)或prf879(seqidno:78)rca混合,并在1400rpm和37℃孵育一个半(1.5)小时。将混合物铺在含有二十(20)ppm卡那霉素的l琼脂平板上以选择用质粒转化的细胞。[0440]对于用pzm221(seqidno:84)转化并在含有二十(20)ppm卡那霉素的l琼脂平板上形成菌落的细胞,针对δdlta-2等位基因(seqidno:86),dlta编码序列的700bp缺失,使用标准pcr技术和表16中的引物筛选菌落。[0441]表16[0442]正向和反向引物对[0443]正向gggtacctccatggtaaagtseqidno:113反向acgtattaatgcagtagccgseqidno:114[0444]具有δdlta-2等位基因的菌落在使用表16中的引物时产生2067bp的pcr产物(seqidno:115),而含有完整dlta基因的亲本细胞产生2767bp的pcr产物(seqidno:116)。这可以使用标准电泳技术来区分。含有dlta(seqidno:86)的700bp内部缺失的菌落作为bf598储存。[0445]对于用prf879(seqidno:78)转化并在含有二十(20)ppm卡那霉素的l琼脂平板上形成菌落的细胞,针对δrghr2等位基因(seqidno:80)、rghr2编码序列的缺失(除了前九个(9)和后九个(9)bp)使用标准pcr技术和下表17中的引物筛选菌落。[0446]表17[0447]正向和反向引物对[0448]正向ggatacgccgatttcaatggcseqidno:117反向ggctatgtgctgggggaattseqidno:118[0449]具有δrghr2等位基因(seqidno:80)的菌落在使用表17中的引物时产生1523bp的pcr产物(seqidno:119),而含有完整rghr2基因的亲本细胞产生1922bp的pcr产物(seqidno:120)。使用标准电泳技术可以区分这两种产物之间的差异。将含有rghr2基因(seqidno:84)缺失的菌落作为bf602储存。[0450]如上所述,使含有pbl.comk质粒(seqidno:88)的bf598版本成为感受态。将一百(100)μl感受态细胞与五(5)μlprf879(seqidno:78)rca混合,并在1400rpm且37℃孵育一个半(1.5)小时。将混合物铺在含有二十(20)ppm卡那霉素的l琼脂平板上以选择用质粒转化的细胞。[0451]对于用prf879(seqidno:78)转化并在含有二十(20)ppm卡那霉素的l琼脂平板上形成菌落的细胞,针对δrghr2等位基因(seqidno:80)、rghr2编码序列的缺失(除了前九个(9)和后九个(9)bp)使用标准pcr技术和上表17中的引物筛选菌落。[0452]具有δrghr2等位基因(seqidno:80)的菌落在使用表17中的引物时产生1523bp的pcr产物(seqidno:119),而含有完整rghr2基因的亲本细胞产生1922bp的pcr产物(seqidno:120)。使用标准电泳技术可以区分这两种产物之间的差异。将含有rghr2基因(seqidno:80)缺失的菌落作为bf613储存。下表18显示了在本实例中产生的经修饰的宿主菌株,其具有在该实例中的三(3)个经修饰的基因座的seqid号。[0453]表18[0454]经修饰的宿主菌株[0455][0456]实例4[0457]在经修饰的宿主菌株中构建表达淀粉酶的菌株[0458]在本实例中,将一系列淀粉酶和淀粉酶变体表达盒引入以上实例2表18中列出的菌株谱系中。[0459]淀粉酶1[0460]淀粉酶1(seqidno:126)是地衣芽孢杆菌的天然α淀粉酶,通常称为amyl。淀粉酶1(seqidno:127)的第一盒被整合到sera1基因座(seqidno:44)中并包含以下:sera1orf(seqidno:30)和合成的p3启动子(seqidno:128),其可操作地连接至编码经修饰的枯草芽孢杆菌apre5’utr(seqidno:129)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶1(seqidno:131)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。整合在lysa基因座(seqidno:133)中的淀粉酶1的第二盒(seqidno:132)包含编码lysa的dna(seqidno:134)和合成的p2启动子(seqidno:135),其可操作地连接至编码经修饰的枯草芽孢杆菌apre5’utr(seqidno:129)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶1(seqidno:131)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。[0461]淀粉酶2[0462]淀粉酶2(seqidno:136)是在pct公开号wo2018/184004(通过引用以其整体并入本文)中描述的变体芽孢杆菌属物种α-淀粉酶。淀粉酶2(seqidno:137)的第一盒被整合到sera1基因座(seqidno:44)中并包含以下:sera1orf(seqidno:30)和枯草芽孢杆菌rrni启动子(seqidno:138),其可操作地连接至编码枯草芽孢杆菌apre5’utr(seqidno:139)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶2(seqidno:140)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。整合在lysa基因座(seqidno:133)或amyl基因座(seqidno:142)中的淀粉酶2(seqidno:141)的第二盒包含编码lysa的dna(seqidno:134)和合成的p3启动子(seqidno:128),其可操作地连接至编码枯草芽孢杆菌apre5’utr(seqidno:139)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶2(seqidno:140)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。[0463]淀粉酶3[0464]淀粉酶3(seqidno:143)是变体噬细胞菌属物种α-淀粉酶(例如,参见pct公开号wo2014/164777;wo2012/164800和wo2014/16483,各自通过引用以其整体并入本文)。淀粉酶3(seqidno:144)的第一盒被整合到sera1基因座(seqidno:44)中并包含以下:sera1orf(seqidno:30)和合成的p3启动子(seqidno:128),其可操作地连接至编码经修饰的枯草芽孢杆菌apre5’utr(seqidno:129)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶3(seqidno:145)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。整合在lysa基因座(seqidno:133)中的第二淀粉酶3盒(seqidno:146)包含编码lysa的dna(seqidno:134)和合成的p2启动子(seqidno:135),其可操作地连接至编码经修饰的枯草芽孢杆菌apre5’utr(seqidno:129)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶3(seqidno:145)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。[0465]淀粉酶4[0466]淀粉酶4(seqidno:147)是变体噬细胞菌属物种α-淀粉酶(例如,参见pct公开号wo2014/164777;wo2012/164800和wo2014/16483,各自通过引用以其整体并入本文)。淀粉酶4(seqidno:148)的第一盒被整合到sera1基因座(seqidno:44)中并包含以下:sera1orf(seqidno:30)和合成的p3启动子(seqidno:128),其可操作地连接至编码枯草芽孢杆菌apre5’utr(seqidno:139)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶4(seqidno:149)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:129)。整合在lysa基因座(seqidno:133)中的第二淀粉酶4盒(seqidno:150)包含编码lysa的dna(seqidno:134)和合成的p2启动子(seqidno:135),其可操作地连接至编码枯草芽孢杆菌apre5’utr(seqidno:139)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶4(seqidno:149)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。[0467]淀粉酶5[0468]淀粉酶5(seqidno:151)是变体芽孢杆菌属物种707α-淀粉酶(参见pct公开号wo2008/153805和美国专利公开号us2014/0057324)。淀粉酶5(seqidno:152)的第一盒被整合到sera1基因座(seqidno:44)中并包含以下:sera1orf(seqidno:30)和合成的p3启动子(seqidno:128),其可操作地连接至编码枯草芽孢杆菌apre5’utr(seqidno:139)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶5(seqidno:153)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。整合在lysa基因座(seqidno:133)中的第二淀粉酶5盒(seqidno:154)包含编码lysa的dna(seqidno:134)和合成的p2启动子(seqidno:135),其可操作地连接至编码枯草芽孢杆菌apre5’utr(seqidno:139)的dna,其可操作地连接至编码地衣芽孢杆菌amyl信号序列(seqidno:130)的dna,其可操作地连接至编码淀粉酶5(seqidno:153)的dna,其可操作地连接至地衣芽孢杆菌amyl转录终止子(seqidno:102)。[0469]使用pct公开号wo2019/040412(通过引用以其整体并入本文)所述的方法将所有淀粉酶表达盒转化到经修饰的宿主菌株中。[0470]实例5[0471]经修饰的宿主背景对淀粉酶产生的影响[0472]在本实例中,使用标准的小规模或实验室规模发酵条件测定含有淀粉酶1-5表达盒(实例4)的两个拷贝的经修饰宿主菌株(即,表19;bf140、bf561、bf598、bf602和bf613)的α-淀粉酶产生(如pct公开号wo2018/156705和wo2019/055261中描述,各自通过引用并入本文)。使用bradford方法或ceralpha测定法对α-淀粉酶产生进行量化。将淀粉酶产生方面的相对改善与包含下表19中呈现的相同α-淀粉酶表达盒的未修饰的宿主进行比较。[0473]表19[0474]不同的经修饰的宿主菌株的关于淀粉酶生产的相对性能[0475][0476]因此,从不同的α-淀粉酶组中测试的所有五(5)种淀粉酶都证明了与未修饰的宿主bf140相比在bf613修饰的背景(其包括dlta-2等位基因(seqidno:125)缺失(δdlta-2),rghr2等位基因(seqidno:80)缺失(δrghr2)和由天然prsa启动子(seqidno:124)控制的天然prsa基因的第二拷贝的插入)中α-淀粉酶产生的改善。[0477]对于淀粉酶2和淀粉酶3,在bf602修饰的背景中α-淀粉酶产生方面的改善(包括rghr2(δrghr2)等位基因(seqidno:80)缺失和由天然prsa启动子(seqidno:124)控制的天然prsa基因的第二拷贝)几乎与bf613修饰的宿主中看到的改善一样好,这表明对于某些淀粉酶,改善只需要这两个等位基因的存在,而且δdlta-2等位基因的存在对这种改善没有害处。[0478]参考文献[0479]pctpublicationno.wo1989/06279[0480]pctpublicationno.wo1990/11352[0481]pctpublicationno.wo1994/18314[0482]pctpublicationno.wo1999/19467[0483]pctpublicationno.wo1999/20726[0484]pctpublicationno.wo1999/20769[0485]pctpublicationno.wo1999/20770[0486]pctpublicationno.wo1999/43794[0487]pctpublicationno.wo2000/29560[0488]pctpublicationno.wo2000/60059[0489]pctpublicationno.wo2001/51643[0490]pctpublicationno.wo2002/14490[0491]pctpublicationno.wo2003/083125[0492]pctpublicationno.wo2003/089604[0493]pctpublicationno.wo2006/037483[0494]pctpublicationno.wo2006/037484[0495]pctpublicationno.wo2006/089107[0496]pctpublicationno.wo2008/112459[0497]pctpublicationno.wo2014/164777[0498]pctpublicationno.wo2019/040412[0499]pctpublicationno.wo2018/156705[0500]pctpublicationno.wo2019/055261[0501]u.s.publicationno.us2014/0329309[0502]uspatentno.4,914,031[0503]uspatentno.4,980,288[0504]uspatentno.5,208,158[0505]uspatentno.5,310,675[0506]uspatentno.5,336,611[0507]uspatentno.5,399,283[0508]uspatentno.5,441,882[0509]uspatentno.5,482,849[0510]uspatentno.5,665,587[0511]uspatentno.5,700,676[0512]uspatentno.5,741,694[0513]uspatentno.5,858,757[0514]uspatentno.5,880,080[0515]uspatentno.6,197,567[0516]uspatentno.6,218,165.[0517]usre34,606[0518]albertiniandgalizzi,bacteriol.,162:1203-1211,1985.[0519]bergmeyeretal.,"methodsofenzymaticanalysis"vol.5,peptidases,proteinasesandtheirinhibitors,verlagchemie,weinheim,1984.[0520]botsteinandshortle,science229:4719,1985.[0521]brodeetal.,“subtilisinbpn'variants:increasedhydrolyticactivityonsurface-boundsubstratesviadecreasedsurfaceactivity”,biochemistry,35(10):3162-3169,1996.[0522]caspersetal.,“improvementofsec-dependentsecretionofaheterologousmodelproteininbacillussubtilisbysaturationmutagenesisofthen-domainoftheamyesignalpeptide”,appl.microbiol.biotechnol.,86(6):1877-1885,2010.[0523]changetal.,mol.gen.genet.,168:11-115,1979.[0524]christiansonetal.,anal.biochem.,223:119-129,1994.[0525]devereuxeta/.,nucl.acidres.,12:387-395,1984.[0526]earletal.,“ecologyandgenomicsofbacillussubtilis”,trendsinmicrobiology.,16(6):269-275,2008.[0527]ferrarietal.,"genetics,"inharwoodetal.(ed.),bacillus,plenumpublishingcorp.,1989.[0528]fisheret.al.,arch.microbiol.,139:213-217,1981.[0529]guerot-fleury,gene,167:335-337,1995.[0530]hamoenetal.,“controllingcompetenceinbacillussubtilis:sharedusedofregulators”,microbiology,149:9-17,2003.[0531]hamoenetal.,genesdev.12:1539-1550,1998.[0532]higuchietal.,nucleicacidsresearch16:7351,1988.[0533]hoetal.,gene77:61,1989.[0534]hochetal.,j.bacteriol.,93:1925-1937,1967.[0535]holubova,foliamicrobiol.,30:97,1985.[0536]hopwood,theisolationofmutantsinmethodsinmicrobiology(j.r.norrisandd.w.ribbons,eds.)pp363-433,academicpress,newyork,1970.[0537]hortonetal.,gene77:61,1989.[0538]hsiaetal.,analbiochem.,242:221-227,1999.[0539]iglesiasandtrautner,moleculargeneralgenetics189:73-76,1983.[0540]jensenetal.,“cell-associateddegradationaffectstheyieldofsecretedengineeredandheterologousproteinsinthebacillussubtilisexpressionsystem”microbiology,146(pt10:2583-2594,2000.[0541]kontinenandsarvas,“theprsalipoproteinisessentialforproteinsecretioninbacillussubtilisandsetsalimitforhigh-levelsecretion”,mol.microbiol.may;8(4):727-737,1993.[0542]liuandzuber,1998,[0543]loetal.,proceedingsofthenationalacademyofsciencesusa81:2285,1985.[0544]mayetal.“inhibitionofthed-alanine:d-alanylcarrierproteinligaseinbacillussubtilisincreasesthebacterium’ssusceptibilitytoantibioticsthattargetthecellwall”,febsjournal,272:2993-3003,2005.[0545]mcdonald,j.gen.microbiol.,130:203,1984.[0546]needlemanandwunsch,j.mol.biol.,48:443,1970.[0547]ogura&fujita,femsmicrobiollett.,268(1):73-80.2007.[0548]olempska-beeretal.,“food-processingenzymesfromrecombinantmicroorganisms‑‑areview”’regul.toxicol.pharmacol.,45(2):144-158,2006.[0549]palmerosetal.,gene247:255-264,2000.[0550]rauletal.,“productionandpartialpurificationofalphaamylasefrombacillussubtilis(mtcc121)usingsolidstatefermentation”,biochemistryresearchinternational,2014.[0551]sarkarandsommer,biotechniques8:404,1990.[0552]saundersetal.,j.bacteriol.,157:718-726,1984.[0553]shimada,meth.mol.biol.57:157;1996[0554]smithandwaterman,adv.appl.math.,2:482,1981.[0555]smithetal.,appl.env.microbiol.,51:6341986.[0556]stahlandferrari,j.bacteriol.,158:411-418,1984.[0557]stahletal,j.bacteriol.,158:411-418,1984.[0558]trieu-cuotetal.,gene,23:331-341,1983.[0559]vandijlandhecker,“bacillussubtilis:fromsoilbacteriumtosuper-secretingcellfactory”,microbialcellfactories,12(3).2013.[0560]vorobjevaetal.,femsmicrobiol.lett.,7:261-263,1980.[0561]ward,"proteinases,"infogarty(ed.).,microbialenzymesandbiotechnology.appliedscience,london,pp251-317,1983.[0562]wellsetal.,nucleicacidsres.11:7911-7925,1983.[0563]westersetal.,“bacillussubtilisascellfactoryforpharmaceuticalproteins:abiotechnologicalapproachtooptimizethehostorganism”,biochimicaetbiophysicaacta.,1694:299-310,2004.当前第1页12当前第1页12
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
用于增强地衣芽孢杆菌中蛋白产生的组合物和方法与流程
作者:admin
2022-08-27 14:16:35
787
- 下一篇: 内窥镜用物镜光学系统及内窥镜的制作方法
- 上一篇: 用于鞋类的喷涂系统的制作方法