有机化合物处理,合成应用技术制备用于多重多肽测序的样品的方法、试剂盒和装置1.相关申请2.本技术根据35u.s.c.§119(e)要求2019年10月28日提交的美国临时申请序列号62/926,975的申请日的权益,其全部内容通过引用的方式并入本文。背景技术:3.蛋白质组学已成为生物学系统研究中基因组学和转录组学的重要且必要的补充。然而,多重蛋白质组学分析的方法迄今为止一直受到限制。技术实现要素:4.本文提供了制备用于多肽测序的样品的方法,其利用多肽条形码来促进多重蛋白质组学分析。本文还提供了用于该方法的组合物、试剂盒和装置。5.在一些方面,本公开涉及制备多重样品的方法。在一些实施方案中,所述方法包括:(i)使多肽群与条形码组分接触以产生包含一种或多种条形码多肽的样品;和(ii)将(i)的样品与一种或多种补充样品组合以产生用于并行多肽测序的多重样品。6.在一些实施方案中,(i)包括:(a)提供多肽群;(b)使(a)的多肽群与包含多个条形码分子的条形码组分接触,其中多个多肽与条形码组分的接触产生包含一种或多种条形码多肽的样品。7.在一些实施方案中,(ii)中的一种或多种补充样品通过以下方式产生:(a)提供多肽群;(b)使(a)的多肽群与包含多个条形码分子的条形码组分接触,其中多肽群与条形码组分的接触产生包含一种或多种条形码多肽的样品。8.在一些实施方案中,(a)中的多肽群由单一多肽组成。在一些实施方案中,(a)中的多肽群包含衍生自单一多肽的多肽片段。在一些实施方案中,(a)中的多肽群包含多个多肽。9.在一些实施方案中,(a)包括裂解细胞群以产生包含在细胞群中表达的多个多肽的裂解样品。在一些实施方案中,所述细胞群:由单个细胞组成;包含多个同质细胞;或者包含多个异质细胞。在一些实施方案中,所述细胞群从受试者中分离。在一些实施方案中,所述受试者是人、小鼠、大鼠或非人灵长类动物。10.在一些实施方案中,(a)进一步包括使裂解样品与修饰剂接触,从而产生包含经修饰的多肽的样品。11.在一些实施方案中,(a)进一步包括分离裂解样品的部分多肽,从而产生包含在细胞群中表达的多肽子集的富集样品。在一些实施方案中,分离裂解样品的部分多肽包括:i.使裂解样品与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与裂解样品中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和ii.分离结合的多肽亚群或未结合的多肽亚群。12.在一些实施方案中:多个富集分子中的每个富集分子是抗体、适体或酶;或多个富集分子的子集中的富集分子包含抗体、适体或酶。13.在一些实施方案中:多个富集分子中的每个富集分子被固定在基质上;或多个富集分子的子集中的富集分子被固定在基质上。在一些实施方案中,当包含多个多肽的裂解样品接触基质时,发生多个多肽与多个富集分子的接触。在一些实施方案中,所述基质选自由表面、珠粒、颗粒和凝胶组成的组,任选地其中:所述表面是固体表面;所述珠粒是磁珠;或所述颗粒是磁性颗粒。14.在一些实施方案中:多个富集分子中的每个富集分子与两个或更多个包含不同氨基酸序列的多肽结合;或多个富集分子的子集中的富集分子与两个或更多个包含不同氨基酸序列的多肽结合。15.在一些实施方案中:多个富集分子中的每个富集分子与氨基酸翻译后修饰结合;或多个富集分子的子集中的富集分子与氨基酸翻译后修饰结合。在一些实施方案中,翻译后修饰选自由乙酰化、adp-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、n-连接糖基化、类泛素化、硝化、o-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、s-亚硝基化、硫酸化、苏素化、泛素化组成的组。16.在一些实施方案中,所述方法进一步包括使富集样品的多肽与修饰剂接触,从而产生包含经修饰的多肽的样品。在一些实施方案中,所述修饰剂包括变性剂并且至少一种多肽通过变性而被修饰。在一些实施方案中,所述修饰剂封闭游离羧酸根基团并且至少一种多肽通过封闭多肽的游离羧酸根基团而被修饰。在一些实施方案中,所述修饰剂封闭游离硫醇基团并且至少一种多肽通过封闭多肽的游离硫醇基团而被修饰。在一些实施方案中,所述修饰剂包括裂解剂并且至少一种多肽通过裂解而被修饰。17.在一些实施方案中,(i)的条形码组分包括包含多核酸部分的条形码分子。在一些实施方案中,所述多核酸部分的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。在一些实施方案中,(ii)进一步包括将多重样品沉积在固体基质上或固体基质内,其中所述固体基质包含对应于包含多核酸部分的条形码分子的一个或多个多核酸部分的固定化的检测分子,任选地其中检测分子包含与包含多核酸部分的条形码分子的一个或多个多核酸部分互补的多核酸。在一些实施方案中,所述固体基质是芯片阵列。18.在一些实施方案中,(i)的条形码组分包括包含多肽部分的条形码分子。在一些实施方案中,所述多肽部分的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,所述多肽部分是抗体的氨基酸序列。在一些实施方案中,(ii)进一步包括将多重样品沉积在固体基质上或固体基质内,其中所述固体基质包含对应于包含抗体氨基酸序列的条形码分子的一个或多个多肽部分的固定化的抗原。在一些实施方案中,所述固体基质是芯片阵列。19.在一些实施方案中,(i)的条形码组分包括条形码分子,所述条形码分子包含小分子部分,例如荧光分子部分。在一些实施方案中,所述荧光分子部分包含芳族或杂芳族化合物,例如芘、蒽、萘、吖啶、芪(stilbene)、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭(ethidium)、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明等。在一些实施方案中,所述荧光分子部分包含选自由以下组成的组的染料:氧杂蒽(xanthene)染料、萘染料、香豆素染料、吖啶染料、花青染料、苯并恶唑染料、芪染料、芘染料、酞菁(phthalocyanine)染料、藻胆蛋白染料、方酸染料和bodipy染料。20.在一些实施方案中,(i)中产生的样品包含多肽,每个多肽具有共价连接到其n末端或c末端的十个氨基酸内的氨基酸的条形码分子。在一些实施方案中,(i)中产生的样品包含多肽,每个多肽具有共价连接到其n末端或c末端的条形码分子。21.在其他实施方案中,所述方法包括:(i)提供两个或更多个多肽群;(ii)将(i)的两个或更多个多肽群沉积在固体基质上或固体基质内,其中每个多肽群与(i)中的其他多肽群保持物理分离;从而制备用于并行多肽测序的多重样品。在一些实施方案中,所述固体基质是芯片阵列。在一些实施方案中,每个多肽群沉积在固体基质的不同注射端口中。22.在一些实施方案中,(a)中的多肽群中的至少一个由单一多肽组成。在一些实施方案中,(a)中的多肽群中的至少一个包含衍生自单一多肽的多肽片段。在一些实施方案中,(a)中的多肽群中的至少一个包含多个多肽。23.在一些实施方案中,(i)包括裂解细胞群以产生包含在细胞群中表达的多个多肽的裂解样品。在一些实施方案中,所述细胞群:由单个细胞组成;包含多个同质细胞;或者包含多个异质细胞。在一些实施方案中,所述细胞群从受试者中分离。在一些实施方案中,所述受试者是人、小鼠、大鼠或非人灵长类动物。在一些实施方案中,(i)进一步包括:(c)将(b)中产生的每个裂解样品与修饰剂接触,从而产生包含经修饰的多肽的样品。24.在一些实施方案中,(a)进一步包括分离裂解样品的部分多肽,从而产生包含在细胞群中表达的多肽子集的富集样品。25.在一些实施方案中,(c)包括:i.使(b)中产生的每个裂解样品与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与每个裂解样品中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和ii.分离结合的多肽亚群或未结合的多肽亚群。26.在一些实施方案中:多个富集分子中的每个富集分子被固定在基质上;或者多个富集分子的子集中的富集分子被固定在基质上。27.在一些实施方案中:多个富集分子中的每个富集分子被固定在基质上;或多个富集分子的子集中的富集分子被固定在基质上。在一些实施方案中,当包含多个多肽的裂解样品接触基质时,发生多个多肽与多个富集分子的接触。在一些实施方案中,所述基质选自由表面、珠粒、颗粒和凝胶组成的组,任选地其中:所述表面是固体表面;所述珠粒是磁珠;或所述颗粒是磁性颗粒。28.在一些实施方案中:多个富集分子中的每个富集分子与两个或更多个包含不同氨基酸序列的多肽结合;或多个富集分子的子集中的富集分子与两个或更多个包含不同氨基酸序列的多肽结合。29.在一些实施方案中:多个富集分子中的每个富集分子与氨基酸翻译后修饰结合;或多个富集分子的子集中的富集分子与氨基酸翻译后修饰结合。在一些实施方案中,翻译后修饰选自由乙酰化、adp-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、羟基化、甲基化、肉豆蔻酰化、n-连接糖基化、类泛素化、硝化、o-连接糖基化、氧化、棕榈酰化、磷酸化、异戊二烯化、s-亚硝基化、硫酸化、苏素化、泛素化组成的组。30.在一些实施方案中,(i)进一步包括:(d)使(c)中产生的每个富集样品的多肽与修饰剂接触,从而产生包含经修饰的多肽的样品。在一些实施方案中,所述修饰剂包括变性剂并且至少一种多肽通过变性而被修饰。在一些实施方案中,所述修饰剂封闭游离羧酸根基团并且至少一种多肽通过封闭多肽的游离羧酸根基团而被修饰。在一些实施方案中,所述修饰剂封闭游离硫醇基团并且至少一种多肽通过封闭多肽的游离硫醇基团而被修饰。在一些实施方案中,所述修饰剂包括裂解剂并且至少一种多肽通过裂解而被修饰。31.在一些方面,本公开涉及确定多重样品中多肽的至少部分氨基酸序列和来源的方法。在一些实施方案中,所述方法包括:(i)根据本文所述的方法制备多重样品;(ii)检测多重样品中条形码多肽的条形码身份,从而确定多重样品的多肽来源;和(iii)对多重样品中的多肽进行并行测序,从而确定多重样品中多肽的至少部分氨基酸序列;其中(iii)在(ii)之前、之后或与之同时发生。32.在一些实施方案中,条形码多肽的条形码身份在(ii)中通过dna测序、多肽测序、杂交、发光、结合动力学和/或固体基质上或固体基质内的物理位置来检测。33.在一些实施方案中,(iii)包括:(a)使多重样品的单个多肽分子与一种或多种末端氨基酸识别分子接触;和(b)检测指示一种或多种末端氨基酸识别分子与在单个多肽被降解时暴露在单个多肽末端的连续氨基酸结合的一系列信号脉冲,从而对所述单个多肽分子进行测序。34.在一些实施方案中,(iii)包括:(a)使多重样品的单个多肽分子与包含一种或多种末端氨基酸识别分子和裂解试剂的组合物接触;和(b)在裂解试剂存在下检测指示一种或多种末端氨基酸识别分子与单个多肽分子末端结合的一系列信号脉冲,其中所述一系列信号脉冲指示因末端氨基酸被裂解试剂裂解而随时间暴露在末端的一系列氨基酸。35.在一些实施方案中,(iii)包括:(a)鉴定多重样品的单个多肽分子末端的第一个氨基酸;(b)去除第一个氨基酸以暴露单个多肽分子末端的第二个氨基酸,和(c)鉴定单个多肽分子末端的第二个氨基酸,其中(a)-(c)在单一反应混合物中进行。36.在一些实施方案中,(iii)包括:(a)使多重样品的单个多肽分子与一种或多种与单个多肽分子结合的氨基酸识别分子接触;(b)在多肽降解条件下检测指示一种或多种氨基酸识别分子与单个多肽分子结合的一系列信号脉冲;和(c)基于一系列信号脉冲中的第一特征模式鉴定单个多肽分子中的第一类型的氨基酸。37.在一些实施方案中,(iii)包括:(a)在多肽降解过程中获得数据;(b)分析数据以确定对应于在降解过程中在多肽末端依次暴露的氨基酸的数据部分;和(c)输出代表所述多肽的氨基酸序列。38.在一些实施方案中,(iii)包括:(a)使多重样品的多肽与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽末端的一种或多种类型的末端氨基酸;和(b)通过检测多肽与一种或多种标记的亲和试剂的相互作用来鉴定多肽末端的末端氨基酸。39.在一些实施方案中,(iii)包括:(a)使多重样品中的多肽与一种或多种标记的亲和试剂接触,所述亲和试剂选择性结合多肽末端的一种或多种类型的末端氨基酸;(b)通过检测多肽与所述一种或多种标记的亲和试剂的相互作用来鉴定多肽末端的末端氨基酸;(c)去除末端氨基酸;和(d)在多肽末端重复(a)-(c)一次或多次以确定多肽的氨基酸序列。在一些实施方案中,所述方法进一步包括:在(a)之后和(b)之前,去除未选择性结合末端氨基酸的一种或多种标记的亲和试剂中的任意一种;和/或在(b)之后和(c)之前,去除选择性结合末端氨基酸的一种或多种标记的亲和试剂中的任意一种。在一些实施方案中,(c)包括通过使末端氨基酸与异硫氰酸酯接触来修饰末端氨基酸,和:使经修饰的末端氨基酸与特异性结合并去除经修饰的末端氨基酸的蛋白酶接触;或使经修饰的末端氨基酸经受足以去除经修饰的末端氨基酸的酸性或碱性条件。40.在一些实施方案中,鉴定末端氨基酸包括:将末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸中的一种类型;或将末端氨基酸鉴定为与一种或多种标记的亲和试剂结合的一种或多种类型的末端氨基酸之外的类型。在一些实施方案中,所述一种或多种标记的亲和试剂包括一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种trna合成酶或其组合。在一些实施方案中,所述一种或多种标记的肽酶已被修饰以使裂解活性失活;或其中所述一种或多种标记的肽酶保留用于去除(c)的裂解活性。41.在一些方面,本公开涉及用于执行本文所述的方法的试剂盒。42.在一些实施方案中,所述试剂盒包括包含多个条形码分子的条形码组分。在一些实施方案中,所述条形码组分进一步包含反应组分,所述反应组分包含一种或多种用于将条形码分子共价连接至多肽的试剂。在一些实施方案中,所述条形码组分包含一种或多种条形码分子,所述条形码分子包含多核酸部分、多肽部分和/或荧光分子部分。43.在一些实施方案中,所述多核酸部分的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。在一些实施方案中,所述多核酸部分包含适体。44.在一些实施方案中,所述多肽部分的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,所述多肽部分是抗体或适体。45.在一些实施方案中,所述荧光分子部分包含芳族或杂芳族化合物,例如芘、蒽、萘、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明等。在一些实施方案中,所述荧光分子部分包含选自由以下组成的组的染料:氧杂蒽染料、萘染料、香豆素染料、吖啶染料、花青染料、苯并恶唑染料、芪染料、芘染料、酞菁染料、藻胆蛋白染料、方酸染料和bodipy染料。46.在一些实施方案中,所述试剂盒进一步包含固体支持物。在一些实施方案中,所述固体支持物包含固定化的检测分子(或多个固定化的检测分子)。在一些实施方案中,所述检测分子包含对应于条形码组分的条形码分子的多核酸部分。在一些实施方案中,所述检测分子包含对应于条形码组分的条形码分子的多肽部分。47.在一些实施方案中,所述试剂盒包含允许物理分离不同来源的多肽群的固体支持物。48.在一些方面,本公开涉及用于执行本文所述的方法的装置。49.在一些实施方案中,一种装置包含:至少一个硬件处理器;和至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在由所述至少一个硬件处理器执行时使所述至少一个硬件处理器执行本文所述的方法。50.在一些实施方案中,所述装置包含至少一个存储处理器可执行指令的非暂时性计算机可读存储介质,所述处理器可执行指令在由至少一个硬件处理器执行时使所述至少一个硬件处理器执行本文所述的方法。51.在一些实施方案中,所述装置包含:(i)样品制备模块,其被设置为与一个或多个盒(cartridge)接合(interface),每个盒包含:(a)一个或多个储存器或反应容器,其被设置为接收复杂样品;(b)一种或多种序列样品制备试剂,其中样品制备试剂包含多个条形码分子;和(c)基质,其包含一种或多种固定化的捕获探针;(ii)包含像素(pixel)阵列的测序模块,其中每个像素被设置为从样品制备模块接收测序样品,并且包含:(a)样品孔;和(b)至少一个光检测器。52.在一些实施方案中,所述样品制备试剂进一步包含多个富集分子。在一些实施方案中,多个富集分子中的至少富集分子的子集共价连接至固定化的捕获探针。在一些实施方案中,至少富集分子的子集共价连接至能够被固定化的捕获探针结合的珠粒或颗粒。在一些实施方案中,多个富集分子中的每个富集分子包含抗体、适体或酶。在一些实施方案中,多个富集分子的子集中的富集分子包含抗体、适体或酶。53.在一些实施方案中,所述样品制备试剂包括修饰剂。在一些实施方案中,修饰剂介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。54.在一些实施方案中,所述测序模块进一步包含储存器或反应容器,所述储存器或反应容器被设置为将测序试剂递送到每个像素的样品孔中。55.在一些实施方案中,所述测序试剂包括标记的亲和试剂。在一些实施方案中,标记的亲和试剂包含一种或多种标记的适体、一种或多种标记的肽酶、一种或多种标记的抗体、一种或多种标记的降解途径蛋白、一种或多种氨基转移酶、一种或多种trna合成酶或其组合。附图说明56.本领域技术人员将理解,本文所述的附图仅用于说明目的。应当理解,在一些情况下,本发明的各个方面可能被变大或放大以有助于理解本发明。在附图中,相似的参考符号在各个附图中通常指代相似的特征、功能上相似和/或结构上相似的元件。附图不一定按比例绘制,而是强调说明教导的原理。附图无意以任何方式限制本教导的范围。57.本发明的特征和优点将在下面结合附图的详细描述中变得更加明显。58.当参考附图描述实施方案时,可以使用方向参考(“上方”、“下方”、“顶部”、“底部”、“左侧”、“右侧”、“水平”、“垂直”等)。此类参考仅旨在帮助读者以正常方向查看附图。这些方向参考并非旨在描述具体装置的优选或独特方向。装置可以以其他方向体现。59.如从详细描述中显而易见的,在整个申请中为了说明的目的而在附图中描绘和进一步描述的实例描述了非限制性实施方案,并且在一些情况下可以为了更清楚的说明的目的而简化某些过程或省略特征或步骤。60.图1提供了条形码化之前(左)和之后(右)两个样品的示例性图示。第一样品的条形码分子与第二样品的条形码分子是可区分的。61.图2提供了蛋白质条形码化之后的工作流程的示例性实施方案。条形码样本汇集到多重样品中(1)。然后(同时或依次)确定/鉴定多重样品中多肽的序列和条形码身份(即样品来源)(2)。最后,根据它们的条形码身份(即样品来源)将序列分组(3)。62.图3a-3e提供了示例性条形码分子和检测示例性条形码的方法。图3a.条形码分子可以包含多核酸部分(“dna条形码”),其通过使用包含多核酸部分(其也可以包含发光分子)的检测分子的杂交来鉴定。图3b.条形码分子可以包含多核酸部分,其通过dna测序来鉴定。图3c.条形码分子可以包含多肽部分(例如,短多肽标签),其通过多肽测序来鉴定。图3d.条形码分子可以包含已经经化学修饰(例如,酪氨酸磷酸化)的样品,其通过化学修饰通过多肽测序来鉴定。图3e.条形码分子可以包含多肽部分(例如,抗体;这里为“抗体a”或“抗体b”),其通过在芯片上的定位(例如,通过与检测分子的结合;这里为“抗原a”或“抗原b”)来鉴定。63.图4提供了通过物理分离进行条形码化的示例性实施方案。如果需要,芯片可以通过物理划分并且任选地包括其他条形码分子。64.图5提供了描绘制备用于多肽测序的多重样品的示例性工作流程的图示。65.图6提供了描绘制备用于多肽测序的多重样品的示例性工作流程的图示。66.图7提供了描绘制备用于多肽测序的多重样品的示例性工作流程的图示。67.图8提供了描绘制备富集样品的示例性工作流程的图示。68.图9提供了描绘制备富集样品的示例性工作流程的图示。69.图10提供了描绘用于制备富集样品和/或多重样品的示例性装置的图示。具体实施方式70.如本文所述,发明人已经认识到并理解不同的结合相互作用可以为多肽测序中的常规标记策略提供另外的或替代的方法。常规的多肽测序可以涉及用独特可识别的标记来标记每种类型的氨基酸。这个过程可能费力并且容易出错,因为有至少二十种不同类型的天然存在的氨基酸,以及其多种翻译后变体。在一些方面,本公开涉及使用氨基酸识别分子的技术的发现,所述氨基酸识别分子与不同类型的氨基酸有区别地结合以产生指示多肽的氨基酸序列的可检测特征。71.在一些方面,本公开涉及可以仅使用单一反应混合物(例如,不需要通过反应容器的反复试剂循环)来实时监测多肽测序反应的发现。常规的多肽测序反应可以涉及将多肽暴露于不同的试剂混合物以在氨基酸检测和氨基酸裂解步骤之间循环。因此,在一些方面,本公开涉及下一代测序的进步,其允许通过氨基酸检测在整个进行中的降解反应中实时分析多肽。72.对单个生物体的蛋白质组学分析可以提供对细胞过程和反应模式的洞察,从而改进诊断和治疗策略。同时对多个样品进行测序(即多重测序)的能力将提高单个样品的蛋白质组学分析的效率并降低与之相关的成本。因此,在一些方面,本公开涉及制备用于多肽测序的多重样品的方法,其利用多肽条形码化来促进多重蛋白质组学分析。73.在一些方面,本公开涉及制备用于多肽测序的多重样品的方法。在一些实施方案中,所述方法包括:(i)提供(例如,来自不同受试者/患者的)多个样品;(ii)用不同的条形码标记每个样品的多肽;和(iii)组合标记的多肽以产生用于多肽测序的单个多重样品。74.在一些方面,本公开涉及确定多重样品中多肽的至少部分氨基酸序列和来源的方法,所述方法包括:(i)制备包含条形码多肽的多重样品;(ii)检测多重样品中条形码多肽的条形码身份;(iii)和对多重样品中的多肽进行并行测序;其中(iii)在(ii)之前、之后或与之同时发生。(ii)中检测到的条形码可用于从多重数据中提取样本特异性序列信息。75.本文还提供了用于所述方法的组合物、试剂盒和装置。76.i.制备复杂样品的方法77.在一些方面,本公开涉及制备复杂样品(例如,复杂多肽样品)的方法。如本文所用,术语“复杂样品”是指包含多种分子(例如,多肽、多核酸、代谢物等)的样品,所述分子的至少两种是化学上独特的。在一些实施方案中,复杂样品包含多个多肽,其中所述多个多肽包含至少两个包含不同氨基酸序列的多肽。78.通常,复杂样品来源于细胞群(例如,由细胞群产生)。在一些实施方案中,细胞群由单个细胞组成。在其他实施方案中,细胞群包含两个或更多个细胞。79.例如,在一些实施方案中,细胞群包含至少5个、至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1×103个、至少1×104个、至少1×105个、至少1×106个、至少1×107个、至少1×108个、至少1×109个或至少1×1010个细胞。80.在一些实施方案中,所述群包含1-5、1-10、1-20、1-30、1-50、1-60、1-70、1-80、1-90、1-100、1-150、1-200、1-250、1-300、1-350、1-400、1-450、1-500、1-600、1-700、1-800、1-900、1-1×103、1-1×104、1-1×105、1-1×106、1-1×107、1-1×108、1-1×109、1-1×1010、100-150、100-200、100-250、100-300、100-350、100-400、100-450、100-500、100-600、100-700、100-800、100-900、100-1×103、100-1×104、100-1×105、100-1×106、100-1×107、100-1×108、100-1×109、100-1×1010、1×103-1×104、1×103-1×105、1×103-1×106、1×103-1×107、1×103-1×108、1×103-1×109、1×103-1×1010、1×104-1×105、1×104-1×106、1×104-1×107、1×104-1×108、1×104-1×109、1×104-1×1010、1×105-1×106、1×105-1×107、1×105-1×108、1×105-1×109或1×105-1×1010个细胞。81.细胞群可以包含原核细胞和/或真核细胞。细胞群可以包含多个同质细胞。替代地,细胞群可以包含多个异质细胞。82.可以从受试者(例如,多细胞或共生生物)中分离细胞群。在一些实施方案中,所述受试者是小鼠、大鼠、兔、豚鼠、仓鼠、猪、羊、狗、灵长类动物、猫或人。83.分离细胞群的方法是本领域技术人员已知的。例如,制备复杂样品的方法可以包括活检、解剖(例如显微解剖,例如激光捕获)、有限稀释、显微操作、免疫磁性细胞分离、荧光激活细胞分选、密度梯度离心、免疫密度细胞分离、微流体细胞分选、沉降、粘附或其组合。84.在一些实施方案中,制备复杂样品的方法包括裂解细胞群,从而产生包含多种分子(例如,多肽、多核酸、代谢物等)的裂解样品。裂解细胞群的方法是本领域普通技术人员已知的。在一些实施方案中,使用任何一种已知的物理或化学方法裂解包含细胞的样品以从所述细胞释放靶分子。在一些实施方案中,可以使用电解法、酶促法、基于去污剂的方法和/或机械均化来裂解样品。在一些实施方案中,如果样品不包含细胞或组织(例如,包含纯化的多肽的样品),则可以省略裂解步骤。85.替代地或另外地,制备复杂样品的方法可以包括亚细胞分级分离(即,分离一个或多个细胞区室,例如内体、突触体、细胞质、核质、染色质、线粒体、过氧化物酶体、溶酶体、黑色素体、外来体、高尔基体、内质网、中心体、伪足或其组合)。86.来源于相同细胞群的分子在本文中被描述为具有相同的“来源”。87.ii.制备多重样品的方法88.在一些方面,本公开涉及制备多重样品的方法。如本文所用,术语“多重样品”是指包含至少两个具有不同来源的子样品(例如,两个或更多个样品,每个样品由不同的细胞群或多个分子制备)的样品。89.在一些实施方案中,多重样品包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个或至少1000个子样品,所述子样品各自具有不同的来源。90.在一些实施方案中,多重样品包含2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、2-11、2-12、2-13、2-14、2-15、2-16、2-17、2-18、2-19、2-20、2-25、2-30、2-35、2-40、2-45、2-50、2-60、2-70、2-80、2-90、2-100、2-200、2-300、2-400、2-500、2-600、2-700、2-800、2-900、2-1000、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-60、5-70、5-80、5-90、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、10-15、10-20、10-25、10-30、10-35、10-40、10-45、10-50、10-60、10-70、10-80、10-90、10-100、10-200、10-300、10-400、10-500、10-600、10-700、10-800、10-900、10-1000、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-200、20-300、20-400、20-500、20-600、20-700、20-800、20-900、20-1000、50-60、50-70、50-80、50-90、50-100、50-200、50-300、50-400、50-500、50-600、50-700、50-800、50-900、50-1000、100-200、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、500-600、500-700、1500-800、500-900或500-1000个子样品,所述子样品各自具有不同的来源.91.在一些实施方案中,多重样品包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个子样品,所述子样品各自具有不同的来源。92.多重样品中的每个子样品可以包含多个分子。在一些实施方案中,多重样品中的一个或多个子样品包含:从细胞群(可以是单细胞)制备的复杂样品的分子(例如多肽)(参见“制备复杂样品的方法”);或富集样品的分子(例如多肽)(参见“制备富集样品的方法”)。在一些实施方案中,子样品的多个分子源来源于单个分子(例如,通过单个多肽的片段化)。93.多重样品中的每个子样品可以包含单个分子(例如,单个多肽)。在一些实施方案中,多重样品中的一个或多个子样品包含单个分子(例如,单个多肽)。94.通常,多重样品中每个子样品中的至少分子的子集可以与多重样品中其他子样品的分子区分开来。例如,在一些实施方案中,可以将多重样品中每个子样品中的至少多肽的子集与多重样品中其他子样品的多肽区分开来。以这种方式,可以鉴定多重样品中至少分子的子集的来源。95.因此,在一些实施方案中,多重样品中的至少一个子样品包含条形码分子,每个条形码分子包含对子样品独特的条形码(即,独特条形码)。如果在多重样品中的任何其他子样品的分子上未发现条形码,则认为该条形码对子样品是独特的。96.在一些实施方案中,多重样品中的两个或更多个子样品包含条形码分子。在一些实施方案中,多重样品中的每个子样品包含条形码分子。在一些实施方案中,多重样品中除了一个子样品之外的所有子样品都包含条形码分子。97.在多重样品中,包含条形码分子的每个子样品的条形码分子(即,每个“标记子样品”)都包含独特条形码。在一些实施方案中,标记子样品中的每个条形码分子包含相同的条形码。在一些实施方案中,标的子样品中的条形码分子包含独特条形码的组合。例如,在一些实施方案中,标记子样品包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个条形码分子的独特组合。98.在一些实施方案中,标记子样品包含条形码多肽和:条形码dna分子、条形码rna分子、条形码cdna分子、条形码代谢物或其组合,其中:条形码多肽包含第一条形码(或第一条形码组合);条形码dna分子包含第二条形码(或第二条形码组合);子样品中的条形码rna分子包含第三条形码(或第三条形码组合);条形码cdna分子包含第四条形码(或第四个条形码组合);条形码代谢物包含第五条形码(或第五条形码组合);或其组合。99.在一些实施方案中,制备多重样品的方法包括:(i)使细胞群与条形码组分接触以产生包含条形码分子(例如条形码多肽)的样品(即第一标记子样品);和(ii)将(i)的样品与一种或多种补充样品(即一种或多种另外的子样品)组合以产生用于并行分子测序(例如多肽测序)的多重样品。100.在一些实施方案中,制备多重样品的方法包括:(i)使多个分子与条形码组分接触以产生包含条形码分子(例如条形码多肽)的样品(即第一标记子样品);和(ii)将(i)的样品与一种或多种补充样品(即一种或多种另外的子样品)组合以产生用于并行分子测序(例如多肽测序)的多重样品。101.在前两段中描述的一些实施方案中,步骤(ii)进一步包括将多重样品沉积在固体基质上或固体基质内。在一些实施方案中,固体基质包含多个固定化的(例如,共价连接的)检测分子,其中一种或多种检测分子与多重样品的条形码分子的条形码相互作用。在一些实施方案中,固体基质是芯片阵列。102.在一些实施方案中,制备多重样品的方法包括:(i)提供至少两个分子群(例如,多肽);(ii)将(i)的至少两个分子群沉积在固体基质上或固体基质内,其中每个分子群与(i)中的其他分子群保持物理分离;从而制备用于并行多肽测序的多重样品。103.a.多肽条形码化的方法104.在一些方面,本公开涉及对样品的分子(例如,多肽、dna、rna、cdna、代谢物等)进行条形码化的方法。在一些实施方案中,样品包含活细胞。在一些实施方案中,样品是从细胞群(其可以是单细胞)制备的复杂样品(参见“制备复杂样品的方法”)。在一些实施方案中,样品是富集样品(参见“制备富集样品的方法”)。在一些实施方案中,样品包含单个分子(例如,多肽)或来源于单个分子的片段(例如,多肽片段)。105.在此特别相关的是,本公开涉及对多肽进行条形码化的方法。可以通过化学修饰和/或物理分离对多肽进行条形码化。106.(i)化学修饰107.可以通过化学修饰对多肽(或多个多肽)进行条形码化。多肽的化学修饰改变了多肽的化学组成,并且可以在多肽合成期间(体内或体外)或在多肽合成之后(即,翻译后)发生。多肽可以在其氨基酸序列内的任何位置进行修饰。先前已经描述了产生多肽缀合物(以得到条形码多肽)的方法,并且是本领域普通技术人员已知的。参见,例如,corey等人,science,1987;238:1401–1403;kukolka等人,org.biomol.chem.,2004;2:2203–2206;debets等人,chem.commun.,2010;46:97–99;takeda等人,bioorg.med.chem.lett.,2004;14:2407–2410;yang等人,bioconjug.chem.,2015;26:1381–1395;rosen等人,nat.chem.,2014;6:804–809;cong等人,bioconjug.chem.,2012;23:248–263;mattson,g.等人,molecular biology reports,1993;17:167-183。108.在一些实施方案中,多肽(或多个多肽)通过包括使细胞群与条形码组分接触以产生包含条形码多肽的样品的方法被条形码化。在这种情况下,可以在合成期间或在合成之后(即,翻译后)修饰多肽(或多个多肽)。109.在一些实施方案中,多肽(或多个多肽)通过包括使多肽(或多个多肽)与条形码组分接触以产生包含条形码多肽的样品的方法被条形码化。在这种情况下,多肽(或多个多肽)将在合成之后(即,翻译后)被修饰。110.条形码组分可以包括修饰剂。所述修饰剂可以包含具有不同裂解模式的内切蛋白酶。所述内切蛋白酶的实例是本领域普通技术人员已知的,并且包括但不限于胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶、嗜热菌蛋白酶、胃蛋白酶、谷氨酰内肽酶、脑啡肽酶、lys-c、arg-c、asp-n、lys-n、glu-c、walp和malp。参见例如,giansanti等人,nat.protoc.,2016年4月28日;11(5):993-1006。多肽修饰剂可以包含能够用翻译后修饰来修饰多肽的酶。翻译后修饰的实例是本领域技术人员已知的,并且包括但不限于乙酰化、腺苷酰化、adp-核糖基化、烷基化(例如甲基化)、酰胺化、精氨酰化、生物素化、丁酰化、氨甲酰化、羰基化、羧基化、瓜氨酸化、脱酰胺、消除(eliminylation)、甲酰化、糖基化(例如,n-连接糖基化、o-连接糖基化)、glipyatyon、糖化、羟基化、碘化、isg化、异戊二烯化、脂化、丙二酰化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化聚乙二醇化、磷酸化、磷酸泛酰巯基乙炔化(phosphopantetheinylation)、聚乙二醇化(polyglcylation)、聚谷氨酰化(polyglutamylation)、异戊二烯化、丙酰化、pupylation、s-谷胱甘肽化、s-亚硝基化、s-亚磺酰化、s-亚磺酰化(s-sulfinylation)、s-磺酰化、琥珀酰化、硫酸化、sumo化和泛素化。负责以这些方式修饰多肽的酶也是本领域技术人员已知的。111.替代地或另外地,条形码组分可以包含多个条形码分子。在一些实施方案中,条形码组分由多个条形码分子组成。在一些实施方案中,条形码组分可以进一步包含一种或多种试剂(例如酶、化合物、小分子、缓冲液等)以促进条形码分子与多肽的共价连接。条形码分子可以在任何位置与多肽共价连接。在一些实施方案中,条形码分子在其末端(n末端或c末端)的10、9、8、7、6、5、4、3或2个氨基酸内的氨基酸位置处与多肽共价连接。在一些实施方案中,条形码分子在其n末端处与多肽共价连接。在一些实施方案中,条形码在其c末端处与多肽共价连接。112.在一些实施方案中,条形码组分的每个条形码分子在化学上是相同的。在一些实施方案中,条形码组分包含两个或更多个化学上不同的条形码分子。例如,条形码组分可以包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个化学上不同的条形码分子。113.条形码组分的条形码分子可以是非天然氨基酸(即非标准氨基酸)。非天然氨基酸500、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-150、20-200、20-250、20-300、20-350、20-400、20-450、20-500、50-75、50-100、50-150、50-200、50-250、50-500、50-350、50-400、50-450、50-500、100-200、100-250、100-500、100-350、100-400、100-450或100-500个氨基酸.122.在一些实施方案中,所述多肽部分是适体。在一些实施方案中,多所述肽部分是抗体。在一些实施方案中,所述多肽部分是抗原。123.在一些实施方案中,条形码分子包含小分子部分。在一些实施方案中,条形码分子包含两个或更多个小分子部分。在其中条形码分子包含多个小分子部分的实施方案中:每个小分子部分可以是相同的;小分子部分的子集可以是相同的;或者每个小分子部分可以在化学上不同。124.在一些实施方案中,所述小分子部分包含生物素。125.在一些实施方案中,所述小分子部分包含药物或发光分子(或荧光分子)。适用于本文所述的方法的药物和发光分子的实例是本领域技术人员已知的。如本文所用,发光分子是吸收一个或多个光子并且可以随后在一个或多个时段后发射一个或多个光子的分子。126.在一些实施方案中,发光分子可以包含第一和第二生色团。在一些实施方案中,第一生色团的激发态能够通过能量转移到第二生色团而弛豫。在一些实施方案中,能量转移是福斯特共振能量转移(fret)。这样的fret对可用于提供发光标记,其具有使所述标记更容易从混合物中的多个发光标记中区分的性质。在其他实施方案中,fret对包含第一发光标记的第一生色团和第二发光标记的第二生色团。在某些实施方案中,fret对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。127.在一些实施方案中,发光分子是指荧光团或染料。通常,发光分子包含芳族或杂芳族化合物,并且可以是芘、蒽、萘、萘胺、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、苯并恶唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、氧杂蒽或其他类似化合物。128.在一些实施方案中,发光分子包含选自以下一种或多种的染料:5/6-羧基罗丹明6g、5-羧基罗丹明6g、6-羧基罗丹明6g、6-tamra、star 440sxp、star 470sxp、star 488、star 512、star 520sxp、star 580、star 600、star 635、star 635p、star red、alexa350、alexa405、alexa430、alexa480、alexa488、alexa514、alexa532、alexa546、alexa555、alexa568、alexa594、alexa610-x、alexa633、alexa647、alexa660、alexa680、alexa700、alexa750、alexa790、amca、atto 390、atto 425、atto 465、atto 488、atto 495、atto 514、atto 520、atto 532、atto 542、atto 550、atto 565、atto 590、atto 610、atto 620、atto 633、atto 647、atto 647n、atto 655、atto 665、atto 680、atto 700、atto 725、atto 740、atto oxa12、atto rho101、atto rho11、atto rho12、atto rho13、atto rho14、atto rho3b、atto rho6g、atto thio12、bd horizontmv450、493/501、530/550、558/568、564/570、650、dyomics-651、dyomics-652、dyomics-654、dyomics-675、dyomics-676、dyomics-677、dyomics-678、dyomics-679p1、dyomics-680、dyomics-681、dyomics-682、dyomics-700、dyomics-701、dyomics-703、dyomics-704、dyomics-730、dyomics-731、dyomics-732、dyomics-734、dyomics-749、dyomics-749p1、dyomics-750、dyomics-751、dyomics-752、dyomics-754、dyomics-776、dyomics-777、dyomics-778、dyomics-780、dyomics-781、dyomics-782、dyomics-800、dyomics-831、450、伊红、fitc、荧光素、hilytetmfluor405、hilytetmfluor 488、hilytetmfluor 532、hilytetmfluor 555、hilytetmfluor594、hilytetmfluor 647、hilytetmfluor 680、hilytetmfluor 750、680lt、750、800cw、joe、640r、red 610、red 640、red 670、red 705、丽丝胺罗丹明b、napthofluorescein、oregon488、oregon514、pacific bluetm、pacific greentm、pacific orangetm、pet、pf350、pf405、pf415、pf488、pf505、pf532、pf546、pf555p、pf568、pf594、pf610、pf633p、pf647p、570、670、705、罗丹明123、罗丹明6g、罗丹明b、罗丹明绿、罗丹明绿-x、罗丹明红、rox、setatm375、setatm470、setatm555、setatm632、setatm633、setatm650、setatm660、setatm670、setatm680、setatm700、setatm750、setatm780、setatmapc-780、setatmpercp-680、setatmr-pe-670、setatm646、setau 380、setau 425、setau 647、setau 405、square 635、square650、square 660、square 672、square 680、磺酰罗丹明101、tamra、tet、texastmr、tritc、yakima yellowtm、zy3、zy5、zy5.5和zy7。129.(ii)物理分离130.多肽(或多个多肽)可以通过物理分离进行条形码化。在一些实施方案中,多肽(或多个多肽)沉积在固体基质上或固体基质内,使得多肽(或多个多肽)与另外的多肽(或另外的多个多肽)保持物理上分离。131.在一些实施方案中,所述固体基质是芯片阵列。132.在一些实施方案中,所述芯片阵列包含多个区室(例如,孔)和/或注射端口。例如,在一些实施方案中,所述芯片阵列包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个区室。在一些实施方案中,所述芯片阵列包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-13、1-14、1-15、1-16、1-17、1-18、1-19、1-20、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、2-11、2-12、2-13、2-14、2-15、2-16、2-17、2-18、2-19、2-20、3-4、3-5、3-6、3-7、3-8、3-9、3-10、3-11、3-12、3-13、3-14、3-15、3-16、3-17、3-18、3-19、3-20、5-6、5-7、5-8、5-9、5-10、5-11、5-12、5-13、5-14、5-15、5-16、5-17、5-18、5-19、5-20、10-15或15-20个区室。在一些实施方案中,所述芯片阵列包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个注射端口。在一些实施方案中,所述芯片阵列包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-13、1-14、1-15、1-16、1-17、1-18、1-19、1-20、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、2-11、2-12、2-13、2-14、2-15、2-16、2-17、2-18、2-19、2-20、3-4、3-5、3-6、3-7、3-8、3-9、3-10、3-11、3-12、3-13、3-14、3-15、3-16、3-17、3-18、3-19、3-20、5-6、5-7、5-8、5-9、5-10、5-11、5-12、5-13、5-14、5-15、5-16、5-17、5-18、5-19、5-20、10-15或15-20个注射端口。133.在一些实施方案中,所述芯片阵列包含多个物理上分离的点(或区域),这些点(或区域)包含固定化的检测分子,如本文所述。例如,在一些实施方案中,所述芯片阵列包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个,至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个、至少450个、至少500个、至少550个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少5000个或至少10,000个物理上分离的点。在一些实施方案中,芯片阵列包含2-10、2-20、2-30、2-40、2-50、2-60、2-70、2-80、2-90、2-100、10-20、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、50-100、50-150、50-200、50-250、50-300、50-350、50-400、50-450、50-500、50-550、50-600、50-650、50-700、50-750、50-800、50-850、50-900、50-950、50-1000、500-1000、500-2000、500-3000、500-4000、500-5000、500-6000、500-7000、500-8000、500-9000或500-10,000个物理上分离的点。在一些实施方案中,固定化的检测分子共价连接到芯片阵列。134.b.确定多重样品中条形码分子的来源的方法135.在一些方面,本公开涉及确定多重样品中条形码分子(例如,多肽、dna、rna、cdna、代谢物)的来源的方法。条形码分子的来源(或多个条形码分子的来源)通过鉴定分子的条形码来确定。条形码身份可以通过测序(例如,多肽和/或多核酸测序)、发光、杂交、结合动力学、固体基质上或固体基质内的物理位置或其组合来检测。136.在一些实施方案中,可以对多重样品的条形码多肽(或多个条形码多肽)进行测序(例如,并行测序)以确定多肽的氨基酸序列。在这样的实施方案中,条形码多肽的来源可以在多重样品的多肽测序之前、之后或与多重样品的多肽测序同时确定。在一些实施方案中,在多肽测序之前确定条形码多肽的来源。在一些实施方案中,在多肽测序之后确定条形码多肽的来源。在一些实施方案中,条形码多肽的来源与多肽的测序同时确定。在一些实施方案中,多重样品的条形码多肽的氨基酸序列根据它们的来源(如由它们的条形码身份确定)进行分组。137.(i)多核酸测序方法学138.在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括通过对分子的条形码进行测序来检测分子的条形码身份(或条形码分子的条形码身份)。因此,在一些方面,本公开涉及对多肽和/或多核酸(例如,脱氧核糖核酸或核糖核酸)进行测序的方法。下文讨论了对多肽进行测序的方法(参见“多肽测序方法学”)。本文还描述了多核酸测序方法学。139.在一些实施方案中,多核酸测序方法包括以下步骤:(i)将靶体积中的复合物暴露于一种或多种标记的核苷酸,所述复合物包含样品中存在的靶多核酸或多种多核酸、至少一种引物和聚合酶;(ii)将一个或多个激发能量或一个或多个激发能量的一系列脉冲引导到靶体积附近;(iii)在顺序掺入包含至少一种引物之一的多核酸期间检测来自一种或多种标记的核苷酸的多个发射光子;和(iv)通过确定发射光子的一种或多种特征来鉴定掺入的核苷酸的序列。80、20-90、20-100、20-200、20-300、20-400、20-500、20-600、20-700、20-800、20-900、20-1000、50-60、50-70、50-80、50-90、50-100、50-200、50-300、50-400、50-500、50-600、50-700、50-800、50-900、50-1000、100-200、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、500-600、500-700、1500-800、500-900或500-1000个化学上不同的检测分子。149.检测分子可以包含多核酸部分、多肽部分、小分子部分或其组合。150.在一些实施方案中,检测分子包含多核酸部分。在一些实施方案中,检测分子包含两个或更多个多核酸部分。在其中检测分子包含多个多核酸部分的实施方案中:每个多核酸部分可以是相同的;多核酸部分的子集可以是相同的;或者每个多核酸部分可以在化学上不同。151.在一些实施方案中,所述多核酸部分的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。152.在一些实施方案中,所述多核酸部分的长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个或至少500个核苷酸。153.在一些实施方案中,所述多核酸部分的长度为5-10、5-15、5-20、5-25、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、5-150、5-200、5-250、5-300、5-350、5-400、5-450、5-500、10-15、10-20、10-25、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-150、10-200、10-250、10-300、10-350、10-400、10-450、10-500、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-150、20-200、20-250、20-300、20-350、20-400、20-450、20-500、50-75、50-100、50-150、50-200、50-250、50-500、50-350、50-400、50-450、50-500、100-200、100-250、100-500、100-350、100-400、100-450或100-500个核苷酸。154.在一些实施方案中,所述多核酸部分是适体。155.在一些实施方案中,检测分子包含多肽部分。在一些实施方案中,检测分子包含两个或更多个多肽部分。在其中检测分子包含多个多肽部分的实施方案中:每个多肽部分可以是相同的;多肽部分的子集可以是相同的;或者每个多肽部分可以在化学上不同。156.在一些实施方案中,所述多肽部分的长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。157.在一些实施方案中,所述多肽部分的长度为至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个或至少500个氨基酸。158.在一些实施方案中,所述多肽部分的长度为5-10、5-15、5-20、5-25、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、5-150、5-200、5-250、5-300、5-350、5-400、5-450、5-500、10-15、10-20、10-25、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-150、10-200、10-250、10-300、10-350、10-400、10-450、10-500、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-150、20-200、20-250、20-300、20-350、20-400、20-450、20-500、50-75、50-100、50-150、50-200、50-250、50-500、50-350、50-400、50-450、50-500、100-200、100-250、100-500、100-350、100-400、100-450或100-500个氨基酸。159.在一些实施方案中,所述多肽部分是适体。在一些实施方案中,所述多肽部分是抗体。在一些实施方案中,所述多肽部分是抗原。在一些实施方案中,所述多肽部分是亲和素、链霉亲和素或亲和素样多肽,例如,traptavidin、tamavidin、bradavidin、xenavidin及其同源物和变体。160.在一些实施方案中,检测分子包含小分子部分,例如药物部分或发光分子部分(荧光分子部分的)。在一些实施方案中,检测分子包含两个或更多个小分子部分。在其中检测分子包含多个小分子部分的实施方案中:每个小分子部分可以是相同的;小分子部分的子集可以是相同的;或者每个小分子部分可以在化学上不同。161.适用于本文所述的方法的药物和发光分子的实例是本领域技术人员已知的。如本文所用,发光分子是吸收一个或多个光子并且可以随后在一个或多个时段后发射一个或多个光子的分子。162.在一些实施方案中,发光分子可以包含第一和第二生色团。在一些实施方案中,第一生色团的激发态能够通过能量转移到第二生色团而弛豫。在一些实施方案中,能量转移是福斯特共振能量转移(fret)。这样的fret对可用于提供具有使标记更容易从混合物中的多个发光标记中区分的性质的发光标记。在其他实施方案中,fret对包含第一发光标记的第一生色团和第二发光标记的第二生色团。在某些实施方案中,fret对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。163.在一些实施方案中,发光分子是指荧光团或染料。通常,发光分子包含芳族或杂芳族化合物,并且可以是芘、蒽、萘、萘胺、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、苯并恶唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、氧杂蒽或其他类似化合物。164.在一些实施方案中,发光分子包含选自以下一种或多种的染料:5/6-羧基罗丹明6g、5-羧基罗丹明6g、6-羧基罗丹明6g、6-tamra、star440sxp、star 470sxp、star 488、star 512、star 520sxp、star 580、star 600、star 635、star 635p、star red、alexa350、alexa405、alexa430、alexa480、alexa488、alexa514、alexa532、alexa546、alexa555、alexa568、alexa594、alexa610-x、alexa633、alexa647、alexa660、alexa680、alexa700、alexa750、alexa790、amca、atto 390、atto 425、atto 465、atto 488、atto 495、atto 514、atto 520、atto 532、atto 542、atto 550、atto 565、atto 590、atto 610、atto 620、atto 633、atto 647、atto 647n、atto 655、atto 665、atto 680、atto 700、atto 725、atto 740、atto oxa12、atto rho101、atto rho11、atto rho12、atto rho13、atto rho14、atto rho3b、atto rho6g、atto thio12、bd horizontmv450、493/501、530/550、558/568、564/570、576/589、581/591、630/650、650/665、fl、fl-x、r6g、tmr、tr、calgold 540、calgreen 510、calorange 560、calred 590、calred 610、calred 615、calred 635、blue、cftm350、cftm405m、cftm405s、cftm488a、cftm514、cftm532、cftm543、cftm546、cftm555、cftm568、cftm594、cftm620r、cftm633、cftm633-v1、cftm640r、cftm640r-v1、cftm640r-v2、cftm660c、cftm660r、cftm680、cftm680r、cftm680r-v1、cftm750、cftm770、cftm790、chromeotm642、chromis 425n、chromis 500n、chromis 515n、chromis 530n、chromis 550a、chromis 550c、chromis 550z、chromis 560n、chromis 570n、chromis 577n、chromis 600n、chromis 630n、chromis 645a、chromis 645c、chromis 645z、chromis 678a、chromis 678c、chromis 678z、chromis 770a、chromis 770c、chromis 800a、chromis 800c、chromis 830a、chromis 830c、3、3.5、3b、5、5.5、7、350、405、415-co1、425q、485-ls、488、504q、510-ls、515-ls、521-ls、530-r2、543q、550、554-r0、554-r1、590-r2、594、610-b1、615-b2、633、633-b1、633-b2、650、655-b 1、655-b2、655-b3、655-b4、662q、675-b1、675-b2、675-b3、675-b4、679-c5、680、683q、690-b1、690-b2、696q、700-b1、700-b1、730-b1、730-b2、730-b3、730-b4、747、747-b 1、747-b2、747-b3、747-b4、755、766q、775-b2、775-b3、775-b4、780-b1、780-b2、780-b3、800、830-b2、dyomics-350、dyomics-350xl、dyomics-360xl、dyomics-370xl、dyomics-375xl、dyomics-380xl、dyomics-390xl、dyomics-405、dyomics-415、dyomics-430、dyomics-431、dyomics-478、dyomics-480xl、dyomics-481xl、dyomics-485xl、dyomics-490、dyomics-495、dyomics-505、dyomics-510xl、dyomics-511xl、dyomics-520xl、dyomics-521xl、dyomics-530、dyomics-547、dyomics-547p1、dyomics-548、dyomics-549、dyomics-549p1、dyomics-550、dyomics-554、dyomics-555、dyomics-556、dyomics-560、dyomics-590、dyomics-591、dyomics-594、dyomics-601xl、dyomics-605、dyomics-610、dyomics-615、dyomics-630、dyomics-631、dyomics-632、dyomics-633、dyomics-634、dyomics-635、dyomics-636、dyomics-647、dyomics-647p1、dyomics-648、dyomics-648p1、dyomics-649、dyomics-649p1、dyomics-650、dyomics-651、dyomics-652、dyomics-654、dyomics-675、dyomics-676、dyomics-677、dyomics-678、dyomics-679p1、dyomics-680、dyomics-681、dyomics-682、dyomics-700、dyomics-701、dyomics-703、dyomics-704、dyomics-730、dyomics-731、dyomics-732、dyomics-734、dyomics-749、dyomics-749p1、dyomics-750、dyomics-751、dyomics-752、dyomics-754、dyomics-776、dyomics-777、dyomics-778、dyomics-780、dyomics-781、dyomics-782、dyomics-800、dyomics-831、450、伊红、fitc、荧光素、hilytetmfluor405、hilytetmfluor 488、hilytetmfluor 532、hilytetmfluor 555、hilytetmfluor594、hilytetmfluor 647、hilytetmfluor 680、hilytetmfluor 750、680lt、750、800cw、joe、640r、red 610、red 640、red 670、red 705、丽丝胺罗丹明b、napthofluorescein、oregon488、oregon514、pacific bluetm、pacific greentm、pacific orangetm、pet、pf350、pf405、pf415、pf488、pf505、pf532、pf546、pf555p、pf568、pf594、pf610、pf633p、pf647p、570、670、705、罗丹明123、罗丹明6g、罗丹明b、罗丹明绿、罗丹明绿-x、罗丹明红、rox、setatm375、setatm470、setatm555、setatm632、setatm633、setatm650、setatm660、setatm670、setatm680、setatm700、setatm750、setatm780、setatmapc-780、setatmpercp-680、setatmr-pe-670、setatm646、setau 380、setau 425、setau 647、setau 405、square 635、square650、square 660、square 672、square 680、磺酰罗丹明101、tamra、tet、texas tmr、tritc、yakima yellowtm、zy3、zy5、zy5.5和zy7。165.在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。基质可以是表面(例如固体表面)、珠粒(例如磁珠)、颗粒(例如磁性颗粒)或凝胶。166.(iii)发光167.在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括通过发光来检测分子(或多个条形码分子)的条形码身份。条形码身份的检测可以是直接的或间接的(例如,通过检测检测分子的发光)。168.在一些实施方案中,基于发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其两种或更多种的组合来鉴定条形码身份。在一些实施方案中,可以基于不同的发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其两种或更多种的组合来区分多个条形码身份。169.在一些实施方案中,通过将发光分子暴露于一系列单独的光脉冲并评估从所述分子发射的每个光子的时序或其他特性来检测发光。在一些实施方案中,分子的发光寿命由从所述分子顺序发射的多个光子确定,并且发光寿命可用于鉴定所述分子。在一些实施方案中,分子的发光强度由从所述分子顺序发射的多个光子确定,并且发光强度可用于鉴定所述分子。在一些实施方案中,分子的发光寿命和发光强度由从所述分子顺序发射的多个光子确定,并且发光寿命和发光强度可用于鉴定所述分子。170.在某些实施方案中,发光分子吸收一个光子并在一个时段后发射一个光子。在一些实施方案中,可以通过测量所述时段来确定或估计分子的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段来确定或估计分子的发光寿命。在一些实施方案中,可以通过测量所述时段在多种类型的分子的发光寿命中区分分子的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段在多种类型的分子的发光寿命中区分分子的发光寿命。在某些实施方案中,通过确定或估计标记的发光寿命来鉴定或区分在多种类型的标记中的分子。在某些实施方案中,通过在多种类型分子的多种发光寿命中区分分子的发光寿命,在多种类型的分子中鉴定或区分分子。171.可以使用任何合适的方法来确定发光分子的发光寿命(例如,通过使用合适的技术测量寿命或通过确定发射的时间相关特性)。在一些实施方案中,确定分子的发光寿命包括确定相对于另一标记的寿命。在一些实施方案中,确定分子的发光寿命包括确定相对于参照的寿命。在一些实施方案中,确定分子的发光寿命包括测量寿命(例如,荧光寿命)。在一些实施方案中,确定分子的发光寿命包括确定一种或多种指示寿命的时间特性。在一些实施方案中,可以基于多个发射事件(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100或更多个发射事件)发生在相对于激发脉冲的一个或多个时间门控窗口中的分布来确定分子的发光寿命。例如,可以基于关于激发脉冲测量的光子到达时间的分布将分子的发光寿命与具有不同发光寿命的多个分子区分开。172.应当理解,发光分子的发光寿命指示在标记达到激发态之后发射的光子的时序,并且可以通过指示光子的时序的信息来区分所述标记。一些实施方案可以包括通过测量与分子发射的光子相关的时间,基于所述标记的发光寿命将分子与多个分子区分开。时间分布可以提供发光寿命的指示,该指示可以从分布中确定。在一些实施方案中,可以基于时间分布将所述分子与多个分子区分开,例如通过将时间分布与对应于已知分子的参考分布进行比较。在一些实施方案中,发光寿命的值由时间分布确定。173.如本文所用,在一些实施方案中,发光强度是指单位时间由发光分子发射的发射光子的数量,该发光分子通过递送脉冲激发能量而被激发。在一些实施方案中,发光强度是指单位时间检测到的发射光子的数量,这些发射光子由通过脉冲激发能量的递送而被激发的分子发射并且由特定传感器或传感器组检测。174.如本文所用,在一些实施方案中,亮度是指报告单位发光分子的平均发射强度的参数。因此,在一些实施方案中,“发射强度”可用于一般指包含一种或多种分子的组合物的亮度。在一些实施方案中,分子的亮度等于其量子产率和消光系数的乘积。175.如本文所用,在一些实施方案中,发光量子产率是指在给定波长处或在给定光谱范围内导致发射事件的激发事件的分数,并且通常小于1。在一些实施方案中,本文所述的发光标记的发光量子产率在0和约0.001之间、约0.001和约0.01之间、约0.01和约0.1之间、约0.1和约0.5之间、约0.5和0.9之间、或约0.9和1之间。在一些实施方案中,通过确定或估计发光量子产率来鉴定分子。176.如本文所用,在一些实施方案中,激发能量是来自光源的光脉冲。在一些实施方案中,激发能量在可见光谱中。在一些实施方案中,激发能量在紫外光谱中。在一些实施方案中,激发能量在红外光谱中。在一些实施方案中,激发能量处于或接近发光标记的吸收最大值,从该发光标记中检测多个发射光子。在某些实施方案中,激发能量在约500nm和约700nm之间(例如,约500nm和约600nm之间、约600nm和约700n m之间、约500nm和约550nm之间、约550nm和约600nm之间、约600nm和约650n m之间、或约650nm和约700nm之间)。在某些实施方案中,激发能量可以是单色的或被限制在光谱范围内。在一些实施方案中,光谱范围具有约0.1nm和约1nm之间、约1nm和约2nm之间、或约2nm和约5nm之间的范围。在一些实施方案中,光谱范围具有约5nm和约10nm之间、约10nm和约50nm之间、或约50nm和约100nm之间的范围。177.(iv)物理分离178.在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括通过物理分离来检测分子(或多个条形码分子)的条形码身份。通过物理分离来检测条形码身份可以包括确定条形码分子在基质(例如,微阵列芯片)上的位置。179.例如,基质可以包括多个检测分子(如本文所述),这些检测分子被组织在基质上的离散位置。在这种情况下,包含与基质上的检测分子杂交、结合或被其结合的条形码的条形码分子可以定位在检测分子的位置处。因此,在一些实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括使多肽(或多个多肽)与包含多个检测分子的基质接触。180.如上所述,在一些实施方案中,多肽(或多个多肽)通过将多肽(或多个多肽)沉积在固体基质上或固体基质内而被条形码化,使得多肽(或多个多肽)保持与另外的多肽(或另外的多个多肽)在物理上分离。在这样的实施方案中,确定条形码分子的来源(或多个条形码分子的来源)的方法包括检测条形码分子(或多个条形码分子)在固体基质上的位置。181.c.示例性实施方案182.在一些实施方案中,条形码分子包含通过dna测序鉴定的多核酸部分(图3b)。183.在一些实施方案中,条形码分子包含多核酸部分,其通过使用包含多核酸部分的检测分子的杂交来鉴定(图3a)。在一些实施方案中,检测分子还包含发光分子部分。在一些实施方案中,检测分子被固定在(例如,共价连接到)基质上。184.在一些实施方案中,条形码分子包含多核酸部分,其通过使用包含多肽部分(例如,dna结合蛋白、适体等)的检测分子的杂交来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子共价连接到基质上。185.在一些实施方案中,条形码分子包含通过多肽测序鉴定的多肽部分(例如,短多肽标签)(图3c)。186.在一些实施方案中,条形码分子包含多肽部分(例如,dna结合蛋白或其部分),其使用包含多核酸部分(例如,由dna结合蛋白结合的多核酸序列,或其部分)的检测分子来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子共价连接到基质上。187.在一些实施方案中,条形码分子包含多肽部分,其使用包含多核酸部分(例如,适体)的检测分子来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子共价连接到基质上。188.在一些实施方案中,条形码分子包含在多肽被翻译之后对其进行的氨基酸修饰(图3d)。189.在一些实施方案中,条形码分子包含多肽部分(例如,抗体、抗原、适体等),其使用包含多肽部分(例如,抗原、抗体或底物等)的检测分子来鉴定。在一些实施方案中,检测分子进一步包含发光分子部分。在一些实施方案中,检测分子共价连接到基质上(图3e)。190.在一些实施方案中,条形码组分包含具有不同切割谱的内切蛋白酶,其可以通过多肽测序来检测。191.iii.制备富集样品的方法192.在一些实施方案中,在条形码化(例如,多肽条形码化)之前、同时或之后富集样品。因此,在一些方面,本公开涉及多肽富集的方法。如本文所用,术语“多肽富集”是指其中一种或多种目的多肽的丰度相对于一种或多种参考多肽(例如,复杂样品中的非目的多肽)的丰度增加的过程。如本文所用,术语“目的多肽”是指人们寻求富集的多肽。目的多肽可以包含特定的氨基酸序列。替代地或另外地,目的多肽可以包含特定的多肽修饰(例如,翻译后修饰)。这些方法有助于复杂样品的蛋白质组学分析,这些样品由许多不同的多肽组成,其中只有一些可能是感兴趣的。193.在一些实施方案中,用于多肽富集的方法包括使用多个富集分子从多个多肽中选择多肽子集,从而产生包含多肽子集的富集样品。在一些实施方案中,所述方法包括使多个多肽与多个富集分子接触以产生包含多个多肽中的多肽子集的富集样品。194.在一些实施方案中,用于多肽富集的方法包括:(a)使多个多肽与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和(b)分离结合的多肽子集以产生包含多个多肽中的多肽子集的富集样品。195.在一些实施方案中,用于多肽富集的方法包括:(a)使多个多肽与多个富集分子接触,其中多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集;和(b)分离未结合的多肽子集以产生包含多个多肽中的多肽子集的富集样品。196.在前述段落中描述的实施方案中,应理解富集分子与多肽的结合等同于多肽与富集分子的结合。因此,上述实施方案中的步骤(a)可以等效地描述为:(a)使多个多肽与多个富集分子接触,其中多个富集分子中的至少富集分子的子集被多个多肽中的多肽子集结合,从而产生结合的多肽子集和未结合的多肽子集。197.还应理解,上述实施方案的步骤(a)和(b)可以使用另外的多个富集分子重复一次或多次以产生进一步富集的样品。例如,在一些实施方案中,所述方法包括:(a)使多个多肽与第一多个富集分子接触,其中第一多个富集分子中的至少富集分子的子集与多个多肽中的多肽的子集结合,从而产生第一结合的多肽子集和第一未结合的多肽子集;(b)分离(a)的第一结合的多肽子集或第一未结合的多肽子集;和(c)用一个或多个另外的多个富集分子反复重复步骤(a)和(b)以产生包含多个多肽中的多肽子集的富集样品。在一些实施方案中,使用第二、第三、第四、第五、第六、第七、第八、第九、第十或任何数量的另外的多个富集分子重复步骤(a)和(b)。198.例如,在一些实施方案中,所述方法包括:(a)使多个多肽与第一多个富集分子接触,其中第一多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生第一结合的多肽子集和第一未结合的多肽子集;(b)分离(a)的第一结合的多肽子集或第一未结合的多肽子集;(c)使(b)的分离的多肽与第二多个富集分子接触,其中第二多个富集分子中的至少富集分子的子集与(b)中分离的多肽子集结合,从而产生第二结合的多肽子集和第二未结合的多肽子集;(d)分离(c)的第二结合的多肽子集或第二未结合的多肽子集以产生包含多个多肽中的多肽子集的富集样品。199.替代地或另外地,富集方法可以包括色谱法(例如,尺寸排阻、离子交换等)、等电聚焦、膜过滤、分子筛过滤、浓缩、沉淀(例如,冷沉淀)、干燥、透析或其组合。200.在一些实施方案中,所述方法包括使复杂样品与本文所述的试剂盒或装置接触。参见“用于样品制备的试剂盒”和“用于样品制备和样品测序的装置”。201.在一些实施方案中,富集样品中的多肽是相同的(即,含有相同的氨基酸序列)。在一些实施方案中,富集样品包含至少两种独特的多肽(即,具有不同的氨基酸序列)。例如,在一些实施方案中,富集样品包含至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种、至少16种、至少17种、至少18种、至少19种、至少20种、至少25种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或至少100种独特的多肽。在一些实施方案中,富集样品包含1-2、1-5、1-10、1-15、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、2-5、2-10、2-15、2-20、2-30、2-40、2-50、2-60、2-70、2-80、2-90、2-100、5-10、5-15、5-20、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、10-15、10-20、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、15-20、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、30-40、30-50、30-60、30-70、30-80、30-90、30-100、40-50、40-60、40-70、40-80、40-90、40-100、50-60、50-70、50-80、50-90或50-100种独特的多肽。202.在一些实施方案中,富集样品包含具有至少50%、60%、70%、80%、90%、95%或99%序列同一性的多肽。在一些实施方案中,富集样品包含具有一种或多种多肽修饰(例如,翻译后修饰)的多肽。翻译后修饰的实例是本领域技术人员已知的,并且包括但不限于乙酰化、腺苷酰化、adp-核糖基化、烷基化(例如甲基化)、酰胺化、精氨酰化、生物素化、丁酰化、氨甲酰化、羰基化、羧基化、瓜氨酸化、脱酰胺、消除、甲酰化、糖基化(例如,n-连接糖基化、o-连接糖基化)、glipyatyon、糖化、羟基化、碘化、isg化、异戊二烯化、脂化、丙二酰化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化聚乙二醇化、磷酸化、磷酸泛酰巯基乙炔化、聚乙二醇化、聚谷氨酰化、异戊二烯化、丙酰化、pupylation、s-谷胱甘肽化、s-亚硝基化、s-亚磺酰化、s-亚磺酰化、s-磺酰化、琥珀酰化、硫酸化、sumo化和泛素化。203.a.富集分子204.如本文所用,术语“富集分子”是指表现出优先与(或被)一种或多种靶多肽结合的分子。富集分子可以通过与靶多肽的氨基酸序列的直接相互作用而与(或被)靶多肽结合。替代地或另外地,富集分子可以通过与靶多肽的修饰(例如,翻译后修饰)进行相互作用而与(或被)靶多肽结合。富集分子与(或被)靶多肽的结合可以通过静电相互作用、疏水相互作用、互补形状或其组合来介导。205.在一些实施方案中,靶多肽是目的多肽。在其他实施方案中,靶多肽不是目的多肽。206.优先与一种或多种靶多肽(或靶多肽变体)结合的示例性富集分子包括免疫球蛋白、anticalin、脂质运载蛋白(lipocalin)、darpins、适体、酶、凝集素和肽相互作用结构域。207.如本文所用,术语“免疫球蛋白”是指特征在于具有免疫球蛋白折叠并且起抗体作用并与一种或多种底物(例如,靶多肽)结合的多肽。因此,术语“免疫球蛋白”涵盖常规免疫球蛋白(即iga、igd、ige、igg和igm)、单链可变片段(scfv)、抗原结合片段(fab)、亲和体(affibody)和单域抗体(sdab),例如纳米抗体、vhh和vnar。208.如本文所用,术语“适体”是指优先与一种或多种靶分子(例如,靶多肽)结合的多核酸(例如,dna或rna)或多肽。尽管在自然界中发现了一些实例,但适体通常通过反复几轮的体外选择来进行工程化。209.如本文所用,术语“酶”是指在结合一种或多种底物(例如,靶多肽)时加速化学反应的大分子生物催化剂。通常,酶会在化学反应完成后释放其底物。因此,在其中富集分子包含酶的一些实施方案中,酶被催化失活以增加酶保持与底物结合的可能性。催化失活可以通过一种或多种酶促辅因子(即对于酶作为催化剂的活性所需的非蛋白质化合物或金属离子)的变异和/或消耗来进行。210.如本文所用,术语“肽相互作用结构域”是指与一种或多种多肽(例如,靶多肽)相互作用的多肽(或多肽的一部分)。例如,肽相互作用结构域可以是支架蛋白、多蛋白复合物的多肽或其部分。211.在一些实施方案中,富集分子包含免疫球蛋白、适体、酶和/或肽相互作用结构域。212.优先被一种或多种靶多肽结合的示例性富集分子包括寡核苷酸(例如,双链dna、单链dna、双链rna、单链rna等)、寡糖(或多糖)、脂质、糖蛋白、受体配体、受体激动剂、受体拮抗剂、酶底物和酶辅因子。213.在一些实施方案中,富集分子包含寡核苷酸(例如,双链dna、单链dna、双链rna、单链rna等)、寡糖、脂质、受体配体、受体激动剂、受体拮抗剂、酶底物和/或酶辅因子。214.本文使用优先结合来表征富集分子以强调:(i)富集分子不需要表现出高特异性(即,仅与单个靶多肽结合(或被其结合)到可观的水平);(ii)富集分子可能表现出某种程度的脱靶结合(即,与脱靶分子结合(或被其结合)到可检测的水平);和(iii)富集分子不需要以100%的效率与靶多肽结合(即,即使在存在过量富集分子的情况下,也并非必然需要复杂样品中的所有靶多肽都被结合)。215.在一些实施方案中,富集分子优先与单个靶多肽结合(或优先被其结合)。然而,在其他实施方案中,富集分子优先与两个或更多个靶多肽结合(或优先被其结合)。216.在一些实施方案中,富集分子表现出优先与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、或至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1000个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个靶多肽结合(或优先被其结合)。217.在一些实施方案中,富集分子表现出优先与二、三、四、五、六、七、八、九、十、十一、十二、十三、十四或十五个靶多肽结合(或优先被其结合)。218.在一些实施方案中,富集分子表现出优先与1-2、1-5、1-10、1-15、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、2-5、2-10、2-15、2-20、2-30、2-40、2-50、2-60、2-70、2-80、2-90、2-100、5-10、5-15、5-20、5-30、5-40、5-50、5-60、5-70、5-80、5-90、5-100、10-15、10-20、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、15-20、20-30、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-30、20-40、20-50、20-60、20-70、20-80、90、40-100、50-60、50-70、50-80、50-90、或50-100、100-200、100-300、100-400或100-500种富集分子类型的组合。227.在一些实施方案中,多个富集分子中的每个富集分子优先与单个靶多肽结合(或优先被其结合)。在其他实施方案中,多个富集分子中的一个或多个(例如,子集)富集分子表现出优先与两个或更多个靶多肽结合(或优先被其结合)。在其他实施方案中,多个富集分子中的每个富集分子表现出优先与两个或更多个靶多肽结合(或优先被其结合)。228.在一些实施方案中,多个富集分子中的一种或多种(例如,子集)富集分子与翻译后多肽修饰结合。在其他实施方案中,多个富集分子中的每个富集分子表现出优先与两个或更多个翻译后多肽修饰结合。229.在一些实施方案中,多个富集分子中的每个富集分子被固定在(例如,共价连接到)基质(例如,如“用于样品制备和样品测序的装置”中描述的捕获探针)上,例如表面(例如固体表面)、珠粒(例如磁珠)、颗粒(例如磁性颗粒,或凝胶)。在一些实施方案中,多个富集分子中的一个或多个(例如,子集)被固定在(例如,共价连接到)基质上。因此,在一些实施方案中,当包含多个多肽的样品接触基质时,会发生多个多肽与多个富集分子的接触。230.例如,在一些实施方案中,富集分子共价连接(例如,交联)在凝胶中并且样品被拉过凝胶。在一些实施方案中,富集分子共价连接到珠粒(例如,磁珠)上,然后被拉下。231.(ii)多重富集分子232.如上所述,在一些实施方案中,所述方法包括:(a)使多个多肽与第一多个富集分子接触,其中第一多个富集分子中的至少富集分子的子集与多个多肽中的多肽子集结合,从而产生第一结合的多肽子集和第一未结合的多肽子集;(b)分离(a)的第一结合的多肽子集或第一未结合的多肽子集;和(c)用一种或多种另外的多个富集分子反复重复步骤(a)和(b)以产生包含多个多肽中的多肽子集的富集样品。在一些实施方案中,使用第二、第三、第四、第五、第六、第七、第八、第九、第十或任何数量的另外的多个富集分子重复步骤(a)和(b)。233.在一些实施方案中,多肽富集方法中使用的每个多个富集分子中是独特的(即,每个多个富集分子包含不同的多个富集分子)。在其他实施方案中,两个或更多个多个富集分子是相同的。在一些实施方案中,至少一个多个富集分子中靶向翻译后多肽修饰并且至少一个多个富集分子不靶向翻译后修饰。234.例如,第一富集步骤(利用第一多个富集分子)可以富集特定的翻译后多肽修饰,并且第二富集步骤(利用第二多个富集分子)可以富集特定的多肽(和该多肽的变体)。替代地,第一富集步骤(利用第一多个富集分子)可以富集特定的多肽(和该多肽的变体),并且第二富集步骤(利用第二多个富集分子)可以富集特定的翻译后修饰。235.b.多肽修饰236.复杂样品的一个或多个多肽可以在上述多肽富集之前、同时和/或之后进行体外修饰。例如,在一些实施方案中,在进行多肽富集之前、同时和/或之后将复杂样品与修饰剂接触。其中,修饰剂可以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。237.在一些实施方案中,复杂样品的一个或多个多肽通过片段化进行修饰。在一些实施方案中,片段化包括酶促消化。在一些实施方案中,通过在消化条件下使多肽与内肽酶(例如胰蛋白酶)接触来进行消化。在一些实施方案中,片段化包括化学消化。用于化学和酶促消化的合适试剂的实例是本领域已知的,并且包括但不限于胰蛋白酶、化学胰蛋白酶、lys-c、arg-c、asp-n、lys-n、bnps-粪臭素、cnbr、半胱天冬酶、甲酸、谷氨酰内肽酶、羟胺、碘代苯甲酸、中性粒细胞弹性蛋白酶、胃蛋白酶、脯氨酸-内肽酶、蛋白酶k、葡萄球菌肽酶i、嗜热菌蛋白酶和凝血酶。238.在一些实施方案中,复杂样品的一个或多个多肽通过变性(例如,通过热和/或化学方式)进行修饰。239.在一些实施方案中,复杂样品的一个或多个多肽通过体外翻译后修饰进行修饰,例如通过乙酰化、腺苷酰化、adp-核糖基化、烷基化(例如甲基化)、酰胺化、精氨酰化、生物素化、丁酰化、氨甲酰化、羰基化、羧基化、瓜氨酸化、脱酰胺、消除、甲酰化、糖基化(例如,n-连接糖基化、o-连接糖基化)、glipyatyon、糖化、羟基化、碘化、isg化、异戊二烯化、脂化、丙二酰化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化聚乙二醇化、磷酸化、磷酸泛酰巯基乙炔化、聚乙二醇化、聚谷氨酰化、异戊二烯化、丙酰化、pupylation、s-谷胱甘肽化、s-亚硝基化、s-亚磺酰化、s-亚磺酰化、s-磺酰化、琥珀酰化、硫酸化、sumo化或泛素化。240.在一些实施方案中,复杂样品的一个或多个多肽通过封闭一种或多种官能团(例如,游离羧酸根基团和/或硫醇基团)进行修饰。241.在一些实施方案中,封闭游离羧酸根基团是指对这些基团改变了相对于未经修饰的羧酸根的化学反应性的化学修饰。合适的羧酸根封闭方法是本领域已知的并且应该将侧链羧酸根基团修饰为在化学上不同于待官能化的多肽的羧基末端羧酸根基团。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的酯化或酰胺化。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的甲酯化,例如,通过使多肽与甲醇hcl反应。可用于封闭游离羧酸根基团的试剂和技术的另外实例包括但不限于4-磺基-2,3,5,6-四氟苯酚(stp)和/或碳二亚胺例如n-(3-二甲基氨基丙基)-n'-乙基碳二亚胺盐酸盐(edac)、脲试剂、重氮甲烷、用于fischer酯化的醇和酸,使用n-羟基琥珀酰亚胺(nhs)形成nhs酯(可能作为后续酯或胺形成的中间体),或与羰基二咪唑(cdi)反应或形成混合酸酐,或任何其他修饰或封闭羧酸的方法,可能通过形成酯或酰胺。242.在一些实施方案中,封闭游离硫醇基团是指对这些基团改变了相对于未经修饰的硫醇的化学反应性的化学修饰。在一些实施方案中,封闭游离硫醇基团包括对多肽的游离硫醇基团进行还原和烷基化。在一些实施方案中,通过使多肽与二硫苏糖醇(dtt)以及碘乙酰胺和碘乙酸中的一种或两种接触来进行还原和烷基化。可以使用的另外的和替代的半胱氨酸还原试剂的实例是众所周知的,并且包括但不限于2-巯基乙醇、三(2-羧乙基)膦盐酸盐(tcep)、三丁基膦、二硫丁胺(dtba)或任何能够还原硫醇基团的试剂。可以使用的另外的和替代的半胱氨酸封闭(例如,半胱氨酸烷基化)试剂的实例是众所周知的,并且包括但不限于丙烯酰胺、4-乙烯基吡啶、n-乙基马来酰亚胺(nem)、n-ε-马来酰亚胺基己酸(emc),或任何修饰半胱氨酸以防止二硫键形成的试剂。243.在一些实施方案中,多肽的n末端氨基酸或c末端氨基酸被修饰。244.在一些实施方案中,多肽的羧基末端在包括以下的方法中被修饰:(i)封闭多肽的游离羧酸根基团;(ii)使多肽变性(例如,通过热和/或化学方式);(iii)封闭多肽的游离硫醇基团;(iv)消化多肽以产生至少一个包含游离的c末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,化学地)至游离的c末端羧酸根基团。在一些实施方案中,所述方法进一步包括,在(i)之后和(ii)之前,对包含多肽的样品进行透析。245.在一些实施方案中,以包括以下的方法修饰多肽的羧基末端:(i)使多肽变性(例如,通过热和/或化学方式);(ii)封闭多肽的游离硫醇基团;(iii)消化多肽以产生至少一个包含游离的c末端羧酸根基团的多肽片段;(iv)封闭游离c末端羧酸根基团以产生至少一个包含封闭的c末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,酶促地)至封闭的c末端羧酸根基团。在一些实施方案中,所述方法进一步包括,在(iv)之后和(v)之前,对包含多肽的样品进行透析。246.在一些实施方案中,复杂样品在富集之前与修饰剂接触以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。替代地或另外地,在一些实施方案中,复杂样品在富集的同时与修饰剂接触以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。替代地或另外地,在一些实施方案中,复杂样品(或源自其的样品,包含一个或多个目的多肽)在富集之后与修饰剂接触以介导多肽片段化、多肽变性、翻译后修饰的添加和/或一种或多种官能团的封闭。247.iv.多肽测序方法学248.在一些实施方案中,对多重样品的分子(例如,多肽)进行测序。因此,在一些方面,本公开涉及多肽测序和鉴定的方法。对多肽分子进行测序的各种方法是本领域普通技术人员已知的,并且包括质谱法(例如,肽质量指纹图谱和串联质谱法)和edman降解。另外,本文描述了先前未描述的对多肽进行测序的方法。249.如本文所用,关于多肽的“测序”、“序列确定”、“确定序列”和类似术语包括确定多肽的部分氨基酸序列信息以及完整氨基酸序列信息。也就是说,该术语包括序列比较、指纹识别和关于靶分子的类似信息水平,以及靶分子在目的区域内的每个氨基酸的明确鉴定和排序。该术语包括鉴定多肽的单个氨基酸(或单个氨基酸的概率)。在一些实施方案中,鉴定了多肽的多于一个氨基酸(或多于一个氨基酸的概率)。因此,在一些实施方案中,如本文所用的术语“氨基酸序列”和“多肽序列”可以指多肽材料本身并且不限于在生物化学上表征特定多肽的特定序列信息(例如,表示氨基酸顺序的从一个末端到另一个末端的字母串)。250.在一些实施方案中,确定多肽内特定位置处氨基酸的概率并在概率阵列中进行说明。例如,对于由两个氨基酸组成的多肽,术语“测序”、“序列确定”、“确定序列”等术语可能涉及确定位置1和/或位置2处的氨基的概率,例如[[0.80,0.12.0.05,0.01,0.01,0.01,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00],[0.00,0.10,0.90,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00]],其中阵列中的概率分别对应于a、r、n、d、c、q、e、g、h、i、l、k、m、f、p、s、t、w、y和v。本领域普通技术人员将理解,该实例(和示例性概率阵列)可以扩大到适应另外的氨基酸身份(例如,修饰的氨基酸)的分析,例如本文所述的那些。[0251]在一些实施方案中,多肽分子的测序包括鉴定多肽分子中至少两个(例如,至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个或更多个)氨基酸(或氨基酸概率)。在一些实施方案中,所述至少两个氨基酸是连续的氨基酸。在一些实施方案中,所述至少两个氨基酸是非连续的氨基酸。[0252]在一些实施方案中,多肽分子的测序包括鉴定多肽分子中所有氨基酸的少于100%(例如,少于99%、少于95%、少于90%、少于85%、少于80%、少于75%、少于70%、少于65%、少于60%、少于55%、少于50%、少于45%、少于40%、少于35%、少于30%、少于25%、少于20%、少于15%、少于10%、少于5%、少于1%或更少)。例如,在一些实施方案中,多肽分子的测序包括鉴定多肽分子中一种类型的氨基酸的少于100%(例如,鉴定多肽分子中的一种类型的所有氨基酸的一部分)。在一些实施方案中,多肽分子的测序包括鉴定多肽分子中每种类型的氨基酸的少于100%。[0253]在一些实施方案中,多肽分子的测序包括鉴定多肽中至少1、至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少100或更多种类型的氨基酸。[0254]在一些实施方案中,本技术提供了用于通过随时间鉴定存在于多肽末端的一系列氨基酸(例如,通过末端氨基酸的迭代检测和裂解)来对多肽进行测序的组合物和方法。在其他实施方案中,本技术提供了用于通过鉴定多肽的标记的氨基含量并与参考序列数据库进行比较来对多肽进行测序的组合物和方法。[0255]在一些实施方案中,本技术提供了用于通过对多肽的多个片段进行测序来对多肽进行测序的组合物和方法。在一些实施方案中,对多肽进行测序包括组合多个多肽片段的序列信息以鉴定和/或确定多肽的序列。在一些实施方案中,组合序列信息可以由计算机硬件和软件来执行。参见“用于样品制备和样品测序的装置”。本文所述的方法可以允许对一组相关的多肽,例如生物体的整个蛋白质组进行测序。在一些实施方案中,根据本技术的方面,多个单分子测序反应并行进行(例如,在单个芯片上)。例如,在一些实施方案中,多个单分子测序反应各自在单个芯片或阵列上的单独样品孔中进行。[0256]在一些实施方案中,本文提供的方法可用于对包含多肽的复杂混合物或富集混合物的样品中的单个多肽进行测序和鉴定。在一些实施方案中,本技术提供了独特鉴定多肽的复杂混合物或富集混合物中的单个多肽的方法。在一些实施方案中,通过确定多肽的部分氨基酸序列来检测混合样品中的单个多肽。在一些实施方案中,多肽的部分氨基酸序列在大约5到50个氨基酸的连续区段内。[0257]不希望囿于任何特定理论的,认为大多数人类蛋白质可以参考蛋白质组数据库使用不完整的序列信息来鉴定。例如,人类蛋白质组的简单建模表明,大约98%的蛋白质可以通过仅检测6到40个氨基酸的区段中的四种类型的氨基酸来独特鉴定(参见例如swaminathan等人,plos comput biol.2015,11(2):e1004080;和yao等人,phys.biol.2015,12(5):055003)。因此,多肽的复杂混合物或富集混合物可以被降解(例如,化学降解、酶促降解)成大约6到40个氨基酸的短多肽片段,并且对该多肽文库的测序将揭示存在于原始复杂混合物或富集混合物中的每种多肽的身份和丰度。用于通过确定部分序列信息来选择性标记氨基酸和鉴定多肽的组合物和方法在2015年9月15日提交的标题为“single molecule peptide sequencing”的美国专利申请号15/510,962中进行了详细描述,其全文通过引用的方式并入本文。[0258]实施方案能够以高准确度,例如以至少约50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%或99.9999%的准确度对单个多肽分子进行测序。在一些实施方案中,单分子测序中使用的靶分子是被固定在固体支持物表面(例如样品孔的底部表面或侧壁表面)上的多肽。根据本技术,样品孔还可以包含测序反应所需的其他试剂,例如一种或多种合适的缓冲液、辅因子、标记的亲和试剂和酶(例如有催化活性或无活性的外肽酶,其可以被发光标记或不被标记)。[0259]在一些方面,根据本技术的测序可以涉及将多肽固定在基质(例如,固相支持物,例如芯片,例如本文所述的集成装置)的表面上。在一些实施方案中,可以将多肽固定在基质上的样品孔的表面上(例如,样品孔的底部表面上)。在一些实施方案中,多肽的n末端氨基酸是固定化的(例如,连接到表面)。在一些实施方案中,多肽的c末端氨基酸是固定化的(例如,连接到表面)。在一些实施方案中,一种或多种非末端氨基酸是固定化的(例如,连接到表面)。可以使用任何合适的共价或非共价键连接固定化的氨基酸,例如如本技术中所述。在一些实施方案中,多个多肽被连接到多个样品孔(例如,一个多肽连接到每个样品孔的表面,例如底部表面),例如在基质上的样品孔的阵列中。[0260]在一些方面,根据本技术的测序可以使用允许单分子分析的系统进行。所述系统可以包括测序装置和被设置为与测序装置接合的仪器。参见“用于样品制备和样品测序的装置”。[0261]a.标记的亲和试剂和使用方法[0262]在一些实施方案中,本文提供的方法包括使多肽与选择性结合一种类型的末端氨基酸的标记的亲和试剂(本文也称为氨基酸识别分子,其可以包含或不包含标记)接触。如本文所用,在一些实施方案中,末端氨基酸可以指多肽的氨基末端氨基酸或多肽的羧基末端氨基酸。在一些实施方案中,标记的亲和试剂选择性结合一种类型的末端氨基酸而不是其他类型的末端氨基酸。在一些实施方案中,标记的亲和试剂选择性结合一种类型的末端氨基酸而不是相同类型的内部氨基酸。在其他实施方案中,标记的亲和试剂在多肽的任何位置选择性结合一种类型的氨基酸,例如,与末端氨基酸和内部氨基酸相同类型的氨基酸。[0263]如本文所用,在一些实施方案中,一种类型的氨基酸是指二十种天然存在的氨基酸中的一种或其类型的子集。在一些实施方案中,一种类型的氨基酸是指二十种天然存在的氨基酸之一的经修饰的变体或其未经修饰的和/或经修饰的变体的子集。经修饰的氨基酸变体的实例包括但不限于经翻译后修饰(例如乙酰化、adp-核糖基化、半胱天冬酶裂解、瓜氨酸化、甲酰化、n-连接糖基化、o-连接糖基化、羟基化、甲基化、肉豆蔻酰化、类泛素化、硝化、氧化、棕榈酰化、磷酸化、异戊二烯化、s-亚硝基化、硫酸化、苏素化和泛素化)的变体、经化学修饰的变体、非天然氨基酸和蛋白原氨基酸(例如硒代半胱氨酸和吡咯赖氨酸)。在一些实施方案中,氨基酸类型的子集包括多于一种且少于二十种氨基酸,其具有一种或多种相似的生化特性。例如,在一些实施方案中,一种类型的氨基酸是指选自以下的一种类型:具有带电荷侧链(例如,带正电荷和/或带负电荷的侧链)的氨基酸、具有极性侧链(例如,极性不带电荷的侧链)的氨基酸、具有非极性侧链(例如,非极性脂肪族和/或芳香族侧链)的氨基酸和具有疏水性侧链的氨基酸。[0264]在一些实施方案中,本文提供的方法包括使多肽与选择性结合一种或多种类型的末端氨基酸的一种或多种标记的亲和试剂接触。作为说明性和非限制性实例,当在本技术的方法中使用四种标记的亲和试剂时,任何一种试剂选择性结合一种类型的末端氨基酸,所述末端氨基酸不同于其他三种氨基酸中的任何一种选择性结合的另一种类型的氨基酸(例如,第一试剂结合第一类型,第二试剂结合第二类型,第三试剂结合第三类型,第四试剂结合末端氨基酸的第四类型)。出于此讨论的目的,在本文所述的方法的上下文中的一种或多种标记的亲和试剂可以替代地称为一组标记的亲和试剂。[0265]在一些实施方案中,一组标记的亲和试剂包括至少一种和多达六种标记的亲和试剂。例如,在一些实施方案中,一组标记的亲和试剂包括一种、两种、三种、四种、五种或六种标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括十种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括八种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括六种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括四种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括三种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括两种或更少的标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括四种标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括至少两种和多达二十种(例如,至少两种和多达十种、至少两种和多达八种、至少四种和多达二十种、至少四种和多达到十种)标记的亲和试剂。在一些实施方案中,一组标记的亲和试剂包括超过二十种(例如,20至25、20至30)亲和试剂。然而,应当理解,可以根据本技术的方法使用任意数量的亲和试剂以适应所需用途。[0266]根据本技术,在一些实施方案中,通过检测标记的亲和试剂(例如,包含发光标记的氨基酸识别分子)的发光来鉴定一种或多种类型的氨基酸。在一些实施方案中,标记的亲和试剂包括选择性结合一种类型的氨基酸的亲和试剂和具有与该亲和试剂相关的发光的发光标记。以这种方式,发光(例如,发光寿命、发光强度和本文别处描述的其他发光特性)可以与亲和试剂的选择性结合相关以鉴定多肽的氨基酸。在一些实施方案中,多种类型的标记的亲和试剂可用于根据本技术的方法中,其中每种类型包括具有可从多种中独特识别的发光的发光标记。合适的发光标记可以包括发光分子,例如荧光团染料,并且在本文别处进行了描述。[0267]在一些实施方案中,通过检测标记的亲和试剂的一种或多种电特性来鉴定一种或多种类型的氨基酸。在一些实施方案中,标记的亲和试剂包括选择性结合一种类型的氨基酸的亲和试剂和与该亲和试剂相关的电导标记。以这种方式,一种或多种电特性(例如,电荷、电流振荡颜色(current oscillation color)和其他电特性)可以与亲和试剂的选择性结合相关以鉴定多肽的氨基酸。在一些实施方案中,多种类型的标记的亲和试剂可用于根据本技术的方法中,其中每种类型包含电导标记,其产生电信号的变化(例如,电导的变化,例如特征模式的电导率和电导率转变的幅度),其可从多个中独特地鉴定。在一些实施方案中,多种类型的标记的亲和试剂各自包含具有不同数量的带电荷基团(例如,不同数量的带负电荷和/或带正电荷的基团)的电导标记。因此,在一些实施方案中,电导标记是电荷标记。电荷标记的实例包括树枝状大分子、纳米颗粒、核酸和其他具有多个带电荷基团的聚合物。在一些实施方案中,电导标记可通过其净电荷(例如,净正电荷或净负电荷)、通过其电荷密度和/或通过其带电荷基团的数量来独特地鉴定。[0268]在一些实施方案中,亲和试剂(例如,氨基酸识别分子)可以由本领域技术人员使用常规已知技术进行工程化。在一些实施方案中,期望的性质可以包括仅当一种类型的氨基酸位于多肽的末端(例如,n末端或c末端)时才以高亲和力选择性结合一种类型的氨基酸的能力。在其他实施方案中,期望的性质可以包括当一种类型的氨基酸位于多肽的末端(例如,n末端或c末端)时以及当其位于多肽的内部位置时以高亲和力选择性结合一种类型的氨基酸的能力。[0269]如本文所用,在一些实施方案中,术语“选择性的”和“特异性的”(及其变形,例如,选择性地、特异性地、选择性、特异性)是指优先结合相互作用。例如,在一些实施方案中,选择性结合一种类型的氨基酸的标记的亲和试剂优先结合一种类型而不是另一种类型的氨基酸。选择性结合相互作用将区分一种类型的氨基酸(例如,一种类型的末端氨基酸)和其他类型的氨基酸(例如,其他类型的末端氨基酸),通常超过约10至100倍或更多(例如,超过约1,000或10,000倍)。因此,应当理解,选择性结合相互作用可以指相比于其他类型的氨基酸可以与一种类型的氨基酸独特地识别的任何结合相互作用。例如,在一些方面,本技术通过获得指示一种或多种氨基酸识别分子与多肽分子的关联的数据来提供多肽测序的方法。在一些实施方案中,所述数据包括对应于与多肽分子的氨基酸的一系列可逆氨基酸识别分子结合相互作用的一系列信号脉冲,并且所述数据可用于确定氨基酸的身份。因此,在一些实施方案中,“选择性”或“特异性”结合相互作用是指检测到的区分一种类型的氨基酸和其他类型的氨基酸的结合相互作用。在一些实施方案中,标记的亲和试剂(例如,氨基酸识别分子)以小于约10-6m(例如,小于约10-7m、小于约10-8m、小于约10-9m、小于约10-10m、小于约10-11m、小于约10-12m、至低至10-16m)的解离常数(kd)选择性结合一种类型的氨基酸,而不与其他类型的氨基酸显著结合。在一些实施方案中,标记的亲和试剂以小于约100nm、小于约50nm、小于约25nm、小于约10nm或小于约1nm的kd选择性结合一种类型的氨基酸(例如,一种类型的末端氨基酸)。在一些实施方案中,标记的亲和试剂以约50nm至约50μm(例如,约50nm至约500nm、约50nm至约5μm、约500nm至约50μm、约5μm至约50μm或约10μm至约50μm)的kd选择性结合一种类型的氨基酸。在一些实施方案中,氨基酸识别分子以约50nm的kd结合一种类型的氨基酸。[0270]在一些实施方案中,标记的亲和试剂(例如,氨基酸识别分子)以小于约10-6m(例如,小于约10-7m、小于约10-8m、小于约10-9m、小于约10-10m、小于约10-11m、小于约10-12m、至低至10-16m)的kd结合两种或更多种类型的氨基酸。在一些实施方案中,氨基酸识别分子以小于约100nm、小于约50nm、小于约25nm、小于约10nm或小于约1nm的kd结合两种或更多种类型的氨基酸。在一些实施方案中,氨基酸识别分子以约50nm至约50μm(例如,约50nm至约500nm、约50nm至约5μm、约500nm至约50μm、约5μm至约50μm或约10μm至约50μm)的kd结合两种或更多种类型的氨基酸。在一些实施方案中,氨基酸识别分子以约50nm的kd结合两种或更多种类型的氨基酸。[0271]在一些实施方案中,标记的亲和试剂(例如氨基酸识别分子)以至少0.1s-1的解离速率(koff)结合至少一种类型的氨基酸。在一些实施方案中,解离速率在约0.1s-1和约1,000s-1之间(例如,在约0.5s-1和约500s-1之间、在约0.1s-1和约100s-1之间、在约1s-1和约100s-1之间或在约0.5s-1和约50s-1之间)。在一些实施方案中,解离速率在约0.5s-1和约20s-1之间。在一些实施方案中,解离速率在约2s-1和约20s-1之间。在一些实施方案中,解离速率在约0.5s-1和约2s-1之间。[0272]在一些实施方案中,kd或koff的值可以是已知的文献值,或者该值可以根据经验确定。例如,kd或koff的值可以在单分子测定或整体测定中测量。在一些实施方案中,koff的值可以基于在如本文别处所述的单分子测定中获得的信号脉冲信息根据经验确定。例如,koff的值可以近似为平均脉冲持续时间的倒数。在一些实施方案中,氨基酸识别分子结合两种或更多种类型的氨基酸,这两种或更多种类型中的每一种具有不同的kd或koff。在一些实施方案中,第一类型氨基酸的第一kd或koff与第二类型氨基酸的第二kd或koff相差至少10%(例如,至少25%、至少50%、至少100%或更多)。在一些实施方案中,kd或koff的第一和第二值相差约10-25%、25-50%、50-75%、75-100%或大于100%,例如相差约2倍、3倍、4倍、5倍或更多。[0273]在一些实施方案中,标记的亲和试剂包含发光标记(例如,标记)和选择性结合多肽的一种或多种类型的末端氨基酸的亲和试剂。在一些实施方案中,亲和试剂对末端位置或末端和内部位置处的一种类型的氨基酸或氨基酸类型的子集(例如,少于二十种常见类型的氨基酸)具有选择性。[0274]如本文所述,亲和试剂(也称为“识别分子”)可以是能够选择性或特异性结合一个分子而不是另一个分子(例如,一种类型的氨基酸而不是另一种类型的氨基酸,如具有本文所指的“氨基酸识别分子”)的任何生物分子。亲和试剂(例如识别分子)包括例如蛋白质和核酸,其可以是合成的或重组的。在一些实施方案中,亲和试剂或识别分子可以是抗体或抗体的抗原结合部分,或酶促生物分子,例如肽酶、氨基转移酶、核酶、适体酶或trna合成酶,包括氨酰基-trna合成酶和描述于2016年9月2日提交的标题为“molecules and methods for iterative polypeptide analysis and processing”的美国专利申请号15/255,433中的相关分子。[0275]在一些实施方案中,本技术的亲和试剂或识别分子是降解途径蛋白。适合用作识别分子的降解途径蛋白的实例包括但不限于n端规则途径蛋白,例如arg/n端规则途径蛋白、ac/n端规则途径蛋白和pro/n端规则途径蛋白。在一些实施方案中,识别分子是选自gid4蛋白、ubr1 ubr盒蛋白和clps蛋白(例如,clps2)的n端规则途径蛋白。[0276]肽酶,也称为蛋白酶,是催化肽键水解的酶。肽酶将多肽消化成较短的片段,通常可分为内肽酶和外肽酶,它们分别在内部和末端裂解多肽链。在一些实施方案中,标记的亲和试剂包含已被修饰以使外肽酶或内肽酶活性失活的肽酶。以这种方式,标记的亲和试剂选择性结合而不会裂解多肽中的氨基酸。在其他实施方案中,可以使用未经修饰以使外肽酶或内肽酶活性失活的肽酶。例如,在一些实施方案中,标记的亲和试剂包含标记的外肽酶。[0277]根据本技术的某些实施方案,多肽测序方法可以包括在多肽末端的迭代检测和裂解。在一些实施方案中,标记的外肽酶可以用作执行氨基酸检测和裂解这两个步骤的单一试剂。如一般性描述的,在一些实施方案中,标记的外肽酶具有氨肽酶或羧肽酶活性,从而其分别选择性结合和裂解多肽的n末端或c末端氨基酸。应当理解,在某些实施方案中,标记的外肽酶可以由本领域技术人员催化失活,使得标记的外肽酶保留选择性结合特性以用作非裂解标记的亲和试剂,如本文所述。[0278]外肽酶通常需要多肽底物在其氨基末端包含游离氨基或在其羧基末端包含游离羧基中的至少一个。在一些实施方案中,根据本技术的外肽酶水解多肽末端处或附近的键。在一些实施方案中,外肽酶水解距多肽末端不超过三个残基的键。例如,在一些实施方案中,由外肽酶催化的单个水解反应从多肽末端裂解单个氨基酸、二肽或三肽。[0279]在一些实施方案中,根据本技术的外肽酶是氨肽酶或羧肽酶,其分别从氨基末端或羧基末端裂解单个氨基酸。在一些实施方案中,根据本技术的外肽酶是二肽基-肽酶或肽基-二肽酶,其分别从氨基末端或羧基末端裂解二肽。在其他实施方案中,根据本技术的外肽酶是三肽基-肽酶,其从氨基末端裂解三肽。每个类别或其亚类的肽酶分类和活性是众所周知的,并在文献中进行了描述(参见,例如,gurupriya,v.s.&roy,s.c.proteases and protease inhibitors in male reproduction.proteases in physiology and pathology 195–216(2017);和brix,k.&w.proteases:structure and function.chapter 1)。[0280]可以基于测序反应的方向性对根据本技术的外肽酶进行选择或工程化。例如,在从多肽的氨基末端到羧基末端测序的实施方案中,外肽酶包含氨肽酶活性。相反,在从多肽的羧基末端到氨基末端测序的实施方案中,外肽酶包含羧肽酶活性。识别特定羧基末端氨基酸的羧肽酶的实例,其可用作标记的外肽酶或被灭活以用作本文所述的非裂解标记的亲和试剂,已在文献中进行了描述(参见,例如,garcia-guerrero,m.c.等人,(2018)pnas 115(17))。[0281]用作裂解试剂和/或亲和试剂(例如识别分子)的合适肽酶包括选择性结合一种或多种类型的氨基酸的氨肽酶。在一些实施方案中,氨肽酶识别分子被修饰以使氨肽酶活性失活。在一些实施方案中,氨肽酶裂解试剂是非特异性的,因此它从多肽的末端裂解大多数或所有类型的氨基酸。在一些实施方案中,与多肽末端的其他类型的氨基酸相比,氨肽酶裂解试剂在裂解多肽末端的一种或多种类型的氨基酸方面更有效。例如,根据本技术的氨肽酶特异性裂解丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、硒代半胱氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和/或缬氨酸。在一些实施方案中,氨肽酶是脯氨酸氨肽酶。在一些实施方案中,氨肽酶是脯氨酸亚氨基肽酶。在一些实施方案中,氨肽酶是谷氨酸/天冬氨酸特异性氨肽酶。在一些实施方案中,氨肽酶是甲硫氨酸特异性氨肽酶。在一些实施方案中,氨肽酶是表1中列出的氨肽酶。在一些实施方案中,氨肽酶裂解试剂裂解表1中列出的肽底物。[0282]在一些实施方案中,氨肽酶是非特异性氨肽酶。在一些实施方案中,非特异性氨肽酶是锌金属蛋白酶。在一些实施方案中,非特异性氨肽酶是表2中列出的氨肽酶。在一些实施方案中,非特异性氨肽酶裂解表2中列出的肽底物。[0283]因此,在一些实施方案中,本技术提供了具有选自表1或表2的氨基酸序列(或具有与选自表1或表2的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、80-90%、90-95%、95-99%或更高的氨基酸序列同一性的氨基酸序列)的氨肽酶(例如,氨肽酶识别分子、氨肽酶裂解试剂)。在一些实施方案中,氨肽酶与表1或表2中列出的氨肽酶具有25-50%、50-60%、60-70%、70-80%、80-90%、90-95%或95-99%或更高的氨基酸序列同一性。在一些实施方案中,氨肽酶是经修饰的氨肽酶,并且相对于表1或表2中列出的序列包括一个或多个氨基酸突变。[0284]表1.氨肽酶的非限制性实例[0285][0286][0287][0288]表2.非特异性氨肽酶的非限制性实例[0289][0290][0291][0292][0293]*裂解效率(从最高到最低):精氨酸》赖氨酸》疏水残基(包括丙氨酸、亮氨酸、甲硫氨酸和苯丙氨酸)》脯氨酸(参见,例如,matthews biochemistry 47,2008,5303-5311)。[0294]**裂解效率(从最高到最低):亮氨酸》丙氨酸》精氨酸》苯丙氨酸》脯氨酸;在谷氨酸和天冬氨酸后不裂解。[0295]出于比较两个或更多个氨基酸序列的目的,第一氨基酸序列和第二氨基酸序列之间的“序列同一性”(本文也称为“氨基酸同一性”)百分比可以通过[第一氨基酸序列中与第二氨基酸序列中相应位置的氨基酸残基相同的氨基酸残基的数量]除以[第一氨基酸序列中氨基酸残基的总数]并乘以[100]来计算,其中与第一氨基酸序列相比,第二氨基酸序列中氨基酸残基的每个缺失、插入、取代或添加被认为是单个氨基酸残基(位置)的差异。替代地,可以使用已知的计算机算法(例如,通过smith和waterman(1970)adv.appl.math.2:482c的局部同源算法,通过needleman和wunsch,j.mol.biol.(1970)48:443的同源比对算法,通过pearson和lipman.proc.natl.acad.sci.usa(1998)85:2444的相似性搜索方法,或通过可作为blast、clustal omega或其他序列比对算法的计算机化实现算法),例如使用标准设置,来计算两个氨基酸序列之间的序列同一性程度。通常,出于根据上文概述的计算方法确定两个氨基酸序列之间的“序列同一性”百分比的目的,将氨基酸残基数最多的氨基酸序列作为“第一”氨基酸序列,另一个氨基酸序列将作为“第二”氨基酸序列。[0296]另外地或替代地,可以评估两个或更多个序列的序列之间的同一性。在两个或更多个核酸或氨基酸序列的上下文中,术语“同一的”或百分比“同一性”是指两个或更多个相同的序列或子序列。当在比较窗口或使用上述序列比较算法之一或通过人工比对和目视检查测量的指定区域上进行比较和比对时,如果两个序列在指定区域或整个序列上具有指定百分比的相同氨基酸残基或核苷酸(例如,至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%同一的),则两个序列是“基本上同一的”。任选地,同一性存在于长度为至少约25、50、75或100个氨基酸的区域上,或存在于长度为100至150、150至200、100至200、或200或更多个氨基酸的区域上。[0297]另外地或替代地,可以评估两个或更多个序列的序列之间的比对。在两个或更多个核酸或氨基酸序列的上下文中,术语“比对”或百分比“比对”是指两个或更多个相同的序列或子序列。当在比较窗口或使用上述序列比较算法之一或通过人工比对和目视检查测量的指定区域上进行比较和比对时,如果两个序列在指定区域或整个序列上具有指定百分比的相同氨基酸残基或核苷酸(例如,至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%同一的),则两个序列是“基本上比对上的”。任选地,比对存在于长度为至少约25、50、75或100个氨基酸的区域上,或存在于长度为100至150、150至200、100至200、或200或更多个氨基酸的区域上。[0298]除了多肽分子之外,核酸分子还具有多种有利的特性,可根据本技术用作亲和试剂(例如氨基酸识别分子)。[0299]核酸适体是经过工程化以高亲和力和选择性结合所需靶标的核酸分子。因此,可以使用本领域已知的选择和/或富集技术对核酸适体进行工程化以选择性结合所需类型的氨基酸。因此,在一些实施方案中,亲和试剂包含核酸适体(例如,dna适体、rna适体)。在一些实施方案中,标记的亲和试剂是选择性结合一种类型的末端氨基酸的标记的适体。例如,在一些实施方案中,如本文所述,标记的适体在多肽末端选择性结合一种类型的氨基酸(例如,单一类型的氨基酸或氨基酸类型的子集)。尽管未显示,但应当理解,标记的适体可以被工程化以根据本技术的方法在多肽的任何位置(例如,在多肽的末端位置或末端和内部位置)选择性结合一种类型的氨基酸。[0300]在一些实施方案中,标记的亲和试剂包含具有结合诱导的发光的标记。例如,在一些实施方案中,标记的适体包含供体标记和受体标记以及功能。在其他实施方案中,标记的适体包含淬灭部分并且功能类似于分子信标,其中标记的适体的发光在内部被淬灭为游离分子并恢复为选择性结合的分子(参见例如hamaguchi等人,(2001)analytical biochemistry 294,126-131)。不希望囿于理论的,认为用于结合诱导的发光的这些和其他类型的机制可以有利地减少或消除背景发光以提高本文所述的方法的总体灵敏度和准确度。[0301]除了鉴定多肽末端氨基酸的方法之外,本技术还提供了使用标记的亲和试剂对多肽进行测序的方法。在一些实施方案中,测序方法可以涉及使多肽末端经受末端氨基酸检测和末端氨基酸裂解的重复循环。例如,在一些实施方案中,本技术提供了一种确定多肽的氨基酸序列的方法,所述方法包括使多肽与本文所述的一种或多种标记的亲和试剂接触并使多肽经受edman降解。[0302]常规edman降解涉及修饰和裂解多肽末端氨基酸的重复循环,其中鉴定每个连续裂解的氨基酸以确定多肽的氨基酸序列。作为常规edman降解的说明性实例,多肽的n端氨基酸使用异硫氰酸苯酯(pitc)修饰以形成pitc衍生的n末端氨基酸。然后使用酸性条件、碱性条件和/或高温裂解pitc衍生的n末端氨基酸。还表明,裂解pitc衍生的n末端氨基酸的步骤可以使用来自原生动物克氏锥虫(trypanosoma cruzi)的经修饰的半胱氨酸蛋白酶通过酶促完成,这涉及在中性或接近中性ph下相对温和的裂解条件。有用的酶的非限制性实例描述于2016年9月2日提交的标题为“molecules and methods for iterative polypeptide analysis and processing”的美国专利申请号15/255,433中。[0303]在一些实施方案中,通过edman降解进行测序包括提供通过接头固定在固体支持物表面(例如,固定在样品孔的底部或侧壁表面)上的多肽。在一些实施方案中,如本文所述,多肽被固定在一个末端(例如氨基末端氨基酸或羧基末端氨基酸),使得另一末端是游离的,用于检测和裂解末端氨基酸。因此,在一些实施方案中,本文所述的在edman降解方法中使用的试剂优先与多肽的非固定(例如,游离)末端处的末端氨基酸相互作用。以这种方式,多肽在检测和裂解的重复循环中保持固定。为此,在一些实施方案中,可以根据用于检测和裂解的所需条件组设计接头,例如,以限制多肽在化学裂解条件下从表面脱离。用于将多肽固定在表面的合适的接头组合物和技术在本文别处详细描述。[0304]根据本技术,在一些实施方案中,通过edman降解进行测序的方法包括步骤(i),使多肽与一种或多种选择性结合一种或多种类型的末端氨基酸的标记的亲和试剂接触。在一些实施方案中,标记的亲和试剂通过选择性结合末端氨基酸而与多肽相互作用。在一些实施方案中,步骤(i)进一步包括去除未选择性结合多肽的末端氨基酸(例如,游离末端氨基酸)的一种或多种标记的亲和试剂中的任一种。[0305]在一些实施方案中,所述方法进一步包括通过检测标记的亲和试剂来鉴定多肽的末端氨基酸。在一些实施方案中,检测包括检测来自标记的亲和试剂的发光。如本文所述,在一些实施方案中,发光与标记的亲和试剂独特地关联,因此发光与标记的亲和试剂选择性结合的氨基酸类型相关。因此,在一些实施方案中,通过确定标记的亲和试剂的一种或多种发光特性来鉴定氨基酸的类型。[0306]在一些实施方案中,通过edman降解进行测序的方法包括步骤(ii),去除多肽的末端氨基酸。在一些实施方案中,步骤(ii)包括从多肽去除标记的亲和试剂(例如,一种或多种选择性结合末端氨基酸的标记的亲和试剂中的任一种)。在一些实施方案中,步骤(ii)包括通过使末端氨基酸与异硫氰酸酯(例如,pitc)接触以形成异硫氰酸酯修饰的末端氨基酸来修饰多肽的末端氨基酸(例如,游离末端氨基酸)。在一些实施方案中,异硫氰酸酯修饰的末端氨基酸比未经修饰的末端氨基酸更容易被裂解试剂(例如化学或酶促裂解试剂)去除。[0307]在一些实施方案中,步骤(ii)包括通过使多肽与特异性结合和裂解异硫氰酸酯修饰的末端氨基酸的蛋白酶接触来去除末端氨基酸。在一些实施方案中,蛋白酶包括修饰的半胱氨酸蛋白酶。在一些实施方案中,蛋白酶包括修饰的半胱氨酸蛋白酶,例如来自克氏锥虫的半胱氨酸蛋白酶(参见例如,borgo等人,(2015)protein science 24:571-579)。在其他实施方案中,步骤(ii)包括通过使多肽经受足以裂解异硫氰酸酯修饰的末端氨基酸的化学(例如酸性、碱性)条件来去除末端氨基酸。[0308]在一些实施方案中,通过edman降解进行测序的方法包括步骤(iii),在末端氨基酸裂解后洗涤多肽。在一些实施方案中,洗涤包括去除蛋白酶。在一些实施方案中,洗涤包括将多肽恢复至中性ph条件(例如,在通过酸性或碱性条件进行化学裂解之后)。在一些实施方案中,通过edman降解进行测序的方法包括重复步骤(i)至(iii)多个循环。[0309]在一些实施方案中,含有多肽的复杂混合物或富集混合物(例如,多肽混合物)的样品可以使用普通酶降解成约6至40个氨基酸的短多肽片段。在一些实施方案中,根据本技术的方法对该多肽文库进行测序将揭示存在于原始复杂混合物或富集混合物中的每种多肽的身份和丰度。如本文和文献中所述,大小范围为6至40个氨基酸的大多数多肽可以通过确定多肽链中仅四个氨基酸的数量和位置来独特地鉴定。[0310]因此,在一些实施方案中,通过edman降解进行测序的方法可以使用一组标记的适体进行,该组标记的适体包括四种dna适体类型,每种类型识别不同的n末端氨基酸。每种适体类型可以用不同的发光标记进行标记,从而可以基于一种或多种发光特性来区分不同的适体类型。为了说明性目的,标记的适体的实例组包括:用第一发光标记(“染料1”)标记的半胱氨酸特异性适体;用第二发光标记(“染料2”)标记的赖氨酸特异性适体;用第三发光标记(“染料3”)标记的色氨酸特异性适体;以及用第四发光标记(“染料4”)标记的谷氨酸特异性适体。[0311]在一些实施方案中,在步骤(i)之前,将来自多肽文库的单个多肽分子固定在固体支持物的表面,例如样品孔阵列的样品孔的底部或侧壁表面。在一些实施方案中,如本文别处所述,能够实现表面固定的部分(例如,生物素)或提高溶解度的部分(例如,寡核苷酸)可以化学或酶促连接至多肽的c末端。为了确定每个多肽的序列,在一些实施方案中,固定化的多肽经受n末端氨基酸检测和n末端氨基酸裂解的重复循环。在一些实施方案中,所述方法包括试剂添加和洗涤步骤,这些步骤通过使用自动化流体系统注入到检测表面上方的流通池中来进行。在一些实施方案中,步骤(i)至(iv)说明了使用标记的适体进行检测和裂解的一个循环。[0312]在一些实施方案中,通过edman降解进行测序的方法包括步骤(i),流入四种正交标记的dna适体的混合物中并孵育以使适体与任何固定化的多肽(例如,固定在阵列的样品孔内的多肽)结合,所述在n末端包含四个正确氨基酸中的一个。在一些实施方案中,所述方法进一步包括洗涤固定化的多肽以去除未结合的适体。在一些实施方案中,所述方法进一步包括对固定化的多肽进行成像(“成像步骤(i)”)。在一些实施方案中,所获得的图像包含足够的信息来确定与适体结合的多肽的位置(例如,在样品孔阵列内的位置)以及四个适体中的哪一个在每个位置处被结合。在一些实施方案中,所述方法进一步包括使用合适的缓冲液来洗涤固定化的多肽以从固定化的多肽中去除适体。[0313]在一些实施方案中,测序方法包括步骤(ii)在含有特异性修饰n末端胺基的反应性分子(例如,pitc,如图所示)的溶液中流动。在一些实施方案中,诸如pitc的异硫氰酸酯分子将n末端氨基酸修饰成底物,用于通过经修饰的蛋白酶例如来自克氏锥虫(trypanosoma cruzi)的半胱氨酸蛋白酶cruzain的裂解。[0314]在一些实施方案中,测序方法包括步骤(iii),洗涤固定化的多肽,再流入合适的经修饰的蛋白酶,所述经修饰的蛋白酶识别并裂解来自固定化的多肽的修饰的n末端氨基酸。[0315]在一些实施方案中,该方法包括在酶促裂解后洗涤固定化多肽的步骤(iv)。在一些实施方案中,步骤(i)至(iv)描绘了edman降解的一个循环。因此,所示的步骤(i')是下一个反应循环的开始,该反应循环作为如上文对步骤(i)至(iv)所述进行的步骤(i')至(iv')进行。在一些实施方案中,步骤(i)至(iv)重复大约20-40个循环。[0316]在一些实施方案中,标记的异硫氰酸酯(例如,染料标记的pitc)可用于监测样品上样。例如,在一些实施方案中,在对多肽样品进行测序方法之前,通过使用染料标记的pitc修饰末端,使多肽样品在末端与发光标记预缀合。以这种方式,可以通过在上述步骤(i)之前检测来自标记的发光来监测多肽样品向样品孔阵列中的上样。在一些实施方案中,发光用于确定阵列中样品孔的单个占据(例如,含有单个多肽分子的样品孔的一部分),这可以有利地增加对于给定样品可靠地获得的信息量。在进行步骤(i)之前,一旦通过发光确定了所需的样品上样状态,就可以如所描述的进行化学或酶促裂解。[0317]在一些实施方案中,标记的异硫氰酸酯(例如,染料标记的pitc)可用于监测阵列中多肽样品的反应进程。例如,在一些实施方案中,步骤(ii)包括流入含有染料标记的pitc的溶液,所述pitc特异性地修饰和标记样品中多肽的n末端胺基。在一些实施方案中,可以在步骤(ii)期间或之后检测来自标记的发光以评估样品中多肽的n末端pitc修饰。因此,在一些实施方案中,发光用于确定是否或何时从步骤(ii)进行到步骤(iii)。在一些实施方案中,可以在步骤(iii)期间或之后检测来自标记的发光以评估样品中多肽的n末端氨基酸裂解——例如以确定是否或何时从步骤(iii)进行到步骤(iv)。[0318]测序方法可以使用单独的试剂来检测和裂解多肽的末端氨基酸。尽管如此,在一些方面,本技术提供了一种测序方法,其中包含肽酶(例如选择性结合和裂解不同类型的末端氨基酸的标记的外肽酶)的单一试剂可用于检测和裂解多肽的末端氨基酸。[0319]标记的外肽酶可以包括包含第一发光标记的赖氨酸特异性的外肽酶、包含第二发光标记的甘氨酸特异性的外肽酶、包含第三发光标记的天冬氨酸特异性的外肽酶和包含第四发光标记的亮氨酸特异性的外肽酶。根据本文所述的某些实施方案,每个标记的外肽酶仅在其相应氨基酸位于多肽的氨基末端或羧基末端时选择性结合和裂解该氨基酸。因此,随着通过这种方法的测序从肽的一个末端向另一个末端进行,标记的外肽酶被工程化或选择,使得该组的所有试剂将具有氨肽酶或羧肽酶活性。[0320]在一些方面,本技术通过评估末端氨基酸与标记的氨基酸识别分子(例如,标记的亲和试剂)和标记的裂解试剂(例如,标记的非特异性外肽酶)的结合相互作用来提供实时多肽测序的方法。不希望囿于理论的,标记的亲和试剂根据由结合率或结合的“开”率(kon)和解离率或结合的“关”率(koff)定义的结合亲和性(kd)选择性结合。速率常数koff和kon分别是脉冲持续时间(例如,对应于可检测结合事件的时间)和脉冲间持续时间(例如,可检测结合事件之间的时间)的关键决定因素。在一些实施方案中,可以设计这些速率以实现给出最佳测序准确度的脉冲持续时间和脉冲频率(例如,信号脉冲的频率)。[0321]测序反应混合物可以进一步包含标记的非特异性外肽酶,其包含不同于标记的亲和试剂的发光标记。在一些实施方案中,标记的非特异性外肽酶以低于标记的亲和试剂的浓度存在于混合物中。在一些实施方案中,标记的非特异性外肽酶显示出广泛的特异性,使得它裂解大多数或所有类型的末端氨基酸。[0322]在一些实施方案中,末端氨基酸被标记的非特异性外肽酶裂解产生信号脉冲,并且这些事件以比标记的亲和试剂的结合脉冲更低的频率发生。以这种方式,可以在实时测序过程中对多肽的氨基酸进行计数和/或鉴定。在一些实施方案中,可以使用多种标记的亲和试剂,每种都具有可用于鉴定相应末端氨基酸的诊断脉冲模式(例如,特征模式)。例如,在一些实施方案中,不同的特征模式对应于多于一种标记的亲和试剂与不同类型的末端氨基酸的关联。如本文所述,应当理解,可以根据本技术使用与多于一种类型的氨基酸相关的单一亲和试剂。因此,在一些实施方案中,不同的特征模式对应于一种标记的亲和试剂与不同类型的末端氨基酸的关联。[0323]如上详述,实时测序过程通常可以涉及末端氨基酸识别和末端氨基酸裂解的循环,其中识别和裂解的相对发生可以通过标记的亲和试剂和标记的非特异性外肽酶之间的浓度差来控制。在一些实施方案中,可以优化浓度差,使得在识别单个氨基酸期间检测到的信号脉冲的数量为鉴定提供所需的置信区间。例如,如果初始测序反应提供的信号数据在裂解事件之间的信号脉冲太少而无法确定具有所需置信区间的特征模式,则可以使用相对于亲和试剂降低浓度的非特异性外肽酶来重复测序反应。发明人已经认识到用于控制实时测序反应的其他技术,这些技术可以与所描述的浓度差方法结合使用,或替代地使用。[0324]在一些实施方案中,测序反应涉及温度依赖性末端氨基酸识别和末端氨基酸裂解的循环。测序反应的每个循环可以在两个温度范围内进行:亲和试剂活性优于外肽酶活性(例如,以促进末端氨基酸识别)的第一温度范围(“t1”),以及外肽酶活性优于亲和试剂活性(例如,以促进末端氨基酸裂解)的第二温度范围(“t2”)。测序反应可以通过在第一温度范围t1(以启动氨基酸识别)和第二温度范围t2(以启动氨基酸裂解)之间交替反应混合物温度来进行。因此,温度依赖性测序过程的进展可通过温度控制,并在不同温度范围(例如,t1和t2之间)之间交替,这可以通过手动或自动过程进行。在一些实施方案中,与第二温度范围t2相比,第一温度范围t1内的亲和试剂活性(例如,对氨基酸的结合亲和性(kd))增加至少10倍、至少100倍、至少1,000倍、至少10,000倍、至少100,000倍或更多。在一些实施方案中,与第一温度范围tl相比,第二温度范围t2内的外肽酶活性(例如,底物转化为裂解产物的速率)增加至少2倍、10倍、至少25倍、至少50倍、至少100倍、至少1,000倍或更多。[0325]在一些实施方案中,第一温度范围t1低于第二温度范围t2。在一些实施方案中,第一温度范围t1在约15℃和约40℃之间(例如,在约25℃和约35℃之间、在约15℃和约30℃之间、在约20℃和约30℃之间)。在一些实施方案中,第二温度范围t2在约40℃和约100℃之间(例如,在约50℃和约90℃之间、在约60℃和约90℃之间、在约70℃和约90℃之间)。在一些实施方案中,第一温度范围t1在约20℃和约40℃之间(例如,约30℃),并且第二温度范围t2在约60℃和约100℃之间(例如,约80℃)。[0326]在一些实施方案中,第一温度范围t1高于第二温度范围t2。在一些实施方案中,第一温度范围t1在约40℃和约100℃之间(例如,在约50℃和约90℃之间、在约60℃和约90℃之间、在约70℃和约90℃之间)。在一些实施方案中,第二温度范围t2在约15℃和约40℃之间(例如,在约25℃和约35℃之间、在约15℃和约30℃之间、在约20℃和约30℃之间)。在一些实施方案中,第一温度范围t1在约60℃和约100℃之间(例如,约80℃),并且第二温度范围t2在约20℃和约40℃之间(例如,约30℃)。[0327]在一些实施方案中,本技术提供了使用发光激活试剂的发光依赖性测序过程。在一些实施方案中,发光依赖性测序过程涉及发光依赖性氨基酸识别和裂解的循环。测序反应的每个循环可以通过将测序反应混合物暴露于两种不同的发光条件来进行:亲和试剂活性优于外肽酶活性(例如,以促进氨基酸识别)的第一发光条件,以及外肽酶活性优于亲和试剂活性(例如,以促进氨基酸裂解)的第二发光条件。通过在将反应混合物暴露于第一发光条件(以启动氨基酸识别)和将反应混合物暴露于第二发光条件(以启动氨基酸裂解)之间交替来进行测序反应。作为实例而非限制,在一些实施方案中,两种不同的发光条件包括第一波长和第二波长。[0328]在一些方面,本技术通过评估一种或多种标记的亲和试剂与末端和内部氨基酸的结合相互作用以及标记的非特异性外肽酶与末端氨基酸的结合相互作用提供了实时多肽测序的方法。在一些实施方案中,使用标记的亲和试剂,其在末端和内部位置与一种类型的氨基酸选择性结合和解离。选择性结合在信号输出中产生一系列脉冲。然而,在这种方法中,所述一系列脉冲以由整个多肽中氨基酸类型的数量决定的速率发生。因此,在一些实施方案中,对应于结合事件的脉冲频率将诊断当前存在于多肽中的同源氨基酸的数量。[0329]标记的非特异性肽酶可以以比标记的亲和试剂相对较低的浓度存在,例如,以在裂解事件之间提供最佳时间窗。此外,在某些实施方案中,标记的非特异性肽酶的独特可识别发光标记将指示裂解事件何时发生。随着多肽经历迭代裂解,每当末端氨基酸被标记的非特异性肽酶裂解时,对应于标记的亲和试剂结合的脉冲频率将逐步下降。因此,在一些实施方案中,可以在这种方法中基于脉冲模式和/或基于在裂解事件之间检测到的模式内发生的脉冲频率来鉴定氨基酸并由此对多肽进行测序。[0330]b.通过标记多肽的降解进行测序[0331]在一些方面,本技术提供了通过鉴定对应于已知多肽序列的独特氨基酸组合来对多肽进行测序的方法。在一些实施方案中,所述方法包括检测标记多肽的选择性标记的氨基酸。在一些实施方案中,标记多肽包含经选择性修饰的氨基酸,使得不同的氨基酸类型包含不同的发光标记。如本文所用,除非另有说明,否则标记多肽是指包含一个或多个选择性标记的氨基酸侧链的多肽。选择性标记方法和与标记多肽的制备和分析有关的细节是本领域已知的(参见,例如,swaminathan等人,plos comput biol.2015,11(2):e1004080)。[0332]如本文所述,在一些方面,本技术提供了对多肽进行测序的方法,所述方法通过在多肽降解过程中获得数据,并分析数据以确定与在多肽降解过程中顺序暴露于多肽末端的氨基酸相对应的数据部分。在一些实施方案中,数据的部分包括一系列信号脉冲,指示一种或多种氨基酸识别分子与暴露在多肽末端的连续氨基酸(例如,在降解期间)的关联。在一些实施方案中,所述一系列信号脉冲对应于降解过程种在多肽末端的一系列可逆单分子结合相互作用。[0333]在一些方面,本文所述的多肽测序技术产生的数据表明当多肽被裂解手段(例如,一种或多种裂解试剂)降解时,多肽如何与结合手段(例如,一种或多种氨基酸识别分子)相互作用。如上所讨论的,数据可以包括对应于在末端的裂解事件之间的多肽末端的关联事件的一系列特征模式。在一些实施方案中,本文所述的测序方法包括使单个多肽分子与结合手段和裂解手段接触,其中结合手段和裂解手段被设置为在裂解事件之前实现至少10个关联事件。在一些实施方案中,所述手段被设置为实现两个裂解事件之间的至少10个关联事件。[0334]如本文所述,在一些实施方案中,多个单分子测序反应在样品孔阵列中并行进行。在一些实施方案中,阵列包含约10,000至约1,000,000个样品孔。在一些实施方式中,样品孔的体积可以在约10-21升和约10-15升之间。因为样品孔的体积小,单分子的检测事件可能是可能的,因为在任何给定时间,样品孔内可能只有大约一个多肽。统计上,一些样品孔可能不包含单分子测序反应,而一些样品孔可能包含不止一个单个多肽分子。然而,可观数量的样品孔可以各自包含单分子反应(例如,在一些实施方案中至少30%),从而可以对大量样品孔并行进行单分子分析。在一些实施方案中,结合手段和裂解手段被设置为在裂解事件之前在至少10%(例如,10-50%、超过50%、25-75%、至少80%或更多)的样品孔中实现至少10个关联事件,其中发生单分子反应。在一些实施方案中,结合手段和裂解手段被设置为在裂解事件之前对单分子反应中多肽的至少50%(例如,超过50%、50-75%、至少80%或更多)的氨基酸实现至少10个关联事件。[0335]在一些实施方案中,标记多肽被固定并暴露于激发源。可以检测来自标记多肽的聚集发光,并且在一些实施方案中,随时间暴露于发光可由于发光标记降解(例如,由于光漂白引起的降解)而导致检测信号的损失。在一些实施方案中,标记多肽包含选择性标记的氨基酸的独特组合,其产生初始检测信号。发光标记随时间的降解导致光漂白的标记多肽的检测信号相应降低。在一些实施方案中,可以通过分析一种或多种发光特性(例如,通过发光寿命分析的信号去卷积)对信号进行去卷积。在一些实施方案中,标记多肽的选择性标记的氨基酸的独特组合已经在计算上被预先计算和在经验上被验证——例如,基于蛋白质组的已知多肽序列。在一些实施方案中,将检测到的氨基酸标记的组合与生物体蛋白质组的已知序列数据库进行比较,以鉴定数据库中对应于标记多肽的特定多肽。[0336]在一些实施方案中,确定最佳样品浓度以进行在大规模并行分析中最大化采样的测序反应。在一些实施方案中,选择浓度使得阵列中所需分数(例如,30%)的样品孔在任何给定时间被占据。不希望囿于理论的,认为尽管多肽经一段时间被漂白,相同的孔仍可用于进一步分析。通过扩散,阵列中大约30%的样品孔可用于每3分钟进行一次分析。作为说明性实例,在百万个样品孔芯片中,每小时可以采样6,000,000个多肽,或在4小时阶段内采样24,000,000个多肽。[0337]在一些方面,本技术提供了一种通过检测经受末端氨基酸修饰和裂解的重复循环的标记多肽的发光来对多肽进行测序的方法。在一些实施方案中,对于通过edman降解进行测序的其他方法,所述方法通常如本文所述进行。[0338]在一些实施方案中,所述方法包括(i)修饰标记多肽的末端氨基酸的步骤。如本文别处所述,在一些实施方案中,修饰包括使末端氨基酸与异硫氰酸酯(例如,pitc)接触以形成异硫氰酸酯修饰的末端氨基酸。在一些实施方案中,异硫氰酸酯修饰将末端氨基酸转化为更易于被裂解试剂(例如,如本文所述的化学或酶促裂解试剂)去除的形式。因此,在一些实施方案中,所述方法包括(ii)使用本文别处详述的用于edman降解的化学或酶促方法去除经修饰的末端氨基酸的步骤。[0339]在一些实施方案中,所述方法包括对多个循环重复步骤(i)至(ii),在此期间检测标记多肽的发光,并且可以检测对应于从末端去除标记氨基酸的裂解事件作为检测信号的减少。在一些实施方案中,步骤(ii)之后的信号没有变化鉴定了未知类型的氨基酸。因此,在一些实施方案中,部分序列信息可以通过评估在每个连续轮次中在步骤(ii)之后检测到的信号来确定,通过基于检测到的信号的变化通过确定的同一性指定氨基酸类型或基于检测到的信号没有变化将氨基酸类型鉴定为未知。[0340]在一些方面,根据本技术对多肽进行测序的方法包括通过标记多肽的持续酶促裂解进行测序。在一些实施方案中,使用修饰的进行性外肽酶对标记多肽进行降解,所述修饰的进行性外肽酶从一个末端向另一个末端连续裂解末端氨基酸。外肽酶在本文别处详细描述。在一些实施方案中,标记多肽经受固定化的进行性外肽酶的降解。在一些实施方案中,固定化的标记多肽经受进行性外肽酶的降解。[0341]在一些实施方案中,进行性外肽酶的持续合成速率是已知的,使得检测到的信号降低之间的时序可用于计算每个检测事件之间的未标记氨基酸的数量。例如,如果以每秒去除一个氨基酸的方式裂解40个氨基酸的多肽,则具有3个信号的标记多肽最初会显示所有3个信号,然后是2个信号,然后是1个信号,最后没有信号。以这种方式,可以确定标记氨基酸的顺序。因此,这些方法可用于确定部分序列信息,例如用于基于多肽片段测序的蛋白质组学分析。[0342]在一些实施方案中,单分子多肽测序可以使用基于atp的福斯特共振能量转移(fret)方案(例如,使用一种或多种标记的辅因子)来实现。在一些实施方案中,可以使用固定化的atp依赖性蛋白酶、供体标记的atp和多肽底物的受体标记的氨基酸进行通过基于辅因子的fret的测序。在一些实施方案中,可以用受体标记氨基酸,并且可以用供体标记一种或多种辅因子。[0343]例如,在一些实施方案中,使提取的多肽变性,并且用荧光染料标记半胱氨酸和赖氨酸。在一些实施方案中,使用蛋白质转位酶(例如细菌clpx)的工程化形式与单个底物多肽结合,将它们展开,并通过其纳米通道将它们转位。在一些实施方案中,转位酶用供体染料标记,并且当基质通过纳米通道时,在转位酶上的供体与基质上的两种或更多种不同的受体染料之间发生fret。然后可以根据fret信号确定标记的氨基酸的顺序。在一些实施方案中,可以使用表3中所示的一种或多种以下非限制性标记的atp类似物。[0344]表3.标记的atp类似物的非限制性实例[0345][0346][0347][0348]c.测序样品的制备[0349]可以在测序之前修饰多肽样品(例如,富集的多肽样品)。[0350]在一些实施方案中,多肽的n末端氨基酸或c末端氨基酸被修饰。在一些实施方案中,用能够固定在表面(例如,用于多肽分析的芯片上的样品孔的表面)上的部分来修饰多肽的末端。在一些实施方案中,此类方法包括根据本技术修饰待分析的标记多肽的末端。在其他实施方案中,此类方法包括根据本技术使多肽底物修饰降解或易位的蛋白质或酶的末端。[0351]在一些实施方案中,多肽的羧基末端在包括以下的方法中被修饰:(i)封闭多肽的游离羧酸根基团;(ii)使多肽变性(例如,通过热和/或化学手段);(iii)封闭多肽的游离硫醇基团;(iv)消化多肽以产生至少一个包含游离c末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,化学地)到游离的c末端羧酸根基团上。在一些实施方案中,所述方法进一步包括,在(i)之后和(ii)之前,对包含多肽的样品进行透析。[0352]在一些实施方案中,多肽的羧基末端以包括以下的方法被修饰:(i)使多肽变性(例如,通过热和/或化学手段);(ii)封闭多肽的游离硫醇基团;(iii)消化多肽以产生至少一个包含游离c末端羧酸根基团的多肽片段;(iv)封闭游离的c末端羧酸根基团以产生至少一个包含封闭的c末端羧酸根基团的多肽片段;和(v)将功能部分缀合(例如,酶促地)到封闭的c末端羧酸根基团上。在一些实施方案中,所述方法进一步包括,在(iv)之后和(v)之前,对包含多肽的样品进行透析。[0353]在一些实施方案中,封闭游离羧酸根基团是指这些基团的化学修饰,其相对于未经修饰的羧酸根改变化学反应性。合适的羧酸根封闭方法是本领域已知的,并且应该将侧链羧酸根基团修饰为在化学上不同于待官能化的多肽的羧基末端羧酸根基团。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的酯化或酰胺化。在一些实施方案中,封闭游离羧酸根基团包括多肽的游离羧酸根基团的甲酯化,例如,通过使多肽与甲醇hcl反应。可用于封闭游离羧酸根基团的试剂和技术的其他实例包括但不限于4-磺基-2,3,5,6-四氟苯酚(stp)和/或碳二亚胺例如n-(3-二甲基氨基丙基)-n'-乙基碳二亚胺盐酸盐(edac)、脲试剂、重氮甲烷、用于fischer酯化的醇和酸,使用n-羟基琥珀酰亚胺(nhs)形成nhs酯(可能作为后续酯或胺形成的中间体),或与羰基二咪唑(cdi)反应或形成混合酸酐,或任何其他可能通过形成酯或酰胺来修饰或封闭羧酸的方法。[0354]在一些实施方案中,封闭游离硫醇基团是指这些基团的化学修饰,其相对于未经修饰的硫醇改变化学反应性。在一些实施方案中,封闭游离硫醇基团包括对多肽的游离硫醇基团进行还原和烷基化。在一些实施方案中,通过使多肽与二硫苏糖醇(dtt)以及碘乙酰胺和碘乙酸中的一种或两种接触来进行还原和烷基化。可以使用的另外的和替代的半胱氨酸还原试剂的实例是众所周知的,并且包括但不限于2-巯基乙醇、三(2-羧乙基)膦盐酸盐(tcep)、三丁基膦、二硫丁胺(dtba)或任何能够还原硫醇基团的试剂。可以使用的另外的和替代的半胱氨酸封闭(例如,半胱氨酸烷基化)试剂的实例是众所周知的,并且包括但不限于丙烯酰胺、4-乙烯基吡啶、n-乙基马来酰亚胺(nem)、n-ε-马来酰亚胺基己酸(emc),或任何修饰半胱氨酸以防止二硫键形成的试剂。[0355]在一些实施方案中,消化包括酶促消化。在一些实施方案中,通过在消化条件下使多肽与内肽酶(例如胰蛋白酶)接触来进行消化。在一些实施方案中,消化包括化学消化。用于化学和酶促消化的合适试剂的实例是本领域已知的,并且包括但不限于胰蛋白酶、化学胰蛋白酶、lys-c、arg-c、asp-n、lys-n、bnps-粪臭素、cnbr、半胱天冬酶、甲酸、谷氨酰内肽酶、羟胺、碘代苯甲酸、中性粒细胞弹性蛋白酶、胃蛋白酶、脯氨酸-内肽酶、蛋白酶k、葡萄球菌肽酶i、嗜热菌蛋白酶和凝血酶。[0356]在一些实施方案中,功能部分包含生物素分子。在一些实施方案中,功能部分包含反应性化学部分,例如炔基。在一些实施方案中,缀合功能部分包括如本领域已知的通过羧肽酶y对羧基末端羧甲基酯基团进行生物素化。[0357]在一些实施方案中,将增溶部分添加到多肽中。因此,在一些实施方案中,本文提供的方法和组合物可用于用增加其溶解度的部分修饰多肽的末端。在一些实施方案中,增溶部分可用于由片段化(例如,酶促片段化,例如使用胰蛋白酶)产生并且相对不溶的小多肽。例如,在一些实施方案中,多肽库中的短多肽可以通过将聚合物(例如,短寡核苷酸、糖或其他带电荷的聚合物)缀合至多肽来溶解。[0358]d.发光标记[0359]如本文所用,发光标记是吸收一个或多个光子并且可以随后在一个或多个时段后发射一个或多个光子的分子。在一些实施方案中,该术语可与“标记”或“发光分子”互换使用,这取决于上下文。根据本文所述的某些实施方案的发光标记可以指标记的亲和试剂的发光标记、标记的肽酶(例如标记的外肽酶、标记的非特异性外肽酶)的发光标记、标记的肽的发光标记、标记的辅因子的发光标记或本文所述的另一种标记的组合物。在一些实施方案中,根据本技术的发光标记是指包含一种或多种标记氨基酸的标记多肽的标记氨基酸。[0360]在一些实施方案中,发光标记可以包含第一和第二生色团。在一些实施方案中,第一生色团的激发态能够通过能量转移到第二生色团而弛豫。在一些实施方案中,能量转移是福斯特共振能量转移(fret)。这样的fret对可用于提供具有使标记更容易从混合物中的多个发光标记中区分的性质的发光标记。在其他实施方案中,fret对包含第一发光标记的第一生色团和第二发光标记的第二生色团。在某些实施方案中,fret对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。[0361]在一些实施方案中,发光标记是指荧光团或染料。通常,发光标记包含芳族或杂芳族化合物,并且可以是芘、蒽、萘、萘胺、吖啶、芪、吲哚、苯并吲哚、恶唑、咔唑、噻唑、苯并噻唑、苯并恶唑、菲啶、吩恶嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、氧杂蒽或其他类似化合物。[0362]在一些实施方案中,发光标记包含选自以下中的一种或多种的染料:5/6-羧基罗丹明6g、5-羧基罗丹明6g、6-羧基罗丹明6g、6-tamra、star 440sxp、star 470sxp、star 488、star 512、star 520sxp、star 580、star 600、star 635、star 635p、star red、alexa350、alexa405、alexa430、alexa480、alexa488、alexa514、alexa532、alexa546、alexa555、alexa568、alexa594、alexa610-x、alexa633、alexa647、alexa660、alexa680、alexa700、alexa750、alexa790、amca、atto 390、atto 425、atto 465、atto 488、atto 495、atto 514、atto 520、atto 532、atto 542、atto 550、atto 565、atto 590、atto 610、atto 620、atto 633、atto 647、atto 647n、atto 655、atto 665、atto 680、atto 700、atto 725、atto 740、atto oxa12、atto rho101、atto rho11、atto rho12、atto rho13、atto rho14、atto rho3b、atto rho6g、atto thio12、bd horizontmv450、493/501、530/550、558/568、564/570、576/589、581/591、630/650、650/665、fl、fl-x、r6g、tmr、tr、calgold 540、calgreen 510、calorange 560、calred 590、calred 610、calred 615、calred 635、blue、cftm350、cftm405m、cftm405s、cftm488a、cftm514、cftm532、cftm543、cftm546、cftm555、cftm568、cftm594、cftm620r、cftm633、cftm633-v1、cftm640r、cftm640r-v1、cftm640r-v2、cftm660c、cftm660r、cftm680、cftm680r、cftm680r-v1、cftm750、cftm770、cftm790、chromeotm642、chromis 425n、chromis 500n、chromis 515n、chromis 530n、chromis 550a、chromis 550c、chromis 550z、chromis 560n、chromis 570n、chromis 577n、chromis 600n、chromis 630n、chromis 645a、chromis 645c、chromis 645z、chromis 678a、chromis 678c、chromis 678z、chromis 770a、chromis 770c、chromis 800a、chromis 800c、chromis 830a、chromis 830c、3、3.5、3b、5、5.5、7、350、405、415-co1、425q、485-ls、488、504q、510-ls、515-ls、521-ls、530-r2、543q、550、554-r0、554-r1、590-r2、594、610-b1、615-b2、633、633-b1、633-b2、650、655-b1、655-b2、655-b3、655-b4、662q、675-b1、675-b2、675-b3、675-b4、679-c5、680、683q、690-b1、690-b2、696q、700-b1、700-b1、730-b1、730-b2、730-b3、730-b4、747、747-b1、747-b2、747-b3、747-b4、755、766q、775-b2、775-b3、775-b4、780-b1、780-b2、780-b3、800、830-b2、dyomics-350、dyomics-350xl、dyomics-360xl、dyomics-370xl、dyomics-375xl、dyomics-380xl、dyomics-390xl、dyomics-405、dyomics-415、dyomics-430、dyomics-431、dyomics-478、dyomics-480xl、dyomics-481xl、dyomics-485xl、dyomics-490、dyomics-495、dyomics-505、dyomics-510xl、dyomics-511xl、dyomics-520xl、dyomics-521xl、dyomics-530、dyomics-547、dyomics-547p1、dyomics-548、dyomics-549、dyomics-549p1、dyomics-550、dyomics-554、dyomics-555、dyomics-556、dyomics-560、dyomics-590、dyomics-591、dyomics-594、dyomics-601xl、dyomics-605、dyomics-610、dyomics-615、dyomics-630、dyomics-631、dyomics-632、dyomics-633、dyomics-634、dyomics-635、dyomics-636、dyomics-647、dyomics-647p1、dyomics-648、dyomics-648p1、dyomics-649、dyomics-649p1、dyomics-650、dyomics-651、dyomics-652、dyomics-654、dyomics-675、dyomics-676、dyomics-677、dyomics-678、dyomics-679p1、dyomics-680、dyomics-681、dyomics-682、dyomics-700、dyomics-701、dyomics-703、dyomics-704、dyomics-730、dyomics-731、dyomics-732、dyomics-734、dyomics-749、dyomics-749p1、dyomics-750、dyomics-751、dyomics-752、dyomics-754、dyomics-776、dyomics-777、dyomics-778、dyomics-780、dyomics-781、dyomics-782、dyomics-800、dyomics-831、450、伊红、fitc、荧光素、hilytetmfluor 405、hilytetmfluor 488、hilytetmfluor 532、hilytetmfluor 555、hilytetmfluor 594、hilytetmfluor 647、hilytetmfluor 680、hilytetmfluor 750、680lt、750、800cw、joe、640r、red 610、red 640、red 670、red 705、丽丝胺罗丹明b、napthofluorescein、oregon488、oregon514、pacific bluetm、pacific greentm、pacific orangetm、pet、pf350、pf405、pf415、pf488、pf505、pf532、pf546、pf555p、pf568、pf594、pf610、pf633p、pf647p、570、670、705、罗丹明123、罗丹明6g、罗丹明b、罗丹明绿、罗丹明绿-x、罗丹明红、rox、setatm375、setatm470、setatm555、setatm632、setatm633、setatm650、setatm660、setatm670、setatm680、setatm700、setatm750、setatm780、setatmapc-780、setatmpercp-680、setatmr-pe-670、setatm646、setau 380、setau 425、setau 647、setau 405、square 635、square 650、square 660、square 672、square 680、磺酰罗丹明101、tamra、tet、texastmr、tritc、yakima yellowtm、zy3、zy5、zy5.5和zy7。[0363]e.发光[0364]在一些方面,本技术涉及基于发光标记的一种或多种发光特性的多肽测序和/或鉴定。在一些实施方案中,基于发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其两种或更多种的组合来鉴定发光标记。在一些实施方案中,多种类型的发光标记可以基于不同的发光寿命、发光强度、亮度、吸收光谱、发射光谱、发光量子产率或其中两种或更多种的组合而彼此区分。鉴定可以指指定与发光标记相关的一种类型的氨基酸(例如,单一类型或类型的子集)的确切身份和/或数量,并且还可以指指定多肽中氨基酸相对于其他类型的氨基酸的位置。[0365]在一些实施方案中,通过将发光标记暴露于一系列单独的光脉冲并评估从标记发射的每个光子的时序或其他特性来检测发光。在一些实施方案中,从标记顺序发射的多个光子的信息被聚集和评估以鉴定标记并由此鉴定相关类型的氨基酸。在一些实施方案中,标记的发光寿命由从标记顺序发射的多个光子确定,并且发光寿命可用于鉴定标记。在一些实施方案中,标记的发光强度由从标记顺序发射的多个光子确定,并且发光强度可用于鉴定标记。在一些实施方案中,标记的发光寿命和发光强度由从标记顺序发射的多个光子确定,并且发光寿命和发光强度可用于鉴定标记。[0366]在本技术的一些方面,将单个多肽分子暴露于多个单独的光脉冲,并检测和分析一系列发射光子。在一些实施方案中,所述一系列发射光子提供了关于存在的并且在实验期间在反应样品中不改变的单个多肽分子的信息。然而,在一些实施方案中,所述一系列发射光子提供关于在反应样品中在不同时间(例如,随着反应或过程进行)存在的一系列不同分子的信息。作为实例而非限制,此类信息可用于根据本技术对经受化学或酶促降解的多肽进行测序和/或鉴定。[0367]在某些实施方案中,发光标记吸收一个光子并在一个时段后发射一个光子。在一些实施方案中,可以通过测量所述时段来确定或估计标记的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段来确定或估计标记的发光寿命。在一些实施方案中,可以通过测量时段在多种类型的标记的发光寿命中区分标记的发光寿命。在一些实施方案中,可以通过测量多个脉冲事件和发射事件的多个时段在多种类型的标记的发光寿命中区分标记的发光寿命。在某些实施方案中,通过确定或估计标记的发光寿命在多种类型的标记中鉴定或区分标记。在某些实施方案中,通过在多种类型的标记的多种发光寿命中区分标记的发光寿命,在多种类型的标记中鉴定或区分标记。[0368]可以使用任何合适的方法(例如,通过使用合适的技术测量寿命或通过确定发射的时间相关特性)来确定发光标记的发光寿命。在一些实施方案中,确定一个标记的发光寿命包括确定相对于另一标记的寿命。在一些实施方案中,确定标记的发光寿命包括确定相对于参照的寿命。在一些实施方案中,确定标记的发光寿命包括测量寿命(例如荧光寿命)。在一些实施方案中,确定标记的发光寿命包括确定一种或多种指示寿命的时间特性。在一些实施方案中,可以基于多个发射事件(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100或更多个发射事件)发生在相对于激发脉冲的一个或多个时间门控窗口的分布来确定标记的发光寿命。例如,可以基于关于激发脉冲测量的光子到达时间的分布将标记的发光寿命与具有不同发光寿命的多个标记区分开来。[0369]应当理解,发光标记的发光寿命指示在标记达到激发态之后发射的光子的时序,并且可以通过指示光子的时序的信息来区分标记。一些实施方案可以包括基于标记的发光寿命通过测量与所述标记发射的光子相关联的时间来区分标记与多个标记。时间分布可以提供发光寿命的指示,该指示可以从分布中确定。在一些实施方案中,可以基于时间分布区分标记与多个标记,例如通过将时间分布与对应于已知标记的参照分布进行比较。在一些实施方案中,发光寿命的值由时间分布确定。[0370]如本文所用,在一些实施方案中,发光强度是指每单位时间由发光标记发射的发射光子的数量,该发光标记通过递送脉冲激发能量而被激发。在一些实施方案中,发光强度是指每单位时间检测到的发射光子的数量,这些光子由通过脉冲激发能量的递送而被激发的标记发射并且由特定传感器或传感器组检测。[0371]如本文所用,在一些实施方案中,亮度是指报告每个发光标记的平均发射强度的参数。因此,在一些实施方案中,“发射强度”可用于一般指包含一种或多种标记的组合物的亮度。在一些实施方案中,标记的亮度等于其量子产率和消光系数的乘积。[0372]如本文所用,在一些实施方案中,发光量子产率是指在给定波长或在给定光谱范围内导致发射事件的激发事件的分数,并且通常小于1。在一些实施方案中,本文所述的发光标记的发光量子产率在0和约0.001之间、在约0.001和约0.01之间、在约0.01和约0.1之间、在约0.1和约0.5之间、在约0.5和0.9之间或在约0.9和1之间。在一些实施方案中,通过确定或估计发光量子产率来鉴定标记。[0373]如本文所用,在一些实施方案中,激发能量是来自光源的光脉冲。在一些实施方案中,激发能量在可见光谱中。在一些实施方案中,激发能量在紫外光谱中。在一些实施方案中,激发能量在红外光谱中。在一些实施方案中,激发能量处于或接近发光标记的吸收最大值,从该发光标记中检测多个发射光子。在某些实施方案中,激发能量在约500nm和约700nm之间(例如,在约500nm和约600nm之间、在约600nm和约700nm之间、在约500nm和约550nm之间、在约550nm和约600nm之间、在约600nm和约650nm之间或在约650nm和约700nm之间)。在某些实施方案中,激发能量可以是单色的或限制在光谱范围内。在一些实施方案中,光谱范围具有约0.1nm至约1nm、约1nm至约2nm或约2nm至约5nm的范围。在一些实施方案中,光谱范围具有约5nm至约10nm、约10nm至约50nm或约50nm至约100nm的范围。[0374]v.用于样品制备的试剂盒[0375]在一些方面,本公开涉及用于制备用于测序的多肽样品(例如,多重样品)的试剂盒。试剂盒可能足以制备用于测序的一个或多个多肽样品(例如,多重样品)。在一些实施方案中,试剂盒足以制备单个多肽样品。在其他实施方案中,试剂盒足以制备至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90或至少100个多肽样品。[0376]在一些实施方案中,试剂盒包含如本文所述的包含多个条形码分子的条形码组分。参见“制备多重样品的方法”。在一些实施方案中,试剂盒包含如本文所述的一种或多种检测分子。参见“制备多重样品的方法”。在一些实施方案中,试剂盒包含如本文所述的允许物理分离不同来源的多肽群的固体支持物。参见“制备多重样品的方法”。在一些实施方案中,试剂盒包含如本文所述的包含多个富集分子的富集组分。参见“多肽富集方法”。在一些实施方案中,试剂盒包含如本文所述的修饰剂。参见“多肽富集方法”。在一些实施方案中,试剂盒包含如本文所述的亲和试剂。参见“多肽测序方法”。在一些实施方案中,试剂盒包含如本文所述的标记的肽酶。参见“多肽测序方法”。[0377]试剂盒可以对一种或多种生物体(例如,一种或多种单细胞和/或多细胞生物体)是特异性的。在一些实施方案中,试剂盒包含修饰一种或多种生物体的多肽、与其结合、被其结合等的组分(例如,条形码分子、检测分子、富集分子或其组合)。例如,在一些实施方案中,试剂盒包含修饰人类蛋白质组中的一种或多种已知多肽、与其结合、被其结合等的组分。[0378]在一些实施方案中,试剂盒对一种或多种疾病或病况具有特异性。例如,试剂盒可以是肿瘤学试剂盒、心脏病学试剂盒、遗传性疾病试剂盒或其组合。肿瘤学试剂盒可以包含与abl1、abl2、acsl3、acvr2a、adamts20、adgra2、adgrb3、adgrl3、aff1、aff3、akap9、akt1、akt2、akt3、alk、amer1、apc、ar、arid1a、arid2、arnt、asxl1、atf1、atm、atr、atrx、aurka、aurkb、aurkc、axl、bap1、bcl10、bcl11a、bcl11b、bcl2、bcl2l1、bcl2l2、bcl3、bcl6、bcl7a、bcl9、bcr、birc2、birc3、birc5、blm、blnk、bmpr1a、braf、brca1、brca2、brd3、brip1、btk、bub1b、cacna1d、card11、casc5、casp8、cbfa2t3、cbfb、cbl、ccnd1、ccnd2、ccne1、cd79a、cd79b、cdc73、cdh1、cdh11、cdh2、cdh20、cdh5、cdk12、cdk4、cdk6、cdk8、cdkn2a、cdkn2b、cdkn2c、cebpa、chek1、chek2、cic、cks1b、cmpk1、col1a1、crbn、creb1、crebbp、crkl、crlf2、crtc1、csf1r、csmd3、ctnna1、ctnnb1、cyld、cyp2c19、cyp2d6、daxx、dcc、ddb2、ddit3、ddr2、dek、dicer1、dnmt3a、dpyd、dst、egfr、eml4、ep300、ep400、epha3、epha7、ephb1、ephb4、ephb6、erbb2、erbb3、erbb4、ercc1、ercc2、ercc3、ercc4、ercc5、erg、esr1、ets1、etv1、etv4、ext1、ext2、ezh2、fanca、fancc、fancd2、fancf、fancg、fas、fbxw7、fcgr2b、fgfr1、fgfr2、fgfr3、fgfr4、fh、flcn、fli1、flt1、flt3、flt4、fn1、foxa1、foxl2、foxo1、foxo3、foxp1、foxp4、fzr1、g6pd、gata1、gata2、gata3、gdnf、gna11、gnaq、gnas、gpc3、grm8、gucy1a2、hcar1、hey1、hif1a、hist1h3b、hlf、hmga1、hnf1a、hook3、hoxa13、hoxd11、hras、hsp90aa1、hsp90ab1、ick、idh1、idh2、igf1r、igf2、igf2r、ikbkb、ikbke、ikzf1、il2、il21r、il6st、il7r、ing4、irf4、irs2、itga10、itga9、itgb2、itgb3、jak1、jak2、jak3、jun、kat6a、kat6b、kdm5c、kdm6a、kdr、keap1、kiaa1549、kit、klf6、kmt2a、kmt2c、kmt2d、kras、lamp1、lck、lifr、lpp、lrp1b、ltf、ltk、maf、mafb、magea1、magi1、malt1、maml2、map2k1、map2k2、map2k4、map3k7、mapk1、mapk8、mark1、mark4、mbd1、mcl1、mdm2、mdm4、men1、met、mitf、mlh1、mllt10、mllt4、mllt6、mmp2、mn1、mpl、mre11a、msh2、msh6、mtcp1、mtor、mtr、mtrr、muc1、mutyh、myb、myc、mycl、mycn、myd88、myh11、myh9、nbn、ncoa1、ncoa2、ncoa4、nf1、nf2、nfe2l2、nfkb1、nfkb2、nin、nkx2-1、nlrp1、notch1、notch2、notch4、npm1、nr4a3、nras、nsd1、ntrk1、ntrk3、numa1、nup214、nup98、nutm2a、nutm2b、omd、p2ry8、pak3、palb2、parp1、pax3、pax5、pax7、pax8、pbrm1、pbx1、pde4dip、pdgfb、pdgfra、pdgfrb、per1、pgap3、phox2b、pik3c2b、pik3ca、pik3cb、pik3cd、pik3cg、pik3r1、pik3r2、pim1、pkhd1、plag1、plcg1、plekhg5、pml、pms1、pms2、pot1、pou5f1、pparg、ppp2r1a、prdm1、prkar1a、prkdc、psip1、ptch1、pten、ptgs2、ptpn11、ptprd、ptprt、rad50、raf1、ralgds、rap1gds1、rara、rb1、recql4、rel、ret、rhoh、rnasel、rnf2、rnf213、ros1、rps6ka2、rrm1、runx1、runx1t1、samd9、sbds、sdha、sdhb、sdhc、sdhd、set、setbp1、setd2、sf3b1、sgk1、sh2d1a、sh3gl1、smad2、smad4、smarca4、smarcb1、smo、smug1、socs1、sox11、sox2、src、ssx1、ssx2、ssx4、stat5b、stk11、stk36、sufu、syk、syne1、taf1、taf1l、tal1、tbl1xr1、tbx22、tcf12、tcf3、tcf7l1、tcf7l2、tcl1a、tert、tet1、tet2、tfe3、tgfbr2、tgm7、thbs1、timp3、tlr4、tlx1、tmprss2、tnfaip3、tnfrsf14、tnk2、top1、tp53、tpr、trim24、trim33、trip11、trrap、tsc1、tsc2、tshr、ttl、ubr5、ugt1a1、usp9x、vhl、was、whsc1、wrn、wt1、xpa、xpc、xpo1、xrcc2、znf384、znf521或其任意组合结合(或被其结合)的富集分子。[0379]心脏病学试剂盒可以包含与abcc9、abcg5、abcg8、acta1、acta2、actc1、actn2、akap9、alms1、ank2、ankrd1、apoa4、apoa5、apob、apoc2、apoe、bag3、braf、cacna1c、cacna2d1、cacnb2、calm1、calr3、casq2、cav3、cbl、cbs、cetp、col3a1、col5a1、col5a2、cox15、creb3l3、creld1、cryab、csrp3、ctf1、des、dmd、dnajc19、dolk、dpp6、dsc2、dsg2、dsp、dtna、efemp2、eln、emd、eya4、fbn1、fbn2、fhl1、fhl2、fkrp、fktn、fxn、gaa、gatad1、gckr、gja5、gla、gpd1l、gpihbp1、hadha、hcn4、hfe、hras、hspb8、ilk、jag1、jph2、jup、kcna5、kcnd3、kcne1、kcne2、kcne3、kcnh2、kcnj2、kcnj5、kcnj8、kcnq1、klf10、kras、lama2、lama4、lamp2、ldb3、ldlr、ldlrap1、lmf1、lmna、lpl、ltbp2、map2k1、map2k2、mib1、murc、mybpc3、myh11、myh6、myh7、myl2、myl3、mylk、mylk2、myo6、myoz2、mypn、nexn、nkx2-5、nodal、notch1、nppa、nras、pcsk9、pdlim3、pkp2、pln、prdm16、prkag2、prkar1a、ptpn11、raf1、rangrf、rbm20、ryr1、ryr2、sall4、scn1b、scn2b、scn3b、scn4b、scn5a、sco2、sdha、sepn1、sgcb、sgcd、sgcg、shoc2、slc25a4、slc2a10、smad3、smad4、snta1、sos1、srebf2、taz、tbx20、tbx3、tbx5、tcap、tgfb2、tgfb3、tgfbr1、tgfbr2、tmem43、tmpo、tnnc1、tnni3、tnnt2、tpm1、trdn、trim63、trpm4、ttn、ttr、txnrd2、vcl、zbtb17、zhx3和/或zic3结合(或被其结合)的富集分子。[0380]遗传性疾病试剂盒可以包含与abca4、abcc9、abcd1、acadvl、acta2、actc1、actn2、ada、aipl1、aire、akap9、alpl、amt、ank2、apc、app、aptx、arl6、arsa、asl、aspa、atl1、atm、atp2a2、atp7a、atp7b、atxn1、atxn2、atxn7、bag3、bckdha、bckdhb、best1、bmpr1a、btd、btk、ca4、cacna1c、cacnb2、calr3、capn3、casq2、cav3、ccdc39、ccdc40、cdh23、cep290、cerkl、cftr、chat、chd7、chek2、chm、chrna1、chrnb1、chrnd、chrne、clcn1、cngb1、col11a1、col11a2、col1a1、col1a2、col2a1、col3a1、col4a1、col4a5、col5a1、col5a2、col7a1、col9a1、crb1、crx、ctdp1、ctns、cyp27a1、dbt、dcx、des、dhcr7、dkc1、dld、dmd、dnah11、dnah5、dnah9、dnai1、dnai2、dnm2、dok7、dsc2、dsg2、dsp、dysf、eln、emd、eng、ext1、eya1、eys、f8、f9、fanca、fancc、fancf、fancg、fbn1、fbxo7、fgfr1、fgfr3、fmo3、foxl2、frg1、frmd7、fscn2、fxn、gaa、galt、gata4、gba、gbe1、gcsh、gdf5、gjb2、gjb3、gjb6、gla、gldc、gne、gnptab、gpc3、gpd1l、gpr143、gucy2d、hba2、hbb、hcn4、hexa、hfe、hibch、hmbs、hr、ids、idua、ikbkap、il2rg、impdh1、itgb4、jag1、jup、kcne1、kcne2、kcne3、kcnh2、kcnj2、kcnq1、kcnq4、kiaa0196、klhl7、kras、krt14、krt5、l1cam、lamb3、lamp2、ldb3、lmna、lrat、lrrk2、mapt、mc1r、mecp2、med12、men1、mertk、mfn2、mlh1、mmaa、mmab、mmachc、mpz、msh2、mtm1、mut、mybpc3、myh11、myh6、myh7、myl2、myl3、mylk、myo7a、myoz2、nf1、nf2、nipbl、nkx2-5、nme8、npc1、npc2、nr2e3、nras、nsd1、oca2、ocrl、otc、pabpn1、pafah1b1、pah、pax3、pax6、pcdh15、pex1、pex10、pex13、pex14、pex19、pex26、pex3、pex5、pink1、pkd1、pkd2、pkhd1、pkp2、plec、pln、plod1、pmm2、pmp22、polg、ppt1、prcd、prkag2、prom1、prpf31、prpf8、prph2、psen1、psen2、ptch1、ptpn11、raf1、rag1、rag2、rai1、rapsn、rb1、rdh12、ret、rho、ror2、rp9、rpe65、rpgr、rpgrip1、rpl11、rpl35a、rps10、rps19、rps24、rps26、rps6ka3、rps7、rs1、rsph4a、rsph9、ryr1、ryr2、sall4、scn1b、scn3b、scn4b、scn5a、scn9a、sema4a、serpina1、serping1、sgcd、sh3bp2、six1、six5、slc25a13、slc25a4、slc26a4、smad3、smad4、snca、snrnp200、snta1、sod1、sos1、sox9、spata7、spg7、stard3、taf1、taz、tbx5、tcof1、tgfbr1、tgfbr2、tmem43、tnnc1、tnni3、tnnt1、tnnt2、tnxb、topors、tp53、tpm1、tsc1、tsc2、ttpa、ttr、tulp1、twist1、tyr、ush1c、ush2a、vcl、vhl、was、wrn、wt1或其任意组合结合(或被其结合)的富集分子。[0381]在一些实施方案中,试剂盒中的至少一种组分以干燥或冻干形式提供。在其他实施方案中,试剂盒的至少一种组分以溶解的形式提供。[0382]本文提供的试剂盒采用合适的包装。合适的包装包括但不限于小瓶、瓶子、罐子、软包装等。还考虑了与特定装置结合使用的包装。参见“用于样品制备和样品测序的装置”。试剂盒可以具有无菌入口(例如,容器可以是具有可被皮下注射针刺穿的塞子的静脉注射溶液袋或小瓶)。容器还可以具有无菌入口。[0383]试剂盒任选地可以提供另外的部件,例如缓冲液和解释信息。在一些实施方案中,试剂盒进一步包含至少一种缓冲液。适用于本文所述的方法的缓冲液先前已描述。在一些实施方案中,试剂盒可以另外包含在本文所述的任何方法中使用的说明。[0384]在一些实施方案中,本公开提供了包含上述试剂盒内容物的制品。[0385]vi.用于样品制备和样品测序的装置[0386]在一些方面,本公开涉及用于样品制备和/或样品测序的装置。在一些实施方案中,所述装置包括样品制备模块。在一些实施方案中,所述装置包括样品测序模块。在一些实施方案中,所述装置包括样品制备模块和样品测序模块。[0387]a.用于样品制备的装置[0388]通常提供在制备用于分析的样品的过程中使用的包括装置、盒(例如,包含通道(例如,微流体通道))和/或泵(例如,蠕动泵)的装置。根据本公开,可以使用装置来使来自生物样品的靶分子的富集、浓缩、操作和/或检测成为可能。在一些实施方案中,提供了用于自动处理样品以产生用于下一代测序和/或其他下游分析技术的材料的装置和相关方法。装置和相关方法可用于执行化学和/或生物反应,包括根据本文别处描述的样品制备或样品分析过程的核酸和/或多肽加工反应。[0389]在一些实施方案中,设置样品制备装置以将靶分子或包含多个分子(例如,靶核酸或靶多肽)的样品递送或转移至测序模块或装置。在一些实施方案中,样品制备装置直接连接到(例如,物理连接到)或间接连接到测序装置。[0390]在一些实施方案中,装置包括序列制备模块,其被设置为接收一个或多个盒。在一些实施方案中,盒包括一个或多个储存器或反应容器,其被设置为接收流体和/或包含在样品制备过程中使用的一种或多种试剂。在一些实施方案中,盒包含一个或多个通道(例如,微流体通道),其被设置为容纳和/或传输在样品制备过程中使用的流体(例如,包含一种或多种试剂的流体)。试剂包括缓冲液、酶促试剂、聚合物基质、条形码组分(例如,条形码分子)、检测分子、富集分子、捕获试剂、尺寸特异性选择试剂、序列特异性选择试剂和/或纯化试剂。在样品制备过程中使用的其他试剂在本文别处描述。[0391]在一些实施方案中,盒包括一种或多种(例如,适合重构为液体形式的液体或冻干形式的)储存试剂。盒的存储试剂包括适合于执行所需过程的试剂和/或适合于处理所需样品类型的试剂。在一些实施方案中,盒是单次使用的盒(例如,一次性盒)或多次使用的盒(例如,可重复使用的盒)。在一些实施方案中,盒被设置为接收用户提供的样品。用户提供的样品可以在装置接收所述盒之前或之后被添加到所述盒中,例如,由用户手动或以自动化过程。[0392]在一些实施方案中,所述装置可有助于在根据本公开的方法中制备多重样品。参见“制备多重样品的方法”。[0393]在一些实施方案中,所述装置可有助于在根据本公开的方法中靶分子的富集。参见“多肽富集方法”。以这种方式,所述装置能够利用分子以高度多重的方式富集目的多肽。[0394]在一些实施方案中,使用电泳方法富集样品中的靶分子。在一些实施方案中,使用亲和力scoda富集样品中的靶分子。在一些实施方案中,使用反转场凝胶电泳(fige)富集样品中的靶分子。在一些实施方案中,使用脉冲场凝胶电泳(pfge)富集样品中的靶分子。[0395]在一些实施方案中,装置包含样品制备模块,所述样品制备模块包含在富集过程中使用的基质(例如,多孔介质、电泳聚合物凝胶),所述基质包含固定化的捕获探针,所述捕获探针与样品中存在的靶分子(直接或间接)结合。在一些实施方案中,在富集过程中使用的基质包含1、2、3、4、5或更多个独特的固定化的捕获探针,每个探针结合独特靶分子和/或以不同的结合亲和力结合相同的靶分子。[0396]在一些实施方案中,固定化的捕获探针是与靶多肽或多肽片段结合的多肽捕获探针。例如,在一些实施方案中,固定化的捕获探针是如本文所述的富集分子。[0397]在一些实施方案中,多肽捕获探针以10-9至10-8m、10-8至10-7m、10-7至10-6m、10-6至10-5m、10-5至10-4m、10-4至10-3m或10-3至10-2m的结合亲和力与靶多肽(或多肽片段)结合。在一些实施方案中,结合亲和力在皮摩尔至纳摩尔范围内(例如,在约10-12和约10-9m之间)。在一些实施方案中,结合亲和力在纳摩尔至微摩尔范围内(例如,在约10-9和约10-6m之间)。在一些实施方案中,结合亲和力在微摩尔至毫摩尔范围内(例如,在约10-6和约10-3m之间)。在一些实施方案中,结合亲和力在皮摩尔至微摩尔范围内(例如,在约10-12和约10-6m之间)。在一些实施方案中,结合亲和力在纳摩尔至毫摩尔范围内(例如,在约10-9和约10-3m之间)。[0398]在一些实施方案中,固定化的捕获探针是与靶核酸杂交的寡核苷酸捕获探针。在一些实施方案中,寡核苷酸捕获探针与靶核酸至少50%、60%、70%、80%、90%、95%或100%互补。在一些实施方案中,单个寡核苷酸捕获探针可用于富集具有至少50%、60%、70%、80%、90%、95%或99%的序列同一性的多个相关靶核酸(例如,2、3、4、5、6、7、8、9、10、20、30、40、50或更多个相关靶核酸)。多种相关靶核酸的富集可以允许产生宏基因组文库。在一些实施方案中,寡核苷酸捕获探针可以实现相关靶核酸的差异富集。在一些实施方案中,寡核苷酸捕获探针可以实现靶核酸相对于与其修饰状态(例如甲基化状态、乙酰化状态)不同的相同序列核酸的富集。[0399]在一些实施方案中,为了富集长度为0.5-2k碱基的核酸靶分子,寡核苷酸捕获探针可以使用5’acrydite部分被共价固定在丙烯酰胺基质中。在一些实施方案中,为了富集更大的核酸靶分子(例如,长度》2k碱基),寡核苷酸捕获探针可以被固定在琼脂糖基质中。在一些实施方案中,寡核苷酸捕获探针可以使用硫醇-环氧化物化学(例如,通过将硫醇修饰的寡核苷酸共价连接到交联的琼脂糖珠粒)固定在琼脂糖基质中。连接到琼脂糖珠粒的寡核苷酸捕获探针可以在标准琼脂糖基质(例如,以相同的琼脂糖百分比)中结合和固化。[0400]在一些实施方案中,多种捕获探针(例如,多种捕获探针类型的群体,例如,与诸如腺病毒、葡萄球菌、肺炎或结核病等传染原的确定性靶分子结合的群体)可以被固定在富集基质中。将样品应用于具有多个确定性捕获探针的富集基质可能会导致疾病或病况的诊断(例如,存在传染原)。[0401]在一些实施方案中,在根据本公开的方法中,在去除非靶分子之后,装置可以有助于靶分子从富集基质中的释放。在一些实施方案中,可以通过增加富集基质的温度从富集基质中释放靶分子。调整基质的温度会进一步影响迁移速率,因为升高的温度会提供更高的捕获探针严格性,从而需要靶分子和捕获探针之间更大的结合亲和力。在一些实施方案中,在富集相关靶分子时,可以逐步提高基质温度,从而以逐步增加同源性来释放和分离靶分子。这可以允许对与初始参考靶分子的关系越来越远的靶多肽或靶核酸进行测序,从而能够发现新的蛋白质(例如,酶)或功能(例如,酶促功能或基因功能)。在一些实施方案中,当使用多个捕获探针(例如,多个确定性捕获探针)时,基质温度可以逐步或以梯度方式增加,允许不同靶分子的温度依赖性释放并导致产生一系列条形码释放带,其代表存在或不存在控制分子和目标分子。[0402]根据本公开的装置通常包含机械和电子和/或光学部件,其可用于操作如本文所述的盒。在一些实施方案中,装置部件运行以在盒上或在盒的特定区域上实现和维持特定温度。在一些实施方案中,装置部件运行以向盒的电极施加特定时长的特定电压。在一些实施方案中,装置部件运行以将液体移入、移出盒的储存器和/或反应容器或移至盒的储存器和/或反应容器之间。在一些实施方案中,装置部件运行以将液体移动通过盒的通道,例如,移入、移出盒的储存器和/或反应容器或移至盒的储存器和/或反应容器之间。在一些实施方案中,装置部件通过与盒的弹性体、试剂特异性储存器或反应容器相互作用的蠕动泵送机构(例如,装置)移动液体。在一些实施方案中,装置部件通过蠕动泵送机构(例如,装置)移动液体,所述蠕动泵送机构被设置为与与盒的通道相关联的弹性体部件(例如,包括弹性体的表面层)相互作用以泵送流体通过通道。装置部件可以包括计算机资源,例如,用于驱动可以输入样品信息、可以选择特定过程以及可以报告运行结果的用户界面。[0403]以下非限制性实例旨在说明本文所述的装置、方法和组合物的方面。根据本公开的样品制备装置的使用可以进行以下描述的步骤中的一个或多个。用户可以打开装置的盖子并插入支持所需过程的盒。然后,用户可以将可以与特定裂解溶液结合的样品添加到盒上的样品端口。然后,用户可以关闭装置盖子,通过装置上的触摸屏界面输入任何样品特定信息,选择任何过程特定参数(例如,所需大小选择的范围、靶分子捕获所需的同源度等),并启动样品制备过程运行。[0404]运行后,用户可能会收到相关的运行数据(例如,运行成功完成的确认、运行特定指标等)以及过程特定信息(例如,生成的样本量、特定靶序列的存在或不存在等)。通过运行生成的数据可以进行后续的生物信息学分析,该分析可以是本地的或基于云的。根据进程,可以从盒中提取完成的样本以供后续使用(例如,基因组测序、qpcr定量、克隆等)。然后可以打开该装置,然后可以取出盒。[0405]图10提供了描绘用于制备样品(例如,富集或多重样品)的示例性装置的图示。参见例如美国专利号8608929,其全部内容通过引用的方式并入本文。[0406]b.测序装置[0407]通常还提供包括在对包含多肽的样品(例如,多重样品)进行测序的过程中使用的装置、盒(例如,包含通道(例如,微流体通道))和/或泵(例如,蠕动泵)的装置。在一些方面,可以使用允许单分子分析和/或单分子测序并行的系统来进行根据本公开的核酸或多肽的测序。所述系统可以包括测序装置和被设置为与测序装置接口的仪器。[0408]测序装置可以包括包含像素阵列的测序模块,其中各个像素包括样品孔和至少一个光检测器。测序装置的样品孔可以形成在测序装置的表面上或穿过测序装置的表面,并且被设置为接收放置在测序装置表面上的样品。在一些实施方案中,样品孔是可以被插入装置中的盒(例如,一次性或单次使用的盒)的部件。总的来说,样品孔可以被认为是样品孔的阵列。多个样品孔可以具有合适的尺寸和形状,使得样品孔的至少一部分接收单个靶分子或包含多个分子(例如,靶核酸或靶多肽)的样品。在一些实施方案中,样品孔内的分子数量可以分布在测序装置的样品孔中,使得一些样品孔包含一个分子(例如,靶核酸或靶多肽),而其他样品孔包含零个、两个或更多个分子。[0409]在一些实施方案中,测序装置设置在从样品制备装置接收包含多个分子(例如,一种或多种目的多肽)的样品的位置。在一些实施方案中,测序装置直接连接(例如,物理连接到)或间接连接到样品制备装置。[0410]测序装置可以包括像素阵列,其中各个像素包括样品孔和至少一个光检测器。测序装置的样品孔可以形成在测序装置的表面上或穿过测序装置的表面,并且被设置为接收放置在测序装置表面上的样品。总的来说,样品孔可以被认为是样品孔的阵列。多个样品孔可以具有合适的尺寸和形状,使得样品孔的至少一部分接收单个样品(例如,单个分子,例如多肽)。在一些实施方案中,样品孔内的样品数量可以分布在测序装置的样品孔中,使得一些样品孔包含一个样品,而其他样品孔包含零个、两个或更多个样品。[0411]从一个或多个光源向测序装置提供激发光,所述光源可以在测序装置的外部或内部。测序装置的光学部件可以接收来自光源的激发光并将光引导到测序装置的样品孔阵列并照亮样品孔内的照明区域。在一些实施方案中,样品孔可以具有允许样品保持在样品孔表面附近的构造,这可以容易地将激发光递送到样品和检测来自样品的发射光。位于照明区域内的样品可以响应于被激发光照亮而发射光。例如,可以用荧光标志物标记样品,所述荧光标志物响应于通过激发光的照射实现激发态而发射光。由样品发射的发射光然后可以由对应于样品孔的像素内的一个或多个光检测器检测,其中样品被分析。根据一些实施方案,当在数量范围可以在大约10,000像素到1,000,000像素之间的样品孔阵列上执行时,可以并行分析多个样品。[0412]测序装置可以包括用于接收激发光并将激发光引导到样品孔阵列之间的光学系统。光学系统可以包括一个或多个被设置为将激发光耦合到测序装置并将激发光引导到其他光学部件的光栅耦合器。光学系统可以包括将来自光栅耦合器的激发光引导到样品孔阵列的光学部件。这样的光学部件可以包括分光器、光学组合器和波导。在一些实施方案中,一个或多个分光器可以耦合来自光栅耦合器的激发光并将激发光递送到至少一个波导。根据一些实施方案,分光器可以具有允许激发光在所有波导上基本均匀地传递的构造,使得每个波导接收基本相似量的激发光。这样的实施方案可以通过提高测序装置的样品孔接收的激发光的均匀性来提高测序装置的性能。例如,用于将激发光耦合到样品孔和/或将发射光引导到光检测器以包括在测序装置中的合适部件的实例在2015年8月7日提交的标题为“integrated device for probing,detecting and analyzing molecules”的美国专利申请号14/821,688以及2014年11月17日提交的标题为“integrated device with external light source for probing,detecting,and analyzing molecules”的美国专利申请号14/543,865中进行了描述,两者的全部内容均通过引用的方式并入本文。可以在测序装置中实施的合适的光栅耦合器和波导的实例在2017年12月15日提交的标题为“optical coupler and waveguide system”的美国专利申请号15/844,403中进行了描述,其全部内容通过引用的方式并入本文。[0413]另外的光激性结构可以定位在样品孔和光检测器之间,并且被设置为减少或防止激发光到达光检测器,否则这可能会导致检测发射光时的信号噪声。在一些实施方案中,可以充当测序装置的电路的金属层也可以充当空间滤光器。合适的光激性结构的实例可以包括光谱滤光器、偏振滤光器和空间滤光器,并且在2018年7月23日提交的标题为“optical rejection photonic structures”的美国专利申请号16/042,968中进行了描述,其全部内容通过引用的方式并入本文。[0414]位于测序装置之外的部件可用于将激发源定位和对准到测序装置。这样的部件可以包括光学部件,包括透镜、镜子、棱镜、窗口、孔径、衰减器和/或光纤。仪器中可以包括另外的机械部件,以允许控制一个或多个对准部件。这样的机械部件可以包括致动器、步进电机和/或旋钮。合适的激发源和对准机构的实例在2016年5月20日提交的标题为“pulsed laser and system”的美国专利申请号15/161,088中进行了描述,其全部内容通过引用的方式并入本文。光束控制模块的另一个实例在2017年12月14日提交的标题为“compact beam shaping and steering assembly”的美国专利申请号15/842,720中进行了描述,其通过引用的方式并入本文。合适的激发源的另外的实例在2015年8月7日提交的标题为“integrated device for probing,detecting and analyzing molecules”的美国专利申请号14/821,688中进行了描述,其全部内容通过引用的方式并入本文。[0415]与测序装置的单个像素一起定位的光检测器可以被设置和定位以检测来自像素的相应样品孔的发射光。合适的光检测器的实例在2015年8月7日提交的标题为“integrated device for temporal binning of received photons”的美国专利申请号14/821,656中进行了描述,其全部内容通过引用的方式并入本文。在一些实施方案中,样品孔及其相应的光检测器可以沿着公共轴线对齐。以这种方式,光检测器可以与像素内的样本孔重叠。[0416]检测到的发射光的特性可以提供用于鉴定与发射光相关的标志物的指示。这样的特性可以包括任何合适类型的特性,包括由光检测器检测到的光子的到达时间、由光检测器随时间累积的光子量和/或跨两个或更多个光检测器的光子分布。在一些实施方案中,光检测器可以具有允许检测与样品的发射光(例如,发光寿命)相关的一个或多个时序特性的构造。在激发光脉冲传播通过测序装置之后,光检测器可以检测光子到达时间的分布,并且到达时间的分布可以提供样品发射光的时序特性的指示(例如,发光寿命的代表)。在一些实施方案中,一个或多个光检测器提供由标志物发射的发射光的概率(例如,发光强度)的指示。在一些实施方案中,多个光检测器的尺寸和布置可被设置为捕获发射光的空间分布。来自一个或多个光检测器的输出信号然后可用于将标志物与多个标志物区分开来,其中多个标志物可用于鉴定样品内的样品。在一些实施方案中,样品可以被多种激发能量激发,并且样品响应于多种激发能量而发射的发射光和/或发射光的时序特性可以将标志物与多个标志物区分开来。[0417]在操作中,样品孔内的样品的并行分析是通过使用激发光激发孔内的一些或所有样品并用光检测器检测来自样品发射的信号来进行的。来自样品的发射光可以由相应的光检测器检测并转换为至少一个电信号。电信号可以沿着测序装置的电路中的导线传输,所述导线可以连接到与测序装置接口的仪器。随后可以处理和/或分析电信号。电信号的处理或分析可以在位于仪器上或仪器外的合适的计算设备上进行。[0418]所述仪器可以包括用于控制仪器和/或测序装置的操作的用户界面。用户界面可以被设置为允许用户将信息输入到仪器中,例如用于控制仪器功能的命令和/或设置。在一些实施方案中,用户界面可以包括用于语音命令的按钮、开关、拨号盘和麦克风。用户界面可以允许用户接收关于仪器和/或测序装置的性能的反馈,例如同轴度(proper alignment)和/或通过来自测序装置上的光检测器读出信号获得的信息。在一些实施方案中,用户界面可以使用扬声器提供听觉反馈来提供反馈。在一些实施方案中,用户界面可以包括用于向用户提供视觉反馈的指示灯和/或显示屏。[0419]在一些实施方案中,所述仪器可以包括被设置为与计算设备连接的计算机接口。计算机接口可以是usb接口、火线接口或任何其他合适的计算机接口。计算设备可以是任何通用计算机,例如膝上型计算机或台式计算机。在一些实施方案中,计算设备可以是经由合适的计算机接口在无线网络上可访问的服务器(例如,基于云的服务器)。计算机接口可以促进仪器和计算设备之间的信息通信。用于控制和/或配置仪器的输入信息可以被提供给计算设备并通过计算机接口传输给仪器。由仪器生成的输出信息可以通过计算机接口由计算设备接收。输出信息可以包括关于仪器性能、测序装置性能和/或从光检测器的读出信号产生的数据的反馈。[0420]在一些实施方案中,所述仪器可以包括被设置为分析从测序装置的一个或多个光检测器接收的数据和/或将控制信号传输到激发源的处理装置。在一些实施方案中,处理装置可以包括通用处理器、专门适配的处理器(例如,中央处理单元(cpu),例如一个或多个微处理器或微控制器内核、现场可编程门阵列(fpga)、专用集成电路(asic)、定制集成电路、数字信号处理器(dsp)或其组合)。在一些实施方案中,来自一个或多个光检测器的数据的处理可以由仪器的处理装置和外部计算设备两者来执行。在其他实施方案中,可以省略外部计算设备,并且可以仅由测序装置的处理装置执行来自一个或多个光检测器的数据处理。[0421]根据一些实施方案,被设置为基于发光发射特性来分析样品的仪器可以检测不同发光分子之间的发光寿命和/或强度的差异,和/或相同发光分子在不同环境中的寿命和/或强度之间的差异。发明人已经认识到并理解,发光发射寿命的差异可用于辨别不同发光分子的存在与否和/或辨别发光分子所经受的不同环境或条件。在一些情况下,根据寿命(例如,而不是发射波长)辨别发光分子可以简化系统的方面。作为实例,当基于寿命辨别发光分子时,波长区分光学器件(例如波长过滤器、每个波长的专用检测器、不同波长的专用脉冲光源和/或衍射光学器件)可以在数量上减少或被消除。在一些情况下,以单一特征波长操作的单一脉冲光源可用于激发在光谱的相同波长区域内发射但具有可测量的不同寿命的不同发光分子。使用单个脉冲光源而不是在不同波长下工作的多个光源来激发和辨别在相同波长范围内发射的不同发光分子的分析系统操作和维护的复杂度更低,更紧凑,并且可以以更低的成本制造。[0422]尽管基于发光寿命分析的分析系统可能具有某些好处,但通过允许另外的检测技术可以增加由分析系统获得的信息量和/或检测精度。例如,系统的一些实施方案可以另外被设置成基于发光波长和/或发光强度来辨别样品的一种或多种特性。在一些实施方式中,发光强度可以另外地或替代地用于区分不同的发光标记。例如,一些发光标记可以以显著不同的强度发射或在它们的激发概率上有显著差异(例如,至少约35%的差异),即使它们的衰减率可能相似。通过将分箱信号参考测量的激发光,可以根据强度水平区分不同的发光标记。[0423]根据一些实施方案,不同的发光寿命可以用被设置为在发光标记激发之后对发光发射事件进行时间分箱(time-bin)的光检测器来区分。时间分箱可以发生在光检测器的单个电荷累积周期期间。电荷累积周期是读出事件之间的间隔,在该期间光生载流子累积在时间分箱的光检测器的仓中。时间分箱的光检测器的实例在2015年8月7日提交的标题为“integrated device for temporal binning of received photons”的美国专利申请号14/821,656中进行了描述,其通过引用的方式并入本文。在一些实施方案中,时间分箱的光检测器可以在光子吸收/载流子产生区域中产生电荷载流子并且将电荷载流子直接转移到电荷载流子存储仓中的电荷载流子存储仓。在这样的实施方案中,时间分箱的光检测器可以不包括载流子行进/捕获区域。这样的时间分箱的光检测器可以被称为“直接分箱像素”。包括直接分箱像素的时间分箱的光检测器的实例在2017年12月22日提交的标题为“integrated photodetector with direct binning pixel”的美国专利申请号15/852,571中进行了描述,其通过引用的方式并入本文。[0424]在一些实施方案中,相同类型的不同数量的荧光团可以与样品中的不同试剂连接,从而可以基于发光强度来鉴定每种试剂。例如,两个荧光团可以连接到第一标记的亲和试剂,四个或更多个荧光团可以连接到第二标记的亲和试剂。由于不同数量的荧光团,可能存在与不同亲和试剂相关的不同激发和荧光团发射概率。例如,在信号累积间隔期间,第二标记的亲和试剂可能有更多的发射事件,因此仓的表观强度明显高于第一标记的亲和试剂。[0425]发明人已经认识到并理解,基于荧光团衰减率和/或荧光团强度区分核苷酸或任何其他生物或化学样品可以简化光学激发和检测系统。例如,可以用单波长源(例如,产生一个特征波长而不是多个源的源或以多个不同特征波长操作的源)来执行光激发。此外,检测系统中可能不需要波长识别光学器件和滤光器。此外,每个样品孔可以使用单个光检测器来检测来自不同荧光团的发射。短语“特征波长”或“波长”用于指代有限辐射带宽内的中心或主要波长(例如,脉冲光源输出的20nm带宽内的中心或峰值波长)。在一些情况下,“特征波长”或“波长”可用于指代源辐射输出的总带宽内的峰值波长。[0426]等同和范围[0427]在权利要求书中,除非有相反的指示或从上下文中明显看出,否则诸如“一个/一种(a)”、“一个/一种(an)”和“该/所述(the)”之类的冠词可以表示一个或多于一个。除非有相反的指示或从上下文中明显看出,否则如果一个、多于一个或所有组成员存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关,则认为在组的一个或多个成员之间包含“或”的权利要求或描述是令人满意的。本发明包括其中该组的一个成员恰好存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关的实施方案。本发明包括其中多于一个或所有组成员存在于给定产品或方法中、在给定产品或方法中使用、或以其他方式与给定产品或方法相关的实施方案。[0428]此外,本发明涵盖所有变化、组合和排列,其中将来自一个或多个所列权利要求的一个或多个限制、要素、条款和描述性术语引入另一权利要求。例如,可以修改从属于另一权利要求的任何权利要求,以包括在从属于相同基本权利要求的任何其他权利要求中发现的一个或多个限制。在要素作为列表,例如以马库什组格式呈现的情况下,要素的每个子组也被公开,并且可以从所述组中删除任何要素。应当理解,一般而言,在本发明或本发明的方面被称为包括特定要素和/或特征的情况下,本发明的某些实施方案或本发明的方面由或基本上由这样的要素和/或特征组成。为简单起见,这些实施方案并未在本文中具体阐述。[0429]如本文在说明书和权利要求书中使用的短语“和/或”应理解为表示如此结合的要素中的“一个或两个”,即,在一些情况下要素结合存在而在其他情况下要素分离存在。用“和/或”列出的多个要素应该以相同的方式解释,即“一个或多个”这样结合的元素。除了由“和/或”子句具体标识的要素之外,可以任选地存在其他要素,无论与那些具体标识的要素相关或不相关。因此,作为非限制性实例,当与诸如“包含”之类的开放式语言结合使用时,对“a和/或b”的引用在一个实施方案中可以仅指a(任选地包括除b之外的要素);在另一个实施方案中,仅指b(任选地包括除a之外的要素);在又一个实施方案中,指a和b两者(任选地包括其他元素);等等。[0430]如本文在说明书和权利要求书中使用的,“或”应理解为与如上定义的“和/或”具有相同的含义。例如,当分开列表中的项目时,“或”或“和/或”应被解释为是包含的,即包含至少一个,但也包含要素的数量或列表以及任选地其他未列出的项目中的多于一个。只有明确指出相反的术语,例如“仅一个”或“恰好一个”,或在权利要求中使用时,“由……组成”将指包含要素的数量或列表中的恰好一个要素。一般而言,当前面带有排他性术语,例如“任一”、“其中一个”、“只有一个”或“恰好一个”时,本文使用的术语“或”仅应解释为表示排他性的替代方案(即“一个或另一个但不是两者”)。当在权利要求中使用时,“基本上由……组成”应具有专利法领域所使用的一般含义。[0431]如本文在说明书和权利要求书中使用的,短语“至少一个”在提及一个或多个要素的列表时,应理解为表示选自要素列表中的任何一个或多个要素的至少一个元素,但不一定包括要素列表中具体列出的每个要素中的至少一个,并且不排除要素列表中的任何要素组合。该定义还允许除了在短语“至少一个”所指的要素列表中具体标识的要素之外的元素可以任选地存在,无论是否与那些具体标识的要素相关或不相关。因此,作为非限制性实例,“a和b中的至少一个”(或等效地,“a或b中的至少一个”,或等效地“a和/或b中的至少一个”)可以,在一个实施方案中,指至少一个,任选地包括多于一个的a,不存在b(并且任选地包括除b之外的要素);在另一个实施方案中,指至少一个,任选地包括多于一个的b,不存在a(并且任选地包括除a之外的要素);在又一个实施方案中,指至少一个,任选地包括多于一个的a,和至少一个,任选地包括多于一个的b(并且任选地包括其它要素);等等。[0432]还应该理解的是,除非有明确的相反指示,否则在本文要求保护的任何包括一个以上步骤或动作的方法中,该方法的步骤或动作的顺序不一定限于所记载的方法的步骤或动作的顺序。[0433]在权利要求以及上述说明书中,所有过渡短语,例如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“持有”、“由……组成”,等应被理解为是开放式的,即意味着包括但不限于。如美国专利局专利审查程序手册第2111.03节所述,只有过渡短语“由……组成”和“基本上由……组成”应分别为封闭或半封闭式过渡短语。应当理解,在本文档中使用开放式过渡短语(例如,“包含”)描述的实施方案在替代实施方案中还被考虑为“由”开放式过渡短语描述的特征“组成”和“基本上由”开放式过渡短语描述的特征“组成”。例如,如果本技术描述了“包含a和b的组合物”,则该申请还考虑了替代实施方案“由a和b组成的组合物”和“基本上由a和b组成的组合物”。[0434]在给出范围的地方,端点包括在内。此外,除非另有说明或从上下文和本领域普通技术人员的理解中以其他方式显而易见,否则表示为范围的值可以假定在本发明的不同实施方案中的所述范围内的任何特定值或子范围,以范围下限单位的十分之一,除非上下文另有明确规定。[0435]本技术涉及各种已发布的专利、公开的专利申请、期刊文章和其他出版物,所有这些都通过引用的方式并入本文。如果任何并入的参考文献与本说明书之间存在冲突,则以本说明书为准。此外,落入现有技术的本发明的任何特定实施方案可以明确地排除在任何一项或多项权利要求之外。因为这样的实施方案被认为是本领域普通技术人员已知的,所以即使本文没有明确阐述排除,它们也可以被排除。出于任何原因,无论是否与现有技术的存在相关,本发明的任何特定实施方案都可以从任何权利要求中排除。[0436]本领域技术人员将认识到或能够仅使用常规实验来确定本文描述的特定实施方案的许多等同物。本文描述的本实施方案的范围不旨在限于以上描述,而是如所附权利要求书中所述。本领域的普通技术人员将理解,在不背离本发明的精神或范围的情况下,可以对本说明书进行各种改变和修改,如所附权利要求书所定义的。[0437]本文对变量的任何定义中记载的化学基团列表包括将该变量定义为任何单个基团或所列基团的组合。本文对变量的实施方案的记载包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。本文对实施方案的记载包括作为任何单个实施方案或与任何其他实施方案或其部分组合的实施方案。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
制备用于多重多肽测序的样品的方法、试剂盒和装置与流程
作者:admin
2022-08-19 19:46:08
413
- 下一篇: 存储器子系统的有源输入/输出扩展器的制作方法
- 上一篇: 聚苯醚-聚酰胺组合物、其制备方法及用途与流程