鉴定的新兴技术,已引起越来越多的关注。这一技术的主要目的是鉴定已知物种和发现的新物种。DNA条形码提供了可信息化的分类学标准和更加敏感的分子差别模式,相对于传统生物鉴定的优势在于可以揭示隐存种,鉴定缺少形态数据或形态不易区分的种类,为物种鉴定提供简单有效的工具。综述了DNA条形码技术的产生、发展和基本原理以及在生物分类学中的应用及存在的问题。
关键词:DNA条形码技术;生物分类学;mtCOI;物种鉴定
中图分类号:Q19文献标识码:A文章编号:0439-8114(2011)05-0886-05
Application Prospect of DNA Barcode Technology in Taxonomy
JIAO Ming-chao,ZHAO Da-xian,OUYANG Shan,WU Xiao-ping
(College of Life Sciences and Food Engineering,Nanchang University,Nanchang 330031,China)
Abstract: DNA barcode (DNA barcoding) technology, a recently developed technology of species identification, had attracted more and more attention. Its main purpose was to identify the known species and discover new species. DNA barcodes could provide taxonomy with information technology standards and more sensitive molecular difference patterns. Compared with traditional bio-identification, its advantages lay in that it could reveal the cryptic species and identify species that lacked morphological data or were difficult to distinguish so as to provide simple and effective tools for species identification. The principles and development of DNA barcode technology, its application and possible problems in application in taxonomy were reviewed.
Key words: DNA barcode technology;biological taxonomy;mtCOI;species identification
长期以来,生物分类学家一直在寻找能够迅速区分不同物种的方法。传统的分类学主要依赖形态或者解剖学特征,这些特征往往对形态近似种的鉴定较困难,且可能出现错误。如果每个物种都携带有表明自己身份的“条形码”,那么物种分类和鉴定工作将得到极大的简化。在这种情况下,DNA条形码(DNA Barcoding)技术应运而生。
1DNA条形码技术的产生和发展
Tautz等[1-3]首先提出运用DNA序列作为生物分类系统的主要平台,即DNA分类学(DNA taxonomy)的观点。2003年初,Hebert等[4,5]首次提出用一种基因的序列作为鉴别不同物种的条形码,并选中COI基因,随后探讨该技术在鸟类分类鉴定中的可行性,他们的工作推动了条形码技术在生物物种鉴定中的应用。2003年3月,20多位分类学家、分子生物学家和生物信息学家汇聚美国冷泉港,召开了题为“Taxonomy and DNA”的会议,提出对全球所有生物物种的某个特定基因进行大规模测序,以期实现物种鉴定的目标,进而推进生物进化历史的研究。同年9月,在冷泉港再次召开题为“Taxonomy,DNA and the barcode of life”的会议,对DNA条形码鉴定所有真核生物的科学性、社会利益有了更深入的探讨,并且提出了组织策略及国际生物条形码计划(International barcode of life project)的发展蓝图。2004年秋,美国国立生物技术信息中心(NCBI)与生命条形码联盟(CBOL)签署合作,物种条形码的标准DNA序列及其相关数据将存档于GenBank。随后,GenBank提供的COI序列数迅速增长,突出表现在除脊索动物之外各类群COI序列数量的剧增,目前脊索动物的分类基本上都已经完成。2005年2月,伦敦举办了第一届全球DNA条形码会议,对DNA条形码的分类理念、实验技术的细节分析以及资料库建立等议题进行了讨论。最终目的是联合各个类群的DNA条形码数据库组建一个全球生物的DNA条形码数据库,将此数据库设置在GenBank中,让公众可以自由登录查询[6,7]。
2DNA条形码技术的原理
DNA条形码技术是通过对一个标准目的基因的DNA序列进行分析从而进行物种鉴定的技术。DNA序列由A,T,C,G 4种碱基组成,如果有n个碱基,就会有4n种编码方式。如果按照这个公式计算,15个碱基位点就能出现近10亿种的编码序列,这个数字是现存物种的100倍。由于自然选择的原因,某些位点上的碱基是固定的,从而导致可能的编码组合数减少。这可以通过只考虑蛋白编码基因来解决,因为在蛋白编码基因里,由于密码子的简并性,其第三位碱基通常都不受自然选择作用的影响,是自由变化的。一个长度300bp的蛋白质编码基因的核苷酸片段在第三密码子位点含有100个核苷酸,这些位点上发生的替代通常都是中性选择,并且大多数都是通过随机漂变在种群中固定下来的。在这100多个位点上就存在4 100种可能性,为随后的序列比对分析提供了较大的可能性。随着分子生物学技术的飞速发展,获得100多个碱基序列变得非常容易。
理想的DNA条形码应当符合下列标准[3]:①具有足够的变异性以区分不同的物种;②同时应具有相对的保守性,以便于用通用引物进行扩增;③必须是一段标准的DNA区来尽可能鉴别不同的分类群;④目标DNA区应当包含足够的系统进化信息以定位物种在分类系统(科,属等)中的位置;⑤目标DNA区应该足够的短,以便有部分降解的DNA扩增。
mtDNA是一种闭合的、双链环状的核外遗传系统,是真核细胞中分子量较小而又较易纯化的复制单位,线粒体基因没有内含子,没有等位基因重组事件,是母系遗传的单倍体,并且线粒体基因的通用引物能够扩增绝大多数的动物物种,因此比核基因更有优势。
线粒体基因组13个蛋白编码基因的长度在动物界中变化很小(图1[8]),基于长度差异的考虑,900bp左右最适合现有的技术条件,其中,只有COI,Cytb,ND4,ND5这4个基因满足上述条件[9]。考虑到COI和Cytb的进化速率比ND4和ND5慢,首先,进化太快就不可能设计出通用引物,也就限制了它作为DNA条形码的标记基因;其次,由于进化速率过快引发碱基发生二次突变,导致数据信息不能够区分远源物种的分类关系。COI和Cytb都拥有合适的序列长度和适宜的进化速率,但COI相比Cytb更具有优势,表现在:①COI的通用引物能够扩增大多数的COI-5’序列;②COI序列拥有更多的系统发育信号,更适合于分析亲缘关系密切的分类类群。
因此,通常选择COI作为DNA条形码的标记基因,对那些COI不能有效鉴定的物种,可以考虑使用其他片段作为辅助标记基因。
3DNA条形码技术在生物分类学中的应用
DNA条形码技术在植物分类学上的研究进展相对较慢。植物的线粒体DNA因杂交和基因渗入而变异很少,不适合用作标记基因片段,利用线粒体基因通常不能成功鉴别物种[10]。依据某一个片段也不可能准确鉴定所有的植物物种,因此,研究者提出了不同的片段组合方案:ITS+trnH-psbA、rpoC1+rpoB+matK 和rpoC1+matK+trnH-psbA等。任宝青等[10]利用4个DNA片段(rbcL、matK、trnL-F,26S rDNA)和65个广义形态学形状重建毛茛目的系统发育关系,并更新了毛茛目的分类系统。随着PCR技术和DNA测序技术的快速发展,DNA条形码技术将在植物分类学中扮演更加重要的角色。
DNA条形码技术在动物分类学中则得到更广泛的应用,几乎涉及动物各类群的分类[6-13]。Hebert等[4]选取COI基因的一段序列对动物中的7门8目的不同种群进行种类鉴定,发现无论在门、目,还是在近缘种水平, 该基因都具有较好的鉴定功能。近年来,随着相关研究工作的开展,进一步确立了以COI基因为基础的DNA条形码技术的有效性。很多国际组织自行建立的DNA条形码数据库构成整个DNA条形码项目的重要组成部分,有较大影响或规模的组织包括ALL Leps、FISH·BOL、Canadian Fauna和Birds等[6,12]。同样,COI基因特定片段作为DNA条形码在真菌的鉴定研究中也取得了有价值的结果。有学者对Aseomyeota、Basidiomyeota、Chytridiomycota等的31个真菌物种的COI基因进行了研究,结果显示约600bp的COI基因片段长度可以准确鉴定真菌物种。表1总结了DNA条形码技术在生物分类学中的应用现状。
4DNA条形码技术在生物分类学应用中的优势及存在的问题
形态学分类有其局限性[9]:例如,表型可塑性和遗传可变性容易导致鉴定不准确;形态学方法无法鉴定许多群体中普遍存在的隐存分类单元;形态学鉴定受生物性别和发育阶段的限制,因此很多生物很难鉴定。同时,分类学家识别能力也有局限性,能够正确鉴定1 000个物种的分类学家极少,对地球上1亿~10亿个物种而言就需要1万~10万个分类学家来支撑这个物种的识别体系。
DNA条形码技术在弥补传统分类不足上的潜力巨大。它提供了一个更加敏感、精确、客观的分子差别模式。其优势表现在:①鉴别过程快速简便,鉴别结果更精确,客观;②能在生物不同生长阶段取样鉴别;③利用生物体小块组织鉴别,如通过鉴别胃里的食物小块重建食物链;④不需要专门的物种鉴定专家,只需要设计好鉴别的实验流程,鉴别过程是可以机械重复的;⑤鉴别过程迅速,量大,一个标准DNA数据库的建立,利用试剂盒,PCR仪等基础实验设备,可以一次性鉴定大量的标本。
当然,DNA条形码技术在物种鉴定中体现快速、高效的同时,也避免不了技术上的缺陷,主要表现在:①如何选择合适的基因标记序列,作为DNA条形码的标记基因,一方面应该足够保守,以便于能够利用通用引物扩增大范围的物种,另一方面要包含足够的变异可区分不同物种。理论上不存在普遍适用的标记基因,因此在鉴别不同的物种种类时,需要根据实际情况选择标记基因。②如何确定不同长度的DNA序列对物种进行有效区分的意义;该技术是否适合区分关系密切或快速进化的物种等需要进一步验证。DNA条形码技术主要是对物种进行鉴定,重点在于种内和种间差异的限定,但种内和种间定义并不太明确,不同物种的变异范围并不一样,没有一个统一的标准界限。此外,碱基的二次变异,线粒体DNA的修剪机制,对快速进化物种和杂交新品种在鉴定上带来困难,近缘物种间的基因交流,同属物种间较低的差异也会给物种分类鉴定带来困难。另外,植物的线粒体DNA因杂交和基因渗入而变异很少,利用线粒体基因通常不能成功地鉴别,这些类群的标记基因至今仍没有明确报道,需要进一步探讨。
用DNA条形码指导发现新物种也同样存在争议。例如使用线粒体DNA对动物进行生物地理学和系统学分析时经常会得到与形态学研究不一致的结论,这也使得研究者不得不重新对研究对象的形态、生态和行为等特征进行描述。分子条形码序列数据只是提供一个未知物种区别于其他样本物种的关键证据,但鉴定物种同样需要详细的形态学研究为DNA序列提供可靠的参考。由于许多稀有物种缺乏分子数据,因此用形态学来鉴定这些物种仍是必要的。所以,在鉴定物种时,不能完全抛弃形态学手段,必须将条形码技术与形态学手段有机地结合起来[9]。
5DNA条形码技术对隐存生物多样性的研究
隐存生物是指外观相似,遗传特征截然不同的物种。过去20年,由于PCR技术和DNA测序技术的日益成熟,人类获得的其他物种的基因组图谱越来越多,科学家发现的隐存种的数量也在急剧增长。Hebert等[5]为260种北美鸟类排出了DNA条形码序列。结果发现,每只鸟都有单独的条形码,种间差别平均比种内不同个体间的差别高出18倍。另一项研究中,有学者[15,16]曾运用DNA条形码证实了在哥斯达黎加原认为1种的常见蝴蝶(Astraptes fulgerator)实际上可分为10种。
隐存生物是生物多样性中尚未被人们准确认识的重要部分,它们涉及到生态学研究的各个领域。①在某些特殊的生态系统中,物种不明确往往造成对生态系统功能研究的缺失。②一个包含隐存种的濒危复合群体,模糊了群体中该物种的真实数量,对保护政策制定起了误导作用。③环境监测中,隐存种对污染的反应可能不一致,影响监测的准确性。例如,用于污染监测的贝类由于各个隐存种的存在,可能对污染的反应并不一致。④运用DNA条形码技术对某些特殊物种进行重新划分,不仅是学术问题,在实际应用上也有重要意义。20世纪初,划分蚊子种类时的失误导致了对疟疾控制的混乱:原本被划分为一个物种的蚊子竟包含了6个不同的种类,而其中只有3种传播疾病[37]。因此,运用DNA条形码技术对隐存生物的研究将对生物多样性的评估、野生动物的管理、物种进化甚至传染性疾病的认识与治疗产生极大的影响。
参考文献:
[1] TAUTZ D,ARCTANDER P,MINELLI A, et al.DNA points the way ahead in taxonomy[J]. Nature,2002,418:479.
[2] TAUTZ D,ARCTANDER P,MINELLI A,et al. A plea for DNA taxonomy[J]. Trends in Ecology & Evolution,2003,18(2):70-74.
[3] 肖金花,肖晖,黄大卫.生物分类学的新动向——DNA条形编码[J]. 动物学报,2004,50(5):852-855.
[4] HEBERT P D N, RATNASINGHAM S R, DEWAARD J. Barcoding animal life: Cytochrome c oxidase subunit 1 divergences among closely related species [J]. Proc R Soc Lond B (Suppl.) Biol Sci,2003,270:96-99.
[5] HEBERT P D N, STOECKLE M, ZEMLAK T. Identification of birds through DNA barcodes [J]. Plos Biology,2004,2(10):1657-1663.
[6] 彭居俐,王绪桢, 何舜平. DNA条形码技术的研究进展及其应用[J] .水生生物学报,2008,32(6):916-919.
[7] 彭居俐,王绪桢,王丁,等.基于线粒体COI基因序列的DNA条形码在鲤科鲌属鱼类物种鉴定中的应用[J].水生生物学报,2009,33(2):271-276.
[8] JOHN W.DNA barcoding in animal species:Progress,potential and pitfalls [J]. Phylogenetics and Systematics,2007, 29:188-197.
[9] 莫帮辉,屈莉,韩松,等.DNA条形码识别I. DNA条形码研究进展及应用前景[J].四川动物,2008,27(2):303-306.
[10] 任宝青,陈之端.植物DNA条形码技术[J].植物学报,2010,45(1):1-12.
[11] 关申民,高邦权. COI序列:影响动物分类学与生态学的DNA barcode[J].生态学杂志,2008,27(8):1406-1412.
[12] 雷富民,杨岚.中国鸟类的DNA分类及系统发育研究概述[J].动物分类学报,2009,34(2):309-315.
[13] KRESS W J,ERICKSON D L. A two-locus global DNA barcode for land plants: The coding rbcL gene complements the non-coding trnH-psbA spacer region [J]. Plos ONE,2007,2(6):508.
[14] WANG W,LU A,CHEN Z,et al. Phylogeny and classification of ranunculales: Evidence from four molecular loci and morphological data [J]. Perspectives in Plant Ecology, Evolution and Sytematics ,2009, 11:81-110.
[15] HAJIBABAEI M, HJANZEN D, HEBERT P D N, et al. DNA barcodes distinguish species of tropical lepidoptera [J]. PNAS, 2006 ,103(4):968-971.
[16] HEBERT P D N, PENTON E, BURNS J, et al. Ten species in one: DNA barcoding reveals crytic species in the neotropical skipper butterfly Astraptes fulgerator[J]. PNAS, 2004, 101(41): 14812-14817.
[17] VENCES M, THOMAS M,ARIE MEIJDEN V,et al. Comparative performance of the 16S rRNA gene in DNA barcoding of amphibians [J].Frontiers in Zoology,2005,2(5):1-12.
[18] VENCES M, THOMAS M, BONETT R, et al. Deciphering amphibian diversity through DNA barcoding: Chances and challenges [J] PhilTrans R Soc B,2005,360:1859-1868.
[19] HEBERT P D N, STOECKLE M, ZEMLAK T. Identification of birds through DNA barcodes [J]. Plos Biology,2004,2(10):1657-1663.
[20] WEIBEL, MOORE A .Test of a mitochondrial gene-based phylogeny of woodpeckers (Genus Picoides) using an independent nuclear gene, b-fibrinogen intron 7[J]. Molecular Phylogenetics and Evolution, 2002, 22(2):247–257.
[21] NICOLAS H, ROBERT H, LOUIS B. Identification Canadian freshwater fishes through DNA barcodes [J]. Plos Biology, 2008, 3(6):1-8.
[22] 周春花,欧阳珊,吴小平,等.基于16S rRNA和ND1基因序列的中国蚌科丽蚌属的系统发育[J].动物学报,2007,53(6):1024-1030.
[23] 李咏梅,陈秀荔,赵永贞,等.钦州湾牡蛎线粒体16S rRNA和COI基因片段的序列变异分析[J].广东海洋大学学报,2009,19(3):11-18.
[24] 林睿,黎学铭,胡缨,等.广西,湖南,云南三地钉螺Cytb基因序列变异和系统进化研究[J].中国病原生物学杂志,2008,3(2):110-113.
[25] 关飞,牛安欧,李友松.中国不同种拟钉螺COI基因序列差异分析及其系统学初探[J].中国人兽共患病学报,2007,3(1):45-48.
[26] 程汉良,夏德全,吴婷婷,等.6种帘蛤科贝类及4个地理种群文蛤线粒体COI基因片段序列分析[J].海洋学报,2007,29(5):109-116.
[27] 黄晓燕,王丽珍. 5种螺蛳属动物和中国圆田螺COI基因序列分析[J].水生态学杂志,2008,1(1):1-3.
[28] 郑文娟,朱世华,沈锡权,等.基于线粒体COI基因序列探讨泥蚶的遗传分化[J].2009,30(1):17-23.
[29] DAVID C ,CAMPBELL, JOHNSON P, et al. Identification of “extinct” freshwater mussel species using DNA barcoding [J]. Molecular Ecology Resources, 2008, 8:711-724.
[30] GUAN F, NIU A, ATTWOOD STEPHEN W. Molecular phylogenetics of Triculine snails(Gastropoda: Pomatiopsidae) from southern China[J]. Molecular Phylogenetics and Evolution. 2008, 48:702-707.
[31] JENNIFER E B, JEANNE M S C, RENEE DEAN, et al. Conservation genetics of two endangered Unionid Bivalve species, Epioblasma florentina walkeri and E. capseformis (Unionidae: Lampsilini) [J].JMoll, 2002,68:385-391.
[32] JASON P C, THOMAS DK. Ancient sex-specific extension of the cytochrome c oxidase II gene in Bivalves and the Fidelity of doubly-uniparental inheritance [J]. Molecular Biology and Evolution, 2002, 19(8):1323-1328.
[33] MARCO B, ETTORE O, STEFANO S, et al. Molecular phylogeny of the family Pectinidae (Mollusca: Bivalvia) based on mitochondrial 16S and 12S rRNA genes[J]. Molecular Phylogenetics and Evolution,2004,31:89-95.
[34] AMY R. W, CHARLES L. A molecular phylogeny of Physidae(Gastropoda:Basommatophora)based on mitochondrial DNA sequences[J]. Journal of Molluscan Studies,2007,73(3):241-257.
[35] FELIPE A,FABIOLA L, CRISTIAN G.Molecular analysis in chilean commercial gastropods based on 16S rRNA, COI and ITS1-5.8S rDNA-ITS2 sequences [J]. Gayana,2009,73(1): 17-27.
[36] JARED M L,MICHAEL S T,KAUSTUV R,et al. A molecular phylogenetic analysis of strombid gastropod morphological diversity [J]. Molecular Phylogenetics and Evolution, 2006,41:436-444.
[37] DAVID B, DAVID J L, NAVJOT S S, et al. Cryptic species as a window on diversity and conservation [J].TRENDS in Ecology and Evolution ,2006,22(3):148-155.