您的当前位置:首页正文

拟南芥盐胁迫响应启动子的生物信息学分析

2020-11-28 来源:步旅网
山东农业大学学报(自然科学版),2010,41(2):164—168 Journal of Shandong Agricultural University(Natural Science) 拟南芥盐胁迫响应启动子的生物信息学分析 吴炳江,阎鹏磊,刘东篱,郑成超,杨国栋 (山东农业大学生命科学学院,作物生物学国家重点实验室,山东泰安271018) 摘要:本研究使用生物信息学方法分析了拟南芥盐胁迫响应的顺式作用元件。首先分析盐胁迫0.5 h、1 h的拟 南芥全基因组芯片,得到627个盐胁迫上调基因和282个下调基因。然后使用MEME软件分析了盐胁迫响应基 因的启动子,得到10个保守元件。通过显著性分布分析表明Motif_l\Motif_8\Motif_10显著分布于上调基因启 动子中;Motif_l\Motif_10显著不分布于盐胁迫下调基因启动子中。Motif一1元件是G—box元件(ABRE(ABA Responsive Element)元件),大量分布于盐胁迫上调基因启动子中,广泛参与盐胁迫过程中ABA依赖的信号转导 途径。Motif一8、Motif一10分别类似于ABRE元件和DRE(Dehydration—Responsive Element)元件,但由于和 ABRE、DRE元件的保守序列不尽相同,Motif_8\Motif_10很有可能是新的盐胁迫响应元件。本研究对于研究拟 南芥在盐胁迫应答过程中在转录水平上发生的调控过程具有重要帮助作用. 关键词:拟南芥;全基因组芯片;盐胁迫响应启动子 中图分类号:Q 811.4 文献标识码:A 文章编号:1000—2324(2010)02—0l64一O5 BIol ’oRMATlCAL ANALYSlS o ’SALlNrrY—RESPU SlVE王,RlUMU.1’ERS D ARABⅡ)0PSIS THALIANA WU Bing—jiang,YAN Peng—lei,LIU Dong—li,ZHENG Cheng—chao,YANG Guo—dong (Colledge of Life Suience,Shangdong A whural University,State Key Laboram of Crop Biowgy,Taian 271018,China) Abstract:Salinity—responsive motifs were analyzed with multiple bioinformatic softwares in this study.627 sa- linity up—regulated genes and 282 down—regulated genes were identified from the microarray data about 0.5 h and 1 h high salinity stress in Arabidopsis.The upstream 1000bp promoter regions of all salinity—regulated genes retrieved from TAIR were used for finding conserved motifs by MEME software and 10 putative such motifs were identiied.Motiff 1 was indentified as a G—box element,which is one of the ABA—responsive elements that functions in ABA—dependent gene expression under abiotic stress,and overrepresents in salinity up—regulated promoters.Motif8 and Motif10 were also overrepresented in salinity up—regulated promoters,and the con— __served sequences of these two motifs were similar to ABRE and DRE,respectively.Since conserved sequences of ABRE and DRE are not present in Motif8 and Motif1 0,the two motifs might be new salinity—responsive ele— __ments.This study will help studying the regulation process in transcriptional level during the responses to salt stress in Arabidopsis. Key words:Arabidopsis;genomic microarray;salinity—responsive promoter 1材料与方法 1.1数据来源 本研究使用的拟南芥盐胁迫基因芯片数据来源于TAIR(WWW.arabidopsis.org)网站的Affymetrix CEL 文件(accession number:ME00328);启动子上游lO00bp序列数据来自TAIR8一upstream一1000数据库(re— lease 8.0,February 2008)。 收稿日期:2009—08—19 作者简介:吴炳江(1989一),本科生,SRT项目组成员。 通讯作者:Author for correspondence.E—mail:gdyang@sdau.edu.cn 第2期 吴炳江等:拟南芥盐胁迫响应启动子的生物信息学分析 ・165・ 1.2分析工具 。 本研究使用的生物信息学软件有GENESPRING(www.chem.agilent.corn);MEME(www.meme.sdsc. edu);EMBOSS软件包("WW ̄V.emboss.sourceforge.net)等。元件功能分析使用的分析工具有PLACE数据 库(www.dna.affrc.go.jp/PLACE/)等。 1.3 根据拟南芥全基因组芯片得到拟南芥与盐胁迫响应的基因 对于拟南芥全基因组基因芯片数据,我们分析了盐胁迫处理Oh(对照)、0.5 h和1 h的芯片数据。我 们参照Joachim Kilian等人的方法¨j,利用Genespring软件(version 9.05),得到的拟南芥盐胁迫响应的基 因。然后去除这些基因中的假基因、转座子元件相关基因、编码RNA的基因、叶绿体基因和线粒体基因。 我们得到上调基因627个(上调组)、下调基因282个(下调组)。然后从TAIR网站上得到这些基因转录 起始位点上游1000 bp的序列用于保守元件的分析。 1.4用MEME软件分析保守元件 MEME软件是目前使用最广的一种保守元件分析方法,参照Carlos Molina ’ 等人的分析方法,使用 MEME(version 4.1.0)分析软件分别处理了上调、下调组的启动子序列。从每一组中根据E值得分得到 1O个保守元件的序列及分布等相关信息。 1.5 分析元件的显著性分布以及利用元件数据库分析元件功能 使用EMBOSS软件包(WWW.emboss.sourceforge.net)中的profit、prophecy和shufieseq软件对得到的 f结果显著性分布进行分析 J。将MEME得到的这些保守元件提交到PLACE数据库在线启动子分析数据 库中,得到了这些保守元件功能的相关信息。最后,将得到的分析结果进行整理。 2结果与分析 2.1从盐胁迫响应启动子中寻找保守元件 MEME(Multiple EM for Motif Elicitation)是使用最广泛的保守元件分析软件之一。” 。从一组DNA序 列中发现比较短的保守元件是一件十分困难的事,DNA序列越多就越困难。为了减少简单重复序列的干 扰,我们使用RepeatMasker程序忽略掉这些简单的重复序列(A.Smit,R.Hubley and P.Green,unpub- lished data)。RepeatMasker程序可在网站web页面使用(http://www.repeatmasker.org/cgi—bin/WEBRe— peatMasker) 。 使用MEME软件进行启动子区保守元件分析,每组启动子中分别得到了长度为6到10的1O个保守 序列。然后将每组中的元件发现次数小于平方根(基因数)的去除。同时我们发现UP组和DOWN组一 些元件是相同的,我们将相同的元件合并,最后总共得到10个元件(表1)。从表1中我们发现Motif_2 (保守序列:CTFCTI'CTI'C)和Motif一7(GAAGAAGAAG)是反向互补序列;Motif一4(GAGAGAGAGA)和 Motif-6(TCTCTCTCTC)是反向互补序列。 2.2元件显著性分布的分析 为了证明MEME发现的l0个元件显著的分布在盐胁迫上调、下调基因的启动子区,我们使用EM— BOSS软件包中的profit和prophecy软件,分析元件在盐胁迫上调、下调基因上游1000bp中出现的频率。 分别以上调、下调启动子的随机序列和拟南芥全基因组启动子中出现的频率作为比较的背景。随机序列 使用shufieseq软件产生,sfhufiesfeq根据启动子序列中四种碱基的出现频率,随机产生一条长度相同的序 列。上调、下调启动子数据文件使用shufieseq软件重复l0次,各产生10个随机文件。拟南芥的全基因 f组启动子数据库文件来源于TAIR8一upstream一1000,从中去除假基因、转座子元件相关基因、编码RNA的 基因、叶绿体基因和线粒体基因,最后全基因组数据库中得到27025个基因的启动子序列。 为了检测元件的分布情况,首先我们以MEME发现的元件序列为基础,利用prophecy软件制作了每 一个元件的核苷酸频率矩阵NFM(Nucleotide Frequency Matrices)。然后,以每个元件的NFM为基础,利用 profit软件分别检测了元件在上调启动子、上调启动子随机序列(10个重复)、下调启动子、下调启动子随 机序列(10个重复)、全基因组启动子(27025个启动子)共5个数据库中的分布情况(表2A)。为了统一 ・166・ 山东农业大学学报(自然科学版) 第4l卷 不同数据库间的比较标准,表2A中的数据转换成每10000个启动子中元件出现的次数(表2B)。 表1 MEME分析盐胁迫响应基因上游1000 bp启动子区得到的保守元件 Table 1 Analysis of motifs presented in[一1000,一1]regions of salinity—responsive genes in Arabidopsis. (MEME version 4.1.0) Motif Logo l ̄ngth{bD) …’tt。 一 eCAC ! - TC C jC CITC]1(F r(7’IICIC ,:套C一 C . ^( }(X}[(iAICG[A'I’cG(1iCTI(JI(t1 1 - 赣A A A A—A - C CACACAC。 c^(-CA0ACIA(・】0{^( l - TCTCTc下G王阜 -7,AA AA AA -: AC T0 GA: ・i ̄csG CCAG : ̄ACC_CGe。 表2B结果表明,以随机序列为背景,所有的元件在上调或下调组的出现频率显著高于各自随机序 列,这表明MEME发现的10个元件不是随机出现的,具有很高的特异性,可能具有一定的功能。以全基 因组为背景,Motif_l在上调组的出现频率为2089.31 t ̄/lO000基因(一下直接用2089.31表示),而基因 组中出现频率为699.72,二者比值为2.99,说明Motif 1显著分布于盐胁迫上调启动子中;而Motif_l在下 调组的出现频率为141.84,与基因组的比值为0.20,说明Motif_l显著不分布于盐胁迫下调启动子中。 Motif_3在下调组的出现频率为212.77,在基因组的出现频率为为629.42,二者的比值为0.34,说明Motif._ 3显著不分布于盐胁迫下调启动子中。Motif8在上调组的出现频率为191.39,基因组的出现频率为98. 43,二者的比值为1.94,说明Motif_8显著分布于盐胁迫上调启动子中。Motif_10在上调组出现频率为 175.44,基因组中的出现频率为40.33,二者的比值为4.35,说明Motif_10显著分布于盐胁迫上调启动子 中;而Motifl0在下调组中没有发现(出现频率为0),说明该元件显著不分布于下调基因中。 总之,以上保守元件的显著性分布分析结果表明,Motifl\Motif8\Motifl0显著分布于盐胁迫上调基 因启动子中;而Motifl\Motif3\Motif_10显著不分布在盐胁迫下调基因启动子中。有趣的是,我们只发 现了显著分布于盐胁迫上调基因启动子的保守元件,而没有发现显著分布与盐胁迫下调基因启动子的保 守元件,这可能与盐胁迫上调基因、下调基因表达不同的调控方式有关。 表2元件出现的次数 Table 2 Occurrence of motifs in Arabidopsis 第2期 吴炳江等:拟南芥盐胁迫响应启动子的生物信息学分析 ・167・ ‘ 表3每10000个基因中元件出现的次数 Table 3 Ouurrence of motifs per 10000 genes in Arobidopsis 与背景(启动子随机序歹0、全基因组启动子序列)比较有显著差异P<0.01(z—test)。 Sigmficantly different from the background model(Random,Genome)atP<0.01(E—test) 2.3保守元件功能分析 为了预测MEME得到的元件的生物学功能,我们将元件的保守序列(表1)提交到网上的元件数据 库。网上的元件数据库比较多,主要有PlantCARE、PLACE、TRANSFAC数据库,我们的分析结果表明, TRANSFAC的公共数据库中植物来源的元件较少,而PlantCARE检索到的结果比较少,所以我们最后采 用的是PLACE的结果。 从PLACE分析的结果中得知,Motif_l含有保守的CACGTG序列,是一种典型的G—box元件 一 。 G—box元件属于一种ABRE元件(ABA responsive element),该元件在ABA的信号转导过程中起重要作 用,与bZIP类转录因子结合,启动ABA诱导的下游功能基因的表达,广泛参与各种非生物胁迫过程 ]。 元件的显著性分布分析(表3)也表明该元件显著分布与盐胁迫诱导的基因中,这也是与它的功能相一致。 另外,ABRE元件还需要另外一个元件相伴才能发挥作用,它的伴元件可以是ABRE元件,也可以是其他 元件,如CE3元件 。Motif_3含有保守序列NCGNCGNCGN,CGACG元件被认为是一种G—box的伴元 件 J,但是在Motif_3中CGACG元件的A碱基不保守。Motif_4和Motif_6互为互补序列,含有保守序列 (TC)n,属于CT—rich元件,最早在CaMV 35S启动子转录起始位点上游60bp位点发现,具有增强基因表 达的功能 10]。Motif_8的保守序列GACGTGGCA[GT],含有ABRE元件的核心保守区ACGT序列,是一种 ABRE—like顺式作用元件¨ 。不过大多数的ABRE元件是[cT]ACGT,但在Motif_8元件中该序列为 GACGT。Motif_9(CCAC[CT][AG]CCAC)含有的CACT序列是一种在叶肉细胞中特异表达的元件¨ ,同 时GCCAC(SORLIPs)元件是一种光诱导基因启动子顺式作用元件¨ ’ j。Motif一10(CACCG[ATG]cc [AC]A)类似于DRE(Dehydration—Responsive Element)元件(CCGAC),DRE元件也是一种广泛参与逆境 胁迫的瞬时作用元件,与转录因子DREB互作启动抗逆境基因的表达 ” 。不过Motif一10元件中的 CCGAC中的A碱基不保守。Motif_2 Motif_5 Motif_7未检索到相关信息,属于功能未知的元件。 3讨论 在本项研究中,我们使用生物信息学方法在全基因组的范围内查找了拟南芥与盐胁迫有关的保守元 件,分析了这些元件的分布规律和它们的功能。在l0个发现的元件中,有3个元件(Motif_l\Motif8\Mo- tif_10)显著分布于盐胁迫处理0.5 h、1 h上调的基因启动子中;同时Motif_l\Motif_10还显著不分布于盐 胁迫下调的基因中。功能分析表明Motif_l含有保守的CACGTG序列,是典型的G—box元件。该元件属 于ABRE元件的一种,参与逆境胁迫中ABA依赖的信号转导途径。同时显著性分布分析表明Motif_l在 盐胁迫上调基因中分布最广。以上结果表明,在盐胁迫信号转导过程中,G—box是ABRE元件(核心序列 ACGT)的一种主要形式。Motif_8也含有ABRE元件的核心序列ACGT;Motif_10含有DRE元件的保守序 列CCGAC。但由于这两个元件分别含有不保守的碱基(Motif_8:G—ACGT VS.[CT一]ACGT;Motif_10:CCG 山东农业大学学报(自然科学版) 第4l卷 [ATG一]C VS.CCGA—C),所以Motif_8\Motif_10也可能是新的与盐胁迫有关的元件。 其余的元件,它们的分布情况与随机序列比较具有非常好的显著性分布,但与全基因组的启动子比较 并没有显著性差异,这说明这些元件可能是一些参与普遍调控机制的顺式作用元件,有实验表明Motif_4\ 6(CT/AG)n和Motif_2\7(CTI'/AAG)13序列参与非B型DNA结构的形成,而非B型DNA结构的形成 是染色体水平上基因表达调控的一种重要形式。另外(CTI")n,(CGN)n,(CA)I1序列与DNA的甲基 化有关,参与基因的表达调控 。 通过生物信息学方法的分析,我们在基因组的水平上揭示参与盐胁迫响应的顺式作用元件,为进一步 阐明盐胁迫等非生物胁迫的信号转导途径奠定了基础。 表4元件功能分析 Table 4 Function of motifs found by MEME 参考文献 [1]Kilian,J.,et a1.,The AtGenExpress global stress expression data set:protocols,evaluation and model data analysis of UV—B light,drought and cold stress responses.Plant J,2007.50(2):P.347—63 [2]Molina,C.and E.Grotewold,Genome wide analysis of Arabidopsis core promoters.BMC Genomics,2005.6(1):P.25 [3]Bailey,T.L.,et a1.,MEME:discovering and analyzing DNA and protein sequence Motifs.Nucleic Acids Res,2006.34(Web Server issue): P.W369—73 [4]Gomez—Porras,J.L.,et a1.,Genome—wide analysis of ABA—responsive elements ABRE and CE3 reveals divergent patterns in Arabidopsis and rice.BMC Genomics,2007.8:P.260 [5]Menkens,A.E.,U.Schindler,and A.R.Cashmore,The G—box:a ubiquitous regulatory DNA element in plants bound by the GBF family of bZIP proteins.Trends Biochem Sci,1995.20(12):P.506—10 [6]Busk,P.K.and M.Pages,Reuglation of abscisic acid—induced transcription.Plant Mol Biol,1998.37(3):P.425—35 [7]Siberil,Y.,et a1.,Catharanthus roseus G—box binding factors 1 and 2 act as repressors of strictosidine synthase gene expression in cell cultures. Plant Mol Biol,2001.45(4):P.477—88 [8]Yamaguchi—Shinozaki,K.and K.Shinozaki,Organization of cis—acting regulatory elements in osmotic—and cold—sterss—responsive promot- ers.Trends Plant Sci,2005.10(2):P.88—94 [9]Hwang,Y.S.,et a1.,Three cis—elements required for irce alpha—amylase Amy3D expression during sugar starvation.Plant Mol Biol,1998. 36(3):P.331-41 [10]Pauli,S.,et a1.,The caulilfower mosaic virus 35S promoter extends into the transcribed region.J Virol,2004.78(22):P.12120—8 [1 1]Simpson,S.D.,et a1.,Two different novel cis—acting elements of erdl,a clpA homologous Arabidopsis gene function in induction by dehydra— tion stress and dark—induced seneScence.P1ant J.2003.33(2):P.259—7O [12]Nakashima,K.,et a1.,Transcriptional regulation of ABI3一and ABA—responsive genes including RD29B and RD29A in seeds,germinating embryos,and seedlings of Arabidopsis.Plant Mol Biol,2006.60(1):P.51—68 (下转第174页) ・174・ 山东农业大学学报(自然科学版) 第4l卷 另外,李广领 等报道了田间条件下喷施三唑酮对玉米褐斑病有较好的防治效果,而本研究结果表 明该药剂对玉米褐斑病菌休眠孢子囊的萌发没有抑制作用。研究还发现三唑类药剂对玉米褐斑病菌休眠 孢子囊萌发的抑制作用差异很大,如戊唑醇、丙环唑、苯醚甲环唑能抑制休眠孢子囊的萌发,而三唑酮则对 休眠孢子囊的萌发无显著抑制作用;而且随着温度的变化,三唑类药剂的抑制作用也呈现不同的变化趋 势,如丙环唑和苯醚甲环唑对萌发的抑制作用随温度的升高而逐渐增强,戊唑醇与之相反。因此,本研究 所筛选出的药剂仅说明其能抑制玉米褐斑病菌休眠孢子囊的萌发,从而减轻病菌对玉米的侵染,但所筛选 出的药剂(如代森锰锌、恶霉灵)和三唑类药剂对休眠孢子囊萌发释放出的游动孢子、游动孢子所产生的 侵染丝及侵染后产生的根状菌丝体的体外寄生单倍体阶段等有无抑制作用,还有待进一步研究。 参考文献 [1]冯艳梅.玉米褐斑病的发生及防治[J].现代农业科技,2008,9:84 [2]郝伟.玉米褐斑病重发原因与防治对策[J].粮食作物,2008,4:113—116 [3]金晓华,何其明,徐泽海,等.玉米揭斑病在京郊夏玉米上发生及危害[J].植物保护,1994,6:46—47 [4]李绍伟,李绍生,赵国建,等.2006年豫东地区玉米褐斑病大流行的原因分析及防治对策[J].中国种业,2007,7:46-47 [5]李石初.玉米褐斑病调查研究初报[J].作物杂志,2003,2:45—46 [6]毛朝军.玉米褐斑病的发生及预防[J].河南农业,2002,(7):18 [7]沈光斌.玉米褐斑病重发原因及防治技术[J].安徽农学通报,2000,12(5):191 [8]孙炳剑,雷小天,袁虹霞,等.玉米褐斑病暴发流行原因分析与防治对策[J].河南农业科学,2006,(I1):61—62 [9]L.LANGE nd L.W.OLSON.Germination of the Resting Sporangia of Physoderma maydis,the Causal Agent of Physoderma Disease of Maize [J].Protoplasma,1980,102:323—342 [1O]L.W.OLSON,U.M.EDEN,and L.LANGE.The Endobiotic Thallus of Physoderma maydis,the Causal Agent of Physoderma Disease of Maize[J].Protoplasma,1980,103:1一l6 [1 1]L W.OLSON and L.LANGE.The Meiospore of Physodemar maydis.The Causal Agent of Physodemar Disease of Maize[J].Protoplasma, 1978,97:275—290 [12]陈家想.玉米褐斑病发生与防治[J]北京农业,2000,12:35 [13]董金皋.农业植物病理学(北方本)[M].北京:中国农业出版社,2001:104—106 [14]李广领,吴艳兵,王建华,等.不同杀菌剂对玉米褐斑病田间药效试验[J].西北农业学报,2009,18(2):280—282 (上接第168页) [13]Gowik,U.,et a1.,cis—Regulatory elements for mesophyll—specific gene expression in the CA plant Flavefia trinervia,the promoter of the C4 phosphoenolpyruvate earboxylase gene.Plant Cell,2004.16(5):P.1077—90 [14]Hudson,M.E.and P.H.Quail,Identification of promoter Motifs involved in the network of phytochrome A—reulgated gene expression by eom・ bined analysis of genomic sequence and mieroarray data.Plant Physiol,2003.133(4):P.1605一l6 [15]Jiao,Y.,et 1a.,Conservation and divergence of light—reulgated genome expression patterns during seedling development in irce and Arabidop— sis.Plant Cell,2005.17(12):P.3239—56 [16]Kizis,D.and M.Pages,Maize DRE—binding proteins DBF1 and DBF2 are involved in rabl7 reulgation through the drought—responsive element in n ABA—dependenta pathway.Plant J,2OO2.30(6):P.679—89 [17]Oubouzet,J.G.,et a1.,OsDREB genes in rice,Oryza sativa L.,encode transcription activators that function in drought一,high—salt—and cold— responsive gene expression.Plnta J,20O3.33(4):P.751—63 [18]Colot,V.and J.L.Rossignol,Eukaryotie DNA methylation as an evolutionary device.Bioessays,1999.21(5):P.402—11 [19]Hohn,T.,et a1.,Methylation of coding regionaloneinhibits gene expressionin plant protoplasts.Proc Natl Acad Sei U S A,1996.93(16): P.8334—9 

因篇幅问题不能全部显示,请点此查看更多更全内容