2017-02,38(1)中国烟草科学  Chinese Tobacco Science                                15 普通烟草ERF转录因子亚家族成员鉴定及表达模式分析
任昂彦1,2,孔英珍1*
(1.中国农业科学院烟草研究所,青岛266101;2.中国农业科学院研究生院,北京100081)
摘要:乙烯结合响应因子(Ethylene-responsive element binding factors, ERF)家族广泛参与植物的生长发育、逆境调节及激素信号应答等过程。利用生物信息方法,鉴定普通烟草基因组ERF转录因子亚家族成员,并对该亚家族成员的染体定位、理化性质、系统发生、保守结构域、亚细胞定位和组织表达模式进行分析。结果显示,目前在普通烟草中得到121个ERF基因,在烟草24条染体分布位置具有不均匀性。通过构建进化树,根据拟南芥ERF亚家族的分类方式将烟草ERF 亚家族分为6组,同一分组成员的理化性质及保守域呈现高度一致性。亚细胞定位分析结果显示,绝大部分成员定位在细胞核,少数定位在线粒体和叶绿体上。组织表达模式分析结果显示,烟草ERF基因在幼根、成熟根、离体叶和茎中表达量较高,不同分组成员之间表达存在差异。
关键词:普通烟草;ERF基因家族;生物信息;表达模式;基因家族
中图分类号:S572.03        文章编号:1007-5119(2017)01-0015-08      DOI:10.13496/j.issn.1007-5119.2017.01.003
Genome-wide Identification and Expression Pattern Analysis of the ERF
Gene Subfamily in Nicotiana tabacum
REN Angyan1,2, KONG Yingzhen1*
(1. Tobacco Research Institute, Chinese Academy of Agricultural Sciences, Qingdao 266101, China; 2. Graduate School of Chinese
Academy of Agricultural Sciences, Beijing 100081, China)
Abstract: Ethylene-responsive element binding factors (ERF transcription factors) family is widely involved in plant development, stress resistance and hormone response. Using bioinformatics methods, we have identified 121 ERF transcription factors that are located on 24 chromosomes irregularly in Nicotiana tabacum. This was followed by analyzing their chromosomal location, protein properties, phylogenetic relation, conserved domain structure, subcellular localization as well as tissue expression profile. Based on phylogenetic analysis these 121 members of the ERF family were classified into six groups, according to the classification of Arabidopsis thaliana. Genes from the same group have similar properties and the conserved domains show a high degree of conservation. The res
ults of subcellular localization analysis indicate that most of the genes are located in the nucleus, while a small number of them are localized on the mitochondria and chloroplasts. Some genes of ERF transcript factors have high level expression in young roots, mature roots, leaves and stems. Also, genes from different groups have different expression profiles.
Keywords:nicotiana tabacum; ERF transcript factors; bioinformatics; expression pattern; gene family
乙烯结合响应因子(Ethylene-responsive element binding factors, ERF)也可称为EREBP (Ethylene-responsive element binding protein)是AP2/ERF转录因子超家族中最大的转录因子亚家族分支,是植物所特有的参与乙烯响应途径调节的转录因子家族,主要参与植物的逆境调节,比如干旱、低温、虫害等。AP2/ERF转录因子家族因含AP2保守结构域而得名,该结构域由58~60个保守的氨基酸序列组成。2002年Sakuma等[1]根据AP2结构域的数量及结构,将拟南芥AP2/ERF转录因子家族
基金项目:国家自然科学基金项目“拟南芥MUR3基因通过影响木葡聚糖结构参与细胞伸长的分子机制研究”(31470291)、“拟南芥MYB52转录因子调控果胶质去甲酯化过程的分子机制”(31670302);国家科技部支撑计划项目“高生物量能源植物和新型生物质资源培育与综合利用示范”(2015BAD15B03)
作者简介:任昂彦(1989-),女,在读硕士,研究方向为分子育种。E-mail:ray0918@163。*通信作者,E-mail:kongyingzhen@163
收稿日期:2016-08-16                  修回日期:2016-11-08
16                                          中国烟草科学                                    2017年第38卷
分为5个亚家族:AP2、RA V、ERF、DREB和其他。其中AP2亚家族成员蛋白序列中含有2个AP2结构域;RA V亚家族含有1个AP2结构域和1个B3结构域;ERF和DREB亚家族均只含有1个AP2结构域,但结构域的序列结构有所区别;除此之外有1个单独基因独立分为1个亚家族。拟南芥ERF 亚家族的AP2保守结构域可与GCCbox(AGCCGCC)特异性结合,并且AP2结构域的氨基酸序列的第14和19位分别为丙氨酸(Ala)和天冬氨酸(Asp)[1],而DREB亚家族相应位置分别为缬氨酸(Val)和谷氨酸(Glu)。近年来,陆续在不同的物种鉴定出了ERF亚家族的转录因子,例如拟南芥[2]、水稻[3]、烟草[4]、柳树[5]、大豆[6]、棉花[7]、马铃薯[8]、小麦[9]等,这些ERF转录因子主要参与低温、干旱、高渗等非生物胁迫和防御病原感染等生物胁迫调节[10]。另外,ERF类转录因子参与激素信号转导也已被广泛报道,例如大豆GmERF3可被脱落酸、水杨酸、茉莉酸和乙烯利所诱导[6]。
随着生物信息技术的发展和基因组测序工作的完成[11],AP2/ERF转录因子超级家族已成为研究的热点。在茄科植物研究中,2010年Sharma等[12]利用EST(expressed sequence tag,表达序列标签)数据库鉴定出番茄有85个ERF基因,水稻有139个AP2/ERF成员[13],在辣椒中发现123个成员[14],在马铃薯中鉴定出155个AP2/ERF成员[8]等。目前对烟草的DREB亚家族有所报导[15-16],但对ERF亚家族基因鲜有鉴定分析。
烟草作为重要的经济作物及模式植物,研究其ERF转录因子亚家族基因分布、保守结构域的结构、染体定位、亚细胞定位及表达模式分析等,对研究烟草的生长发育具有重要意义。因此,本研究利用生物信息方法对烟草的ERF亚家族基因进行鉴定及基因表达分析,为研究ERF基因在烟草中的功能奠定基础。
1  材料与方法
1.1普通烟草ERF转录因子家族蛋白序列的鉴定
基于TAIR数据库(/)报导的拟南芥ERF转录因子亚家族65个成员蛋白全长序列,在茄科数据库SNG(solgenomics. net/)和NCBI数据库(bi.v/)进行Blastp检索(e值:≤1e-15),获得烟草的相似序列,去除重复,作为烟草ERF亚家族的候选序列。结合Pfam数据库(pfam.sanger.ac.uk/)[17]中AP2结构域序列号PF00847和SMART(smart. embl-heidelberg.de/)[18]在线分析候选序列的结构域,确保含有AP2结构域,依据拟南芥ERF亚家族AP2结构域的数量和结构特征,确定烟草ERF转录因子亚家族成员。
1.2  ERF转录因子蛋白全长理化性质分析
利用ExPASy ProtParam(/ protparam/)对所得烟草ERF蛋白序列进行理化性质
分析[19]。利用WolF PSORT(script. com/wolf-psort.html)和TargetP(www.cbs.dtu. dk/services/TargetP/)在线工具对烟草ERF亚家族成员进行亚细胞定位分析[20]。
1.3  普通烟草ERF转录因子家族进化分析
利用Muscle[19]程序对拟南芥和普通烟草ERF 亚族的蛋白序列进行多序列比对,基于比对结果利用MEGA6.0[21]软件采用邻接法(Neighbor-Joining,NJ)构建拟南芥和普通烟草ERF亚族进化树,检验参数(Bootstrap)设置为1000。
1.4  ERF亚家族蛋白全长基序及多序列比对分析
利用MEME4.11.2(Multiple Expectation Maximization for Motif Elicitation, meme. nbcr. net/meme/i)[22]在线平台分析普通烟草ERF亚家族成员蛋白全长的保守基序(Motif),最大motif检索值定为10。
利用ClustalW(jp/tools/ clustalw/)[10]进行多序列比对,参数设置为默认值,并利用BoxShade程序将比对结果可视化。
1.5  不同组织表达模式分析
在NCBI数据库中下载烟草转录组数据,利用R语言Bioconductor程序对转录数据进行分析并提
第1期任昂彦等:普通烟草ERF转录因子亚家族成员鉴定及表达模式分析                    17
取ERF亚家族转录组数据,进行均一化,利用MeV 本地软件绘制热图。
2  结果
2.1  普通烟草ERF亚家族成员鉴定及染体定位
利用已知拟南芥ERF亚族蛋白全长序列和保守的结构域序列在NCBI和SGN数据库中进行Blastp检索烟草序列,结合Pfam和SMART数据库和ERF家族序列特征,筛选出121个烟草ERF亚家族成员。
根据烟草基因组注释信息,将获得的烟草ERF 亚家族基因定位在烟草21条染体上(chromosome,Chr)(表1),依据染体定位结果,对基因进行重新编号。基因定位结果显示,121个基因在21条染体上呈不均匀分布,在Chr 4和Chr 6上ERF基因数目最多,Chr 8、Chr 21、Chr 23均没有ERF亚家族的基因存在。
2.2  蛋白序列进化树分析及理化性质分析
对获得的121个烟草ERF转录因子成员与拟南芥ERF亚家族的65个成员进行系统发生分析,根据拟南芥ERF亚家族的分类方式将烟草的ERF 亚家族分为6组(Group)(Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ),每组分
别包括16、9、41、20、7和28个ERF 成员,根据图1显示,将烟草ERF亚家族的Group Ⅵ分为Ⅵa和Ⅵb亚组(Subgroup),烟草ERF亚家族中每组至少含有4个拟南芥ERF同源基因。
分析烟草ERF蛋白全长理化性质,结果显示,最长的蛋白序列(NtERF119)由894个氨基酸组成,最短的蛋白序列(NtERF89)包含86个氨基酸,除这两个蛋白序列外,其余蛋白序列氨基酸数目均在127~447,变化范围较小。除NtERF119(100.23 kDa)和NtERF89(9.89 kDa)外,其余蛋白分子量变化范围在14.56~48.34 KDa。烟草ERF亚家族121个成员的等电点范围在4.44~10.05,变化幅度较大。不同分组之间的蛋白序列长度以及等电点呈无规律变化,其中GroupⅡ的蛋白序列氨基酸大小变化范围较小在233~395,等电点NtERF51为7.75,其余成员的等电点在4.56~5.76,说明该组成员的蛋白含有较多的酸性氨基酸。GroupⅤ的氨基酸长度变化范围较小在297~380,等电点在4.44~5.22,含有较多的酸性氨基酸。
2.3  蛋白序列基序及序列特征分析
由图2可知,烟草ERF蛋白全长的保守基序(Motif)特征为:同组成员的基序组成相似。并且所有成员均含有Motif1、Motif2和Motif3或者Motif1、Motif3和Motif10共同组成AP2保守结构域。GroupⅠ和GroupⅡ成员均只含有Motif1、Motif2 和Motif3组成的AP2保守结构域;GroupⅢ是成员最多,也是保守域构成最为复杂的一组,特有的3个Motif为:Motif5、Motif8、Motif9;GroupⅣ所特有的包括Motif4和M
otif7;GroupⅤ中各成员的保守域结构一致性较高,除了AP2保守结构域以外还含有Motif6;SubgroupⅥa和SubgroupⅥb存在差异,SubgroupⅥb中所有成员的N端都有一个Motif56;SubgroupⅥa中有6个成员的AP2结构域由Motif1、Motif3和Motif10共同组成(图2)。此外,同一分组成员的基序组成具有一致性,不同组之间基序的组成不同,这一点也证实了分组的可靠性。
从GroupⅠ~Ⅴ和SubgroupⅥa中随机选取成员蛋白序列进行多序列比对,分析AP2结构域发现,该结构域均含保守较强的WLG元件,位于Motif1中(图3)。且AP2结构域由60个左右的氨基酸序列组成,其中Arg-8、Gly-11、Ile-17、Arg-18、Arg-26、Ala-39、Asp-43和Asn-57都是非常保守的氨基酸位点。对各成员蛋白全称进行分析,预测6个功能未知的保守序列,其中Motif4和Motif8分别包含41和30个保守的氨基酸序列,保守性相对较高;Motif5、Motif6、Motif7和Motif9只有少数位置上氨基酸保守性较高(图3)。
18                                          中国烟草科学                                    2017年第38卷
表1  普通烟草ERF家族蛋白理化性质分析
Table 1 Characteristic analysis of ERF proteins in Nicotiana tabacum
基因编号
正则化工具包
体定位
分组
氨基酸
数目
分子量/
KDa
等电
亚细胞
定位
拟南芥
同源基因
基因编号
体定位
分组
氨基酸
数目
分子量/
KDa
等电
亚细胞
定位
拟南芥
同源基因
NtERF1    1 Ⅵ203 22.53 7.70 Nuc at1g15360 NtERF67 9 Ⅴ357 39.08    5.06 Nuc at4g23750 NtERF2    1 Ⅵ172 19.81 9.20 Mit at5g25190 NtERF68 9 Ⅰ242 26.10 9.41 Chl at1g53170 NtERF3    1 Ⅵ397 44.77 8.90 Nuc at1g80580 NtERF69 10 Ⅵ181 20.71 9.41 Mit at5g25190 NtERF4    1 Ⅱ387 42.84    4.66 Nuc at1g53910 NtERF70 10 Ⅲ232 25.99    6.52 Nuc at3g23240 NtERF5    1 Ⅲ204 23.09 9.05 Nuc at5g07580 NtERF71 10 Ⅲ148 16.95 8.76 Nuc at3g23230 NtERF6    1 Ⅲ282 31.83    6.05 Nuc at5g51190 NtERF72 10 Ⅲ130 14.84    5.30 Nuc at3g23220 NtERF7    1 Ⅲ290 33.05    5.85 Nuc at5g51190 NtERF73 10 Ⅴ373 42.01    4.44 Nuc at4g27950 NtERF8    1 Ⅲ183 20.33    6.32 Chl at4g17500 NtERF74 10 Ⅰ303 32.98 8.80 Nuc at3g15210 NtERF9    1 Ⅳ275 31.07 8.75 Nuc at4g34410 NtERF75 11 Ⅵ222 24.67 9.30 Nuc at5g25390 NtERF10    2 Ⅰ166 18.43 9.51 Nuc at5g442
10 NtERF76 11 Ⅳ283 31.36    5.60 Nuc at4g34410 NtERF11    2 Ⅱ247 27.65    5.68 Nuc at2g47520 NtERF77 11 Ⅰ227 24.65 7.90 Nuc at5g44210 NtERF12    2 Ⅲ165 18.85 7.11 Nuc at3g23230 NtERF78 11 Ⅵ214 23.85 9.20 Nuc at5g25390 NtERF13    2 Ⅳ224 25.47 7.14 Nuc at5g13330 NtERF79 12 Ⅵ329 36.78    4.80 Nuc at1g68550 NtERF19    4 Ⅳ222 25.32 8.61 Nuc at5g13330 NtERF80 12 Ⅲ241 27.06    5.50 Nuc at3g23240 NtERF20    4 Ⅳ252 28.94    6.00 Nuc at5g07310 NtERF81 12 Ⅱ233 26.26    5.60 Nuc at3g16770 NtERF21    4 Ⅵ198 22.07 7.70 Nuc at1g15360 NtERF82 12 Ⅲ221 25.47    6.90 Nuc at2g44840 NtERF22    4 Ⅵ230 25.90 8.23 Nuc at5g19790 NtERF83 12 Ⅳ230 26.07 8.80 Nuc at4g34410 NtERF23    4 Ⅴ380 42.85    4.68 Nuc at4g27950 NtERF84 12 Ⅳ281 31.55 8.50 Nuc at4g34410 NtERF24    4 Ⅱ380 42.13    4.74 Nuc at1g53910 NtERF85 12 Ⅴ297 34.28    5.10 Nuc at3g61630 NtERF25    4 Ⅲ291 32.88    6.48 Nuc at1g53910 NtERF86 13 Ⅵ365 40.67    4.50 Nuc at5g19790 NtERF26    4 Ⅲ276 31.47    6.05 Nuc at5g51190 NtERF87 13 Ⅳ217 24.10 8.50 Cyt at2g33710 NtERF27    4 Ⅲ277 31.32    5.62 Nuc at5g51190 NtERF88 13 Ⅵ431 48.20    4.60 Nuc at5g19790 NtERF28    4 Ⅲ233 25.56 7.74 Nuc at4g17500 NtERF89 14 Ⅵ86 9.89 10.0 Mit at5g25390 NtERF29    4 Ⅰ225 24.26 8.63 Nuc at5g44210 NtERF90 14 Ⅵ205 22.95 8.30 Nuc at1g15360 NtERF30    4 Ⅳ227 25.76 7.07 Nuc at2g33710 NtERF91 14 Ⅰ188 21.05 8.70 Nuc at3g20310 NtERF31    4 Ⅳ199 22.32 8.96 Cyt at2g33710 NtERF92 14 Ⅰ288 30.68    6.70 Nuc at3g15210 NtERF32    4 Ⅳ253 28.49    6.75 Nuc at4g34410 NtERF93 14 Ⅲ267 30.
68    5.00 Nuc at4g18450 NtERF33    5 Ⅲ393 43.14    5.35 Nuc at5g47220 NtERF94 14 Ⅴ377 42.46    4.80 Nuc at4g27950 NtERF34    5 Ⅲ242 26.98    5.08 Nuc at5g47220 NtERF95 15 Ⅲ268 30.50    6.70 Nuc at5g51190 NtERF35    5 Ⅲ248 27.58    5.34 Nuc at4g17500 NtERF96 15 Ⅲ205 22.72    6.70 Nuc at5g07580 NtERF36    5 Ⅵ309 34.66    6.86 Nuc at1g68550 NtERF97 15 Ⅲ191 21.61    5.10 Nuc at3g23240 NtERF37    5 Ⅲ135 15.44    5.13 Nuc at5g43410 NtERF98 16 Ⅲ188 21.34 7.70 Nuc at3g23240 NtERF38    5 Ⅰ326 36.43    5.02 Nuc at5g13910 NtERF99 16 Ⅲ234 26.97    5.30 Nuc at3g23240 NtERF39    5 Ⅳ274 30.92 9.03 Nuc at5g64750 NtERF100 16 Ⅲ273 31.14    6.70 Nuc at5g61600 NtERF40    5 Ⅲ319 36.82    6.33 Nuc at3g23240 NtERF101 16 Ⅲ236 26.24 8.50 Nuc at4g17500 NtERF41    6 Ⅲ204 23.18 8.23 Nuc at2g44840 NtERF102 17 Ⅵ383 43.13    4.60 Nuc at5g19790 NtERF42    6 Ⅲ186 20.88 7.88 Nuc at2g44840 NtERF103 17 Ⅵ412 46.41    4.70 Nuc at5g19790 NtERF43    6 Ⅲ217 24.18 7.13 Nuc at2g44840 NtERF104 18 Ⅰ219 24.24 8.60 Nuc at1g50640 NtERF49    6 Ⅳ285 31.48    6.53 Nuc at4g34410 NtERF105 18 Ⅴ359 39.41    5.20 Nuc at4g23750 NtERF50    6 Ⅵ286 31.69 9.87 Nuc at5g19790 NtERF106 18 Ⅵ202 23.02 7.80 Mit at5g25190 NtERF51    6 Ⅱ258 28.97 7.75 Nuc at2g47520 NtERF107 19 Ⅳ257 28.85 8.20 Nuc at4g34410 NtERF52    6 Ⅰ166 18.40 10.1 Nuc at1g50640 NtERF108 19 Ⅳ261 29.40 9.00 Nuc at4g34410 NtERF53    6 Ⅲ165 18.73 7.99 Nuc at3g23230 NtERF109 19 Ⅵ285 32.29    5.40 Chl at5g19790 NtERF54    6 Ⅲ128 14.74    4.88 Nuc at3g23220 NtERF110 19 Ⅵ309 34.81    5.00 Nuc at5
g19790 NtERF55    6 Ⅵ175 20.06    6.98 Nuc at2g33710 NtERF111 20 Ⅳ363 40.14 9.10 Nuc at5g64750 NtERF56    6 Ⅵ398 45.17 9.76 Nuc at2g46310 NtERF112 20 Ⅲ244 26.98    5.40 Nuc at4g17500 NtERF57    6 Ⅵ178 20.03 9.61 Nuc at4g11140 NtERF113 20 Ⅲ243 27.15    4.90 Nuc at4g17500 NtERF58 7 Ⅰ227 25.01 7.89 Nuc at1g50640 NtERF114 20 Ⅲ242 27.15    5.20 Nuc at5g47220 NtERF59 7 Ⅵ177 19.90 9.68 Nuc at4g11140 NtERF115 20 Ⅰ349 39.29    4.80 Nuc at5g13910 NtERF60 7 Ⅵ389 44.37 9.67 Nuc at2g46310 NtERF116 20 Ⅰ255 27.34 9.40 Chl at5g44210 NtERF61 7 Ⅰ201 22.38 8.21 Nuc at3g20310 NtERF117 22 Ⅰ221 24.30 8.60 Nuc at1g50640 NtERF62 9 Ⅲ127 14.57    6.78 Mit at3g23220 NtERF118 22 Ⅵ341 37.93    4.50 Nuc at1g68550 NtERF63 9 Ⅲ157 17.86 9.32 Nuc at3g23230 NtERF119 24 Ⅳ894 100.23 9.00 Nuc at5g07310 NtERF64 9 Ⅲ241 27.07    5.42 Nuc at3g23240 NtERF120 24 Ⅱ395 43.72    4.56 Nuc at1g53910 NtERF65 9 Ⅱ257 28.86    5.76 Nuc at3g16770 NtERF121 24 Ⅳ447 48.35    6.26 Nuc at5g64750 NtERF66 9 Ⅰ320 36.21    4.77 Nuc at5g18560
注:Nuc表示细胞核;Mit表示线粒体;Chl表示叶绿体;Cyt表示细胞质。
第1期任昂彦等:普通烟草ERF转录因子亚家族成员鉴定及表达模式分析                    19
图1  普通烟草和拟南芥ERF家族进化树分析
Fig. 1    A phylogenetic tree of ERF family proteins in N.tabacum and Arabidopsis Thaliana
注:10个不同的方块代表10个不同的Motif
图2  普通烟草ERF家族蛋白分组及保守基序分布分析
Fig. 2 Classification and conserved motif analysis of the ERF gene family in N. tabacum

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。