甲藻与其它藻类是海洋中重要的初级生产者,共生藻科则是珊瑚等无脊椎动物所必需的共生生物,在海洋生态系统中发挥重要作用;然而藻类中又有许多种类会引发有害藻华。研究这些藻类在海洋环境中的生长规律、在海洋生态过程与生物地球化学过程中的角色与作用对于揭示海洋生态系统对气候与环境变化的响应及其社会效应至关重要。
基因组数据资源是开展此类研究的基础,但由于藻类基因组学起步较晚,一些种类(如甲藻)的基因组庞大(约3-120G),重复序列多且结构复杂,至今只有少量物种完成基因组测序,而这些基因组数据往往分布在不同的数据库,且没有方便检索和分析的工具。
基于以上背景,5123导航海洋生态基因组学团队整合了目前已测序的以共生甲藻为主的甲藻基因组和其它藻类基因组数据,建立了开放的共生甲藻和藻类基因组资源数据库(Symbiodiniaceae and Algal Genomic Resource Database,简称SAGER,http://sampgr.org.cn,图1)。
图1 SAGER数据库主页
SAGER数据库是利用多个工具和脚本结合开发的(图2),通过MySQL实现基因组数据的输入和管理。Nginx web服务器用于构建底层网络系统,Joomla!内容管理系统(CMS)和LayUI构建主页、下载页面、基因页面和搜索页面。第三方软件SequenceServe和JBrowse用于实现BLAST和基因组浏览器功能。利用PHP和JavaScript实现各个页面之间的灵活布局和交互转化。
图2 SAGER数据库架构
SAGER数据库整合了共生甲藻的基因组和转录组数据,包含6个共生甲藻物种(B. minutum、F. kawagutii、S. microadriaticum、C. goreaui、Symbiodinium sp.和Cladocopium sp)的基因组组装集、编码区核酸序列(CDS)、氨基酸序列、重新注释的基因集以及66个不同培养条件下基因的表达数据。用户可以通过基因编号、scaffold的位置、来自于任意数据库功能注释的关键词或者编号在Search页面对靶标基因进行关键词搜索,基因具体信息显示在Gene Page页面;也可通过JBrowse和BLAST工具进行数据的可视化和同源性比对搜索;四者之间可进行交互(图3)。此外,该数据库还整合了两个海洋浮游生物基因组数据(海洋真核微型生物转录组测序项目MMETSP以及PhyloDB(版本1.076)数据),并为它们提供BLAST同源搜索。
图3 数据库组成
SAGER自2020年7月创建开放以来,访问人数已经达到4196人次(数据截取至2021年12月30日)。
SAGER数据库也将持续更新藻类基因组数据资源,包括更新、涵盖共生甲藻和海洋浮游植物的室内培养样本的转录组数据,以及野外采集样本的相关测序数据,例如珊瑚共生体、有害藻华的宏转录组数据等。我们也将竭尽所能开发更多网页工具,扩宽数据库的各项功能,改善研究人员的使用体验,期待在未来SAGER能够成为藻类比较基因组学研究以及更多藻类科学工作者便利的检索工具。
供稿 :海洋生态基因组学实验室