文献速递|基因组学数据库助力动植物种质资源研究

元莘生物 2024-08-16 11:14:04

随着基因组学研究的迅速发展,高通量测序技术的不断推出与改进,使得大规模基因组数据快速生成成为可能。由于基因组学数据体积巨大,传统的技术已经无法满足庞大的基因组学数据的存储、管理和分析。因此,非常有必要开发基因组学数据库,实现基因组学数据的高效查询、可视化和深度分析,助力科学研究。元莘生物提供优质的基因组学数据库开发服务,致力挖掘个性化的组学数据和共享解决方案。下面,小编将为大家分享近期发表的高分基因组学数据库文章,一起来学习吧!

文献一

AlliumDB:葱属比较基因组学和功能基因组学数据库

文献标题:AlliumDB: A central portal for comparative and functional genomics in Allium

发表期刊:Horticulture Research

影响因子:8.7(Q1)

发表时间:2023.12.29

文章链接:DOI: 10.1093/hr/uhad285

摘要

葱属(Allium)属于天南星科(Amaryllidaceae),包括洋葱、大蒜、束葱和韭菜等具有重要经济价值的作物,可用作蔬菜、香料和传统药物。葱属植物基因组庞大,阻碍了对重要农艺性状的遗传分析和分子育种。随着基因组、重测序、转录组和表型数据的不断积累,对综合性 Allium 数据库的需求日益增加。在此,该文章构建了一个用户友好型数据库 AlliumDB (https://allium.qau.edu.cn),作为整合公共数据和内部数据的功能基因组学中心。该数据库包含所有目前可用的葱属物种的核基因组和细胞器基因组,并根据GO和KEGG分析、直系同源、基因家族、蛋白质家族(Pfam)和非编码 RNA 家族(Rfam)对基因进行了全面注释。此外,该数据库将转录组数据和变异图谱整合到动态可视化工具中,通过拍摄表型照片等方法为全球收集的数百种葱属植物种质生成了性状记录。将 JBrowse 用于基因结构、RNA 测序数据和变异数据的可视化。分析工具,如基本局部比对搜索工具(BLAST)、序列提取,富集和基序分析用于探索潜在的基因功能。该数据库包含全面的葱属植物基因型和表型数据集。随着组装新的基因组和产生新的葱属植物种质资源重测序数据,数据库将随着这些多组学数据和比较基因组学研究而不断完善和更新。

文献二

Plant GARDEN:一个用于交叉搜索各种植物物种的不同类型基因组和遗传资源的门户网站

文献标题:Plant GARDEN: a portal website for cross-searching between different types of genomic and genetic resources in a wide variety of plant species

发表期刊:BMC Plant Biology

影响因子:5.3(Q1)

发表时间:2023.08.12

文章链接:DOI: 10.1186/s12870-023-04392-8

摘要

植物基因组信息对于植物研究和发展至关重要。随着已发布的植物基因组数量的增加,需要一个高效的系统从植物界许多植物物种中检索各种基因组相关信息。虽然开发了各种植物数据库,但没有一个公共数据库涵盖了不同植物物种的基因组和遗传资源。该文章开发了一个植物基因组门户网站Plant GARDEN(Genome And Resource Database Entry: https://plantgarden.jp/en/index),以提供与不同植物物种的植物基因组学和遗传学相关的多样化信息。使用Elasticsearch作为搜索引擎,并提供了跨物种的交叉关键词搜索功能。独立开发了面向个人计算机和平板电脑的基于Web的用户界面(WUI),使数据搜索更加方便。Plant GARDEN存储了多种类型的数据:参考基因组、基因序列、基于PCR的DNA标记、在遗传研究中鉴定的与特征相关的DNA标记、SNP以及公开可用的序列读取存档(SRA)上的插入/缺失变异。截至2023年3月,Plant GARDEN注册的数据包括304个组装的基因组序列、11,331,614个基因序列、419,132个DNA标记、8,225个QTL和5,934个SNP列表(gvcf文件)。此外,使用功能注释工具Hayai-Annotation对Plant GARDEN中注册的所有基因进行了重新注释,以比较基因之间的同源关系。Plant GARDEN最终将包括大量组装的植物物种的基因组序列,因此数据库中的植物物种数量将继续扩大,通过促进已注册序列的比较来推动对基因组和基因多样性的理解。

文献三

PPGR:综合性多年生植物基因组与调控数据库

文献标题:PPGR: a comprehensive perennial plant genomes and regulation database

发表期刊:Nucleic Acids Research

影响因子:14.9(Q1)

发表时间:2023.12.02

文章链接:DOI: 10.1093/nar/gkad963

摘要

多年生木本植物因其独特的特性而具有重要的生态意义。虽然在其基因组和功能研究方面取得了重大进展,但仍然存在一个重大挑战:缺乏一个全面的参考平台来收集、整合和深入分析大量数据。在此,该文章提出了 PPGR(Resource for Perennial Plant genomics and Regulation);https://ngdc.cncb.ac.Cn/ppgr/)数据库,通过收集、整合、分析和可视化多年生植物的基因组、基因调控和功能数据来弥补这一重大空白。PPGR目前包括60个物种,8.47亿个蛋白质/转录因子-靶标相互作用,9016个不同环境条件和遗传背景下的转录组样本。值得注意的是,PPGR 重点关注调控木材生产、季节性休眠、萜烯生物合成和叶片衰老的基因,这些基因代表了来自实验数据、文献挖掘、公共数据库和基因组预测的丰富信息。此外,PPGR 还集成了一系列多组学搜索和分析工具,以方便浏览和应用这些庞大的数据集。PPGR 是多年生植物的全面而优质的资源,通过实例研究证明了它在揭示基因功能和阐明潜在调控过程方面的能力。

本次文献速递分享了近期发表的葱属比较基因组学和功能基因组学数据库、植物大型基因组数据库和综合性多年生植物基因组与调控数据库。这些数据库整合多物种多组学数据、集成一系列组学搜索和分析的工具,便于查询和应用庞大的基因组学数据,有助于物种进化、分子育种和资源保护等研究。不知道本次关于基因组学数据库的分享是否对各位老师有帮助呢?

0 阅读:0

元莘生物

简介:专注于分子生物学好和高性能计算在医学领域的应用