关于我们
你的位置:车上一下子就弄进去了岳 > 关于我们 > 卵白质组学人人数据库资源汇总

卵白质组学人人数据库资源汇总

发布日期:2025-12-24 11:40    点击次数:68

提到卵白质数据库,专家齐很老到了,基本上每个数据库齐会配备一个网页用具让专家查询粗略作念一些肤浅的卵白质数据分析,以下是一些有名的卵白质组数据库:

TrEMBL: 由欧洲生物信息学征询所(EMBL-EBI)爱戴的卵白质数据库,提供基于UniProt措施的自动瞩目信息。UniProt: 一个全面的、高质料的卵白质数据库,包含来自UniProtKB/Swiss-Prot的手动瞩目卵白质和来自TrEMBL的诡计机瞩目卵白质。Human Protein Atlas: 一个容貌,旨在分析统统东谈主类卵白质在各式组织中的抒发和定位。STRING: 一个数据库和麇集资源,提供已知和瞻望的卵白质-卵白质相互作用。

然而卵白质组数据库并不是卵白质数据库,主若是ProteomeXchange定约,它是一个开放的、人人的数据存储平台,特意用于存储和分享质谱(MS)数据。它由多个卵白质组学数据存储库构成,包括PRIDE Archive、MassIVE、PeptideAtlas 以及iProX等 。

比如咱们不错看到一个卵白质组学著述:https://www.sciencedirect.com/science/article/pii/S0300483X20302912?via=ihub

Availability of data and materialThe proteomics data have been deposited to the ProteomeXchange Consortium via the PRIDE (Perez-Riverol et al., 2019) partner repository with the dataset identifier PXD020248.

ProteomeXchange的缠绵是促进数据的圭臬化、分享和再期骗,解救卵白质组学征询的进一步发展。它着力FAIR原则(可查找性、可走访性、互操作性和可重用性),以确保数据的质料和可用性。一般来说咱们老到iProX(外洋卵白质组学疏导平台)和PRIDE(卵白质组学飘舞数据库)即可:

iProX: iProX(外洋卵白质组学疏导平台)是一个由中国卵白质组学征询者成立的数据库,旨在存储和分享基于质谱的卵白质组学数据。iProX为科研东谈主员提供了一个平台,用于提交、管制和走访卵白质组学数据,解救数据的圭臬化和分享。iProX数据库也着力ProteomeXchange的数据圭臬,促进了全球卵白质组学数据的整合和分析。PRIDE: PRIDE(卵白质组学飘舞数据库)是EMBL-EBI(欧洲生物信息学征询所)爱戴的一个数据库,它是ProteomeXchange定约的一部分。PRIDE特意网罗和存储质谱数据,异常是卵白质和肽段的飘舞和定量信息。PRIDE数据库解救用户上传数据、下载公开数据集,并提供了一系列的分析用具,匡助科研东谈主员进行卵白质组学征询。PRIDE(卵白质组学飘舞数据库)

是EMBL-EBI(欧洲生物信息学征询所)爱戴的一个数据库,不错通过络续:https://www.ebi.ac.uk/pride/archive?sortDirection=DESC&page=2&pageSize=20

稽察数据库当今有的数据集数目:List of Datasets (27273)

比如最近的一个人人数据集即是:Neutrophil-derived migrasomes are an essential part of the coagulation system, mouse.

不错很明晰的看到这个pride数据库为这个数据集提供了raw模式的质谱仪器数据,以及卵白质组抒发量矩阵文献:

图片

小鼠-两分组-卵白质组-互异分析数据集

详备的数据集络续在:https://www.ebi.ac.uk/pride/archive/projects/PXD051229

不外咱们一般来说就洞开内部的ms220042-dia-20220111.xls文献进行后续的卵白质组抒发量互异分析即可

iProX(外洋卵白质组学疏导平台)

在 https://www.iprox.cn/page/BWV016.html 不错看到就 3,676 entries,因为是一个由中国卵白质组学征询者成立的数据库,是以绝大部分数据集齐是中国科研职责者提供的,并且绝大部分齐是在PRIDE(卵白质组学飘舞数据库)也有一个id,如下所示;

图片

3,676 entries,

苟且点击一个数据集进去:https://www.iprox.cn/page/ProjectFileList.html?projectId=IPX0006535000

Proteome of Chinese Breast Cancers (FUSCC-Shao Lab)IPX0006535000PartialPXD042886Jiang YZ, Shao ZM. Molecular features and clinical implications of the heterogeneity in Chinese patients with HER2-low breast cancer. Nature Communications. 2023 Aug 22;14(1):5112-. doi:10.1038/s41467-023-40715-x.Zhiming ShaoZhiming ShaoFudan University Shanghai Cancer Center12023-06-11 08:40:12

也不错看到它的其它id,只需要有id就不错走访它在不同数据库内部的数据纪录,比如:

https://proteomecentral.proteomexchange.org/cgi/GetDataset?ID=PXD042886https://www.ebi.ac.uk/pride/archive/projects/PXD042886如果数据集并莫得提供卵白质抒发量矩阵文献

因为原来即是有许多不同的卵白质组学技巧平台,比如 DIA、Label Free和TMT绚丽,它们的各自的 数据预处理经由 也有点划分哦:

DIA(Data-Independent Acquisition)数据预处理经由:

Spectronaut搜库计谋:

使用Spectronaut软件进行搜库,获取肽段和卵白的相对定量信息。数据log2治愈、缺失值过滤和填充、数据圭臬化,可能使用Combat去除批次效应。

DIA-NN搜库计谋:

使用DIA-NN进行搜库,得到相对定量值。进行log2治愈、数据圭臬化、缺失值处理,临了飘舞互异卵白。Label Free数据预处理经由:

Maxquant搜库计谋:

搜库效果提供Intensity、iBAQ、LFQ intensity三种定量值。数据log2治愈、样本内中值或quantile圭臬化、缺失值过滤和填充。进行互异定量分析。

Proteome Discoverer(PD)搜库计谋:

默许定量值为iBAQ。圭臬化方式为FOT(Fraction of Total)。缺失值填充,禁受顺应阈值进行填充。下流数据分析。TMT(Tandem Mass Tag)数据预处理经由:MSFragger搜库计谋:使用MSFragger进行搜库,得到pepXML模式搜库效果文献。期骗Philosopher用具包进行肽段、卵白和翻译后修饰的定量和过滤。PeptideProphet进行肽段飘舞和考证,PTMProphet进行修饰位点飘舞。ProteinProphet用于卵白飘舞。使用Philosopher进行FDR过滤和定量,获取TMT reporter ion intensity。参考通谈样品翻新,进行多重数据治愈和圭臬化。log2治愈、样本内中值圭臬化、缺失值处理、批次效应去除、互异抒发分析。 本站仅提供存储劳动,统统推行均由用户发布,如发现存害或侵权推行,请点击举报。

Powered by 车上一下子就弄进去了岳 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024