metagenomics

从curatedMetagenoimcData提取健康样本的微生物组

简介

有人问我,这个curatedMetagenomicData有什么作用?对于我们这些research parasite(出处请见NEJM社论)来说,这样庞大的数据集当然是用来挖信息或者是测试算法了: 1. 作为validation cohort来验证已发现的结论。如我们的这篇文章都使用了2014年Oh et al发表于Nature的数据来佐证我们发现的Staphylococcus特异性突变。 2. 用来测试新方法,发现新的生物问题。如这篇文章中我们也用了Oh et al的数据来观测Malessezia在人体皮肤的分布。 3. 因为数据中有大量健康人的微生物组(不同研究中的control),我们也可以用它们补充我们的对照组(当然在机器学习中要注意数据不平衡问题)。 当然最基础的操作,就是要从数据库中提取数据。