研究人员使用分散的单细胞数据集构建细胞图谱
想象一个虚拟人体,它具有丰富的复杂性和细节,使科学家能够模拟无法在体内或体外进行的实验。一组中国研究人员通过开发一个无缝的以细胞为中心的数据组装框架,使这一愿景更接近现实,并使用从分散的公共数据集中收集的数据构建了人类整体细胞图谱(hECA)。
他们在4月28日发表于iScience的一项研究中展示了他们的统一信息学框架。hECA还在整合来自多个来源的人类单细胞数据和执行下游分析方面做出了里程碑式的贡献,该成果于7月4日发表在《定量生物学》上。
“hECA的案例研究表明,这种以细胞为中心的集合细胞图谱可以为生物医学研究带来革命,”清华大学的研究作者张学功说。
单细胞测序技术的快速发展,尤其是被称为单细胞转录组学的RNA测序方法,使科学家能够分析单个细胞并检查哪些基因在不同类型的细胞中开启。
世界各地的科学家在人类细胞图谱(HCA)和人类生物分子图谱计划等项目中致力于构建所有不同细胞类型的单细胞分辨率“图谱”。但是关于如何定义和组装细胞图谱仍然存在一些不确定性。
“细胞图谱组装的关键是细胞信息的组织,”张说。
自2017年HCA项目启动以来,已经发表了许多关于细胞图谱的论文,其中大部分是按项目逐项记录和索引的大量单细胞数据的集合。先前的研究认为,细胞映射是关于创建人体的三维骨架,并将观察到的细胞简单地组装到相应的位置。然而,人体对于这种类型的组装来说太复杂了。
相反,“细胞图谱的组装应该传达数据的多方面性质,并允许用户在不同的索引方法中使用自定义条件进行搜索,”张说。
与此同时,大量的单细胞转录组数据正从多机构合作中涌入公共领域,产生了PB级的数据,涵盖所有主要的成人人体器官以及关键的发育或病理阶段。
对于Zhang的团队来说,这些分散的公共单细胞数据提出了另一种构建细胞图谱的方法:从自下而上开始,组装来自多个来源的数据。
为了将来自多个来源的这种规模的数据组装成一个整体图谱,研究人员开发了一个统一的信息学框架,其中包括一个用于存储具有超高维度和体积的单细胞数据的特殊数据库基础设施,以及一个统一的层次注释框架使来自不同数据集的细胞类型标签具有可比性和一致性。研究人员还设计了一个应用程序编程接口来高效地检索图谱中的细胞。
借助这些技术,该团队开发了三种应用组装图集的新方案。首先,他们启用了数据细胞分类,使用逻辑表达式的灵活组合从组装细胞的虚拟人体中选择细胞。他们创建了一个“定量肖像”系统来表示基因、细胞类型和器官的完整信息。他们还为用户构建了一个可定制的参考创建,以定制他们对细胞类型注释任务的参考。
研究人员进行了一系列实验,以验证和说明组装数据在多个应用场景中的质量和可用性。案例包括对全身药物脱靶(药物的意外生物学后果)的调查,这证明了整体细胞图谱在生物医学研究中开辟新可能性的能力。
根据这项研究,这种类型的数据细胞分选可以揭示重要的器官特异性模式,并帮助科学家确定更容易受到靶向药物治疗副作用影响的器官。
研究人员已经开发出策略和技术来整合来自其他综合数据集的更多高质量数据,并将继续改进和更新hECA的未来版本。
推荐阅读
- alfa romeo车标含义?(阿尔法罗密欧车标)
- 华为鸿蒙os如何操作 华为鸿蒙os2.0系统官网报名入口
- 14款沃尔沃s60l二手车能买吗?(沃尔沃s60为什么贬值厉害)
- power mp3 wma converter(mp3格式转换器)软件介绍(power mp3 wma converter(mp3格式转换器))
- 42岁李贞贤宣布平安生女,网友:歌声击退山贼的那个
- 热火朝天的高铁WiFi迟迟未到(5G能否破局)
- 华为手机性价比最高是哪几款2022? 华为哪款手机性价比高最值得入手
- 进口捷豹全部车型报价?(捷豹报价大全价格表)
- 韩庚江铠同疑相恋,两人同游马尔代夫遭曝光
- 八卦格字帖软件介绍(八卦格字帖)
- 虚拟机 操作系统(操作系统整合:虚拟机管理程序的下一步)
- 比亚迪f6参数配置?(比亚迪f6)
- 奥沙利文获世锦冠军,奥沙利文得了几次世锦赛冠军
- Evel Knievel手游游戏介绍(Evel Knievel手游)
- 索尼wi1000x拆解(SONYNZW-X1000系列高清拆解图集)
- 4座硬顶敞篷跑车都有哪几款?(4门4座硬顶敞篷车推荐)
- 艺术体操团体全能决赛,艺术体操团体全能决赛中国
- 工人物语6通用修改器游戏介绍(工人物语6通用修改器)
- 简述电机换向器的工作原理图(简述电机换向器的工作原理)
- Atheros-AR5007EG无线网卡驱动软件介绍(Atheros-AR5007EG无线网卡驱动)