![](https://scx1.b-cdn.net/csz/news/800a/2019/dataset.jpg)
对首要数据可视化工具 t 分布随机邻域嵌入 (t-SNE) 的改进,称为优化 t-SNE (opt-SNE),为研究人员准确查看数据集内容的能力带来了新的启示。
opt-SNE 是近 10 年前创建的广泛使用的 t-SNE 的改进版。虽然 t-SNE 可以准确分析大约 50 万个在任何给定样本中,近年来,单细胞数据集变得越来越大。借助 opt-SNE,研究人员现在可以以前所未有的分辨率可视化包含数千万个细胞的样本数据。
opt-SNE 的开发由波士顿大学医学院 (BUSM) 病理学和实验室医学助理教授、医学博士 Anna Belkina 领导。
除了能够正确处理大数据集之外,opt-SNE 还能够成功地可视化非常小、不同的细胞群。测试(这些组中的每个细胞都稀有,仅为样本中总细胞数的十万分之一)。在 opt-SNE 之前,这种精确、大规模的可视化以及同时放大微小群体是不可能的。“t-SNE 最初是一种“一刀切”算法,但 opt-SNE 计算针对每个单独的数据集量身定制,这既可以鸟瞰也可以近距离查看样本中的内容。使用 opt-SNE,可以看到大海和其中的针头,”该研究的通讯作者 Belkina 解释说。“这是一个特别用于研究细胞计数和单细胞转录组学数据”。
opt-SNE 使研究人员能够精确定位以前无法检测到的特征,从而区分患病样本和对照样本。这种观察疾病状态的新视角可能会揭示新的治疗目标以及新的生物现象。由于 Belkina 与主要单细胞数据分析平台的开发人员的持续合作,这种方法已被多个研究小组使用,这些开发人员将 opt-SNE 实现到 Omiq.ai 云分析平台(Christopher Ciccolella,MS)和 FlowJo 软件(Josef Spidlen,Ph.D. 和 Richard Halpert,Ph.D.)中,并共同撰写了手稿。opt-SNE 包也已发布。
该研究的其他合著者发表于自然通讯,包括 Rina Anno 博士和 Jennifer Snyder-Cappione 博士。
引用: 大型复杂数据集可视化方面取得进展 (2019 年 12 月 2 日) 于 2024 年 6 月 2 日检索自 https://webbedxp.com/zh-CN/science/jamaal/news/2019-12-advancement-visualization-large-complex-datasets.html
本文件受版权保护。除出于私人学习或研究目的的合理使用外,未经书面许可不得复制任何部分。内容仅供参考。