摘要:本笔记使用 github 原仓库中的 tests 目录下的数据作为示例,并展示了 SEVtras 如何在单细胞 RNA 测序数据集中识别 sEVs。


# 第一部分 sEVs 识别

这里,本笔记使用 github 中的 tests 目录下的数据作为示例,并展示了 SEVtras 如何在单细胞 RNA 测序数据集中识别 sEVs。我们已经在 github 中生成了 h5ad 格式的测试数据,SEVtras 也支持 10x_mtxh5 数据格式。

  • 注意 1: SEVtras 的输入滴定 - 基因矩阵应该是原始数据;在这里,矩阵应该来自 Cell Ranger outsraw_feature_bc_matrix 目录。
  • 注意 2: 这部分需要使用 multiprocessing 包进行并行处理。该包目前与 Windows 10 上的 Jupyter 不兼容。建议在 Linux 上运行这部分。
  • 注意 3: 我们不推荐使用单个样本识别 sEVs。输入更多相似的样本会导致更可靠的结果。

我们支持两种文件输入方式来运行 sEVs 识别:

##1 if samples locate in one directory
import SEVtras
SEVtras.sEV_recognizer(
	input_path='./tests', 
	sample_file='./tests/sample_file', 
	out_path='./outputs', 
	species='Homo')

第一个参数是包含所有样本的目录的路径。因为这些测试文件存在于我们的 tests 目录中,所以我们使用了 ./tests 。第二个参数是目录中每个样本的名称,逐行排列。如果您的数据格式是 10x_mtx ,SEVtras 可以自动检测 sample/outs/raw_feature_bc_matrix/ 的目录(见参数 dir_origin )。

out_path 定义了 SEVtras 的输出,这是一个名为 raw_SEVtras.h5ad 的 h5ad 文件,包含所有滴定的 SEVtras 评分(score)和 sEV 分类(sEV)在 obs 中,还有一个名为 sEVs_SEVtras.h5ad 只包含含 sEV 滴定的文件。

species 表示样本测序的物种来源。

如果样本位于不同的目录中,我们也支持另一种运行 SEVtras 的方式。

##2 if samples locate in differet directories
import SEVtras
SEVtras.sEV_recognizer(
	sample_file='./tests/sample_file', 
	out_path='./outputs', 
	species='Homo')

在这里,第一个参数是每个样本的绝对路径,逐行排列。

sEV_recognizer 的结果可以如下显示:

Untitled

# 第二部分 ESAI 计算

使用 SEVtras.sEV_recognizer 在 :doc: /Part I sEVs 识别 中的输出和带有细胞类型的细胞矩阵,SEVtras 可以追踪每个 sEV 到原始细胞类型并计算 sEV 分泌活性指数(ESAI)。

注意 1: 输入的细胞矩阵应该在 adata 的 obs 中包含样本和细胞类型信息。

注意 2: 这个命令可以兼容所有平台,包括 Windows 上的 Jupyter。

SEVtras 提供了 ESAI_calculator 函数来评估细胞 sEV 分泌活性的动态。

import SEVtras
	SEVtras.ESAI_calculator(
	adata_ev_path='./tests/sEV_SEVtras.h5ad', 
	adata_cell_path='./tests/test_cell.h5ad', 
	out_path='./outputs', 
	Xraw=False, 
	OBSsample='batch', 
	OBScelltype='celltype')

前两个参数表示 sEV 和细胞 anndata 对象的路径。

第三个参数指定 ESAI_calculator 输出的路径。输出包括:

  • 一个结合了 adata_evadata_cell 的 adata 文件,命名为 SEVtras_combined.h5ad
  • 两个 csv 文件计算样本级别(ESAI)和细胞类型级别(ESAI_c)的 sEV 分泌活动指数,分别命名为 ESAI_sample.csvESAI_celltype.csv
  • 一个将 sEV 和细胞嵌入 umap 的 pdf 文件,命名为 SEVumap.pdf
  • 两个在 umap 中绘制 ESAI_c 的 pdf 文件,分别命名为 ESAIumap.pdfESAIumap_sample.pdf

第四个参数表示是否使用 adata_cell 中的原始对象。如果 adata_cell 已经被过滤或标准化,请设置 Xraw=True ,并且将使用 adata_cell.raw (注意:在过滤前请将原始 adata_cell 保存为 adata_cell.raw )。

最后两个参数定义了在 adata 的 obs 中哪个索引代表样本和细胞类型信息。默认情况下,SEVtras 使用 adata_cellobs 中的 batchcelltype 索引。我们可以使用参数 OBSsampleOBScelltype 更改索引。

每个滴定中的原始细胞类型列在 SEVtras_sEVs.h5adobsm 中,索引为 source

SEVumap.pdfESAIumap.pdf 的结果类似于以下内容:

Untitled

更新于