前言:本简易教程的目的在于给那些不会 r 语言的科研人们提供一个简单快速的获取一个蛋白基因进行试验的指南。
# 工具准备
- 一台装有 Office 的电脑
- Gepia
- Jvenn
- 一些基因数据库(本文选用了 FerroDB 铁死亡数据库来获取铁死亡基因)
- Genecards
- Pubmed
- 上述的数据库可以在我的网站 导航 中找到嗷!
# 大致思路
本文的思路:找到一个在胰腺癌中高表达的铁死亡抑制基因进行研究。
# 目标癌肿差异基因的获取
点开 Gepia 的 Differental Genes。
重点要修改的是红框内的值; Dataset
内选择你自己想研究的癌肿, Differental Methods
笔者个人倾向于用 LIMMA
。如果你觉得筛选出来的基因太多,则适当调大 Log~2~FC Cutoff
和 q-value
的值。一般的疾病研究会选择高表达的基因,因此最好不要修改 Chromosomal Distribution
里面的值。随后点击 List
得到差异基因结果。
笔者选用胰腺癌 PAAD 的数据集,以 2 和 0.005 的 Log~2~FC Cutoff
和 q-value
的值, LIMMA
方法进行过表达的筛选。筛选得出了 2616 个基因,点击 Download 下载列表。
# 铁死亡基因获取
FerroDB 中整理了相关的铁死亡基因集。在 Download
页面选择 TXT 格式下载铁死亡的抑制因子(基因)。
# 取交集
把上述两个 .txt
文件重命名成 .xls
格式。打开 Jvenn 将两个表格中的基因名称复制到第一栏、第二栏中。
大功告成!点击中间的数字,获取筛选到的基因。
足足 43 个候选基因哦。
# 临床相关性分析
这边主要是做做预后分析。能做三线表的话最好。
有两种方法:
在 Gepia 中筛选出对预后影响最大的基因,和上边的方法大同小异:
下载好以后,和差异基因、铁死亡基因一并取交集。
很巧~筛选出来了一个!
对刚刚取交集出来的 43 个基因进行一个一个的单基因生存分析,也是在 Gepia 中完成,选择预后好的进行研究即可
癌症类型选择当前研究的癌症 PAAD 即可。
# 文献调研
自然是要看看相关文献(PubMed),同时通过 Genecards 了解一下这个基因的基本功能。
准则如下:
在你的疾病中是否有研究(创新性)?在铁死亡中的研究是否深入(可行性)?
一般创新性,可行性不可兼得。本示例的评判标准如下:
星级 | 标准 |
---|---|
⭐⭐⭐⭐⭐ | 在 PAAD 中完全没报道过;在癌症整个领域中没有报道过。 |
⭐⭐⭐⭐ | 在 PAAD 中没报道过;在癌症中报道过。 |
⭐⭐⭐ | 在 PAAD 中只有生信报道。 |
⭐⭐ | 在 PAAD 中只有很简单的机制研究,可以进一步补充。 |
⭐ | 在 PAAD 中有详细机制研究。 |
星级 | 标准 |
---|---|
⭐⭐⭐ | 在铁死亡中报道过详细的机制。 |
⭐⭐ | 在铁死亡中报道过很敷衍的机制。 |
⭐ | 生信报道;完全没有报道过。 |
当然 FerroDB 中的铁死亡基因大部分是报道了的,也有少量的没有报道的。
# 搜索语句示例
这里以结肠癌、铁死亡中的 ENO1 为例:
// 搜索一下该基因是否被广泛研究 | |
ENO1[Title/Abstract] | |
// 是否在本疾病中被报道? | |
(ENO1[Title/Abstract]) AND ("colon adenocarcinoma" OR "colon cancer") | |
// 是否在铁死亡表型中被报道? | |
(ENO1[Title/Abstract]) AND (Ferroptosis[Title]) | |
// 若上述语句成立,是否在本疾病中建立了和铁死亡的联系? | |
(ENO1[Title/Abstract]) AND ("colon adenocarcinoma" OR "colon cancer") AND (Ferroptosis[Title]) |
# 最后的最后
筛选只是手段,idea 还是要靠各位的广泛阅读和奇思妙想,以及广泛的实验手段(来筛选上下游)了。