个人网页:生物信息学笔记与学习计划
致理书院 郭智健
第一周笔记:算法与模型 2025/2/24
1️⃣ 算法(Algorithm)
- 算法(algorithm)是一种 包含一系列定义清晰的指令的有效方法,计算机可通过执行其指示来应对或解决问题。算法的核心是 建立问题抽象的模型,明确求解目标。
- 例子:
- 线性回归
- K-近邻算法
- K-均值算法
2️⃣ 模型(Model)
3️⃣ 算法和模型的区别
- 对数据运行 算法 来创建 模型。 或者说,模型等于数据+算法,算法作为一种优化程序,在训练数据集上使模型的误差最小化。
生物信息学学习计划
1. 学习基础操作
计划完成时间:前八周
- 熟悉常用Linux 命令
- 尝试用Github管理自己的项目
- 学习使用Docker
- 了解基本的R 语言和 Python
- 学习集群的基本操作
2. 了解常用生信工具原理与操作流程
计划完成时间:结课时
- 使用
FASTQC
进行测序数据质量控制
- 学习RNA-seq流程,使用
fastqc
trim_galore
hisat2
samtools
等工具处理数据
- 学习差异分析,使用
DESeq2
cuffdiff
edgeR
等工具
- 学习画火山图、热图等常用图表
- 学习GO分析、GSEA分析、GSVA分析等
- 学习ChIP-seq流程,会用
MACS2
来call peak,会注释peak、做ChIP-seq差异分析、motif分析
- 学习RNA与可变剪接分析方法
- 学习转座子分析方法
3. 能够分析实验室真实数据
计划完成时间:自习得至此后的科研生活
- 能够为实验室分析RNA-seq、ChIP-seq数据
- 能够自主分析数据库中的数据,并尝试寻找课题
如何访问我的网页
👉 点击这里访问我的 GitHub Pages