代谢组学实验、质控与分析

代谢组学实验、质控与分析
目录
- 1.实验及质控
  （1）项目流程
  （2）非靶代谢质控
  （3）靶向代谢质控
  （4）代谢组全流程质控
- 2.数据分析挖掘
  （1）代谢组分类回顾
  （2）数据预处理
  （3）定量层面挖掘
  （4）功能层面挖掘
1.实验及质控

（1）项目流程

代谢组学分析的特点：
- 流程长；
- 样品量大，项目周期长；
- 个体差异大；
- 设备不稳定性；
- 样品复杂，基质效应显著。
  所以，质量控制是代谢组学研究基础。
项目流程
样本制备——质谱仪分析——数据预处理——定量及统计分析——定性分析——生信及后续分析

（2）非靶代谢质控

质谱仪信号波动使非靶代谢信号随时间漂移。
原因：
- 电喷雾喷针老化
- 仪器设备入口毛细管污染
- 前级离子导引部件污染
- 检测器老化
- 质量分析器污染
信号随时间漂移或中途设备维护会严重影响多元统计分析效果，如PCA中样品分布不均匀，存在异常值。从而引起后续分析，如筛选生物标志物失败。

对非靶代谢信号时间漂移的重新校准，改善数据分析效果：
- 添加QC样本（前后+每隔10样）。
- 使用MetNormalizer校准（基于支持向量回归算法）。
（3）靶向代谢质控

不同出峰时间，对应不同的基质效应。
基质效应可能使绝对定量不准确。
无同位素内标：分析物与内标物基质效应不同；
有同位素内标：保留时间及表面活性的微小差别，仍会使分析物与内标物响应不同。

定量准确性质控：
加标回收实验：理论添加值约等于实测增加值（80-120%）。
设备灵敏度质控：
样品平均混合质控：设备灵敏度在合理范围内，未检出确实来源于内源性分析物浓度的下降。

（4）代谢组全流程质控

样本制备：
- 样本收样及存储标准化管理
- 高效有序的样品预处理流程
质谱仪分析：
- 非靶信号漂移QC实验方案
- 靶向双QC实验方案
数据预处理：
- 高效的数据校准方法
- Hotelling's T2筛出潜在异常点，分情况小心移除
定量及统计分析：
- 多元统计及单变量分析结合筛选生物标志物
- 加标回收实验确保定量结果准确
2.数据分析挖掘

（1）代谢组分类回顾

非靶：进行大规模、系统性研究，用于前期数据挖掘与筛选。
- 非靶组：通常所说的非靶代谢组学，指氨基酸类、核苷酸类、能量代谢、维生素类、神经递质类等及其衍生物。
- 脂质组：甘油脂类、磷酯类、鞘脂类、脂肪酸类、固醇类等。
靶向：验证非靶向分析的结果，对目标代谢物进行选择性、特异性定量与绝对定量。

非靶和靶向的样本制备、色谱体系、代谢物鉴定模式均不同。

（2）数据预处理

①数据完整性检查
- 保留通道值大于一半的数据
- 缺失值填充（10%以上填充）
  -- 删除包含缺失值的变量
  -- 对缺失值进行估计：KNN/PPCA/BPCA/SVD Impute
  -- 固定值填充：最小值的一半
  -- 按列填充：均值/中位数/最小值
- 过滤QC RSD>30%
②数据标准化
- 标准化（后面待续....）
- 归一化
（3）定量层面挖掘

①统计分析
- 单变量
- 多变量
②聚类分析
③共表达网络

（4）功能层面挖掘

通路分析
相关阅读:
在oracle中通过connect by prior来实现递归查询!
c# System.Data.OracleClient需要Oracle客户端软件8.1.7或更高版本
 c# 水晶报表的设计（非常的基础）
webapi+EF(增删改查)
简单三层分页aspnetpager控件（欢迎指点）
listbox 多选删除（找了好多都不行，终于让我写出来了）
execl导出（HTML，repearter控件）
SQL Server中截取字符串常用函数
 几个经常用到的字符串的截取
 gridview的增删改
原文地址：https://www.cnblogs.com/jessepeng/p/14210717.html

代谢组学实验、质控与分析

1.实验及质控

（1）项目流程

（2）非靶代谢质控

（3）靶向代谢质控

（4）代谢组全流程质控

2.数据分析挖掘

（1）代谢组分类回顾

（2）数据预处理

（3）定量层面挖掘

（4）功能层面挖掘