【怪毛匠子整理】
一、使用SOFT文件
1. 确定GEO平台,比如GPL25318, 通过NCBI找到这个平台,也可以通过下面的链接,把GPL25318 替换成你想要的平台ID。
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL25318
2. 下载SOFT文件
点开红框:
下载文件:
解压文件:
R语言处理# 读入文件
df2=read.table("GPL25318_family.soft",sep = " ")
# 使用merge合并
【怪毛匠子整理】
二、使用GEOquery包
library(GEOquery) GPL=getGEO("GPL25318",destdir = ".") g1=Table(GPL) head(exprSet$ID) [1] "200000_s_at" "200001_at" "200002_at" "200003_s_at" "200004_at" "200005_at" new_datasets=merge(exprSet,g1,by = "ID" ,all.x = T) colnames(new_datasets) [1] "ID" "GSM******" "GSM******" ..... [247] "GSM******" "GSM******" "GSM******" [250] "Ensembl Version" "Ensembl Genome Version" "Orientation" [253] "Probeset mapping position" "Ensembl Gene ID" "Gene Symbol" [256] "Chromosomal location" "Strand" "Gene Description" [259] "Entrez Gene" "SPOT_ID"
这样就搞定了!
【怪毛匠子整理】