朋友发来一个word文件,里面的数据没有分割,想分割后放到excel统计
通常遇到这种数据,首先想到每一列数据有没有什么特征
类似这种数据,一种办法是按位数截取,mid函数,或者按第一次出现数字的方式来截取MID(A2,1,MIN(SEARCH({0,1,2,3,4,5,6,7,8,9},A2&"0123456789"))-1)
RNA transport 33 ko03013
Ribosome 43 ko03010
mRNA surveillance pathway 16 ko03015
Ribosome biogenesis in eukaryotes 22 ko03008
Epstein-Barr virus infection 26 ko05169
Proteasome 9 ko03050
Ubiquitin mediated proteolysis 18 ko04120
Spliceosome 26 ko03040
然后,excel里有个分类汇总的功能,但是不太好用,我还是习惯扔到mysql里拿sql语句来groupby
但这次以csv格式导入mysql,没有按照逗号导进去,只好再按照逗号分隔,再groupby了。。
SELECT A.id ,SUM(A.num) FROM (
SELECT SUBSTRING_INDEX(id, ',', 1) AS id ,SUBSTRING_INDEX(id, ',', -1) AS num FROM groupby
) A
GROUP BY A.id