• 【数据分析&数据挖掘】相关性计算+数据分析流程


     1 import pandas as pd
     2 
     3 detail = pd.read_excel("../day05/meal_order_detail.xlsx")
     4 # print("detail: 
    ", detail)
     5 print("detail的列名称: 
    ", detail.columns)
     6 
     7 # corr
     8 print("相关系数为: 
    ", detail.loc[:, ["counts", "amounts"]].corr())
     9 print("spearman相关系数为: 
    ", detail.loc[:, ["counts", "amounts"]].corr(method="spearman"))
    10 print("kendall相关系数为: 
    ", detail.loc[:, ["counts", "amounts"]].corr(method="kendall"))
    11 
    12 # data = detail.loc[:, ["detail_id", "order_id", "dishes_id", "counts", "amounts"]]

    # 完整的机器学习算法流程
    # 1、导包
    # 2、加载数据
    # 3、筛选出有用的列
    # 4、检测并处理缺失值
    # 5、处理异常值
    # 6、数据标准化
    # 7、构建算法模型进行运算
    # 8、算法结果展示---数据可视化
    # 9、结论

    # 纯数据分析
    # 1、导包
    # 2、加载数据
    # 3、筛选有用的数据
    # 4、检测并处理缺失值
    # 5、处理异常值
    # 6、结果可视化--数据分布、走势的可视化
    # 7、书写结论---非常重要
     
  • 相关阅读:
    笔记
    Dwarf Tower
    第k小数
    np
    noi 抓住那头牛
    HDU 1575 Try A
    acm 易错警示
    E
    魔改森林 题解(dp+容斥+组合数学)
    F. Unusual Matrix 题解(思维)
  • 原文地址:https://www.cnblogs.com/Tree0108/p/12116132.html
Copyright © 2020-2023  润新知