• python机器学习-课堂测试5的决策树分析


    将商家的特征值提取出来,转成CSV文件

    #问题企业决策树
    def problem():
        # 1.获取数据
        data_titanic = pd.read_csv("key_data_fp.csv")
        # 2.获取目标值与特征值
        x = data_titanic[[ "xf_count", "gf_count","del_count","zfcs"]]
        y = data_titanic["problem"]
        # 3.数据处理
        # 1).缺失值处理
        # x["age"].fillna(x["age"].mean(), inplace=True)  # 填补处理dropna()删除缺失值所在的行
        # 2).转换为字典
        x = x.to_dict(orient="records")
        # 4.划分数据集
        x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=22)
        # 5.字典特征抽取
        transfer = DictVectorizer()
        x_train = transfer.fit_transform(x_train)
        x_test = transfer.transform(x_test)
        # 6.决策树预估器
        estimator = DecisionTreeClassifier(criterion="entropy")  # criterion默认为gini系数,此处选择的为信息增益的熵
        # max_depth:树深的大小,random_state:随机数种子
        estimator.fit(x_train, y_train)
        # 7.模型评估
        y_predict = estimator.predict(x_test)
        print("直接对比真实值和预测值:
    ", y_test == y_predict)
        score = estimator.score(x_test, y_test)
        print("准确率为:
    ", score)
        # # 8.决策树可视化
        # export_graphviz(estimator, out_file="titanic_tree.dot", feature_names=transfer.get_feature_names())
        # # 使用随机森林
        # estimator = RandomForestClassifier()
  • 相关阅读:
    拼接sql ()
    HttpPostedFileBase 基类
    jQuery获取Select元素
    HttpFileCollection 类使用
    C# 截取字符串——
    判断人员js
    删除PLSQL 关联表
    mongodb常用操作方法
    json返回取值操作
    idhttp请求网址中的中文输入
  • 原文地址:https://www.cnblogs.com/fengchuiguobanxia/p/15433544.html
Copyright © 2020-2023  润新知