• 1.31学习总结:逻辑斯蒂回归分析器


    一、概述

      logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过logistic回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。

    二、用二项逻辑斯蒂回归分析进行二分析

      2.1编程目的

        以鸢尾花数据集为训练集,根据花瓣的长度和宽度对输入的鸢尾花进行分类

      2.2编程实现

        导入相应的包

        

        

                  定制一个函数,使其返回特定个数的数据。然后读取文件,将鸢尾花数据集的特征数据存储在向量中,将其创建成RDD,再转换成DataFrame

         

           

                   将标签列数值化

        

         设置逻辑斯蒂回归算法的参数

        

         完成训练后,将预测得到的数字化索引还原成标签

        

            划分测试集合训练集

        

        对模型准确率进行评估

        

     三、学习视频

    https://www.bilibili.com/video/BV1oE411s7h7?p=75

  • 相关阅读:
    二、跳转指定页面的JS代码
    一、常规的JS页面跳转代码
    您在前一家公司的离职原因是什么?
    如果你在这次面试中没有被录用,你怎么打算?
    如果你在这次面试中没有被录用,你怎么打算?
    针对你们单位业务工作中出现的问题,你提出了一些很好的建议,得到了同事们的赞同,但你的领导并不满意。在这种情况下,你怎么办?
    进程与线程的区别
    work13
    work12
    day09
  • 原文地址:https://www.cnblogs.com/wangzhaojun1670/p/14415186.html
Copyright © 2020-2023  润新知