• 201116西瓜书机器学习系列---9、聚类


    201116西瓜书机器学习系列---9、聚类

    一、总结

    一句话总结:

    1、聚类理论基础?

    2、聚类方法?

    3、聚类性能度量?

    聚类的性能度量主要分为【外部指标】和【内部指标】
    聚类的基本想是:【簇内相似度高,簇外相似度低】

    4、聚类距离计算?

    聚类距离计算分为 【有序属性、无序属性、混合属性(有序和无序混合)】

    5、k均值聚类?

    a、Assign:【计算每个点到中心点的距离】,根据距离分配类别
    b、Move:根据a步骤中分配的类别,【重新计算中心点】
    k均值聚类这个过程和EM算法非常像,【k均值聚类就是EM算法的一个实例】

    6、混合高斯分布?

    按照一定的规则【将高斯分布混合起来】

    7、高斯混合聚类?

    E步:根据当前参数【计算每个样本属于每个高斯函数的后验概率】
    M步:【更新模型参数】

    8、Kmeans使用中的问题?

    1)【对异常值十分敏感】
    异常值十分敏感处理方法:【删除】:异常值不是很多的情况下;【重赋值】:排序or自定义;【抽样】:抽样大小

    二、内容在总结中

    博客对应课程的视频位置:

     
    我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
    博主25岁,前端后端算法大数据人工智能都有兴趣。
    大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
    聊技术,交朋友,修心境,qq404006308,微信fan404006308
    26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
    人工智能群:939687837

    作者相关推荐

  • 相关阅读:
    Octave中的函数记录
    利用jira-python对jira项目
    通过python中xlrd读取excel表格(xlwt写入excel),xlsxwriter写入excel表格并绘制图形
    使用python的requests模块采集请求中的数据
    react+webpack+webstorm开发环境搭建
    Django中url使用总结
    通过Django中的forms类对前台的forms表单数据进行校验
    4.软件测试用例设计
    3.软件开发与测试模型
    16 IO流
  • 原文地址:https://www.cnblogs.com/Renyi-Fan/p/13997693.html
Copyright © 2020-2023  润新知