• 机器学习入门 【二】


    常用库简介

    Numpy 基础科学计算库

    Scipy 强大的科学计算工具集

    Pandas 数据分析的利器

    Matplotlib 画出优美的图形

    Scikit-learn 机器学习库

    Numpy

    【sklearn使用numpy数组形式的数据进行处理,所以需要把数据转换为numpy数组形式,其中的多维数组也是numpy的核心功能之一】

    import numpy
    i = numpy.array([[520,13,14],[25,9,178]])
    print("i: {}".format(i))

    给变量i复制为一个数组
    i是一个典型的numpy数组

    结果:

    sklearn需要使用scipy来对算法进行执行
    sparse函数,用来生成稀疏矩阵,而稀疏矩阵用来存储那些大部分数组为0的np数组 【常用】
    sparse用法
    import numpy as np
    from scipy import sparse
    matrix = np.eye(6)
    #用eye函数生成一个6*6对角矩阵
    #矩阵中对角线上的元素数值为1,其余都是0
    sparse_matrix = sparse.csr_matrix(matrix)
    #这一行把np数组转化为CSR格式的scripy稀疏矩阵(sparse matrix)
    #sparse函数只会存储非0元素
    print("对角矩阵: {}".format(matrix))
    print(" sparse存储的矩阵: {}".format(sparse_matrix))
     
    结果:

    显示的结果:将对角矩阵中的数值为1点的位置(x,y)输出

    pandas
    生成类似excel格式的数据表,还可以对数据表进行修改操作,还可以从多种类的数据库中提取数据
    还支持在不同的列中使用不同类型的数据
    import pandas
    data = {
    "name":["jike","kime","mike"],
    "age":["1","2","3"],
    "height":["12","13","14"]
    }
    data_frame = pandas.DataFrame(data)
    display(data_frame)
    会得到一个数据表:

    还可以查询:
    display(data_frame[data_frame.name != "mike"])
     

    数据可视化

    %matplotlib inline
    #激活maplotlib
    import matplotlib.pyplot as plt
    #先生成一个-20到20,元素数是10的等差数列
    x = np.linspace(-20,20,10)
    y = x**3 + 2*x**2+6*x + 5
    #画出曲线
    plt.plot(x,y,marker = "o")
     
     

    代码开头的%matplotlib inline,允许jupyter notebook进行内置实时绘图
    如果不写,需要在最后一行plt.show() 才会将图形显示出来
  • 相关阅读:
    ORACLE 查询所有用户调度作业
    【ORACLE】查看死锁进程并结束死锁的脚本
    Oracle12c中数据泵新特性之功能增强(expdp, impdp)
    oracle常用查询sql
    记一次异机rman还原后的操作
    Oracle 11gR2 RAC网络配置,更改public ip、vip和scanip
    记一次异机rman还原后的操作
    oracle通过impdp导入不同表用户、不同表空间的数据
    telegram即时通信软件和outline ---- by 余弦 by倾旋
    Vue -3:单文件组件
  • 原文地址:https://www.cnblogs.com/expedition/p/10706995.html
Copyright © 2020-2023  润新知