• Python之原始数据-1


      一、数据对于模型来说是基础,是数据成就了模型,而现在的又是一个数据时代,比如:淘宝等。通过对用户数据的分析挖掘,预测用户的消费习惯等,再比如:人工智能。通过提取摄像头的图片帧数,通过分析图片,得出具体的行为等。这些都离不开再最开始的数据。

      二、数据的获取方式有很多种:

      1)kaggle(推荐):一个免费的数据获取网站,地址:https://www.kaggle.com/

      2)爬虫:通过爬取别人的网站或者其他途径来获取大量的数据,网站爬虫学习:Selenium+PhantomJS爬虫scrapy爬虫

      3)numpy:手动生成数据,分隔等。

      三、在Python中,我们通过读取其他格式数据,来转换成特征数据。常用方式pandas

        支持的数据格式

        

        常用的格式,csv、excel、json

        代码过程:

        orders = pandas.read_csv("market/orders.csv")
        prior = pandas.read_csv("market/order_products__prior.csv")
        products = pandas.read_csv("market/products.csv")
        aisles = pandas.read_csv("market/aisles.csv")
  • 相关阅读:
    java操作练习
    java认知
    java了解
    抽象类及抽象类
    杨辉三角实例菱形实例
    案例分析之运行顺序
    Object类的方法,toString的重写.
    多态
    类的继承
    面对对象
  • 原文地址:https://www.cnblogs.com/ll409546297/p/11212152.html
Copyright © 2020-2023  润新知