• 第一周学习报告


    本周完成工作

    1、进行调研,完善项目方案;

    2、攥写可行性报告;

    3、完成大致系统结构框图。

    本周进行的学习

    1、HTML5的相关学习

    初步学习了html5的一些知识,包括常用的标签以及相关属性,图片的引入,链接的插入等,还学习了层叠样式表的相关语法,对自己的html页面进行排版与美化。
    需要注意的是,html会忽略标签中的连续的空白(包括空格、换行以及制表符),如果想要保持原有的文本格式,需要使用预格式文本标签pre。

    <!DOCTYPE html>
    <html lang="en">
    <!--This is my html_learning's first step-->
    <head>
        <meta charset="UTF-8">
        <title>QQ小介的html测试界面</title>
    </head>
    <!--标题的学习-->
    <h1 style="text-align:center">TEST PAGE</h1>
    
    <!--图像的学习-->
    <img src="1.jpg" width="364" height="209">
    <hr />
    
    <!--段落的学习-->
    <P>This is a picture in the same directory.<br />This is a new line but not a new paragraph.</P>
    <p style="font-family:fangsong;font-size:20px;color:purple">本行文本是<sup>仿宋</sup>,字号<sup>20</sup>,紫色</p>
    <p>本行是一行平庸的文本</p>
    
    <!--预文本的学习-->
    <pre style="background-color:green;font-size:20px">
        预文本标签里的缩进保持不变!
        <big>春晓</big>
        春眠不觉晓,
            处处闻啼鸟。
                夜来风雨声,
                    花落知多少。
    </pre>
    <pre>
        if __name__ == "__main__":
            print("Hello world")
    </pre>
    <body style="background-color:yellow">
    </body>
    </html>
    

    2、机器学习之聚类

    此处我使用的是sklearn库的DBSCAN算法对上网时长进行聚类分析,首先对数据文本进行处理,得到数据集;

    import numpy as np
    import sklearn.cluster as skc
    from sklearn import metrics
    import matplotlib.pyplot as plt
    
    mac2id = dict()
    onlinetimes = []
    f = open('test.txt')
    for line in f:
        mac = line.split(',')[2]
        onlinetimes = int(line.split(',')[6])
        strattime = int(line.split(',')[4].split(' ')[1].split(':')[0])
        if mac not in mac2id:
            mac2id[mac] = len(onlinetime)
            onlinetimes.append((strattime, onlinetime))
        else:
            onlinetimes[mac2id[mac]] = [(strattime, onlinetime)]
    real_X = np.array(onlinetimes).reshape((-1, 2))
    
    

    接着调用DBSCAN算法对得到的数据集进行处理,并打印结果。

    X = real_X[:, 0:1]
    db = skc.DBSCAN(eps=0.01, min_samples=20).fit(x)
    labels = db.labels_
    print(labels)
    raito = len(labels[lable[:] == -1]) / len(labels)
    print("噪声数据的比例:", raito)
    
    n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
    print(n_clusters_)
    print(metrics.silhouette_score(X, labels))
    
  • 相关阅读:
    [置顶] Android中使用sqlite3操作SQLite
    我们不应歧视任何语言,她们都是萌娘!(有图有真相)
    一牛人博客导航
    机器学习&数据挖掘笔记_14(GMM-HMM语音识别简单理解)
    机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)
    机器学习、深度学习、数据挖掘各种资源整理
    MLP 之手写数字识别
    卷积神经网络CNN 手写数字识别
    支持向量机SVM 简要推导过程
    23种设计模式
  • 原文地址:https://www.cnblogs.com/konelee/p/13288095.html
Copyright © 2020-2023  润新知