本周完成工作
1、进行调研,完善项目方案;
2、攥写可行性报告;
3、完成大致系统结构框图。
本周进行的学习
1、HTML5的相关学习
初步学习了html5的一些知识,包括常用的标签以及相关属性,图片的引入,链接的插入等,还学习了层叠样式表的相关语法,对自己的html页面进行排版与美化。
需要注意的是,html会忽略标签中的连续的空白(包括空格、换行以及制表符),如果想要保持原有的文本格式,需要使用预格式文本标签pre。
<!DOCTYPE html>
<html lang="en">
<!--This is my html_learning's first step-->
<head>
<meta charset="UTF-8">
<title>QQ小介的html测试界面</title>
</head>
<!--标题的学习-->
<h1 style="text-align:center">TEST PAGE</h1>
<!--图像的学习-->
<img src="1.jpg" width="364" height="209">
<hr />
<!--段落的学习-->
<P>This is a picture in the same directory.<br />This is a new line but not a new paragraph.</P>
<p style="font-family:fangsong;font-size:20px;color:purple">本行文本是<sup>仿宋</sup>,字号<sup>20</sup>,紫色</p>
<p>本行是一行平庸的文本</p>
<!--预文本的学习-->
<pre style="background-color:green;font-size:20px">
预文本标签里的缩进保持不变!
<big>春晓</big>
春眠不觉晓,
处处闻啼鸟。
夜来风雨声,
花落知多少。
</pre>
<pre>
if __name__ == "__main__":
print("Hello world")
</pre>
<body style="background-color:yellow">
</body>
</html>
2、机器学习之聚类
此处我使用的是sklearn库的DBSCAN算法对上网时长进行聚类分析,首先对数据文本进行处理,得到数据集;
import numpy as np
import sklearn.cluster as skc
from sklearn import metrics
import matplotlib.pyplot as plt
mac2id = dict()
onlinetimes = []
f = open('test.txt')
for line in f:
mac = line.split(',')[2]
onlinetimes = int(line.split(',')[6])
strattime = int(line.split(',')[4].split(' ')[1].split(':')[0])
if mac not in mac2id:
mac2id[mac] = len(onlinetime)
onlinetimes.append((strattime, onlinetime))
else:
onlinetimes[mac2id[mac]] = [(strattime, onlinetime)]
real_X = np.array(onlinetimes).reshape((-1, 2))
接着调用DBSCAN算法对得到的数据集进行处理,并打印结果。
X = real_X[:, 0:1]
db = skc.DBSCAN(eps=0.01, min_samples=20).fit(x)
labels = db.labels_
print(labels)
raito = len(labels[lable[:] == -1]) / len(labels)
print("噪声数据的比例:", raito)
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
print(n_clusters_)
print(metrics.silhouette_score(X, labels))