一、问题背景
大数据18级的专业任意选修课主要有下面几门课程:
A1互联网金融 |
A2移动电子商务 |
A3大数据可视化 |
A4信息咨询学 |
A5企业资源计划(ERP) |
A6大数据技术及应用基础 |
A7Python及大数据分析应用 |
A8商务智能与R语言 |
现在要同学们选择至少两门课程作为自己的选修科目。显然,像这样的现实生活中常见的问题属于决策问题,而所有的决策问题都需要提出一定数目的预设方案进行选择评估。像上面表格陈列的那样,预设方案不止8种,我们学过排列组合知道,假定一个同学的最大学习精力只能保证他(她)选择至多4门选修课,那么其共计有154种备选方案。
但是,如果把每种方案当作一个集合概念来看的话,每门课程就相当于这个集合里的元素,例如方案一:{A1,A2};方案二:{A1,A2,A3};方案三:{A4, A5, A7, A8}等等。接下来我要假设一个前提,即每个同学选课都是保持理智的(有过选课的考虑,有主见的选择),并且每门课的供应量充足,只有这样的话,层次分析法才能适用于大数据选课模型的构建。
由于同学选课都保持理智,所以对于8门选修课,内心有一定的比较排序,比如小明最喜欢A1,第二喜欢A5,第三喜欢A6。那么根据他的意识,除去选课过程中出现的网络崩溃,手滑等问题,他100%会优先选择这三门学科。那么问题来了,我们现在是不是要给所有这8门学科一个综合的评估,给出比较优劣的排名,然后同学根据评估矩阵来知道这门课的一个权重。
二、模型构建
层次分析法
首先,我们的目标任务是选课,方案有154种,但是只要给出每门课的客观评分就能够了解科目的综合情况,不过评估课程要遵循一定的标准,下面我们简单讨论一下如何设置标准。
B1.课程的实用性(课程是否注重实际应用,是否需要实践)
B2.课程的难度
B3.课程的重复性(课程是否与之前的专业必修课或者网络学习资源重复)
B4.课程的前沿性(课程是不是最前沿的)
B5.兴趣看个人(综合评估主要参照上面四个指标)
然后对于上述四个指标进行第一次比较构建:
构建法则,【2,4,6,8介于中间】
1 | 一样重要 |
3 | 比较重要 |
5 | 重要 |
7 | 非常重要 |
9 | 十分重要 |
由于大数据是工科(我感觉学校存在一些院级领导邀功的风气,大数据专业是管工院上报的,但是归属信工院,层次级别上说不过去,虽然是管理学,但是我们都没有管理学基础这门课,不知道学校咋想的,看在学代码的份子上,我还是把它当作工科对待吧),所以我们比较注重实用性、前沿性、其次才是难度,毕竟要恰饭的嘛。
构建比较矩阵
B1 | B2 | B3 | B4 | |
B1 | 1 | 3 | 7 | 2 |
B2 | 1/3 | 1 | 3 | 1/5 |
B3 | 1/7 | 1/3 | 1 | 1/7 |
B4 | 1/2 | 5 | 7 | 1 |
所谓的比较矩阵就是两两进行比较,看看问题谁最重要,采用比值法B1/B2=3,B2/B1=1/3,B1相对于B2而言比较重要,就这么简单!
然后将每个评估准则施加到课程的比较矩阵的构建中,比如控制变量,在B1实用性条件下,各门课的比较矩阵。
例如:
A1 | A2 | A3 | A4 | A5 | A6 | A7 | A8 | |
A1 | 1 | |||||||
A2 | 1 | |||||||
A3 | 1 | |||||||
A4 | 1 | |||||||
A5 | 1 | |||||||
A6 | 1 | |||||||
A7 | 1 | |||||||
A8 | 1 |
三、借助Python工具的黑箱操作得出如下评估矩阵
分别是A1到A8八门课程的权重分布,其中比较优势为:从前到后(权重降序排列)
大数据技术 |
python大数据分析 |
R语言 |
大数据可视化 |
互联网金融 |
移动电子商务 |
信息咨询学 |
ERP |
哈哈,有没有惊讶到!最后学习还是要看兴趣,没有兴趣就要学真本事恰饭,不能瞎选科目!