大学生创新创业项目-智取乐食

大学生创新创业项目-智取乐食
大学生创新创业项目-天津市级

The project was set up in TianJin Normal University. 2019-04
代码&详情见GitHub智取乐食

项目名称：智取乐食

项目介绍：

"智取乐食"利用RFID射频识别技术、称重传感器、大数据分析和数据挖掘技术，设计一款集Web端、微信小程序后台算法于一体的项目。实现餐饮食品自动扣费、每日膳食推荐、个人饮食喜好设置、特色菜品推荐、食物销量预测等功能。项目有效缓解高校食堂食品浪费现象严重，提高学生饮食质量，发挥人性化餐饮服务和科学合理节约的特色。

项目特点：

在软件上，使用微信小程序使用户使用更加便捷，利用大数据技术减少食物浪费并进行人性化推荐；
在硬件上，使用REID射频识别技术和称重传感器技术实现自动扣费方式；
在方式上，自动扣费方式减少学生结账时间进而提高食堂效率，减少人力成本；

使用技术：

RFID射频识别&称重传感器前端数据库微信小程序数据分析与挖掘机器学习深度学习

我的工作：数据分析与挖掘

1. 定义挖掘目标

针对餐饮行业的数据挖掘应用，可定义如下挖掘目标。
1. 每日膳食推荐智能推荐。
2. 基于餐饮大数据，对餐饮客户价值分析。
3. 基于菜品历史销售情况，综合外部因素(节假日、气候、竞争对手等)，对菜品销量进行趋势预测。
2. 数据取样

抽取数据的的标准，一是相关性、二是可靠性、三是有效性。
本项目中取样：
个人属性(/dataset/用户属性new.xls): 用户id 性名性别年龄身高体重籍贯口味1 口味2 忌口喜爱食物类型1 喜爱食物类型2
交易记录(/dataset/交易记录.csv):用户id 食物id 消费单价消费质量消费金额消费时间

个人属性表(数据已进行脱敏处理)

3. 数据探索

当拿到一个样本数据集后，ta是否达到了我们原来设想的要求；样本中有没有什么明显的规律和趋势；有没有从未设想的数据状态；属性之间有什么相关性；ta们可区分成怎样的类别等，这都是要探索的内容。
挖掘模型的质量不会超过抽取样本的质量。数据探索和预处理的目的是为了保证样本数据的质量，从而为保证模型质量打下基础。

单类食物销量日折线图

单类食物销量日柱状图

4. 数据预处理

由于采样数据中常常包含许多含有噪声、不完整、甚至不一致的数据，对数据挖掘所设计的数据对象必须进行预处理。
数据预处理主要包括：数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约等。
个人属性(/dataset/用户属性new.xls)&交易记录(/dataset/交易记录.csv)为预处理后的文件。

5. 挖掘建模

样本抽取完成后，接下来要考虑的问题是：本次建模属于数据挖掘应用中的哪类问题（分类、聚类、关联规则、时序模式或智能推荐）选用哪种算法进行模型构建？
这一步是数据挖掘工作的核心环节。针对餐饮行业的数据挖掘应用，挖掘建模主要包括：
1. 基于聚类&关联规则算法的动态菜品智能推荐
2. 基于聚类算法的餐饮客户价值分析
3. 基于LSTM(长短期记忆网络)算法的菜品销量预测
  以菜品销量为例，模型构建是对菜品历史销量，综合考虑了节假日、气候和竞争对手等采样数据轨迹的概括，ta反应的是采样数据内部结构的一般特征，并于该采样数据的具体结构基本吻合。模型的具体化就是菜品销量预测公式，公式可以产生与观测值有相似结构的输出，这就是预测值。
6. 模型评价

建模过程中会得出一系列分析结果，模型评价的目的之一就是从这些模型中自动找出最好的模型，另外就是要根据业务对模型进行解释和应用。

具体细节&展示

1.基于关联规则算法的动态菜品智能推荐

1.K-modes算法原理

k-modes算法根据个人喜好特征进行聚类，生成的聚类中心（部分）

聚类后每个人所处的聚类点类别（部分）

根据类别在 消费表 里检索出相同标签用户 最近最多购买 且该用户未购买过的食品。

2.基于聚类算法的餐饮客户人群分析

1.K-modes:将人群按食物喜好聚类为几类人群.
如上k-modes聚类步骤。最后将个人属性类别插入个人属性表。

3.基于分类与预测算法的菜品销量预测

1.LSTM(长短期记忆网络)
以日期属性（是否节假日等）、天气属性（日照，风力，空气质量）作为输入，单样菜品作为输出进行深度神经网络的训练。
共126day数据，将前100天划作训练集，后26天作为测试集。

日期属性图 ./dataset/date.xlsx

loss(损失)曲线(每种菜品单独建模，该曲线为其中一条以示例用）

保存的预测模型 ./model/model*.hdf5(用keras load_model函数读取）

酸菜鱼的26day预测折线图

酸菜鱼的未来销量预测折线图

14种食物2018-2019年的食物销量预测

预测结果：83.5%的日期预测误差在±2kg以内，可以极大减少食堂食物浪费问题。
相关阅读:
11个网站后台模版｜ Admin Dashboards ｜ Bootstrap
Replace Pioneer
Unity扩展编辑器--类型3：Custom Editors
Unity扩展编辑器--类型1：Editor Windows
Android新项目GBSS：第1篇搭建开发环境
 树莓派（jessie）制作服务并开机启动
 Jqgrid动态拖拽
 看得见的百亿脱贫投入，看不见的阿里技术“脱贫代码”
OceanBase迁移服务：向分布式架构升级的直接路径
 支付宝工程师创造出了一个可以“拷贝”支付宝的神器
原文地址：https://www.cnblogs.com/cpg123/p/12080878.html

大学生创新创业项目-智取乐食

大学生创新创业项目-天津市级

项目名称：智取乐食

项目介绍：

项目特点：

使用技术：

我的工作：数据分析与挖掘

1. 定义挖掘目标

2. 数据取样

3. 数据探索

4. 数据预处理

5. 挖掘建模

6. 模型评价

具体细节&展示

1.基于关联规则算法的动态菜品智能推荐

2.基于聚类算法的餐饮客户人群分析

3.基于分类与预测算法的菜品销量预测