【论文简读】 Deep web data extraction based on visual

《Deep web data extraction based on visual information processing》
作者 J Liu 上海海事大学 2017 AIHC会议登载
引用 Liu J, Lin L, Cai Z, et al. Deep web data extraction based on visual information processing[J]. Journal of Ambient Intelligence & Humanized Computing, 2017(1):1-11.

简介

一种基于卷积神经网络（CNN）的数据区域定位方法
结合视觉信息进行网页的分割（作者命名为VIBS）

1、CNN 基于卷积神经网路进行区域定位

CNN网络结构由3个阶段组成，如图所示。第一阶段设置卷积层和汇集层以学习图像的特征。第二阶段是设置展平图层所必需的，展平图层会将卷积图层和合并图层生成的特征图转换为一维矢量，以计算完整的连接图层。除了为输出设置最后一个完全连接之外，第三阶段设置多个连接层以过滤先前层学习的特征。

网络架构设计使用13级CNN，包括5个采样层（S），6个卷积层（C）和2个完全连接层。