• [转]2013百度校园招聘-机器学习和数据挖掘工程师-笔试题


    一、简答题(30分)
    1、简述数据库操作的步骤(10分)
    2、TCP/IP的四层结构(10分)
    3、什么是MVC结构,简要介绍各层结构的作用(10分)
    二、算法与程序设计(45分)
    1、由a-z、0-9组成3位的字符密码,设计一个算法,列出并打印所有可能的密码组合(可用伪代码、C、C++、Java实现)(15分)
    2、实现字符串反转函数(15分)
    3、百度凤巢系统,广告客户购买一系列关键词,数据结构如下:(15分)
    User1 手机 智能手机 iphone 台式机 …
    User2 手机 iphone 笔记本电脑 三星手机 …
    User3 htc 平板电脑 手机 …
    (1)根据以上数据结构对关键词进行KMeans聚类,请列出关键词的向量表示、距离公式和KMeans算法的整体步骤
    (2)计算给定关键词与客户关键词的文字相关性,请列出关键词与客户的表达符号和计算公式
    三、系统设计题(25分)
    一维数据的拟合,给定数据集{xi,yi}(i=1,…,n),xi是训练数据,yi是对应的预期值。拟使用线性、二次、高次等函数进行拟合
    线性:f(x)=ax+b
    二次:f(x)=ax^2+bx+c
    三次:f(x)=ax^3+bx^2+cx+d
    (1)请依次列出线性、二次、三次拟合的误差函数表达式(2分)
    (2)按照梯度下降法进行拟合,请给出具体的推导过程。(7分)
    (3)下图给出了线性、二次和七次拟合的效果图。请说明进行数据拟合时,需要考虑哪些问题。在本例中,你选择哪种拟合函数。(8分)
    (4)给出实验方案(8分)
  • 相关阅读:
    洛谷 P3613 【深基15.例2】寄包柜
    洛谷 P1478 陶陶摘苹果(升级版)
    P1090 [NOIP2004 提高组] 合并果子 / [USACO06NOV] Fence Repair G
    c++优先队列(priority_queue)用法详解
    洛谷 P3817 小A的糖果
    洛谷 P1208 [USACO1.3]混合牛奶 Mixing Milk
    洛谷 P1449 后缀表达式
    洛谷 P1106 删数问题
    在Linux中使用tomcat部署项目
    jar在linux上运行脚本 #start #stop #restart
  • 原文地址:https://www.cnblogs.com/anyuan9/p/6171701.html
Copyright © 2020-2023  润新知