• NLP interview


    2019-08-26 17:19:58

    1)聊实习项目

    2)代码题,二维数组中的查找某个target

    3)讲一些最能体现创新能力的工作,而不是一些工程上的实现

    4)讲论文可以从哪些方面做创新点,文本生成的结果怎么排序

    5)部门是做任务型聊天机器人的
     
     
    第一个开始面试的公司,一开始没找内推,被互娱的组捞了。
    3.8 一面,聊项目,然后计算机基础(dns),最后一道算法题,比较愉快。面完两小时接到电话邀请二面,时间定在3.12(这里可能时间定太晚了?)
    3.12 二面,项目+一道算法,但还是准备不多,有些东西忘了,对前沿技术讨论的时候有几个点我说的有问题,面试官评价是做的很多,基础要多把握
    3.28 一面,惯例项目介绍一波。但对方明显对nlp和深度学习相对不是很感兴趣? 话题转移到数学,“τ分布是啥" "..." "极限知道吗" ”知道点,比如求梯度求斜率的时候可以用到“ "呵呵" 猝 转移到基础算法的原理,“分类,聚类xxxxxxx哪个熟。” “分类吧” “哪种” “有哪些?” “lr,svm,xxxxx神经网络” "那就神经网络吧" "太简单了,不问了" 猝 "xgboost和adaboost原理" "...." 疙疙瘩瘩答了一些原理。
    “你对机器学习还停留在理论阶段啊” 猝 .... "我找了nlp内推,如果觉得我不ok的话,就把我转走或者灰掉吧" "我这里了解你的情况了,会处理的" 然后过一个小时变复试。。
    更新: 30号晚上leader加微信,31号下午二面,晚上状态变成已完成
     
     
    1.重复数字的二分查找,找到始末位置
    问了问最近两年的腾讯广告算法比赛有什么不一样。
    问了个场景题,如果有用户历史的阅读文章,怎么做兴趣点的挖掘。
    问了问文本的分类算法。
    问了个给一个query,怎么找相关的文章。
    匹配和检索算法。
    都有哪些方法,没怎么扣细节。
    感觉对NLP问的比较多。问了两遍工作城市意向。
    后面找了个HR,发起了个正式的流程。
     
     
    内推的是自己的学长。一面的是深圳分部的同事,人很好,自己正好有一点network让他认识了我,所以就捞了简历。面试内容很大一部分都是详细问了做过的项目,包括每一步是如何实现的,想法怎么来的。涉及到NLP的问题,问了有word2vec skip-gram的原理,negative sampling怎么做,为什么这么做,如何加速word2vec的训练。attention的机制,lstm和gru的原理,为什么可以解决梯度消失的问题。以及对于我做的一个跨语言情感分析的项目,还详细问了如何区分并提取每个语言不同的特征以及共同的特征。问了大约1h就说会尽快安排二面。
    二面是同一天的晚上,是来自美国分部的同事,重点问了我之前发表论文的课题,包括我在其中负责的部分,对于时序数据的处理等。具体涉及NLP的问题,问了防止过拟合的做法,dropout的原理,batch normalization的原理,maxout激活函数的原理,因为我最近的课题用了Attent is all you need里的position embedding和Multihead的做法,他也详细问了各个步骤和原理,因为是晚上比较晚开始的面试,所以问了半小时就结束了。
    hr面是第二天的晚上七点好像是,也是深圳的同事,问了简历中暑期科研的课题,我的背景,自己希望的工作地点这样。
    然而等offer等了11天。。虽然中间有清明,但是流程还是过了很久。
     
    • 一面:
      • 项目介绍;
      • viterbi解码原理,code;beamsearch;
      • 代码:一道hash的题,忘了;
    • 二面:
      • 项目介绍;
      • BN介绍(为什么加速收敛,从SGD更新角度和weight scale角度),dropout介绍,训练测试差异;
      • 代码:二分查找的题,绝对值;
    • 三面(总监):
      • 聊项目;
  • 相关阅读:
    leetcode 104. Maximum Depth of Binary Tree 二叉树的最大深度(简单)
    leetcode 105. Construct Binary Tree from Preorder and Inorder Traversal 从前序与中序遍历序列构造二叉树(中等)
    leetcode 83. Remove Duplicates from Sorted List 删除排序链表中的重复元素(简单)
    leetcode 637. Average of Levels in Binary Tree 二叉树的层平均值(简单)
    Fiddler的安装与使用
    Redis
    开发那些事儿:如何解决js打包文件体积过大导致的网页加载慢问题?
    AI人工智能识别技术如何助力构建风险监测预警系统?
    H.265流媒体播放器EasyPlayer切换播放协议时,快照无法消失如何处理?
    AI人脸检测/行为识别智能分析网关8大智慧应用场景分析
  • 原文地址:https://www.cnblogs.com/hyserendipity/p/11413785.html
Copyright © 2020-2023  润新知