唯品会2018校招机器学习、算法笔试题

前言

剩下的题目都是关于图像的,一个是卷积神经网络是什么,卷积的意义?
还有一个是传统图像处理里面的sift提取是什么意思?
鉴于自己不是搞图像方面的,就没有详细写了。


个人答案,欢迎交流。


一.(深度学习方向)深度学习和过往的神经网络训练方法有什么区别?给出几个具体的loss function?
  • 神经网络和深度学习的概念区别:
    神经网络是我们经常看到的那种层级网络结构,它是指一种具体的模型。而深度学习是基于当神经网络层数增多,神经网络学习日益困难的问题而提出的一种学习的方式。
  • 更加具体的解答请参见博客,这里面写的非常清楚。

  • 以下是我基于上述博客做的一个简短的解答:

    1.深度学习的目的?
     大多数情况下,我们面临的主要是一个分类问题或者是回归问题。但是基于已有的数据,我们很难提取一些有效的特征构建模型(传统机器学习基于经验),而深度学习则是设计了这样一套方案,能够让模型自己学习特征。

    因此,“深度模型”是手段,“特征学习”是目的。
    摘自上述博客。
    As a result, Deep Learning is an unsupervised learning algorithm.

    2.传统神经网络的训练方式?
     传统的神经网络训练方式正如大家所了解的那样,分为前向传播和反向传播。前向传播构建了神经网络层输出与层输入之间的复杂关系,而反向传播则是利用梯度下降方法,往回更新参数,使得目标函数(也即loss function)下降,最终趋于收敛,则训练完毕。

    3.传统的神经网络训练方式有什么不好?
     梯度消失问题,也就是说若某一层的梯度非常小,则该层前面的梯度会更小(最终趋于0),也就是说很前面的层数的参数会趋于不更新。
     博客中还讲了其他的一些缺点,该兴趣的可以自行查看。

    4.深度学习训练方法?
     深度学习方法采用逐层训练的方法,参照博客中AutoEncoder可以很好的理解layer-wise。
    其实感觉反向传播同神经网路是一样的,只是在前向传播时,是逐层训练,逐层调优。

    5.一些loss function?(这部分不负责任的,还是请大家自行查阅)


    唯品会2018校招机器学习、算法笔试题_第1张图片
    AutoEncoder目标函数


    唯品会2018校招机器学习、算法笔试题_第2张图片
    Sparse Coding稀疏编码


二.(NLP方向)现在深度学习在nlp领域有哪些应用? 请具体说明

自行查阅。
知乎回答感觉就挺好的。


三. 什么是中文分词? 列举出几种你所知的分词方法

三大主流分词方法:基于词典的方法、基于规则的方法和基于统计的方法。

  • 词典或规则:
    基于已有词典 ,根据匹配类型不同而划分,有最大匹配法等。
  • 统计:
    1.组成词语的字可能多次同时出现的可能性最大而形成的N-gram模型
    2.将词语构成看成是标注问题而出现的隐马尔科夫链、条件随机场等模型。

详情可参见博客。


求问,求补充

N-gram和HMM、CRF的区别?

个人认为,N-gram是基于统计的,没有标注问题。
而HMM、CRF引入了一个中间变量(即状态)。


你可能感兴趣的:(笔试题总结)