给大家分享我的宝藏:nlp算法面试经验

(本人双非研二)

2021年.7.20日:奥维森基因科技公司:

1 svm基本原理,核函数,核函数怎么选 ,四分类的原理是什么。​

 svm多分类的两种方法:

支持向量机原理详解(八): 多类分类SVM - 知乎

成对分类方法(one-against-one

一类对余类,one-against-all,one-against-the-rest

2 当下自然语言处理能实现的功能​

3 图灵机的上限    答:Nlp得上限难点应该是自然语言理解

4 几层神经网络能拟合任意函数,最简单的神经网络是几层?   一层

2021年7月26  联想泰利 北京 java开发 

公司给的是北京集体户口 

首先是技术面试:

啥也没问 我不会java 

然后是技术总监面试:

1 问我 不会java 转到java怎么去说服他

2 问我 对于企业的文化是怎么看法

3 问我之前的教育经历

4 问我 你想让公司员工怎么带你 

不要透漏出不能抗压的话语

反问面试官一个问题: 两个技术差不多的人

一个是培训机构的一个是自己学的您选择要哪个?

2021年7月28日 爱康医疗 

 待遇:北京 12k*16  全额五险一金   工作时间八个半小时  不加班  双休  住房补贴

问我做过的项目 

问我自己的优缺点

问我对于企业未来的规划  

让我去我没去 

2021年7月29日:智联招聘公司 面试 

一共是3 面   每轮是四个部分   

深度学习原理  机器学习原理  基础数据结构算法处理问题  项目经历

第一个轮技术面试 :

1 svm对偶 函数原来 应用  svm的分类计算距离 欧式距离 

2 lstm  rnn cnn 原理 

3 问了我项目 :图神经网络  transformer的项目原理 

4 从一个字符串中找到一个 最长回文子串的问题 直接叙述算法逻辑

我给出的答案是:asjdaadsdf 找出所有相同的字母然后判断这个,每个串往里走 找回文子串

O n 的立方 

技术hr给出的 是从每个字母往两端开始走 用指针 O n 的平方 

类似于kmp算法 从两端往中间走  这个问题是,每个元素往两边走 

等待更新..... 等待二面 

二面 :问我自己的项目

          问我一个letcode上的一个算法:两个有序的数组怎么合并成一个 然后要求时间复杂度和空间复杂度是O(N)

解答 是用一个指针进行操作。同时在两个链表中进行游走

三面是薪资待遇问题:

周末双休   中午晚上  吃饭在公司花钱   晚上九点之后 打车吃饭报销  平时上班大约是9.30点到789点 没有住房补贴 交通补贴等。全额度五险一金 +医疗保险 

一年13薪保底  绩效是最多17薪  平均大约是14.5薪

最后hr电话沟通要出offer:

一个月18k 基础工资是13个月 平均绩效是 1.5个月 一年薪资是26.1w 工作制度大约是 995  最后没去

中译语通 (中国对外翻译出版有限公司)央企 知识图谱全国排名前三 

 非常的注重基础:nlp投实习问的问题

2021-10-9电话一面

对阿里天池的比赛问的比较细致

F1分数原理被问到了 问查准率较高 召回率较低怎末处理?​

西瓜好坏二分类:模型预测出来:A分为好西瓜类(A中有好的有坏的)

                                                       B分为坏西瓜类(B中有好的有坏的) 

查准率(精确率):A类中西瓜中确实是好西瓜的个数 / A类西瓜的总数。

召回率:A类西瓜中确实是好西瓜的个数 / 所有好西瓜的个数。

问:查准率较高 召回率较低怎末处理?

可能是原始数据中有标注错误的数据,因该尽快检查原始数据。

Textcnn 原理 与rnn的比较, Textcnn更快

2021年10月11日 电话二面:

问:一个文本库中有从来没发现过的词,基于现有的词库你怎末去分辨出来?

结巴的使用怎末处理这种分词,结巴的功能?不仅仅是分词 还有那些分词工具?

pagerank算法

形式语言与自动机 构造文法句法 

条件概率和联合概率计算方法

svm推导公式

信息熵?是什么 信息增益 

最后的实习生待遇是:早九晚六  双休  月薪 1w 

给大家分享我的宝藏:nlp算法面试经验_第1张图片

 2021-12月6日:好未来,nlp算法

1 transfoemer 输入 输出  问题,最好查看transfoemer pytorch 源码

1.2 购物篮推荐项目中 源码自己回顾一下!!

1.5  transfoemer bert 层数和参数量的问题,做的项目中的 数据量的大小问题!具体记清楚

2 bert 后边加 全连接做分类是怎么加的 ?

3 bert 用 tokener 提取字向量的原理,还有假设这个字没有在 bert的词库中那么是怎么办

4 word2vec中的损失函数是怎么样的?

5 回文子串给出一个 数字 组合 2345432 不用字符串存储的方式,怎么判断是不是回文

给出一个思路:128%120 取余数 是8 , 128%100 取余数是28 然后第一位是2 这样可以得到这个数字的 每一位的值 不用遍历的方式。

最后实习通过了 一天300+饭补20  base北京海淀 没有住房补贴之类的 

2021-字节 nlp算法实习 一面12月 8号

1 写一个函数 计算一个整数的平方根

2 问我 多线程 进程 io密集和计算密集

3 问我 python gel 锁

4 问我 yiled  内部机制

5 问我 def ( ) 传参数的时候 def function(a,b=1,*args,**kwargs)

6 问我深copy 浅 copy 在copy字典的时候怎么做

7 lstm 里面有几种激活函数 激活函数什么时候怎么用

8 问我卷积核设置的时候的一些常用的方式

9 问我bert中attention 与self attention有什么不同

10 问我 fasttext 还有很多记不得了 

2021.12.10号 快手 nlp算法实习生 

1 一个句子 不用监督学习的方法 进行一个5分类的任务 怎么做?

使用半监督或者无监督的方式 学习无监督或者半监督的方法 

假设使用有监督的方式 先手动标注 2w 每次训练5000条 等几个过程就可以训练一个稳定的模型 

然后我给的答复是 句子先经过 bert 然后输出一个向量 然后对这 所有的向量做一个聚类 聚类成五个类别 这时候 每个类别 用人眼 观察下 得到 这个 类别的感情,好 坏 中 极坏 极好 

2 所有的递归都可以用while 循环表示的  while 循环或者 for 循环 。

3 code 题:

树的前序 中序 后续遍历 不用递归 

给出一个链表单向链表, 求倒数第k个元素 。

滴滴的算法实习面试竟然,没写,血亏 最后过了 

2022-1-17vivo 机器翻译的实习 面试

问我 线程 协程 进程 

问我数据结构  红黑树 等别的树模型 

缓存 与 指针

正则表达式 * ? + 的区别 与 应用 +?表示什么匹配什么

2022年 2-21日满帮货运 nlp算法实习生  一面

问我 :冒泡排序算法

快速排序算法 

bert 位置编码详解

sort 排序函数 

字典根据值对健排序 

2022年2-22日  满帮集团 二面 

用torch搭建一个textcnn 

问word2vec 原理

问我lstm 三个门 怎么控制梯度爆炸 

问我 多头 self_attention 机制 

2022-3-8  哔哩哔哩 nlp算法实习生

code时 01 岛屿问题

问我 attention 优点 和具体的公式 

bert mask的缺点 和怎么改进 

transfoemer xl 模型 

样本不均衡怎么办 

货拉拉 有点垃圾 面试有点水 

2022-3-11  阿里风控事业部

问我 code hard 字符串编辑距离 

问我 child tuning 的方法 费雪信息 是怎么计算的 。

问我 图神经网络 图卷积到底是怎么做的 

问我 二分查找时间复杂度 

问我 svm 非线性的是时候怎么办  用什么核 

问我 pca降维 或者tsen 降维 

2022年3月中旬 地平线nlp算法工程师面试

具体忘了 最后过了 基本工资6000+1000房补+400交通补贴 

2022年360人工智能研究院nlp实习面试

二面结束了一直在等消息

两轮都没问code 

全程怼八股文和项目 (2022天池问天引擎搜索大赛)

你可能感兴趣的:(硕博成长之路,人工智能,自然语言处理,word2vec,深度学习,机器学习)