1 svm基本原理,核函数,核函数怎么选 ,四分类的原理是什么。
svm多分类的两种方法:
支持向量机原理详解(八): 多类分类SVM - 知乎
成对分类方法(one-against-one
一类对余类,one-against-all,one-against-the-rest
2 当下自然语言处理能实现的功能
3 图灵机的上限 答:Nlp得上限难点应该是自然语言理解
4 几层神经网络能拟合任意函数,最简单的神经网络是几层? 一层
公司给的是北京集体户口
首先是技术面试:
啥也没问 我不会java
然后是技术总监面试:
1 问我 不会java 转到java怎么去说服他
2 问我 对于企业的文化是怎么看法
3 问我之前的教育经历
4 问我 你想让公司员工怎么带你
不要透漏出不能抗压的话语
反问面试官一个问题: 两个技术差不多的人
一个是培训机构的一个是自己学的您选择要哪个?
待遇:北京 12k*16 全额五险一金 工作时间八个半小时 不加班 双休 住房补贴
问我做过的项目
问我自己的优缺点
问我对于企业未来的规划
让我去我没去
一共是3 面 每轮是四个部分
深度学习原理 机器学习原理 基础数据结构算法处理问题 项目经历
第一个轮技术面试 :
1 svm对偶 函数原来 应用 svm的分类计算距离 欧式距离
2 lstm rnn cnn 原理
3 问了我项目 :图神经网络 transformer的项目原理
4 从一个字符串中找到一个 最长回文子串的问题 直接叙述算法逻辑
我给出的答案是:asjdaadsdf 找出所有相同的字母然后判断这个,每个串往里走 找回文子串
O n 的立方
技术hr给出的 是从每个字母往两端开始走 用指针 O n 的平方
类似于kmp算法 从两端往中间走 这个问题是,每个元素往两边走
等待更新..... 等待二面
二面 :问我自己的项目
问我一个letcode上的一个算法:两个有序的数组怎么合并成一个 然后要求时间复杂度和空间复杂度是O(N)
解答 是用一个指针进行操作。同时在两个链表中进行游走
三面是薪资待遇问题:
周末双休 中午晚上 吃饭在公司花钱 晚上九点之后 打车吃饭报销 平时上班大约是9.30点到789点 没有住房补贴 交通补贴等。全额度五险一金 +医疗保险
一年13薪保底 绩效是最多17薪 平均大约是14.5薪
最后hr电话沟通要出offer:
一个月18k 基础工资是13个月 平均绩效是 1.5个月 一年薪资是26.1w 工作制度大约是 995 最后没去
非常的注重基础:nlp投实习问的问题
2021-10-9电话一面
对阿里天池的比赛问的比较细致
F1分数原理被问到了 问查准率较高 召回率较低怎末处理?
西瓜好坏二分类:模型预测出来:A分为好西瓜类(A中有好的有坏的)
B分为坏西瓜类(B中有好的有坏的)
查准率(精确率):A类中西瓜中确实是好西瓜的个数 / A类西瓜的总数。
召回率:A类西瓜中确实是好西瓜的个数 / 所有好西瓜的个数。
问:查准率较高 召回率较低怎末处理?
可能是原始数据中有标注错误的数据,因该尽快检查原始数据。
Textcnn 原理 与rnn的比较, Textcnn更快
2021年10月11日 电话二面:
问:一个文本库中有从来没发现过的词,基于现有的词库你怎末去分辨出来?
结巴的使用怎末处理这种分词,结巴的功能?不仅仅是分词 还有那些分词工具?
pagerank算法
形式语言与自动机 构造文法句法
条件概率和联合概率计算方法
svm推导公式
信息熵?是什么 信息增益
最后的实习生待遇是:早九晚六 双休 月薪 1w
1 transfoemer 输入 输出 问题,最好查看transfoemer pytorch 源码
1.2 购物篮推荐项目中 源码自己回顾一下!!
1.5 transfoemer bert 层数和参数量的问题,做的项目中的 数据量的大小问题!具体记清楚
2 bert 后边加 全连接做分类是怎么加的 ?
3 bert 用 tokener 提取字向量的原理,还有假设这个字没有在 bert的词库中那么是怎么办
4 word2vec中的损失函数是怎么样的?
5 回文子串给出一个 数字 组合 2345432 不用字符串存储的方式,怎么判断是不是回文
给出一个思路:128%120 取余数 是8 , 128%100 取余数是28 然后第一位是2 这样可以得到这个数字的 每一位的值 不用遍历的方式。
最后实习通过了 一天300+饭补20 base北京海淀 没有住房补贴之类的
1 写一个函数 计算一个整数的平方根
2 问我 多线程 进程 io密集和计算密集
3 问我 python gel 锁
4 问我 yiled 内部机制
5 问我 def ( ) 传参数的时候 def function(a,b=1,*args,**kwargs)
6 问我深copy 浅 copy 在copy字典的时候怎么做
7 lstm 里面有几种激活函数 激活函数什么时候怎么用
8 问我卷积核设置的时候的一些常用的方式
9 问我bert中attention 与self attention有什么不同
10 问我 fasttext 还有很多记不得了
1 一个句子 不用监督学习的方法 进行一个5分类的任务 怎么做?
使用半监督或者无监督的方式 学习无监督或者半监督的方法
假设使用有监督的方式 先手动标注 2w 每次训练5000条 等几个过程就可以训练一个稳定的模型
然后我给的答复是 句子先经过 bert 然后输出一个向量 然后对这 所有的向量做一个聚类 聚类成五个类别 这时候 每个类别 用人眼 观察下 得到 这个 类别的感情,好 坏 中 极坏 极好
2 所有的递归都可以用while 循环表示的 while 循环或者 for 循环 。
3 code 题:
树的前序 中序 后续遍历 不用递归
给出一个链表单向链表, 求倒数第k个元素 。
问我 线程 协程 进程
问我数据结构 红黑树 等别的树模型
缓存 与 指针
正则表达式 * ? + 的区别 与 应用 +?表示什么匹配什么
问我 :冒泡排序算法
快速排序算法
bert 位置编码详解
sort 排序函数
字典根据值对健排序
2022年2-22日 满帮集团 二面
用torch搭建一个textcnn
问word2vec 原理
问我lstm 三个门 怎么控制梯度爆炸
问我 多头 self_attention 机制
code时 01 岛屿问题
问我 attention 优点 和具体的公式
bert mask的缺点 和怎么改进
transfoemer xl 模型
样本不均衡怎么办
问我 code hard 字符串编辑距离
问我 child tuning 的方法 费雪信息 是怎么计算的 。
问我 图神经网络 图卷积到底是怎么做的
问我 二分查找时间复杂度
问我 svm 非线性的是时候怎么办 用什么核
问我 pca降维 或者tsen 降维
具体忘了 最后过了 基本工资6000+1000房补+400交通补贴
二面结束了一直在等消息
两轮都没问code
全程怼八股文和项目 (2022天池问天引擎搜索大赛)