NLP_victor

机器学习基础知识点③：词嵌入

1、文本表示哪些方法？

下面对文本表示进行一个归纳，也就是对于一篇文本可以如何用数学语言表示呢？

基于one-hot、tf-idf、textrank等的bag-of-words；
主题模型：LSA（SVD）、pLSA、LDA；
基于词向量的固定表征：word2vec、fastText、glove
基于词向量的动态表征：elmo、GPT、bert

2、传统的词向量有什么问题？怎么解决？各种词向量的特点是什么？

上述方法得到的词向量是固定表征的，无法解决一词多义等问题，如“川普”。为此引入基于语言模型的动态表征方法：elmo、GPT、bert。

各种词向量的特点：

（1）One-hot 表示：维度灾难、语义鸿沟；

（2）分布式表示 (distributed representation) ：
矩阵分解（LSA）：利用全局语料特征，但SVD求解计算复杂度大；
基于NNLM/RNNLM的词向量：词向量为副产物，存在效率不高等问题；
word2vec、fastText：优化效率高，但是基于局部语料；
glove：基于全局预料，结合了LSA和word2vec的优点；
elmo、GPT、bert：动态特征；

3、基于tf-idf的词袋模型 vs n-gram模型

①词袋模型

最基础的文本表示模型是词袋模型。将每篇文章看成一袋子词，并忽略每个词出现的顺序。具体地说，就是将整段文本以词为单位切分开，然后每篇文章可以表示成一个长向量，向量中的每一维代表一个单词，而该维对应的权重则反映了这个词在原文章中的重要程度。常用TF-IDF来计算权重。

TF（Term Frequency）：词频

IDF（Inverse Document Frequency）：逆文档频率

将TF和IDF相乘就会得到TF-IDF的算法：

TF(t)=（该词语在文档出现的次数）/（文档中词语的总数）

IDF(t)= log_e（文档总数/出现该词语的文档总数）

直观的解释是，如果一个单词在非常多的文章里面都出现，那么它可能是一个比较通用的词汇，对于区分某篇文章特殊语义的贡献较小，因此对权重做一定惩罚。

②N-gram模型

将文章进行单词级别的划分有时候并不是一种好的做法，比如英文中的natural language processing（自然语言处理）一词，如果将natural，language，processing这3个词拆分开来，所表达的含义与三个词连续出现时大相径庭。

通常，可以将连续出现的n个词（n≤N）组成的词组（Ngram）也作为一个单独的特征放到向量表示中去，构成N-gram模型。另外，同一个词可能有多种词性变化，却具有相似的含义。在实际应用中，一般会对单词进行词干抽取（Word Stemming）处理，即将不同词性的单词统一成为同一词干的形式。

4、word2vec和NNLM对比有什么区别？（word2vec vs NNLM）

1）其本质都可以看作是语言模型；

2）词向量只不过NNLM一个产物，word2vec虽然其本质也是语言模型，但是其专注于词向量本身，因此做了许多优化来提高计算效率：

与NNLM相比，词向量直接sum，不再拼接，并舍弃隐层；
考虑到sofmax归一化需要遍历整个词汇表，采用hierarchical softmax 和negative sampling进行优化，hierarchical softmax 实质上生成一颗带权路径最小的哈夫曼树，让高频词搜索路劲变小；negative sampling更为直接，实质上对每一个样本中每一个词都进行负例采样；

5、word2vec vs glove

word2vec是局部语料库训练的，其特征提取是基于滑窗的；而glove的滑窗是为了构建co-occurance matrix，是基于全局语料的，可见glove需要事先统计共现概率；因此，word2vec可以进行在线学习，glove则需要统计固定语料信息。
word2vec是无监督学习，同样由于不需要人工标注；glove通常被认为是无监督学习，但实际上glove还是有label的，即共现次数。
word2vec损失函数实质上是带权重的交叉熵，权重固定；glove的损失函数是最小平方损失函数，权重可以做映射变换。
总体来看，glove可以被看作是更换了目标函数和权重函数的全局word2vec。

6、word2vec的两种优化方法是什么？它们的目标函数怎样确定的？训练过程又是怎样的？

不经过优化的CBOW和Skip-gram中 ,在每个样本中每个词的训练过程都要遍历整个词汇表，也就是都需要经过softmax归一化，计算误差向量和梯度以更新两个词向量矩阵（这两个词向量矩阵实际上就是最终的词向量，可认为初始化不一样），当语料库规模变大、词汇表增长时，训练变得不切实际。为了解决这个问题，word2vec支持两种优化方法：hierarchical softmax 和negative sampling。此部分仅做关键介绍，数学推导请仔细阅读《word2vec 中的数学原理详解》。

（1）基于hierarchical softmax 的 CBOW 和 Skip-gram

hierarchical softmax 使用一颗二叉树表示词汇表中的单词，每个单词都作为二叉树的叶子节点。对于一个大小为V的词汇表，其对应的二叉树包含V-1非叶子节点。假如每个非叶子节点向左转标记为1，向右转标记为0，那么每个单词都具有唯一的从根节点到达该叶子节点的由｛0 1｝组成的代号（实际上为哈夫曼编码，为哈夫曼树，是带权路径长度最短的树，哈夫曼树保证了词频高的单词的路径短，词频相对低的单词的路径长，这种编码方式很大程度减少了计算量）。

CBOW中的目标函数是使条件概率最大化

Skip-gram中的目标函数是使条件概率最大化

（2）基于negative sampling的 CBOW 和 Skip-gram

negative sampling是一种不同于hierarchical softmax的优化策略，相比于hierarchical softmax，negative sampling的想法更直接——为每个训练实例都提供负例。负采样算法实际上就是一个带权采样过程，负例的选择机制是和单词词频联系起来的。

（3） word2vec负采样有什么作用？

负采样这个点引入word2vec非常巧妙，两个作用，1.加速了模型计算，2.保证了模型训练的效果，一个是模型每次只需要更新采样的词的权重，不用更新所有的权重，那样会很慢，第二，中心词其实只跟它周围的词有关系，位置离着很远的词没有关系，也没必要同时训练更新，作者这点非常聪明。

7、 elmo、GPT、bert三者之间有什么区别？（elmo vs GPT vs bert）
之前介绍词向量均是静态的词向量，无法解决一词多义等问题。下面介绍三种elmo、GPT、bert词向量，它们都是基于语言模型的动态词向量。下面从几个方面对这三者进行对比：

（1）特征提取器：elmo采用LSTM进行提取，GPT和bert则采用Transformer进行提取。很多任务表明Transformer特征提取能力强于LSTM，elmo采用1层静态向量+2层LSTM，多层提取能力有限，而GPT和bert中的Transformer可采用多层，并行计算能力强。

（2）单/双向语言模型：

GPT采用单向语言模型，elmo和bert采用双向语言模型。但是elmo实际上是两个单向语言模型（方向相反）的拼接，这种融合特征的能力比bert一体化融合特征方式弱。
GPT和bert都采用Transformer，Transformer是encoder-decoder结构，GPT的单向语言模型采用decoder部分，decoder的部分见到的都是不完整的句子；bert的双向语言模型则采用encoder部分，采用了完整句子。

Reference

nlp中的词向量对比：https://zhuanlan.zhihu.com/p/56382372

你可能感兴趣的:(算法面试)

【字节跳动】数据挖掘面试题0002：从转发数据中求原视频用户以及转发的最长深度和二叉排序树指定值言析数智数据挖掘常见面试题数据挖掘面试题
文章大纲题目一：从转发数据中求原视频用户以及转发的最长深度问题分析解题思路寻找原视频用户计算转发最长深度题目二：在一棵二叉排序树中，找到比给定数值小的最大节点方法思路题目一：从转发数据中求原视频用户以及转发的最长深度在数据处理和算法面试中，常常会遇到一些基于实际业务场景的题目，比如根据用户转发数据来分析原视频用户以及转发深度。今天就来探讨一道这样的面试题：给定被转发用户和转发用户两组数据，求原视频
深入理解栈的合法弹出序列验证算法
引言在计算机科学中，栈(Stack)是一种非常重要的数据结构，它遵循"后进先出"(LIFO)的原则。栈在编程语言实现、算法设计、系统调用等方面有着广泛的应用。今天，我们将深入探讨一个关于栈的经典问题：如何验证一个给定的弹出序列是否是某个压入序列的合法弹出序列。这个问题看似简单，却蕴含着栈操作的精髓，也是许多算法面试中的常见题目。问题描述给定两个整数序列，第一个序列表示栈的压入顺序，请判断第二个序列
【专栏介绍】【2025算法面试通关全攻略】再见孙悟空_ 【2025算法面试通关全攻略】算法面试职场和发展机器学习算法面试题算法工程师面试面试合集
专栏定位：打造算法面试的“百科全书”，覆盖全领域、全难度、全题型无论你是刚入门的“算法小白”，还是追求技术突破的资深工程师，亦或是跨领域求职的转行者，本专栏将通过12大核心领域、300+精选试题、4类题型设计（理论/算法/编程/项目），帮你构建从基础理论到工程实践的完整知识体系，突破面试瓶颈，斩获高薪Offer！核心优势：分层训练、体系化覆盖、紧贴行业脉搏难度分级，适配不同水平基础题（40%）：夯
LeetCode第261题_以图判树 @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习 python c++
LeetCode第261题：以图判树文章摘要本文详细解析LeetCode第261题"以图判树"，这是一道图论问题。文章提供了从DFS到并查集的多种解法，包含C#、Python、C++三种语言实现，配有详细的算法步骤图解和性能分析。适合想要深入理解图论算法和树的性质的算法学习者。核心知识点：图论、DFS、BFS、并查集、树的性质难度等级：中等推荐人群：图论学习者、算法面试准备者题目描述给定从0到n-
阿里的极限压测：手撕红黑树卡壳时，技术主管抛出分布式锁失效危机搞Java的小码农 Java面试场景题 Java 面试高并发分布式锁红黑树技术挑战
标题：阿里的极限压测：手撕红黑树卡壳时，技术主管抛出分布式锁失效危机场景设定时间：阿里总部，终面环节，技术主管正在考核即将加入某高并发项目组的应届生小兰。小兰即将面对一场极限压测场景模拟，这是她能否通过终面的关键一战。第一轮提问：基础数据结构与算法面试官（技术主管）：小兰，首先我们来聊点基础的。你能否手撕红黑树，讲讲它的基本性质和实现原理？小兰：嗯……红黑树是一种自平衡二叉搜索树，它的节点有红黑两
每日算法 -【Swift 算法】正则表达式匹配：支持 `.` 和 `*` 不二狗算法算法 swift 正则表达式
用动态规划实现正则表达式匹配：支持.和*在这篇文章中，我们将深入探讨如何实现一个正则表达式匹配引擎，支持两个基础通配符：.：匹配任意一个字符*：匹配零个或多个前面的字符该问题是LeetCode上的经典题目，也常出现在算法面试中。我们将重点分析动态规划的解法，比较不同方法的优劣，并分析时间复杂度与空间复杂度。问题描述给定一个字符串s和一个字符模式p，实现一个函数来匹配它们。支持以下规则：.匹配任意一
LeetCode 215：数组中的第K个最大元素 - 两种高效解法详解进击的小白菜 Top100 详解 2025 leetcode java 算法
文章目录问题描述解法一：快速选择算法（QuickSelect）算法思想算法步骤Java实现复杂度分析算法特点解法二：最小堆（优先队列）算法思想算法步骤Java实现复杂度分析算法特点两种解法比较测试示例总结在算法面试中，查找数组中第K个最大元素是一个经典问题。LeetCode第215题要求我们在未排序的数组中找到第K大的元素。本文将介绍两种高效的解决方案：快速选择算法和堆（优先队列）方法，帮助你全面
腾讯百度阿里华为常见算法面试题TOP100(2)：图论、矩阵、数组沉迷单车的追风少年面试经验记录百度面试算法阿里
之前总结过字节跳动TOP50算法面试题：字节跳动常见算法面试题top50整理_沉迷单车的追风少年-CSDN博客_字节算法面试题目录矩阵73.矩阵置零54.螺旋矩阵48.旋转图像240.搜索二维矩阵II数组53.最大子数组和56.合并区间189.轮转数组238.除自身以外数组的乘积41.缺失的第一个正数图论200.岛屿数量994.腐烂的橘子207.课程表208.实现Trie前缀树矩阵73.矩阵置零
【LeetCode 热题 100】56. 合并区间 —— 一文弄懂排序+遍历经典解法（附Python代码）未名编程 LeetCode热题100详解算法 leetcode 动态规划
题目链接LeetCode56.合并区间一、引言：区间合并，刷题路上的绊脚石？区间类问题是算法面试中常见的经典题型，尤其是“合并区间”问题，考察你对排序、区间重叠判断及边界处理的理解和编码能力。很多同学在面对这题时，容易卡在：什么时候两个区间算重叠？为什么一定要排序？怎么保证合并后不漏区间、不多区间？边界条件（端点相等）该如何处理？如果你也曾被这些疑问困扰，那么这篇文章绝对帮你理清思路！本文将带你：
大模型算法面试指南：美团二面基础问题详解，助你轻松应对面试挑战！ AGI大模型老王算法面试职场和发展 AI大模型人工智能大模型程序员
想招人，网上找了一些面试题。结果发现，有的东西我自己都叫不准。这就尴尬了，赶快充电一波。这是网上找的美团的问题。解答是我在大模型生成结果上校验、修改出来的。1.Encoder-Decoder,CausalDecoder,PrefixDecoder的区别这三种架构是Transformer模型及其变体的主要形式，它们在处理序列数据的方式上有所不同，尤其是在注意力机制的应用上。Encoder-Decod
大模型算法面试|阿里二面凉了：Transformer为何要用KV缓存？ AI小白熊算法面试 transformer 人工智能学习语言模型职场和发展
前几天有个网友偷偷给我发私信，那叫一个信心满满地冲向阿里面试大模型岗位，结果悲催了，铩羽而归。到底是哪里出了岔子呢？这篇文章，我们就从面试官的视角，来拆解这个Transformer的面试连环炮。如果是你在面试现场被这些问题“轰炸”，到底该咋回答呢？嘿嘿，一起看看吧！01为什么Transformer推理要做KV缓存？面试官心理分析第一个问题一般都是先热热身，面试官问这个呢，其实是想看看，你知不知道T
第十二章大厂面试终极备战：体系化破解算法与系统设计全息架构师面试算法代理模式
第十二章大厂面试终极备战：体系化破解算法与系统设计一、算法面试深度突破1.1高频算法题型分类解析六大核心题型思维导图：
Android面试总结之GC算法篇每次的天空 android 面试算法
一、GC机制核心原理与算法面试题1：Android中为什么采用分代回收？分代策略如何优化GC效率？标准答案：分代回收基于对象生命周期的差异，将堆分为年轻代（YoungGen）和老年代（OldGen）：年轻代：对象存活率低，采用复制算法（如ART的GenerationalCopying），将存活对象复制到To区，快速回收垃圾。例如，新创建的对象首先分配在Eden区，MinorGC时存活对象晋升到Su
在递增矩阵中查找目标值的高效方法几点才到啊矩阵算法线性代数 c语言
引言在很多算法面试题或者实际应用中，我们常常需要在一个矩阵中查找目标值。一个经典的问题是，在一个二维矩阵中查找一个值，该矩阵的特点是每行从左到右递增，且每列从上到下递增。面对这种情况，如何高效地查找目标值呢？我们可以通过利用矩阵的递增特性来设计一个高效的查找算法。本文将详细讲解如何使用右上角开始的方法，设计一个时间复杂度为O(m+n)的查找算法。问题分析给定一个二维矩阵，矩阵的每行元素是递增的，且
大模型面经 | 春招、秋招算法面试常考八股文附答案（二）皮先生! 大模型面经算法面试人工智能大模型深度学习自然语言处理
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。目录1.大模型幻觉问题2.介绍一下常见的位置编码3.介绍一下LoRA4.AdaLoRA和QLoRA5.RLHF中，PPO需要哪几个模型，分别是什么作用?1.大模型幻觉问题幻觉是指大模型在生成文本或进行预测时，产生与事实不符或不符合逻辑的输出。例如，在问答任务中，模型可能给出与问题无关或错误的答案，即使这些
大模型面经 | 介绍一下CLIP和BLIP 皮先生! 大模型面经人工智能深度学习算法大模型面试多模态自然语言处理
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）
大模型面经 | 春招、秋招算法面试常考八股文附答案（四）皮先生! 大模型面经人工智能算法自然语言处理深度学习面试大模型微调
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）
NLP/大模型算法工程师「春招、秋招高频面试题 | 建议收藏」皮先生! 大模型面经算法面试自然语言处理大模型人工智能深度学习面经
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）
大模型面经 | DeepSpeed中ZeRO-1、ZeRO-2和ZeRO-3的区别是什么？皮先生! 大模型面经大模型算法面试自然语言处理人工智能分布式训练
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）一文搞
大模型面经 | 如何解决大模型幻觉问题？皮先生! 大模型面经人工智能深度学习算法面试自然语言处理职场和发展大模型
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）一文搞
大模型面经 | 介绍一下大模型微调方法Prefix Tuning、Prompt Tuning、P-Tuning和P-Tuning v2 皮先生! 大模型面经面试职场和发展人工智能深度学习自然语言处理算法大模型微调
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）一文搞
大模型面经 | 春招、秋招算法面试常考八股文附答案（RAG专题二）皮先生! 大模型面经算法大模型面试自然语言处理人工智能 RAG（检索增强生成）八股文
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的RAG（检索增强生成）相关面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）一文搞懂DeepSeek核心技术-多头潜在注意力（MLA）一文搞懂DeepSeek核心技术-DeepSe
大模型面经 | 春招、秋招算法面试常考八股文附答案（三）皮先生! 大模型面经人工智能面试自然语言处理算法大模型微调深度学习
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）一文搞
国密算法面试题解析及应用曼岛_ 密码学实战算法密码学面试
以下是密码学领域常见的面试题及其详细解析，涵盖基础理论、算法实现与应用场景，帮助系统化备战技术面试一、基础概念类1.密码学的主要目标是什么？答案：确保数据的机密性（加密防止窃听）、完整性（哈希校验防篡改）、认证性（数字签名验证身份）和不可否认性（签名防抵赖）。2.对称加密与非对称加密的区别？答案：对称加密（如AES、SM4）：加密解密使用同一密钥，速度快，适合大数据量加密，但密钥分发困难。非对称加
大模型面经 | DeepSeek-R1中提到的思维链(Chain of Thought，CoT)是什么？皮先生! 大模型面经人工智能面试自然语言处理算法大模型思维链职场和发展
大家好，我是皮先生！！今天给大家分享一些关于大模型面试常见的面试题，希望对大家的面试有所帮助。往期回顾：大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题一）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题二）大模型面经|春招、秋招算法面试常考八股文附答案（RAG专题三）大模型面经|春招、秋招算法面试常考八股文附答案（一）大模型面经|春招、秋招算法面试常考八股文附答案（二）一文搞
验证二叉搜索树c语言,2019 算法面试相关(leetcode)--树、二叉树、二叉搜索树 miao君验证二叉搜索树c语言
树是一种数据结构，它是由n(n>=1)个有限结点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点：每个结点有零个或多个子结点；没有父结点的结点称为根结点；每一个非根结点有且只有一个父结点；除了根结点外，每个子结点可以分为多个不相交的子树二叉树(BinaryTree)是每个结点最多有两个子树的树结构。通常子树被称作“左子树”(l
大厂算法面试 7 天冲刺：第7天-系统设计与模拟面试实战 —— 架构思维 + Java落地工一木子数据结构与算法笔记算法面试架构
️第7天：系统设计与模拟面试实战——架构思维+Java落地一、What：系统设计是什么？系统设计是对一个复杂系统的高可用、高性能、高扩展性架构进行顶层思考和具体实现的过程。涉及核心主题：可扩展性（Scalability）可用性（Availability）一致性（Consistency）缓存设计（Cache）数据分片与副本（Sharding&Replication）接口限流与熔断（RateLimit
Android面试题(一)Java高频面试题红日666 Android 面试题大全 java Java面试题
Android面试题(一)Java高频面试题Android面试题(二)Android中高级/资深面试题Android面试题(三)Java虚拟机原理面试题Android面试题(四)常用设计模式面试题Android面试题(五)数据结构/算法面试题Android面试题(六)高频网络基础面试题Android面试题(七)Kotlin高频面试题Android面试题(八)Flutter高频面试题目录Java的基
大厂算法面试 7 天冲刺：第5天- 递归与动态规划深度解析 - 高频面试算法 & Java 实战工一木子数据结构与算法笔记算法面试动态规划
第5天：递归与动态规划深度解析-高频面试算法&Java实战1.递归&动态规划核心概念1.1递归（Recursion）递归是一种通过函数调用自身来解决问题的方法，通常用于分解大问题为子问题。关键点：递归终止条件（BaseCase）递归关系（RecurrenceRelation）避免重复计算（记忆化或动态规划）1.2动态规划（DynamicProgramming,DP）动态规划是一种优化递归的算法，核
大厂算法面试 7 天冲刺：第6天-树与图深度剖析——高频算法面试题 & Java 实战工一木子数据结构与算法笔记算法面试 java
第6天：树与图深度剖析——高频算法面试题&Java实战一、核心知识概览Overview1.树（Tree）树是一种非线性数据结构，常见于面试中的二叉树（BinaryTree）、二叉搜索树（BST）、N叉树等。常见面试考点：树的遍历（前序、中序、后序、层序）最近公共祖先（LowestCommonAncestor,LCA）判断平衡树、对称树、二叉搜索树验证等2.图（Graph）图是一种更复杂的数据结构，
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他