程序员对白

Transformer面试题总结101道

大家好，我是对白。

今天给大家总结了101道Transformer的面试题，建议收藏：

1，请阐述 Transformer 能够进行训练来表达和生成信息背后的数学假设，什么数学模型

或者公式支持了 Transformer 模型的训练目标？请展示至少一个相关数学公式的具体推导过程。

2，Transformer 中的可训练 Queries、Keys 和 Values 矩阵从哪儿来？Transformer 中为何会有 Queries、Keys 和 Values 矩阵，只设置 Values 矩阵本身来求 Attention 不是更简单吗？

3，Transformer 的 Feed Forward 层在训练的时候到底在训练什么？

4，请具体分析 Transformer 的 Embeddigns 层、Attention 层和 Feedforward 层的复杂度

5，Transformer 的 Positional Encoding 是如何表达相对位置关系的，位置信息在不同的Encoder 的之间传递会丢失吗？

6，Transformer 中的 Layer Normalization 蕴含的神经网络的假设是什么？为何使用Layer Norm 而不是 Batch Norm？Transformer 是否有其它更好的 Normalization 的实现？

独立同分布假设

7，Transformer 中的神经网络为何能够很好的表示信息？

8，请从数据的角度分析 Transformer 中的 Decoder 和 Encoder 的依存关系

9，请描述 Transformer 中的 Tokenization 的数学原理、运行流程、问题及具体改进方法

10，请描述一下你认为的把 self-attention 复杂度从 O(n2) 降低到 O(n)有效方案.

11，Bert 的 CLS 能够有效的表达 Sentence Embeddings 吗？

12，使用 BPE (Byte-Pair Encoding) 进行 Tokenization 对于 Cross-lingual 语言模型的意义是什么？是否会有问题及如何改进？

13，如果使用 Transformer 对不同类别的数据进行训练，数据集有些类别的数据量很大(例如有 10 亿条)，而大多数类别的数据量特别小(例如可能只有 100 条)，此时如何训练出一个相对理想的 Transformer 模型来对处理不同类别的任务？

14，如何使用使用多种类小样本对 Transformer 训练而取得很好的分类效果，请详述背后的架构设计和数学机制

15，在给 Transformer 输入 Embeddings 的时候是否可以使用多方来源的词嵌入训练模型？请阐述背后的数学原理及工程上的具体实现机制

16，更深更宽的 Transformer 网络是否意味着能够获得更强的预训练模型？请至少从 3个角度，例如架构的工程化落地、参数的信息表达能力、训练任务等，来展开具体的分析

17，如何大规模降低 Transformer 中 Embedding 中的参数数量？请至少具体分析一种具体方法背后的数学原理和工程实践

18，请描述 Trasnformer 不同的 Layer 之间的 FeedForward 神经网络之间的联系，例如在 Bert 中不同 Layer 之间的 CLS 有什么关系、对角矩阵随着 Layer 的加深有何变化等

19，如何降低 Transformer 的 Feedforward 层的参数数量？请详述背后的数学原理和工程实践

20，Transformer 的 Layer 深度过深，例如 512 个 Layer，会可能导致什么现象？请详述背后的数学机制21，Bert 中 NSP 可能的问题有些哪些？这些问题背后的数学原理是什么？如何改进？可以去掉 NSP 训练任务吗？

22，请详解分析 Transformer 的 Batch 大小与训练的信息困惑度 ppl 的关系并阐明背后的数学原理

23，请从数据的角度分析一下为何在对 Transformer 进行参数的 Quantization 的时候工业界最终选择了 INT8？包括压缩的具体过程、KL 散度、长尾分布等。如何处理Quantization 后模型质量降低度情况？

24，以 Transformer 为代表的的 Neuron Network 逐渐主导了人工智能各领域，例如NLP, CV 等的信息表示。请从数学的角度阐述为什么 Neuron Network 能够代表任意人复杂度的信息？使用神经网络表达信息具体有什么优势？

25，请描述至少三种判断 Transformer 中神经元 Neuron 相对重要程度的具体方法及其背后的数学原理

26，为什么说 Transformer 的注意力机制是相对廉价的？注意力机制相对更对于 RNN 系列及 Convolution 系列算法而言在计算上（尤其是计算复杂度）有什么优势？

27，请用具体例子阐述使用 Multi-head 的物理机制和并从数学的视角来推导其有效性的原因

28，请分享一下至少三种提升 Transformer 预测速度的具体的方法及其数学原理

29，请分别描述 Bert 的 MLM 和 NSP 技术(例如 Sampling) 的问题及具体改进方式

30，请阐述使用 Transformer 实现 Zero-shot Learning 数学原理和具体实现流程

31，请至少描述 2 种对来自不同训练模型训练出来的 Embeddings 进行相似度比较的方法的具体实现

32，如何使得一个小模型，例如 LSTM，具有一个大模型，例如 Bert 的能力？

33，为何训练后的 BERT 模型不能够很容易的实现模型泛化？请从架构机制和数学原理部分进行分析

34，GPT 的 auto-regressive 语言模型架构在信息表示方面有什么架构上的缺陷？

35，请描述 BERT 中 MLM 实现中的至少 5 个缺陷及可能的解决方案

36，请从数学的角度阐明如何实现对 Transformer 任意位置和长度进行 Mask 的具体实现方式

37，请描述 Encoder 和 Decoder 中 Attention 机制的三点不同之处并阐述其数学原理

38，请描述 Transformer 中 Decoder 的 Embedding layers 架构设计、运行流程和数学原理

39，请描述 Transformer 进行 Training 的全生命周期的在 Decoder 中是如何进行

Embedding 的呢？请阐述其流程和数学原理

40，请描述 Transformer 进行 Inference 的全生命周期的在 Decoder 中是如何进行Embedding 的呢？请阐述其流程和数学原理

41，Transformer 如果采用和 Inference 同样的流程来进行 Training，会有什么问题？请至少指出 3 点问题并说明背后的数学原理

42，为何 Transformer 的 Matrix Dimensions 是 3D 的？请详述每个 Dimension 大小的改变是如何影响整个 Transformer 训练过程的？请详述其具体的流程和数学原理

43，请描述只由一个 Encoder 和 Decoder 的 Transformer 使用了 Attention 的三个地方及其功能

44，请分别描述当进行 Training 和 Inference 的时候 Masking 在 Transformer 三大不同类型使用 Attention 机制的地方的具体功能和数学实现

45，请描述 Transformer 的 Training Loss 具体工作流程和背后的数学公式

46，请阐述 Multi-head Attention 机制中通过 Linear layer 的 Matrices 计算 Query、Key、Value 时候进行 logical partition 和 physical partition 的异同及背后的数学原理

47，请阐述 Transformer 中所有能够 trainable 的操作及其功能

48，请阐述 Query、Key、Value 在 Transformer 中具体的功能

49，为什么 Transformer 中的 Attention Score 能够衡量不同 Words 之间 Relevance 的不同程序呢？请说明背后的物理机制和数学原理

50，Transformer 是如何知道什么样的 Weights 能够使得其更好的表达不同信息部分的不同程度的注意力的？请描述其运行机制和背后的数学假设

51，如何减少 Transformer 中训练后的 Word Embeddings 的 Bias？请阐述其背后的数学原理和实现流程

52，如何解决 Self-attention 和 Word 和自己的 Attention 最大的问题？

53，为什么 Transformer 能够对 NLP、CV 等任何 AI 领域的信息进行有效表示？

54，为何通过 Ground Truth 就能够训练 Transformer 使其具有泛化能力?

55，为什么在 Transformer 的 Attention 计算的时候需要进行 Scaling 操作，请从神经网络和数学原理的角度进行解释

56，在 Transformer 中，一个输入文本词汇的顺序是由 position encoding 来表达还是由multi-head attention 来具体实现的？请阐述运行机制和数学原理

57，请描述 multi-head attention 的至少三种实现方式并提供相应的示例实现代码58，请描述 Transformer 中三种类型的 non-linear 操作并阐述请数学原理

59，相比于 RNN 等，为何 Transformer 论文作者声称“Attention is all you need”？请重点从数学的角度阐述其原因

60，请具体谈一下 Teacher forcing 的数学原理及其在 Transformer 中的至少两个地方的应用

61，在 Transformer 的架构中 Decoder 在进行 Inferencer 的时候同时接收来自 Encoder和 Decoder 的输入信息，以 NLP 为例，这两种类型的输入在词法、语法、语义上是否有所不同？背后的数学原理是是什么？

62，请描述 BERT 的 Tokenization 机制的优势和不足，及针对不足的解决方案

63，Transformer 的 Input 长度为何受限？请阐明数学原因并提供至少一种可能的解决方案

64，如果使用 Pytorch 实现 Transformer，如何巧妙的使用或者停用

optimizer.zero_grad()来训练大模型，例如内存只允许一次只能训练一个 Instance？

65，训练 Transformer 时候，如果因为内存大小限制导致连一个 Instance 的训练都无法容纳，该如何完成所有 Instance 的训练，请描述详细的工程过程

66，请从 Data Science 的角度分析为何 Transformer 是目前最 generic 的 AI 模型？

67，请分析一下是什么能够从根本上限制 Transformer 的能力？

68，请描述 Transformer 训练时候的 Label Smoothing 核心功能、运行机制和数学原理

69，请描述 Beam Search 算法在 Transformer 中的具体应用并阐述其有效性的数学数学假设和数学公式

70，请分析如何使用 Transformer 来有效的对 Knowledge Graph 中的 Edge 进行

Encoding？

71，如何由你使用 Transformer 来实现一个对话系统，如何判定用户当前的交流的内容是否离题，例如在办理一项业务过程中突然对话机器人今天天气怎么？请阐述架构思路及数学原理

72，请使用 Einsum 的方式编码实现 Transformer 的 Attention 机制

73，请描述 Transformer 使用动态 Batch Size 进行训练的原理、流程和数学证明

74，如何使用 Transformer 实现一个能够同时预测 Intent 和 Entity 的信息系统？

75，使用一个 Transformer 模型同时预测 Intent 和 Entity 有什么弊端？请分析该弊端的产生的原因并提出具体的解决方案76，使用 Transformer 实现 NLU 的时候需要使用 Masking 机制吗？请解释工程原因及数学原理

77，如何使用 Transformer 来描述多轮对话？请描述工程架构和数学原理

78，请问使用 Transformer 和 CRF 做 NER 哪个更好？请提出至少 3 个工程落地的最佳实践。

79，请问使用手动实现 Transformer 和使用 BERT 哪个做 Intent 识别效果更好？请阐述具体的原因和工程实践过程

80，为何 Transformer 比 RNN、LSTM 等传统神经网络具有更高性价比且能够更有效的使用内存和计算资源？

81，Transformer 为何只使用 Attention 机制就解决了 CNN、LSTM、RNN 等能解决的一切问题及这些传统网络解决不了的问题？

82，当有新的数据的来训练 Transformer 模型的时候，如何如何实现模型的增量训练？

83，请分析如何使用 Transformer 探测 Toxic 语言，Toxic 语言能够通过 Tansformer 移除吗？请分析工程实践和数学原理

84，Transformer 在通用语言领域(例如，整个英语语言领域)能否实现 Word Analogy 功能，请分析具体的工程原因和数学原因

85，如何分类语料库中的有些 Label 标注是错误的，如何使用 Transformer 来发现分类语料库中的 Bad Label？请描述具体的工程过程

86，为何说 Transformer 是一种理想的 Bayesian 模型实现？请阐述数学原理及具体的场景案例

87，请描述 Transformer 至少三个使用 Bayesian 具体地方并阐述在这些具体地方使用Bayesian 的数学原理

88，为什么说 Transformer 基于对 Bayesian 的时候极大的降级了训练时候的 overfitting？请阐述工程工程和数学原理

89, 请详解描述使用 Transformer 进行 Transfer Learning 中具体 Prior 和 Posterior

Probability 地方及其具体的功能和数学原理

90, 请描述 Transformer 在 Training 和 Inference 对 MLE(maximum likelihood estimation)模型具体应用

91, 请描述 Transformer 在 Training 的时候具体使用 MAP(Maximum A Posteriori)

estimation 模型的地方并描述其流程机制和数学原理

92, 请描述 Transformer 在训练的过程中什么情况下使用 MLE 和 MAP 是基本没有区别的，其背后的数学原理是什么？93, 为什么一般情况下 Transformer 的训练不会完全使用 Bayesian 模型而是更倾向于采用Naive Bayes？请具体阐述其架构和背后的数学原理

94，请从 Bayesian 模型的角度分析 Transformer 中代表模型例如 GPT3 为何是模型越宽、越深越好？

95，请描述 Naive Bayes 在 Transformer 的 Auto-encoding 模型训练时候的具体应用及其有效性的数学证明

96，请描述 Naive Bayes 在 Transformer 的 Auto-regressive 模型训练时候的具体应用，这样能够在小样本数据的时候帮助取得优质德训练效果？其有效性的数学证明是什么？

97，请描述 Naive Bayes 在 Transformer 的 Generative Process 的具体流程和有效性的数学证明

98，使用 Naive Bayes 来完成 Transformer 的 Generative Process 会有什么问题？问题背后工程实现限制和数学原因是什么？

99，如何使用 Transformer 和 LDA 结合完成信息的多分类模型？请实现示例代码

100，为何说 Transformer 是目前人工智能领域工程落地实践 Bayesian 理论的典型？请从数学的的角度进行完整的证明（至少包含 Encoder-Decoder、Training、Inference 等对Bayesian Theory 的具体实现）

101，在 Gavin 看来，“Transformer 赋予机器思想。Transformer 是实现多模态目前最佳的底层引擎，是人工智能、贝叶斯理论、认知模型演进的统一架构，是学术界（无意间）

基于 Bayesian 理论通过神经网络实现的（计算机）认知模型持续的 Evolving 的理想架构体系”，你怎么看？

如果觉得有用，就请分享到朋友圈吧！

关于我

你好，我是对白，清华计算机硕士毕业，现大厂算法工程师，拿过8家大厂算法岗SSP offer（含特殊计划），薪资40+W-80+W不等。

高中荣获全国数学和化学竞赛二等奖。

本科独立创业五年，两家公司创始人，拿过三百多万元融资(已到账)，项目入选南京321高层次创业人才引进计划。创业做过无人机、机器人和互联网教育，保研清华后退居股东。

我每周至少更新三篇原创，分享人工智能前沿算法、创业心得和人生感悟。我正在努力实现人生中的第二个小目标，上方关注后可以加我微信交流。

期待你的关注，我们一起悄悄拔尖，惊艳所有

古典密码设计思想与经典算法：从罗马军团到数字世界的密码学之旅算法第二深情密码学密码学
一、古典密码设计思想：信息的“魔法变形术”1.核心思想古典密码学的基本目标是通过变换明文字符的位置或形式，使其对未授权者不可读。其核心设计思想分为两种：置换（Permutation）：打乱字符顺序，但保留字符本身替代（Substitution）：用其他字符替换原字符，改变字符内容这两种操作如同“整理书架”和“换衣服”的区别：置换：把书架上的书按新顺序排列（位置变化）替代：把每本书的内容替换成其他文
二分查找进阶：查找最靠左和最靠右的索引（Java实现）算法第二深情算法学习算法 java intellij-idea
一、引言在实际开发中，二分查找（BinarySearch）是一种高效的查找算法，尤其在处理有序数组时表现出色。然而，标准的二分查找只能返回目标值的任意一个位置（例如中间位置）。如果需要找到目标值的最左索引或最右索引（例如统计重复元素的出现次数），或者只需要单纯知道最左或最有二、普通二分查找vs.边界查找1.普通二分查找publicstaticintbinarySearch(int[]arr,int
今日份开心～漫步银河的空想家
今日份开心～1.本周双休，感觉这周日子过得特别快，才周一开完会就周五了～2.考试通过率百分百～今年来第一次和组员一起吃饭，聊聊天～3.今天想吃小龙虾，安排上了它～4.管理好情绪，耐心处理客户问题心态放好第二级～5.穿喜欢的衣服～很显白～6.本周无因工作失误导致的罚款，每天面对各种处罚，生怕哪里没做好被罚款，鸭梨山大！7.喝上了奶茶～8.和弟弟聊天，很久没有打语音电话了～
过年，我损失了什么？张超_75c3
自阴历12月28日至正月5日，春节放假在老家待了整整8天。可以这么说，在家过了一个轻轻松松、愉快祥和地春节，晚上打牌、早上睡到10点起床、带妻子和女儿短途旅行两次、串亲戚等等，有说有笑，不亦乐乎！可是，今天我不想说这些，而是更想说说，这八天时间，我到底失去了什么？能不能过的更有意义些？我失去了什么？只有我自己知道，平时的我每天5:20起床，起床后学习“得到”专栏吴军的“谷歌方法论”，每天一篇，可以
【vue-7】Vue3 响应式数据声明：深入理解 reactive() AllenBright #Vue vue.js 前端 javascript
在Vue3中，响应式系统经过了彻底的重构，提供了更强大、更灵活的方式来声明和管理响应式数据。reactive()是Vue3组合式API中最核心的响应式函数之一。本文将深入探讨reactive()的工作原理、使用场景以及最佳实践。1.什么是reactive()?reactive()是Vue3提供的一个函数，它接收一个普通JavaScript对象，并返回该对象的响应式代理。这个代理对象与原始对象看起来
2018-6-12 Day9 预算日伍羽卿桁
【百日生涯营DAY9】制定下周的预算；然后制定下个月的预算吧。预算这件事，就跟你制定愿景一样，既要期待又要以现实为基础。通过不断试错和总结复盘，以后你的预算能力也会越来越强的！1.6月16日为来贵阳租房:1700×6（半年）＋1700（押金）＋1700（中介费）＝136002.家具:100003.搬家:50004.三餐:20005.昆明结算工资:500018-卿心-贵阳-2组
正面管教之旅戚海英
知道正面管教，源于一个好朋友。听她说了她的魅力以后才开始去接触简.尼尔人的正面管教。我是一名小学老师，随着教龄的增加，更多地感受到的职业的倦怠。熊孩子层出不穷，在与熊孩子的较量中总是重复着那种你胜三场，我胜两场的戏码。总想着可以用更好的方法去和孩子们和谐相处。特别是当我订下我要做一个让孩子最欢迎的老师的目标时，更觉得责任重大。正面管教于是走进了我的世界。图片发自App一口气买了六本，一个系列。却没
本色李健：不去讨好生活，生活有时会讨好你。海边小妹
有些明星，虽然身处娱乐圈，但并不那么娱乐，对于粉丝们的影响，可以涉及整个人生观的建设。比如音乐人李健，他这样的歌手，不光真心地热爱着音乐，为大众带来走心又好听的歌曲，让我们的生活多了许多美好的艺术享受，尤其难得的是，他的为人处事和做人风范，都可以成为激励我们的阳光正能量。李健说过的最让我印象深刻的一句话是：“不去讨好生活，生活有时会讨好你。”这句话，每每在我对人生感到困惑的时候，便浮上心头。活在这
人生课题，真实与假象李德刚_a11e
中年不是"问题"，而是你我必经的人生"课题"：看清"中年危机"的真实与假象一、中年危机谁说了算？2018年，接连几位女星站在荧光幕前，对观众吐露她们的心声。姚晨在《星空演讲》，用「糊掉的五年」描述40岁女演员接不到戏的处境。浙江卫视《我就是演员》中，杨蓉、王媛可和斓曦用演技告诉观众，她们是真正的实力派。但同时她们也大吐苦水，表示市场对中年女演员不友好，使得她们要不就是被迫降龄演出，要不就得面对没有
如何解决一个flink on yarn集群上已经跑了一个job，再提交第二个job的时候，task报java heap size oom的问题 fzip Flink flink java 大数据
在FlinkonYARN集群中提交第二个Job时出现Task的JavaHeapSizeOOM（内存溢出），核心原因是集群资源不足（第一个Job已占用大量资源，第二个Job分配的内存不够）或Job资源配置不合理（单个Job申请资源过多，或内存参数设置与实际需求不匹配）。解决需从“资源排查”“Job配置优化”“集群资源扩容”三个维度入手，具体步骤如下：一、先排查核心原因：确认资源占用与配置是否匹配1.
flink sql读hive catalog数据，将string类型的时间戳数据排序后写入kafka，如何保障写入kafka的数据是有序的 fzip Flink flink sql hive
在FlinkSQL中，要确保从Hive读取的STRING类型时间戳数据排序后有序写入Kafka，需要结合批处理模式、时间类型转换、单分区写入和Kafka生产者配置。以下是完整解决方案：一、核心解决方案1.批处理模式+全局排序将作业设置为批处理模式，并对字符串时间戳进行类型转换后排序：--设置为批处理模式（关键！）SET'execution.runtime-mode'='batch';--从Hive
KVM中使用桥接模式.运维就业技术教程
在KVM中使用桥接模式可以让虚拟机直接接入物理网络，使其成为局域网中的独立节点。以下是配置和使用桥接模式的详细指南：一、桥接模式原理作用:虚拟机通过宿主机的网桥（如virbr0）直接与物理交换机/路由器通信，获得与宿主机相同的网段IP。特点:虚拟机拥有独立IP，可被局域网内其他设备直接访问。无需NAT转换，网络性能更高。需确保宿主机网桥已正确配置。二、配置步骤1.创建网桥接口大多数Linux发行版
对“人格障碍”的浅认识春暖花开LittleHui
“人格障碍”这个词是我在学习心理学时接触到的。人格障碍是指明显偏离正常且根深蒂固的行为方式，具有适应不良的性质，其人格在内容上、质上或整个人格方面异常，由于这个原因，病人遭受痛苦，或给个人或社会带来不良影响。人格的异常妨碍了他们的情感和意志活动，破坏了其行为的目的性和统一性，给人以与众不同的特意感觉，在待人接物方面表现尤为突出。人格障碍通常开始于童年、青少年或成年早期，（更多是原生家庭造成的，来自
中原焦点团队焦点中32期袁莎2022年12月5日坚持分享第283天，咨询约练第18次 aeffeeb5d38b
父母和孩子相处的过程中，需要明确表达自己的想法，只有这样，孩子才能知道父母喜欢什么，不喜欢什么。一起吃饭的时候，哥哥夹了一块肉吃，因为他在减肥需要保持身材，不吃肥肉，就把带肉皮的肥肉直接放在我碗里。我很严肃的对哥哥说:“我虽然很爱你，但并不代表你不吃的东西就可以随便丢给我。记住，自己不喜欢的东西不要随便给别人，要给也是给自己喜欢的。妈妈每次都是把最好的东西留给你和弟弟，从来没说把自己不吃或者不喜欢
炒股思维和纪律决定成败，同时知道做超短线看什么选股指标，月盈利30%以上。股海救星
炒股思维和纪律决定成败，同时知道做超短线看什么选股指标，月盈利30%以上。（请加老师微信：hxw128126进入到“股票强化训练营”一起学习，领取涨幅大于40%的选股指标和战法）做交易的，尤其是做交易的，几乎每个人都会了解一些技术分析。趋势线、支撑压力、各种价格形态、超买超卖、背离、百分比回撤，等等，这些技术手段几乎每个人都了解它的主要内容和使用方法。可是，为什么很多人总是用不好技术分析的这些工具
19、大规模 MIMO系统中的混合预编码与自动重传请求性能分析 wood5 大规模MIMO 混合预编码自动重传请求(ARQ)
大规模MIMO系统中的混合预编码与自动重传请求性能分析1引言现代无线通信系统中，大规模多输入多输出（MIMO）技术通过增加天线数量显著提升了频谱效率和链路可靠性。然而，由于硬件复杂性和功耗的限制，传统的全数字实现方式在大规模天线阵列中变得不切实际。混合射频-基带预编码/合并架构通过引入射频模拟预编码阶段，有效降低了硬件复杂性，并在频谱效率和可靠性方面表现出色。本篇文章将探讨在大规模MIMO系统中，
马小秋秋言物语直播间 | 结婚后，应该谁来管钱？马小秋
马小秋秋言物语直播间提问：马小秋主席，我们中国人很含蓄，总说“提钱伤感情”，我就是在婚前没有谈好关于钱的问题，婚后我想管钱，可是先生不想交一分钱，我该怎么办？刚刚度过双节假期，对我们中国人来说，中秋节是家人团圆的日子，国庆节是国人团聚的日子，相信大家的心情也如马小秋一样明快愉悦。假期期间，马小秋回老家探望了老父亲，老父亲已经摘掉呼吸机，意识逐渐清明，还能以笑来回应我们的陪伴和鼓励，希望马小秋的老父
我与新媒体雾屿礁
新媒体是什么，刚开始我也不知道是什么东西，后来是从课堂是了解到新媒体与我们生活息息相关。新媒体按照字面上的意识就可以看出是一种崭新的媒体方式，新媒体作为一项相较于传统意义上的单项传播方式，新媒体更具有多项传播性。新媒体可以看作继报纸、广播、电台、和楼宇广告等传统媒体后，随着媒体的发展与变化而形成的新的媒体形态，是以电脑，手机，电视等，向用户提供信息的传播形态。新媒体的优势：1.传播的和更新的速度更
高情商沟通案例分析2 Vimfi
题目：反思一次话题终结者的经历，可以是你的，也可以是其他人的。他们都有什么共同特点？你认为该如何避免？话题终结者的案例：有一次办公室同事聚餐，饭桌上大家讨论起来了购物。然后就有同事说，现在基本上都是在手机上购物了。于是我接着说是啊，我也很少逛街了，现在是电商时代呀，京东、淘宝啊太便利了。现在社会发展太快了，我们都快跟不上社会步伐了。然后一个同事说，现在手机上还兴起了很多微商，经常会被刷屏，还有什么
你是怎样一个人小夕的文字
你是怎样一个人？你想要的生活是什么？你有什么追求和理想？你的规划是什么？这三个问题，我以前根本没有想过，每天坐公交就会不断回忆我们之间的所有…………恋爱不是你的全部，而我一直把你在折腾，我在你面前就像白纸一样，情绪不好了，会是怎样，我下一句想说什么……我知道你会有自己的想法和规划，你有自己想要的生活，你的性格，你的处事方式……而我却没有理解你，还一直找你闹，作给你看，弄得，也许在你的心里，我渐渐不
最全2025年AI开发工具深度对比分析：程序员的智能编程助手全指南最新功能、定价策略、使用体验和适用场景 Cursor、GitHub Copilot、Claude 4、Claude Code wei佳人工智能 ai AI编程 webstorm idea vscode
2025年AI开发工具深度对比分析：程序员的智能编程助手全指南引言(不想看文字可直接看后面图表对比）随着人工智能技术的飞速发展，AI编程助手已经从概念走向现实，成为现代软件开发不可或缺的工具。2025年上半年，AI编程工具市场迎来了前所未有的变革，各大厂商纷纷推出革命性功能，从简单的代码补全演进为能够理解完整项目上下文的智能编程代理。据最新市场研究显示，全球AI代码工具市场在2024年达到67亿美
战斗并没有打响开心点金石
接下挑战书我身负上亿颗子弹和敌人一起奔赴战场却看见“情人谷鸳鸯浴暂停营业”2018.10.30.
面试真题 | 小红书-C++引擎架构
文章目录1.自我介绍2.项目3.c++多态，如何实现的，虚表、虚表指针存储位置C++多态的实现机制虚表指针的存储位置面试官的深度追问4.explicit关键字explicit关键字的回答面试官可能的追问5.unique_ptr、shared_ptr、weak_ptr的原理，有没有线程安全问题，weak_ptr的解决了什么问题？可以用裸指针吗？会有什么问题回答unique_ptrshared_ptr
掌握reStructuredText：编写与格式化文档的技巧
本文还有配套的精品资源，点击获取简介：reStructuredText（rST）是一种轻量级文本标记语言，广泛用于Python社区的文档编写，特别是借助Sphinx文档生成器。本文介绍了rST的基础语法和高级特性，包括段落、标题、强调、代码、列表、引用、链接、图像、表格、章节组织、自定义角色和指令、包含和排除文件以及源代码高亮。同时，探讨了Sphinx与rST结合使用的高级功能，包括扩展、配置和构
掌握C#文件操作与XML处理：学习资料完整指南竹石文化传播有限公司
本文还有配套的精品资源，点击获取简介：C#是一种广泛应用于Windows和跨平台开发的编程语言，它在.NET框架中包含强大的文件和XML操作能力。本文深入探讨了C#中的文件读写技术，包括使用System.IO命名空间中的File类进行文本和二进制文件处理，FileStream类的流操作，以及XML文档的解析、创建和修改方法。同时，文章也介绍了文件操作的扩展功能和在进行文件操作时应考虑的异常处理。通
[Python] -项目实战5- Python 实现简易学生成绩管理系统踏雪无痕老爷子 Python python 开发语言
一、为什么做这个项目？学习OOP和GUI基础：通过类与对象封装学生信息，熟悉Tkinter构建窗口、表格、按钮等。实用性强：可添加、查询、删除、修改学生记录，是常见管理系统的基本功能。扩展性好：后续可以接入数据库、图表展示、权限控制等功能。二、核心技术与工具tkinter：Python内置的桌面GUI库，用于构建窗口界面、表单和按钮。sqlite3：轻量级关系数据库，适合小型持久化存储，无需部署服
[Python] -项目实战4- 利用Python进行Excel批量处理踏雪无痕老爷子 Python python excel 开发语言
一、为什么要批量处理Excel文件？节省时间：人工对数十、数百个Excel文件重复操作不现实，Python批量处理一次搞定。保证一致性：统一格式、统一操作，避免手动误差。易于集成：可嵌入日常自动化流程，支持定时和触发执行。二、常用库及选型建议库作用优势局限pandas读取/清洗/分析Excel数据语法简
Kafka面试问题1 小小少年Boy
1请说明什么是ApacheKafka?Kafka是分布式发布-订阅消息系统。Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。它可以同时用于在线消息数据处理，和离线的数据文件处理。2、请说明什么是传统的消息传递方法?传统的消息传递方法包括两种：排队：在队列中，一组用户可以从服务器中读取消息，每条消息都发送给其中一个人。发布-订阅：在这个模型中，消息被广播
大喜之日企图逃婚的新郎扬帆1
南方的雪飘飘洒洒，落地无痕。正如我和秀那有始无终的爱，独倚在窗台，心如潮涌，透过朦胧的雪线仿佛又看见秀那张甜甜的笑脸……秀比我小二岁，和我是邻居。从我记事的那天起,我俩就是总是形影不离。我们一起上学、一起放牛、一起去村外的小河里捉鱼虾…….虽是吃着庄稼人的粗茶淡饭但秀却长得清丽可人，亮晶晶的眼睛笑起来象一弯新月。那甜甜的小酒窝深深的淹没了我的心坎。每当她小鸟依人地跟着瘦长的我欢快地跑东跑西时，一大
微信小程序-礼物商城：完整开发项目教程薛迟
本文还有配套的精品资源，点击获取简介：微信小程序是腾讯公司推出的移动应用开发平台，适用于无需安装即可使用的在线服务。本项目分享的“微信小程序-礼物商城”源码为开发者提供了电商功能的实际参考，包括商品展示、搜索、购物车、订单管理、支付和用户评价等。源码覆盖了WXML、WXSS、JavaScript基础技术，数据存储、网络请求、页面路由、组件化开发、样式设计、调试与发布、授权与登录以及性能优化等微信小
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

Transformer面试题总结101道

关于我

你可能感兴趣的:(职场感悟,程序人生,人生经验,面试,职场和发展,java)