rebirth_2020

ELMO,GPT,BERT初步学习

https://lilianweng.github.io/lil-log/2019/01/31/generalized-language-models.html
在2018年，诸如GPU, BERT等大体积的语言模型在各种任务上达到了比较好的效果。而我们在训练语言模型的过程中，也不同于图像的预训练模型，NLP任务的预训练不需要带标签的数据。
最刚开始的语言模型(word2vec, doc)训练思路是基于词共现的，而不会更具特定的上下文做改变。这种方式的embedding在一定程度上会有效，但是其提升程度是有限的。
这里我们会提到多种对文本构建词向量的方法，这些词向量怎么更加容易和高效低用于下游NLP任务。

CoVe

CoVe(Contentual Word Vecotrs)， attention的seq2seq的机器翻译模型中得到的词向量。【这里的CoVe得到的是整个句子的向量】

NMT recap

NMT(Neural Machine Translation) 的encoder部分由两层标准的biLSTM组成，decoder是一个带有attiontion机制的LSTM。
以英-法翻译为例，在encoder端进行英语单词embedding的训练。
encoder的输出，会带有单词上下文的信息，好处是对很多下游NLP任务有好处。
使用glvoe和CoVe共同做文本分类任务，其中glove提供了词之间的共现关系，CoVe提供了句子的上下文信息。
CoVe的缺陷:

在有监督的翻译任务上做预训练，受制于语料。
CoVe对最终任务性能的提升受限于具体的任务。
接下来会说到的 ELMo模型克服了如下问题: 通过无监督的预训练(GPT\BERT)，可以用于各种下游任务。

ELMo

ELMo(Embedding from language Model)，通过无监督的方式，使用预训练语言模型来做包含上下文信息的单词表征。

bidirectional language model

使用双向LSTM提取特征，两个LSTM共享embedding层和softmax层。
模型的目标是最小化negative log likelihood。

ELMo representations

在biLM的顶层，ELMo通过具体的任务学习，把各层的隐层堆叠起来，隐藏层的内容包括: embedding layer output和weight。
为了评估不同的隐藏层捕获的不同信息，ELMo使用不同层的表征来表示语义特征和语法特征。

semantic task: 单词语义消歧。BILM的顶层隐藏层要优于第一层。
syntax task: part-of-speech(POS)任务中，使用第一层要优于BiLM的顶层神经元。
研究表明，语法信息在低层次的隐藏层中得到了比较好的表达，而语义信息是在高层的隐藏层中得到了较好的表达。【怎么指定使用哪一层的神经元呢】

Use ELMo in Downstream Tsasks

这里的语言模型是无监督的，理论上可以继续加大。然而这个训练依然是和任务无关的，所以还需要在具体的任务上，再做一些工作以提高性能。

Cross-View Training

Model Architecture

https://zhuanlan.zhihu.com/p/55182085

OpenAI GPT

GPT(generative pre-trainging transformer) ，雨ELMO比较相似。使用了更多的语料，体积上也更大。和ELMo主要体现在两个方面的不同：

模型结构不同。ELMo是浅层的模型，将从左到右和从右到左的多层LSTM级联起来；而GPT在decoder部分是一个多层的transformer。
在辖有任务红，使用embedding的方式是不同的，ELMo在特殊任务重把embeedding当作外部特征直接喂入，而GPT需要对特殊任务做微调。

transformer decoder as language model

与原生的transformer下关闭，这里的模型丢弃了encoder部分，因此输入为一个单一的句子。
输入句子，模型包含了多个transformer block，每个block又包含了一个multi-head self-attention以及pointwise feed-forward层。最终输出为经过softmax归一化的分布式表达。
在损失函数上，GPT和ELMo一样，都是negative log-likelihood。

BPE

Byte Pair Encoding(BPE)用来对输入序列进行编码。BPE最初是是使用在压缩算法重，后来被应用于解决机器翻译重的OOV问题，我们可以解决极少出现的单词问题，并翻译为一种新的语言。为了把很少出现或UNK的单词分解为多个subwords，BPE通过迭代和贪婪的方法将单个token进行有分割的拼接。

superviesed fine-tuning

GTP与任务无关，只可以使用预训练的方式直接进行训练。
以分类任务为例，在带标签的数据集重，输入为x=(x1,x2…,xn)，输出为y。GPT先将x通过与训练的transformer decoder，然后最后一层的输出就是隐藏层表示，需要更新的权重是Wy，这些权重可以对特殊任务有更好的适应性。
loss为最小化negative log-likelihood，另外添加LM loss会有更好的效果。

可以加快训练阶段的拟合速度
可以提升有监督模型的生成效果。
可以应用的场景包括: 分类、蕴含关系、句子相似度、多项选择等。
在大部分的任务上可以达到一个比较好的效果。首先GPT在训练阶段可以接受尽可能多的数据，第二部微调阶段，只需要提供较少的数据，以及少量的参数更新。
但是GPT有一个限制，就是单向的模型，只能够预测从左到右。

BERT

BERT(Bidirectional Encoder Representations from Transformers)同样更可以在无标注的样本上进行预训练，然后在特殊任务上进行微调，不需要做额外的网络搭建。
与GPT相比，BERT最大的不同在于其训练方式是双向的。模型可以学习到单词的上下文信息。
BERT的结构是一个而多层的双向transformer encoder。

pre-training tasks

BERT模型的训练包含了两个任务，Mask language model 和 Next sentence prediction

Mask language model

训练阶段每个单词有15%的概率，使用[MASK]替换。而在微调的时候，是没有[MASK]的，所以又加了一些trick，使用80%的概率，在挑选重的15%的单词里，继续下替换MASK，有10%的概率随机替换一个词，10%的概率使用原来的词。
模型只预测missing的单词，【看不懂这里…】

Next sentence prediction

考虑到在下游环境中，会涉及到句子间的关系信息，bert添加了一个文本二分类的任务，来判断语料中下一个句子作为当前句子的下一句是不是合适。

句子对均匀分布，50%的是，50%的不是
模型输出判断句子B是不是A的下一句。
这两个人的特性，促使了我们的训练数据可以无限多。训练loss是LM likelihood lose与mean next sentence prediction likelihood的和。

input Embedding

输入embedding主要包含三个组成:

wordpiece tokenization embedding, 就是subword的embedding，可以解决rare word和oov的问题。
segment embedding，当有两个句子A,B的时候，会有分割符[SEP]的问题存在，这里使用E(A)E(B)来区分句子的界限。
position embedding，
embedding的第一个位置是[CLS]，将来在下游任务可以使用。

use bert in Downstream Tasks

bert的微调阶段，也仅仅需要少量的参数加入。
对于分类任务，我们使用最后隐藏层的特殊字符[CLS]，将其输入dense层，然后做softmax。
对于QA问题入SQuAD，我们需要预测一个段落是不是一个问题的答案。bert对两个touken给出概率分布【这里不是很清晰】

有三处需要再细看。

你可能感兴趣的:(NLP,自然语言处理)

LangChain开发【NL2SQL】应用（few-shot优化）向羿燃 LangChain开发及生态 langchain ai 人工智能数据分析
前言之前发布的博客LangGraph开发Agent智能体应用【NL2SQL】-CSDN博客，留了一个问题，对于相对复杂的sql（leetcode中等难度的sql题），gpt4o就力不从心了。这篇文章来讲一下优化什么是few-shot使用这些少量的、调整后的样本对预训练模型进行微调其实就是给LLM少量示例关于few-shot的研究：https://medium.com/ubiai-nlp/step-
大模型prompt实例：知识库信息质量校验模块写代码的中青年大模型 prompt 人工智能 python 大模型 LLM
大模型相关目录大模型，包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容从0起步，扬帆起航。大模型应用向开发路径：AI代理工作流大模型应用开发实用开源项目汇总大模型问答项目问答性能评估方法大模型数据侧总结大模型token等基本概念及参数和内存的关系大模型应用开发-华为大模型生态规划从零开始的LLaMA-Factory的指令增
数字人技术在短视频中的应用 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
数字人、短视频、人工智能、计算机视觉、自然语言处理、虚拟主播、内容创作1.背景介绍短视频作为一种新兴的传播媒介，其内容形式丰富、传播速度快、用户粘性强，已成为当今互联网领域最热门的应用之一。随着技术的不断发展，数字人技术逐渐成熟，并开始在短视频领域得到广泛应用。数字人是指利用计算机技术模拟真实人类形象和行为的虚拟角色，其具备逼真的外形、流畅的肢体动作和自然的语言表达能力。数字人技术在短视频领域的应
deep seek m0_69576880 前端 ai
1.介绍:DeepSeek是一款由国内人工智能公司研发的大型语言模型，拥有强大的自然语言处理能力，能够理解并回答问题，还能辅助写代码、整理资料和解决复杂的数学问题。免费开源，媲美ChatGPT最近最火爆的AI对话程序。www.deepseek.com这是deepseek官网2.这是deepseek注册页面3.国产语言对话ai，大家有兴趣的可以去试试。不过chatgpt也进行了改变，大家也可以免费使
RWKV Runner：让RNN-LLM模型触手可及步子哥 rnn 人工智能深度学习
在这个信息爆炸的时代，人工智能（AI）已经成为我们生活中不可或缺的一部分，尤其是大语言模型（LLM）在自然语言处理中的广泛应用。然而，尽管这些技术的潜力巨大，许多用户仍然面临着使用门槛高、配置复杂等问题。为了解决这一困境，RWKVRunner应运而生。它不仅提供了一个简便的接口，还让用户能够轻松地使用大语言模型。本文将深入探讨RWKVRunner的功能、安装步骤以及如何利用它来实现各种应用。RWK
AI大模型（如GPT、BERT等）可以通过自然语言处理（NLP）和机器学习技术，显著提升测试效率小赖同学啊 python 人工智能自动化测试(app pc API)人工智能自然语言处理 gpt
在软件测试中，AI大模型（如GPT、BERT等）可以通过自然语言处理（NLP）和机器学习技术，显著提升测试效率。以下是几个具体的应用场景及对应的代码实现示例：1.自动生成测试用例AI大模型可以根据需求文档或用户故事自动生成测试用例。代码示例（使用OpenAIGPTAPI）：importopenai#设置OpenAIAPI密钥openai.api_key="your-openai-api-key"#
清影2.0（AI视频生成）技术浅析（二）：自然语言处理爱研究的小牛 AIGC—视频 AIGC—自然语言处理自然语言处理人工智能音视频 AIGC 深度学习机器学习
清影2.0（AI视频生成）中的自然语言处理（NLP）技术是其核心组件之一，负责将用户输入的自然语言文本转化为机器可以理解的语义表示，从而指导后续的视频生成过程。一、基本原理1.目标清影2.0的NLP技术旨在将用户输入的自然语言文本转化为机器可以理解的语义表示，从而指导后续的视频生成。具体目标包括：1.深度语义理解：理解文本的语义、情感、意图等深层次信息。2.上下文关联：捕捉文本中词语之间、句子之间
Python深度学习代做目标检测NLP计算机视觉强化学习 matlabgoodboy 计算机视觉 python 深度学习
了解您的需求，您似乎在寻找关于Python深度学习领域的代做服务，特别是在目标检测、自然语言处理（NLP）、计算机视觉以及强化学习方面。以下是一些关于这些领域的概述以及寻找相关服务的建议。1.Python深度学习代做概述目标检测：目标检测是计算机视觉中的一个重要任务，旨在识别图像或视频中的特定对象，并确定它们的位置。Python中的深度学习框架（如TensorFlow、PyTorch）和计算机视觉
使用OpenAI API进行文本分类标注 dgay_hua 人工智能 python
技术背景介绍文本分类标注（Tagging）是一种非常有用的技术，可以对文档进行分类，例如情感分析、语言检测、风格判断、主题识别等。这项技术在自然语言处理（NLP）领域中有广泛的应用，例如社交媒体监控、客户反馈分析和自动化客服系统等。在本文中，我们将使用OpenAI的API，通过LangChain工具来进行文本分类标注。我们将展示如何定义分类函数和模式(schema)，并通过实际代码演示实现文本分类
赋能 DeepSeek：打造图文互生能力，助力测试工程师提效 Python测试之道人工智能 python
前言作为测试工程师，我们日常工作中经常需要处理图文相关的任务，例如：基于测试需求生成示意图：通过简单的文字描述生成流程图、架构图等，提高测试设计效率。从图中提取关键信息生成文档：从截图或流程图中提取重要信息，自动生成测试用例或需求分析。然而，DeepSeek-r1:1.5b本地模型虽然在自然语言处理方面表现出色，但并不具备直接的图像生成或图像解析能力。如果能为DeepSeek增加“图生文”或“文生
利用Infinity Embeddings创建文本嵌入 qahaj python
技术背景介绍在自然语言处理(NLP)任务中，文本嵌入是一种将文本数据转换成固定维度向量的技术。这些向量能够捕捉文本之间的语义关系，使得在后续的任务（如文本分类、相似度计算等）中非常实用。Infinity嵌入模型是一种能够方便创建高质量文本嵌入的现代工具。核心原理解析InfinityEmbeddings利用强大的预训练模型，通过对输入的文本数据进行编码，生成具有语义意义的高维向量。这个过程不仅仅是简
在DeepSeek面前，还需要学习.NET吗？ dotNET跨平台学习
随着人工智能技术的快速发展，像DeepSeek这样的大模型不断涌现，给技术领域带来了新的变革和挑战。与此同时，.NET作为微软推出的成熟技术平台，也有着自己独特的地位和价值。那么在DeepSeek面前，是否还需要学习.NET呢？答案是肯定的，原因主要有以下几点：应用场景不同-DeepSeek：主要聚焦于自然语言处理、智能对话等人工智能领域，为用户提供智能问答、文本生成等服务。例如，用户可以通过De
大语言模型原理基础与前沿通过稀疏MoE扩展视觉语言模型 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿通过稀疏MoE扩展视觉语言模型1.背景介绍在人工智能领域，语言模型和视觉模型的结合已经成为一个重要的研究方向。大语言模型（LargeLanguageModels,LLMs）如GPT-3、BERT等，已经在自然语言处理（NLP）任务中取得了显著的成果。而视觉语言模型（Vision-LanguageModels,VLMs）则通过结合视觉和语言信息，进一步提升了模型在多模态任务中
26、深度学习-自学之路-NLP自然语言处理-理解加程序，怎么把现实的词翻译给机器识别。小宇爱深度学习-自学之路深度学习自然语言处理人工智能
一、怎么能让机器能够理解我们的语言呢，我们可以利用神经网络干很多的事情，那么我们是不是也可以用神经元做自然语言处理呢，现在很多的实际应用已经说明了这个问题，可以这么做。那我们考虑一下该怎么做，首先我们应该把我们现实中的每一个单词都用一个词向量来进行表示：importnumpyasnponehots={}onehots['cat']=np.array([1,0,0,0])onehots['the']
27、深度学习-自学之路-NLP自然语言处理-做一个简单的项目识别一组电影评论，来判断电影评论是积极的，还是消极的。小宇爱深度学习-自学之路深度学习自然语言处理人工智能
一、如果我们要做这个项目，第一步我们要做的就是需要有对应的训练数据集。这里提供两个数据集，一个是原始评论数据集《reviews.txt》，以及对应的评论是消极还是积极的数据集《labels.txt》，下面的程序就是找到这两个数据集，并把对应的数据集的内容分别赋值给reviews和labelsdefpretty_print_review_and_label(i):print(labels[i]+"\
探索Hugging Face平台：AI工具和集成指南 stjklkjhgffxw 人工智能 python
探索HuggingFace平台：AI工具和集成指南在人工智能和自然语言处理领域，HuggingFace无疑是一个备受瞩目的平台。无论是开发者还是研究者，大家都能从中找到适合的资源和工具。本篇文章旨在为大家深入介绍如何在HuggingFace平台上使用不同的功能模块，包括模型、API和工具集成。主要内容1.安装和集成要使用HuggingFace与Langchain的集成功能，我们首先需要安装lang
视觉中的transformer：ViT ch隔壁老张深度学习笔记 transformer 深度学习计算机视觉
《》摘要transformer已经是NLP的标准。但是在cv领域用的很少，视觉里一般是和cnn一起用或者把某些conv替换成transformer（整体还是CNN）本篇文章证明纯的transformer直接在图片分类上也做得很好：在大量数据集上进行预训练的前提上，迁移到小数据集（作者说ImageNet是小数据集-_-）上也很好。Intro启发现在NLP里的transformer都是在大量数据集上进
使用 OpenAI API 创建智能聊天机器人 vaidfl 机器人 python
1.技术背景介绍在人工智能应用中，聊天机器人是一种非常流行的应用。得益于近几年自然语言处理（NLP）技术的飞速发展，聊天机器人已经从简单的问答模式发展到能够进行复杂对话的智能助手。本篇文章将深入介绍如何使用OpenAI提供的API构建一个智能聊天机器人，并通过实际代码演示实现过程。2.核心原理解析OpenAI提供的GPT模型是目前最先进的语言生成模型之一，它可以生成自然流畅的文本。我们可以通过调用
使用OpenAI的API构建聊天机器人 dgay_hua 机器人 python
技术背景介绍聊天机器人是近年来热门的AI应用之一，无论是客服系统、智能助手还是社交娱乐，都可以看到其身影。构建一个高效的聊天机器人，离不开强大的自然语言处理模型。OpenAI提供的API为开发者简化了这一过程，本文将介绍如何使用OpenAI的API服务构建一个基本的聊天机器人。核心原理解析聊天机器人主要依赖于生成式预训练模型（GPT），它通过大量文本数据训练，学习语言模式和上下文关联，从而能够生成
Andrej Karpathy：计算范式的变革者 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《AndrejKarpathy：计算范式的变革者》概述本文旨在全面探讨AndrejKarpathy在计算范式变革中的角色和贡献。AndrejKarpathy是一位世界级的人工智能专家，程序员，软件架构师，CTO，同时也是计算机图灵奖获得者，计算机编程和人工智能领域大师。他以其深刻的技术见解，对深度学习和自然语言处理领域的贡献，以及对计算范式的革新性思考，成为了当今技术领域的引领者之一。本文分为六个
人工智能之自然语言处理技术演进香橙薄荷心 AI 人工智能自然语言处理
自然语言处理技术演进自然语言处理（NaturalLanguageProcessing，NLP）是人工智能的重要分支，旨在使计算机能够理解、生成和处理人类语言。近年来，NLP技术经历了从规则驱动到数据驱动的革命性演进，尤其是在深度学习和大规模预训练模型的推动下，取得了显著突破。本文将深入探讨NLP技术的演进历程、核心模型及其应用，并通过具体案例和代码示例帮助读者理解其实际应用。1.NLP技术演进历程
利用gensim生成词袋模型（基于频次和基于TF-IDF） weixin_50291342 文本表示自然语言处理 python 机器学习
前言参考文献：胡盼盼编著.自然语言处理从入门到实战[M].中国铁道出版社,2020.最近在学习文本表示的一种最简单方式——词袋模型，书中给出了使用gensim生成词袋模型的代码，原代码就来自于这本书，我加了一些注释，方便理解代码。一、引入库fromgensim.modelsimportTfidfModelfromgensim.corporaimportDictionaryimportjieba二、
RAG中的双编码器与跨编码器模型人工智能
RAG中的双编码器与跨编码器模型阅读时长：19分钟发布时间：2025-02-13近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】检索增强生成（RAG）是一个强大的框架，它结合了基于检索和基于生成的自然语言处理（NLP）任务方法。RAG不只是依赖生成模型，而是通过检索相关文档或段落来利用外
GPT 系列模型发展史：从 GPT 到 ChatGPT 的演进与技术细节 Ash Butterfield nlp gpt chatgpt
从GPT到ChatGPT，OpenAI用短短几年时间，彻底改变了自然语言处理（NLP）的格局。让我们一起回顾这段激动人心的技术演进史！GPT（2018）：划时代的起点：GPT（GenerativePre-trainedTransformer）首次将Transformer架构与无监督预训练结合，开启了大规模语言模型的新时代。核心突破：通过海量文本预训练+任务微调，GPT展示了强大的泛化能力。GPT-
自然语言处理（NLP）入门：基础概念与应用场景 Ash Butterfield nlp 自然语言处理人工智能
什么是自然语言处理（NLP）？自然语言处理（NaturalLanguageProcessing,NLP）是人工智能（AI）的一个重要分支，研究如何让计算机理解、生成、分析和与人类语言进行交互。换句话说，NLP是让机器像人一样“读、写、听、说”的技术，它结合了语言学、机器学习、计算机科学等多学科知识。NLP的核心目标是将非结构化的自然语言（如文本和语音）转化为结构化数据，使机器能够高效处理、分析和生
【Elasticsearch】分词器概述 risc123456 Elasticsearch elasticsearch
Elasticsearch分词与神经网络分词的区别Elasticsearch的分词过程产生的是优化用于搜索和检索的语言学分词。这与机器学习和自然语言处理中的神经分词不同。神经分词器将字符串转换为更小的子词分词，这些分词被编码为向量，供神经网络使用。Elasticsearch没有内置的神经分词器。分词器接收一个字符流，将其分解为单独的分词（通常是单个单词），并输出一个分词流。例如，`whitespa
deepseek和chatgpt对比 dev.null AI #NLP chatgpt
DeepSeek和ChatGPT都是自然语言处理领域的工具，但它们的设计目标和功能有所不同。功能定位：ChatGPT是一个基于OpenAIGPT-3或GPT-4的聊天机器人，旨在进行人机对话、文本生成、问题解答等，广泛应用于教育、客服、创意写作等领域。它的核心功能是生成自然、流畅的对话内容，并能够处理各种复杂的语言任务。DeepSeek（假设你是指某种搜索引擎工具或者特定的语义分析工具）通常聚焦于
获取 OpenAI API Key GPT-4o Mini 模型并开发调用部署ChatGPT聊天 chatgptopenai
获取OpenAIAPIKey并开发调用GPT-4oMini模型OpenAI提供的API可以让开发者轻松调用其强大的自然语言处理模型。以下是获取OpenAIAPIKey并调用GPT-4oMini模型的详细步骤。一、注册OpenAI账户访问官网：打开[OpenAI官方网站]。创建账户：点击页面右上角的“SignUp”按钮，输入你的电子邮件地址和密码。验证邮箱：根据收到的邮件提示，完成邮箱验证。填写信息
从零开始大模型开发与微调：Miniconda的下载与安装 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：Miniconda的下载与安装1.背景介绍随着人工智能和机器学习技术的快速发展,大型语言模型(LargeLanguageModel,LLM)已经成为当前研究和应用的热点。这些模型通过在海量文本数据上进行预训练,能够捕捉到丰富的语义和上下文信息,从而在自然语言处理任务中表现出色。然而,训练这些庞大的模型需要大量的计算资源,对于普通开发者来说,从头开始训练一个大模型是一个巨大
DeepSeek 实现原理探析 rockmelodies 人工智能 ai deepseek 深度学习
DeepSeek实现原理探析引言DeepSeek是一种基于深度学习的智能搜索技术，它通过结合自然语言处理（NLP）、信息检索（IR）和机器学习（ML）等多领域的技术，旨在提供更加精准、智能的搜索结果。本文将深入探讨DeepSeek的实现原理，分析其核心技术及其在实际应用中的表现。一、DeepSeek的核心技术自然语言处理（NLP）词嵌入（WordEmbedding）：DeepSeek使用如Word
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他