uncle_ll

机器学习：Bert and its family

Bert

先用无监督的语料去训练通用模型，然后再针对小任务进行专项训练学习。

ELMo
Bert
ERNIE
Grover
Bert&PALS

Outline

Pre-train Model

首先介绍预训练模型，预训练模型的作用是将一些token表示成一个vector

比如：

Word2vec
Glove

但是对于英文，有太多的英文单词，这个时候应该对单个字符进行编码：

FastText

对于中文，可以对部首偏旁，或者把中文字当做图片送人网络中得到输出：

上述方法的问题不会考虑每个句子意思中相同字会有不同的意思，产生相同的token：

contextualized word embedding

类似于sequence2sequence模型的encoder一样。

同样的token，给出不一样的embedding，上述句子都有苹果两字。

Bigger Model
Smaller Model

重点关注ALBERT，将模型变小的技术：

网络架构设计：

让模型能读很长的内容，不仅是一篇文章，有可能是一本书。
Transformer-XL
Reformer
Longformer

self-attention的计算复杂度是 $O(n^2)$

How to fine-tune

如何进行预训练

输入：
一个句子还是两个句子，[sep]进行分割。
输出部分：
输出一个class，加入一个[cls]，产生跟整个句子有关的embedding

如果没有cls，就是把所有的embedding合起来送入模型，得到一个输出。

第二种就是给每个token一个class，相当于每个embedding一个class

Extraction-based QA

General Sequence
如何用在生成文本呢？

上述结构encoder得不到好的使用

将预训练模型当做encoder使用，每次产生一个word后，送入模型继续生成，直到产生eos结束符。

微调有两种方法：

第一种：预训练模型不动，对其产生的embedding 针对具体任务进行训练，只对上层模型微调；
第二种：预训练模型和具体任务模型联合到一起训练，消耗会大一些；
第二种方法会比对第一种方法获得的效果要更好一点，但是训练整个模型会遇到的一些问题：
训练完了之后预训练模型也发生了改变，相当于每个任务都会有一个不同的预训练模型，每个模型都比较大，这样非常的浪费。

针对上述问题，解决方法：

Adapter：只训练少量的参数结构APT

fine-tune的时候只会调APT结构的参数，但是是插入到transformer结构中，加深了网络：

Weighted Features
综合每一层的embedding，送到具体的任务中学习，权重参数可以学出来。

模型的loss，泛化能力。start-point到end-point，两点间距离越宽，凹的越浅说明泛化能力越一般；两点间距离越近，凹得越深说明泛化能力越好。

How to pre-train

如何进行预训练：

翻译任务

Context Vector（Cove）

把输入的句子A送入encoder，然后decoder得到句子B，需要大量的pair对data

Self-supervised Learning

self-supervised的input和output是自己产生出来的。

Predict Next Token

给定输入，预测下一个token

有了w1预测w2，用w1, w2预测w3，然后用w1,w2,w3预测w4，但是不能用右边的数据用来预测左边的数据：

基础架构网络使用的是LSTM：

LM
ELMo
ULMFiT

后续一些算法将LSTM换成Self-attention

GPT
Megatron
Turing NLG

注意：控制Attention的范围

可以用来生成文章： talktotransformer.com

如果只考虑左边的出现关系，为什么不考虑右边文本呢？

Predict Next Token-Bidrectional

左右两边产生的context，二者联合起来作为最终表示：

但是问题是左边只能看到左边的，无法看到右边的结束，右边只能看到右边的，无法看到左边的开始。

Masking input

随机的盖住某个词，是看到了完整的句子才来预测这个词是什么。
这种思想往前推，跟以前的cbow非常像：

Bert与cbow的区别就是左右两边的长度可以无限，而不是有个window窗口长度。

随机mask是否够好呢？有几种mask方法：

wwm
ERNIE
SpanBert
SBO

盖住一整个句子或者盖住好几个词。或者先把Entity找出来，然后把这些词盖住：

盖住的长度按照上述图的出现概率。

盖住的左右两边的embedding来预测，以及输入的index来恢复中间的哪个词。
SBO的设计期待左右两边的token embedding能够包含左右两边的embeeding信息。

XLNet

结构不是使用的Transformer，而是使用Transformer-XL

随机把顺序打乱，用各式各样不同的信息训练一个token。

Bert的训练语料比较规整：

Bert不擅长做Generative任务，因为bert训练的时候给的是整个句子，而generative只是给一部分，然后由左得右预测下一个token

MASS/BART

要对w1,w2, w3,w4进行一些破坏，不然model学不到任何东西，破坏的方法：

mask（随机mask）
delete（直接删掉）
permutation（打乱)
rotation（改变起始位置）
Text Infilling （插入一个别的误导，少掉一个mask)

结果是：

UniLM

UniLM进行多项训练

Replace or Not

ELECTRA，避开了需要训练和生成的东西，判断哪个位置是否被置换，训练非常简单，另外每个输出都被用到。
*
置换的词不好弄，如果是随便置换肯定很容易知道。所以有了下面的结果，用一个小的bert预测的结果作为替换的结果，小的bert效果不要太好，不然预测的结果跟真实的一样，得不到替换的效果，因为替换的结果是一模一样的。

只需要四分之一的计算量，就能达到XLNet的效果。

Sentence Level

需要整个句子的embedding。

使用skip thought，如果两个句子的预测结果比较像，那么两个输入句子也比较像。
quick thought，如果两个句子的输出是相连的，让相似的句子距离越近越好。
上述方法避开做生成的任务。

原始的Bert其实还有一项任务NSP，预测两个句子是否是相接的还是不相接的。两个句子中间用sep符号分割。

nsp：效果表现不好
Roberta：效果一般
sop: 正向是相接，反向是不相接，被用在ALBERT
structBert：Alice，

T5 Comparison

5个T就叫T5
4个C就叫C4

ERNIE

希望在train的时候加入knowledge

Audio Bert

Multi-lingual BERT

多语言BERT

使用多种语言训练一个Bert模型

104种语言进行训练，可以做到Zero-shot的阅读理解。

在英文语料上进行训练，但在中文的QA任务上，效果还不错

中文翻译成英文，然后进行英文训练，发现结果并没有直接用中文训练的模型。

NER
Pire：词性标注

NER任务和词性标注任务都符合上述规律，用一种语言进行训练，然后在另外一种语音上进行任务处理。

是不是可以用来处理甲骨文？

Cross-lingual Alignment

中文的兔子embedding与英文的兔子embedding是比较接近的，模型可能去掉了语音的特性，而只考虑意思。

year排在第一名，month排在第三名，对应的分数是rank的倒数

资料量要非常大才能有比较好的结果，从BERT200k和BERT1000k中结果可以看到。
对传统的算法GloVe和Word2Vec也进行同样的实验，发现Bert效果还是要优于之前的算法。

How alinment happens

用fake-english代替真的english，然后去训练，跨语言的能力不需要中介语音的存在。

bert是知道语言的信息的，但是不是很在意语言类型。

每串文字代表一种语言，语言还是有一些差距的。

黄色是英文编码，蓝色是中文编码，二者融合起来，通过α进行控制：

在英文上进行fine-tune，然后在中文上进行测试，让embedding更像中文，在测试阶段，加上蓝色向量会提升效果。

你可能感兴趣的:(机器学习,bert,预训练模型)

基于粒子群算法的电力系统无功优化研究(IEEE14节点)（Matlab代码实现）科研_G.E.M. 算法 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、引言二、粒子群算法简介三、无功优化数学模型四、IEEE14节点系统简介五、基于粒子群算法的无功优化实现六、仿真结果与分析七、结论与展望2运行结果3参考文献4Matlab代码实现⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏
深度神经网络（DNN）详解古龙飞扬 dnn 人工智能神经网络
深度神经网络（DNN，DeepNeuralNetwork）是人工智能领域中的一种重要模型，它通过模拟人脑神经网络的结构和工作原理，实现了对复杂数据的处理和决策。以下是对深度神经网络（DNN）的超详细解析：一、DNN的基本概念DNN是一种具有多个隐藏层的神经网络模型，其核心在于其深度，即包含多个隐藏层。这些隐藏层通过非线性变换，使得模型能够捕捉到数据中的复杂关系和模式。DNN通常由输入层、隐藏层和输
Azure AI-102 认证全攻略: (三十四)基本提示工程与 API 指南海棠AI实验室 AI-102 认证考试全攻略深度学习 azure microsoft AI-102
基本提示工程与API指南（修订版）本指南将详细介绍如何在AzureAIStudio中配置和使用AzureOpenAI服务，从创建和管理AIHub，到部署GPT-3.5Turbo及其他大语言模型（LLM），再到通过PromptEngineering优化交互体验。此外，我们将探讨API调用的最佳实践、安全合规要点，以及如何进行成本管理与常见问题排查。通过这些步骤，您可以在实际业务场景中快速上手并发挥模
基于架构的软件开发方法 light900 架构
（1）基于体系结构的设计方法(absd）：是由体系结构驱动的，即指由构成体系结构的商业、质量和功能需求的组合驱动的。absd方法有3个基础：第1基础是功能的分解，第2基础是通过选择体系结构风格来实现质量和商业需求。第3基础是软件模板的使用。ABSD模型把整个软件过程划分为：架构需求、设计、文档化、复审、实现、演化架构需求：需求是指用户对目标软件系统在功能、行为、性能、设计约束等方面的期望。架构需求
探索GigaChat与LangChain的完美结合：深度解析与实战指南 asdfujhgy langchain easyui 前端 python
探索GigaChat与LangChain的完美结合：深度解析与实战指南引言在人工智能的领域中，语言模型和嵌入技术正逐步改变我们与数据交互的方式。GigaChat作为一种创新的AI嵌入服务，结合LangChain可以提供强大的文本嵌入功能，促进自然语言处理任务的完成。本篇文章将带你深入了解如何结合GigaChat与LangChain进行文本嵌入，并提供实用的代码示例与解决方案。主要内容GigaCha
人工智能学习框架：深入解析与实战指南一ge科研小菜鸡人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着人工智能（AI）技术的飞速发展，深度学习、强化学习和自然语言处理等领域的应用愈加广泛。掌握人工智能学习框架（如TensorFlow、PyTorch、Keras等）已成为开发智能系统、研究前沿技术的必备技能。本指南将全面介绍人工智能主流学习框架的特点、安装方法、核心功能，以及通过实践案例展示如何使用这些框架进行AI模型开发、训练与优化。1.
【大模型】Hugging Face下载大模型的相关文件说明神马都会亿点点的毛毛张深度学习 #大模型深度学习 chatgpt gpt
大家好！我是毛毛张!个人首页：神马都会亿点点的毛毛张随着大模型的火热，许多人开始纷纷入坑️大模型，不过目前很多人都只是基于开源的大模型做微调，今天毛毛张要分享的是关于HuggingFace下载大模型微调文件的说明，有助于大家下载的微调文件的作用文章目录1.前言2.文件说明1.前言上图是毛毛张在HuggingFace的官网上的ChatGLM-6B大模型的所有文件，对于初学者来说，对于上面的文件是
【前沿聚焦】机器学习的未来版图：从自动化到隐私保护的技术突破网罗开发人工智能 AI 大模型机器学习人工智能
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
json格式的标记文件转yolo格式（txt）的标记文件帅气的亮 json YOLO python
背景我在使用anylabeling标记软件时发现导出的标记文件格式只能是json格式，而我yolov8训练模型的标记文件需要时txt格式的，所以我需要写一个转换脚本脚本1.脚本1这个脚本是针对于矩形框标记的转换，也就是目标检测importjsonimportosdefconvert_json_to_yolo(json_file_path,output_dir,class_mapping):"""将
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，深度学习作为其主要驱动力之一，已经在各个领域取得了显著的成果。然而，随着模型规模的不断扩大，如何高效地搭建、训练和部署深度学习模型，成为一个亟待解决的问题。传统的单机训练方式在计算资源有限的情况
GPT4All:免费使用本地运行无需GPU的基于C++的GPT模型和UI: A free-to-use, locally running, privacy-aware chatbot. No GPU AI天才研究院 ChatGPT 大数据AI人工智能 LLM大模型落地实战指南 gpt 人工智能语言模型自然语言处理编程实践开发语言 c++
目录GPT4All:https://github.co:m/nomic-ai/gpt4allGPT4AllChatUIGPT4All聊天用户界面效果测试问题：HowtowriteamultipleThreadcodeInJava?输出：GPT4All如何运作RunningLLMsonCPU在CPU上运行LLMSideloadinganyggMLmodel加载任何ggML模型GPT4ALL:目前已经
接口技术-第1次作业厂里英才作业接口技术
目录1、接口技术的基本任务是什么？2、接口芯片的编程模型方法是什么？采用编程模型方法对分析与应用微机系统的硬件资源有什么意义？3、什么是接口？阐述接口的功能。4、什么是多总线技术？多总线层次化总线结构主要有哪几个层次？5、如何实现在PCI总线系统中查找一个PCI设备？1、接口技术的基本任务是什么？微机接口的基本任务有两个：一是实现I/O设备与总线的连接；二是连接起来以后，CPU通过接口对I/O设备
机器学习&深度学习目录 UQI-LIUWJ 各专栏目录深度学习人工智能 1024程序员节
机器学习模型机器学习笔记：Transformer_刘文巾的博客-CSDN博客attention相关机器学习笔记：attention_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ELMOBERT_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ViT（论文AnImageIsWorth16X16Words:TransformersforImageRecognitionatScale）_UQ
【AI论文】FilmAgent: 一个用于虚拟3D空间中端到端电影制作自动化的多智能体框架东临碣石82 自动化运维
摘要：虚拟电影制作涉及复杂的决策过程，包括剧本编写、虚拟摄影以及演员的精确定位和动作设计。受近期基于语言智能体社会的自动化决策领域进展的启发，本文提出了FilmAgent，这是一个新颖的、基于大型语言模型（LLM）的多智能体协作框架，旨在实现我们构建的3D虚拟空间中的端到端电影制作自动化。FilmAgent模拟了各种剧组成员角色，包括导演、编剧、演员和摄影师，并涵盖了电影制作工作流程的关键阶段：（
一篇带你搞懂为什么Vue3比Vue2效率更高！一朵好运莲前端 javascript vue.js html5 css 前端框架
众所周知，vue3比vue2效率有很大的提升，渲染效率提升了1.3~2倍，SSR效率提升了2~3倍。那么vue3是如何提升效率的呢？目录一、静态提升二、预字符串化三、缓存事件处理函数四、BlockTree五、PatchFlag一、静态提升Vue3中的静态提升（StaticTreeHoisting）是一种编译阶段的优化技术，它能够提高组件的渲染性能。具体来说，静态提升通过以下方式工作：1、提升静态节
最小二乘法-线性回归和梯度下降法梦回楼~ 最小二乘法算法机器学习人工智能
最小二乘法一、最小二乘法概念以及应用最小二乘法（LeastSquaresMethod,LSE）是一种数学优化技术，主要用于寻找最佳拟合给定数据点的函数。它通过最小化观测值与模型预测值之间的差的平方和来估计模型参数。换成听得懂的话说就是，我们有一组数据(x1,y1),(x2,y2)…(xn,yn)，我们也知道他的数学表达式的形式例如y=kx+b(但是不知道k、b的具体值)，但是(xn,yn)
容器化检索增强框架（R2R） deepdata_cn RAG RAG
R2RbySciPhi-AI是一个专门的RAG框架，专注于通过迭代细化来改进检索过程。主要特点包括实现新颖的检索算法，支持多步检索过程，与各种嵌入模型和向量存储集成，以及用于分析和可视化检索性能的工具。适合有兴趣突破检索技术界限的开发人员和研究人员，特别是在需要创新检索方法的场景。具有RESTfulAPI的容器化检索增强一代（RAG）。具有生产就绪型功能，包括多模式内容摄取、混合搜索功能、可配置的
高效向量搜索RAG解决方案（Canopy） deepdata_cn RAG RAG
Canopy利用Pinecone在高效向量搜索方面的专业知识，提供强大且可扩展的RAG（Retrieval-AugmentedGeneration）解决方案。包括与Pinecone向量数据库的紧密集成，支持流处理和实时更新，先进的查询处理和重新排序功能，以及管理知识库和版本控制的工具。一、基本原理1.向量嵌入：Canopy首先会将文本数据转换为向量表示，通常使用预训练的语言模型等技术，将文本映射到
遥感深度学习过程中图像分割的尺寸对模型训练结果的影响司南锤深度学习遥感深度学习人工智能
1.计算资源与显存占用大尺寸图像：需要更高的显存和计算资源，可能限制训练时的批大小（batchsize），甚至导致无法训练。解决方案：通常将大图裁剪为小尺寸的补丁（patches），例如256x256或512x512。小尺寸图像：显存占用低，但可能丢失全局上下文信息（如大面积地物分布），影响模型对复杂场景的理解。2.模型感受野与上下文信息小尺寸输入：模型感受野受限，可能无法捕捉大范围地物（如河流、
使用小尺寸的图像进行逐像素语义分割训练，出现样本不均衡训练效果问题司南锤深度学习遥感计算机视觉人工智能机器学习
在使用小尺寸图像进行逐像素语义分割训练时，确实可能出现样本不均衡问题，且这种问题可能比大尺寸图像更显著。1.小尺寸图像如何加剧样本不均衡？(1)局部裁剪导致类别分布偏差问题：遥感图像中某些类别（如道路、建筑）可能稀疏分布。小尺寸裁剪后，部分训练样本可能完全不含某些类别（例如一块纯农田的补丁），导致模型对这些类别缺乏学习机会。示例：原图中“道路”占比5%，若裁剪为256x256的小图，部分小图中可能
06-机器学习-数据预处理不会打代码呜呜呜呜机器学习机器学习人工智能
数据清洗数据清洗是数据预处理的核心步骤，旨在修正或移除数据集中的错误、不完整、重复或不一致的部分，为后续分析和建模提供可靠基础。以下是数据清洗的详细流程、方法和实战示例：一、数据清洗的核心任务问题类型表现示例影响缺失值数值型字段为空（NaN）模型无法处理缺失值，导致训练中断或偏差异常值年龄=200岁，房价=-100万扭曲统计指标（如均值），降低模型泛化性重复数据两行记录完全相同导致模型过拟合，降低
从零推导线性回归：最小二乘法与梯度下降的数学原理 Echo-Nie 机器学习机器学习线性回归人工智能梯度下降数学推导
欢迎来到我的主页：【Echo-Nie】本篇文章收录于专栏【机器学习】本文所有内容相关代码都可在以下仓库中找到：Github-MachineLearning1线性回归1.1什么是线性回归线性回归是一种用来预测和分析数据之间关系的工具。它的核心思想是找到一条直线（或者一个平面），让这条直线尽可能地“拟合”已有的数据点，通过这条直线，我们可以预测新的数据。eg：假设你想预测房价，你知道房子的大小（面积）
在计算机上本地运行 Deepseek R1 itmanll linux
DownloadOllamaonLinuxDownloadOllamaonWindowsDownloadOllamaonmacOSDeepseekR1是一个强大的人工智能模型，在科技界掀起了波澜。它是一个开源语言模型，可以与GPT-4等大玩家展开竞争。但更重要的是，与其他一些模型不同，您可以在自己的计算机上本地运行DeepseekR1。linux步骤第1步：下载Ollama并安装curl-fsSL
超实用的 30 段 Python 案例（上） Python之栈 python 开发语言
Python是目前最流行的语言之一，它在数据科学、机器学习、web开发、脚本编写、自动化方面被许多人广泛使用。它的简单和易用性造就了它如此流行的原因。如果你正在阅读本文，那么你或多或少已经使用过Python或者对Python感兴趣。在本文中，我们将会介绍30个简短的代码片段，你可以在30秒或更短的时间里理解和学习这些代码片段。1.检查重复元素下面的方法可以检查给定列表中是否有重复的元素。它使用了s
cv python_python里面cv是什么意思 weixin_40004659 cv python
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
【深入浅出 Yarn 架构与实现】1-1 设计理念与基本架构大数据王小皮深入浅出Yarn架构与实现架构 hadoop 大数据 yarn java
一、Yarn产生的背景Hadoop2之前是由HDFS和MR组成的，HDFS负责存储，MR负责计算。一）MRv1的问题耦合度高：MR中的jobTracker同时负责资源管理和作业控制两个功能，互相制约。可靠性差：管理节点是单机的，有单点故障的问题。资源利用率低：基于slot的资源分配模型。机器会将资源划分成若干相同大小的slot，并划定哪些是mapslot、哪些是reduceslot。无法支持多种计
#深度学习：从基础到实践 single_ffish 深度学习 gpt 神经网络生成对抗网络 1024程序员节
深度学习是人工智能领域近年来最为火热的技术之一。它通过构建由多个隐藏层组成的神经网络模型，能够从海量数据中自动学习特征和表征,在图像识别、自然语言处理、语音识别等领域取得了突破性进展。本文将全面介绍深度学习的基础知识、主要算法和实践应用,帮助您快速掌握这一前沿技术。1.深度学习的基础1.1人工神经网络深度学习是基于人工神经网络(ArtificialNeuralNetwork,ANN)的一种机器学习
深入解析TCP/IP协议：网络通信的基石一休哥助手网络 tcp/ip 网络协议网络
1.引言TCP/IP协议是现代计算机网络的核心，它为互联网上的设备提供了通信的基础。在网络通信中，TCP/IP协议栈是无处不在的，无论是个人设备的浏览器请求，还是大型分布式系统的内部通信，都依赖于它的稳定、高效与可靠。本文将详细介绍TCP/IP协议的历史、分层模型、核心协议（TCP、IP等），并深入探讨其在网络通信中的重要角色。2.TCP/IP协议简介2.1TCP/IP的历史背景TCP/IP协议由
访问DOM元素（节点） froginwe11 开发语言
DOM（文档对象模型）是Web开发中用于处理HTML和XML文档的标准接口，它允许开发者通过脚本语言（如JavaScript）动态地访问和修改文档的结构、内容和样式。在DOM中，文档的每个部分都被视为一个节点，包括元素、文本、属性等。访问DOM元素（节点）DOM提供了一系列方法来访问和操作元素（节点）：getElementById()：通过元素的ID获取元素节点。例如，document.getEl
高可用架构，高性能架构和高并发架构架构随笔录超级架构师架构 kafka 分布式 hbase 大数据 hdfs
胡弦，视频号2023年度优秀创作者，互联网大厂P8技术专家，SpringCloudAlibaba微服务架构实战派(上下册)和RocketMQ消息中间件实战派(上下册)的作者，资深架构师，技术负责人，极客时间训练营讲师，四维口袋KVP最具价值技术专家，技术领域专家团成员，2021电子工业出版社年度优秀作者，获得2023电子工业出版技术成长领路人称号，荣获2024年电子工业出版社博文视点20周年荣誉专
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他