fan_fan_feng

datawhale 大模型学习第五章-模型训练

一、目标函数

今天要讨论的是以下三种模型结构：
Decoder-only模型：例如，GPT-3，单向上下文嵌入，在生成文本时一次生成一个token
Encoder-only模型:例如，BERT,利用双向上下文注意力生成embeding
Encoder-decoder模型：例如，T5,利用双向上下文编码，利用单向上下文生成文本

最终结果就是将token序列映射为一个Embedding向量

$\sigma :V^{L}\rightarrow R^{d*L}$

其中：
L :代表文本长度
d:代表embeding向量的维度

1.1 Decoder-only 模型

自回归语言模型预测是一个条件分布：即根据1，2,。。。i-1个词语，去预测第1个词语是什么

公式为： $P(X_{i}:X_{1:i-1})$ =

那格局最大似然原理（通俗点讲就是，找到一个参数，是的概率最大），定义以下负对数似然目标函数：
$O(\theta ) =\sum_{x\in D}-logP(x)= \sum_{x\in D}^{}\sum_{i\in L}^{L}-logP(X_{i}:X_{1:i-1})$

1.2 Encoder-only模型

Decoder-only模型，它会产生（单向）上下文嵌入，更适合文本生成任务

Encoder-only模型，他是双向上下文嵌入，更适合分类任务

1.2.1 Bert 模型

BERT的目标函数，它包含以下两个部分：

掩码语言模型（Masked language modeling）
下一句预测（Next sentence prediction）

其中有两个特殊的token：

[CLS] ：包含用于驱动分类任务的嵌入，即Next sentence prediction 任务
[SEP] ：用于告诉模型区分第一个序列（例如，前提）与第二个序列（例如，假设）。

1.2.1.1 掩码语言模型

基本思想是通过加噪然后预测来进行训练：

[the,[MASK],ate,[MASK],cheese] ⇒ [the,mouse,ate,the,cheese]
需要模型把[MASK]位置的词语给预测出来

噪声函数的定义：

假设 I⊂{1,…,L} 代表所有位置中随机的15%。
对于每个 i∈I,(x~i 代表需要mask的位置)：
- 以0.8的概率， x~i←[MASK]
- 以0.1的概率， x~i←xi
- 以0.1的概率， x~i←random word from V

1.2.2 RoBERTa

RoBERTa对BERT进行了以下改进：

删除了下一句预测这一目标函数（发现它没有帮助）。
使用更多数据训练（16GB文本 ⇒⇒ 160GB文本）。
训练时间更长。
RoBERTa在各种基准上显著提高了BERT的准确性（例如，在SQuAD上由81.8到89.4）。

1.3 Encoder-Decoder模型：

首先像BERT一样对输入进行双向编码。
然后像GPT-2一样对输出进行自回归解码。

1.3.1 BART(Bidirectional Auto-Regressive Transformers)

BART (Lewis et al. 2019)是基于Transformer的编码器-解码器模型。

使用与RoBERTa相同的编码器架构（12层，隐藏维度1024）。
使用与RoBERTa相同的数据进行训练（160GB文本）。

基于BERT的实验，最终模型进行以下了变换：

掩码文档中30%的token
将所有子句打乱

最后，通过微调，BART在分类和生成任务上都展示了强大的效果。

1.3.2 T5(Text-to-Text Tranfer Transformer)

训练过程：给定一段文本，在随机位置将其分割为输入和输出：

T= {the，mouse ,ate ,the ,cheese}
X1 = {the} Y1 = {mouse,ate,the,cheese}
X2 = {the,mouse} Y2= {ate,the,cheese}
X3 = {the ,mouse,ate} Y3= {the,cheese}

差异：

BERT使用 [CLS][CLS] 的嵌入来预测。
T5、GPT-2、GPT-3等（生成模型）将分类任务转换成自然语言生成。

二、大模型参数优化算法

2.1 随机梯度下降（SGD）

2.2 Adam( adaptive moment estimation)

引入了一阶动量和二阶动量的概念

参数跟新过程：

说明：

学习率 $\alpha$
一阶指数移动平滑加权 $m_{t}$
二阶指数移动平滑加权 $v_{t}$
一阶指数移动加权衰减系数 $\beta 1$
二阶指数皮冻加权衰减系数 $\beta 2$

内存占用：
之前SGD训练时只需要保存 ( $\theta _{t}$ , $g_{t}$ ) 是模型参数的2倍
现在Adam训练要保存( $\theta _{t}$ , $g_{t}$ ， $m_{t}$ , $v_{t}$ ) 是模型参数的4倍

2.3 混合半精度训练

简单理解就是：
训练的时候用F16,跟新模型参数的时候用F32

2.4 学习率

训练过程中使用衰减学习率
对于Tranformer模型，还需要增加一个（warmup）学习率

2.5 参数初始化

给定矩阵W∈Rm×n ，标准初始化（即，xavier初始化）为 Wij∼N(0,1/n) 。
GPT-2和GPT-3通过额外的 1/N 缩放权重，其中 N 是残差层的数量。
T5将注意力矩阵增加一个1/d (代码）。

以GPT-3为例，使用的参数如下：

Adam参数： 1=0.9,2=0.95,8β1=0.9,β2=0.95,ϵ=10−8
批量小：320万个token（约1500个序列）
使用梯度剪裁（t←gt/min(1,∥g∥2) ）
线性学习率预热（前3.75亿个token）
余弦学习率衰减到10%
逐渐增加批大小
权重衰减设为0.1

你可能感兴趣的:(学习,大模型)

3.3.2 交易体系构建——缠论操作思路人大博士的交易之路数学建模数据挖掘量化分析交易之路分类缠论缠中说禅
本节我们基于交易目标（规避下跌趋势，参与上涨趋势）来构建基于上涨趋势的缠论交易体系。建立上涨趋势的缠论交易体系需要以下几个步骤：识别下跌走势大概率完成的位置等待出现转折结构确定交易模型并交易从概率的角度来说，判断走势结束是个概率事件。为构建成功较高的交易体系我们需要提升识别走势完成的概率，为此我们统计历史走势并进行分析。
Github 2024-04-29 开源项目周报 Top15 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本周(2024-04-29统计)共有15个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目11TypeScript项目3Go项目1Svelte项目1JupyterNotebook项目1Swift项目1Ollama:本地大型语言模型设置与运行创建周期：248天开发语言：Go协议类型：MITLicenseStar数量：4242
利用Redis发布订阅模式、SSE实现分布式实时站内信系统 weixin_38515820 Java redis redis 分布式 java
文章目录前言一、SSE是什么？二、单机与集群的站内信实现方式有何区别？三、Redis发布、订阅模式有何特点？四、代码演示1.数据模型小结2.引入依赖3.配置RedissonClient4.编写RestController用于测试5.编写用户消息订阅逻辑6.实现消息的发布7.实现广播消息的订阅8.个人与团队消息的订阅8.效果演示总结前言站内信功能在各大系统中被广泛应用，本文结合工作的实际场景，使用j
线代好学吗？ Vacant Seat
快期末考了，这两天的学期效率比在家高了几倍，这一周都在学习线代，在宿舍，自习室，图书馆都拿着一本太原理工大学线性代数第二版在那里翻，感觉线性代数这个东西挺有意思，挺灵活的，在这里，我总结一下一点关于线性代数的知识，也有一些是我之前入的坑吧，感觉有用的就点个赞吧！！！求四阶行列式说到这里我感觉还挺搞笑的，我之前一直以为行列式的计算都是按照二阶，三阶行列式那样对角线上的元素相乘，然后判断符号相加，就是
分析React和Vue的区别与优势 Neo Evolution 前端框架
React和Vue是目前两种非常流行的前端框架/库，它们各自有独特的设计理念和特点。下面是它们在各个方面的比较，包括架构、学习曲线、性能等。1.架构与理念React：开发类型：React是一个UI库，专注于视图层的构建。它本身没有集成像Vue或Angular那样的完整框架，所以需要与其他库或工具结合使用（如ReactRouter、Redux、ContextAPI等）。设计理念：React强调组件化
2025vue4.x全栈学习关键技术分析线路图 mabanbang web前端学习 vue4 vue4.x
关键升级点说明‌：‌编译优化‌：Vue4.x采用WASM编译提速300%‌智能工具链‌：Vite插件市场新增AI代码审查模块‌跨平台能力‌：Uni-App支持原生ARCore/ARKit调用‌安全增强‌：默认启用WebAuthn生物认证集成建议配合Vue官方推出的「2025开发者成长计划」分阶段学习，重点关注AI工程化和元宇宙场景开发能力培养。‌TypeScript6.x深度集成‌类型推断速度提升
CSS垂直居中终极方案：告别复杂计算，拥抱现代布局 engchina LINUX css 前端
CSS垂直居中终极方案：告别复杂计算，拥抱现代布局前言：为什么垂直居中如此重要？一、2024年最推荐的3种方案1.Flexbox布局（首推方案）2.Grid布局（未来趋势）3.Transform方案（传统场景备用）二、方案对比与选型指南三、实战技巧与避坑指南常见问题排查企业级项目实践四、延伸学习：现代布局新趋势1.Subgrid布局2.逻辑属性支持3.容器查询（实验性）五、升级建议与工具链总结前言
深入剖析 C++ 中的迪杰斯特拉算法小白布莱克 c++算法开发语言
在图论算法的领域中，迪杰斯特拉（Dijkstra）算法是一颗璀璨的明星，它在解决单源最短路径问题上发挥着关键作用。对于学习C++编程的开发者来说，掌握迪杰斯特拉算法不仅能加深对算法思维的理解，还能在实际项目中有效解决诸多路径规划相关问题。迪杰斯特拉算法原理迪杰斯特拉算法是一种贪心算法，用于计算一个节点到图中其他所有节点的最短路径。它的核心思想是：从源节点出发，每次从未确定最短路径的节点中选择距离源
基于动态规划与0-1整数规划模型的多阶段生产决策问题研究 NovakG_ 数据挖掘动态规划数学建模算法
摘要随着市场竞争的日益激烈，企业将以产品质量作为其发展战略重心，以适应激烈的市场竞争与不断变化的用户需求。本文针对某畅销电子产品生产过程中的决策问题，应用统计学中单边检验、二项分布与正态分布的方法，以最小化产品生产成本为目标，建立了动态规划与0-1整数规划模型。通过数学建模与模拟，为企业的生产提供了科学有效的生产决策依据，降低生产成本并优化资源配置。针对问题一，主要解决两个问题：一是需要设计一个最
基于CNN-LSTM-Attention的回归预测算法（附Tensorflow框架下的代码） Jason_Orton 算法 cnn lstm 机器学习数据挖掘回归 tensorflow
本代码基于Tensorflow框架，即插即用！！！基于CNN-LSTM-Attention的回归预测算法结合了卷积神经网络（CNN）、长短期记忆网络（LSTM）和注意力机制（Attention）三种强大的技术，通常用于时序数据的回归预测问题。这种结合模型能够有效地处理和预测复杂的时序数据，尤其是包含空间和时间信息的任务，如气象预测、股市分析、电力负荷预测等。1.模型概述该模型的核心思想是通过不同网
java菜鸟教程学习（完整版） javapython
java实例一.Java字符串1.Java实例–字符串比较2.Java实例-查找字符串最后一次出现的位置3.Java实例-删除字符串中的一个字符4.Java实例-字符串替换5.Java实例-字符串反转6.Java实例-字符串查找7.Java实例-字符串分割8.Java实例-字符串分割(StringTokenizer)9.Java实例-字符串小写转大写10.Java实例-测试两个字符串区域是否相等1
贪心算法-买卖股票问题 Yuan_Source 算法训练贪心算法贪心算法算法
贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是全局最好或最优的算法。贪心算法并不保证总是能得到全局最优解，但它通常能得到不错的解，而且其实现简单，效率高。贪心算法的基本思路是：建立数学模型：首先，将问题抽象化，建立数学模型。选择贪心策略：分析问题的特点，确定贪心选择策略。贪心策略是每一步都选择当前状态下的最优解。解决
在低功耗MCU上实现人工智能和机器学习电子科技圈 Silicon Labs 人工智能机器学习嵌入式硬件经验分享科技物联网 mcu
作者：SiliconLabs人工智能（AI）和机器学习（ML）技术不仅正在快速发展，还逐渐被创新性地应用于低功耗的微控制器（MCU）中，从而实现边缘AI/ML解决方案。这些MCU是许多嵌入式系统不可或缺的一部分，凭借其成本效益、高能效以及可靠的性能，现在能够支持AI/ML应用。这种集成化在可穿戴电子产品、智能家居设备和工业自动化等应用领域中，从AI/ML功能中获得的效益尤为显著。具备AI优化功能的
2025asp.net全栈技术开发学习路线图 mabanbang asp.net core开发 asp.net 全栈技术
2025年技术亮点‌：Blazor已全面支持WebAssembly2.0标准.NET8+版本原生集成AI模型部署能力AzureKubernetes服务实现智能自动扩缩容EFCore新增向量数据库支持特性‌ASP.NET全栈开发关键技术说明（2025年视角）‌以下技术分类基于现代企业级应用开发需求：‌前端生态‌‌Blazor‌是微软基于WebAssembly的前端框架，允许开发者直接使用C#替代Ja
2025年AI数字人大模型+智能家居HA引领未来（开源项目名称：AI Sphere Butler）玩人工智能的辣条哥开源项目AI Sphere Butler 人工智能智能家居 DeepSeek 大模型知识
介绍开源项目计划：AISphereButler打造全方位服务用户生活的AI全能管家——代号**“小粒”**（管家名称可以随意自定义）GitHub地址：https://github.com/latiaoge/AI-Sphere-Butler项目名称：AISphereButler（创意和设计全球首创）终极愿景：我们的目标是创造一个全方位服务于用户生活的AI全能管家——“小粒”。除了不具备物理形态外，“
《程序员练习生》第2期什么年龄开始编程最好道知极限编程程序员练习生编程语言程序员
最适合开始编程的年龄是10岁开始，坚持下来，18岁之前会小有成就，并衣食无忧。1.为什么是10岁很多人听到编程两个字，就下意识的感觉这是非常高深的技术，至少需要完成高中，甚至是要上了大学才能开始学习的技术。其实不然，编程是一个包含非常多内容的技术，可以从广度和深度不同层面去考量编程技术的难度。对于初学者来说，学习编程的目的不是为了搞科学研究，而是熟悉并习惯编程的思维方式，这一点非常重要；其次是掌握
《西瓜书》大白话思想总结-第三章小溪子子西瓜书概率论机器学习分类
第三章3.1+3.2分类和回归是监督式学习，都是根据数据，分析特征，作出预测，只是预测的值是离散的叫分类，连续的叫回归。为什么叫线性回归呢？因为线性就可以看成是直线，直线当然是连续的。而所给的直线就是根据离散点拟合出来的线，其本质就是一种预测。那么根据离散点的特征，给出了预测方程的这个直线，就符合回归的定义。因此，这就叫作线性回归。（个人理解，不一定对）这个拟合直线的方程，或者叫预测的函数，各个自
GTSAM 库详细介绍与使用指南点云SLAM 点云数据优化工具 GTSAM SLAM后端优化最小二乘法计算机视觉贝叶斯
GTSAM库详细介绍与使用指南一、GTSAM概述GTSAM（GeorgiaTechSmoothingandMapping）是由佐治亚理工学院开发的C++开源库，专注于概率图模型（尤其是因子图）的构建与优化，广泛应用于机器人定位与建图（SLAM）、传感器融合、运动规划等领域。其核心优势在于：高效的因子图优化：支持贝叶斯网络建模与非线性优化。增量式求解器（iSAM/iSAM2）：适用于实时SLAM问题
用示例提升大语言模型的查询分析能力！ llzwxh888 语言模型 windows 人工智能 python
引言随着查询分析的复杂性增加，大语言模型（LLM）在理解如何响应某些场景时可能会面临挑战。为了提高性能，我们可以在提示中添加示例，以便更好地引导模型。本文将详细介绍如何为我们在Quickstart中构建的LangChainYouTube视频查询分析器添加示例，以优化其响应准确性。主要内容设置环境安装依赖项我们需要安装langchain-core和langchain-openai库。#%pipins
如何创建自定义Retriever来增强LLM应用程序 llzwxh888 服务器运维 python
引言在许多大语言模型（LLM）应用中，我们需要从外部数据源中检索信息，以便生成更准确和相关的响应。这些信息往往通过Retriever模块检索，然后用于生成提示，供LLM进行处理和响应。在这篇文章中，我们将深入探讨如何创建一个自定义Retriever，并提供代码示例来帮助你在自己的项目中实现这一功能。主要内容Retriever接口要创建一个自定义Retriever，你需要扩展BaseRetrieve
Java vs C++：2025年编程语言之争——谁将主宰未来？爱吃青菜的大力水手 java c++开发语言
在编程的世界里，Java和C++是两门经久不衰的语言，各自凭借独特的优势吸引了大量IT工作者的关注。无论是企业级开发还是高性能系统编程，这两门语言都在各自的领域中扮演着重要角色。本文深入调研并对比Java和C++在市场份额、插件丰富度、学习成本、安全性等方面的表现，帮助您理解它们的优势与应用场景，并在选择编程语言时做出明智决策。1.市场份额与流行度根据TIOBE指数（2024年最新数据），Java
函数调用和 Java 与 Spring AI 模型的集成算法资料吧！ java spring 人工智能
SpringAI是一个功能强大的SpringFramework项目，它为Java开发人员带来了人工智能（AI）功能。通过将AI模型集成到Java应用程序中，SpringAI简化了创建智能应用程序的过程，同时利用了Spring生态系统的稳健性。本文将指导您完成使用SpringAI将AI模型集成到Java应用程序中的步骤，特别关注允许AI模型与外部数据源和服务动态交互的函数调用机制。SpringAIS
深入探索Mozilla的DeepSpeech：语音识别的新里程碑温宝沫Morgan
深入探索Mozilla的DeepSpeech：语音识别的新里程碑项目地址:https://gitcode.com/gh_mirrors/de/DeepSpeech项目简介是一个开源的语音识别引擎，基于深度学习技术，致力于提供准确、可扩展且易于集成的解决方案。该项目的目标是打破现有的语音识别壁垒，使开发者能够轻松构建支持语音的应用，推动人机交互进入新的时代。技术分析基于Baidu的DeepSpeec
DeepSeek 到底是什么类型的应用，其核心功能是什么？ AndrewHZ python 生活算法深度学习人工智能语言模型 deepseek
DeepSeek是一款多用途的人工智能工具，其核心功能基于大模型技术，覆盖内容生成、数据分析、个性化服务及复杂任务处理等多个领域。以下从应用类型和核心功能两方面展开分析：一、DeepSeek的应用类型通用型人工智能助手DeepSeek被设计为跨行业的通用型AI，适用于生活、学习、工作等场景。例如：生活场景：提供旅游推荐（如黔南的景点、美食）、诗歌创作、儿童故事生成等。专业场景：在金融、保险等领域，
Android系统架构与四大组件 Tyssen Android开发系列教程 android开发系统架构
本篇博文主要讲解Android的系统架构。对于Android开发者来说，有必要了解一下Android应用程序是如何运行的。Android是一个移动操作系统，它大致分为四层，即Linux内核层，库和运行时，Framework层和应用层。Android的体系架构鼓励系统组件重用，共享组件数据，并且定义组件的访问控制权限。可以说，这些层次结构即是相互独立，又是相互关联的。一Android系统架构1.Li
探索火山引擎 DeepSeek-R1：高速低延迟AI解决方案引领未来熬夜磕代码丶经验之谈火山引擎人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言火山引擎DeepSeek-R1满血版推荐火山引擎DeepSeek-R1特性总结前言方舟大模型体验中心全新上线，免登录体验满血+联网版DeepSeekR1模型及豆包最新版模型点击登录登录后免费赠送每个模型50万tokens推理额度。火山引擎DeepSeek-R1满血版推荐✨亲爱的朋友们，快来听我发现的好消息！火山引擎推出的D
CTF 代码学习日记 PHP ianozo 学习 php java
基础2字符串连接可以使用点号（.）3.$_：在PHP中，以$_开头的变量（如$_GET、$_POST、$_COOKIE等）是超级全局变量。超级全局变量的特点是它们在PHP脚本的任何地方（包括函数内部、类内部等）都可以访问，不需要使用global关键字来声明其可访问性。这些变量主要用于获取来自不同数据源的用户输入或者服务器环境相关信息。例如：$_SERVER用途：包含了服务器和执行环境相关的信息。例
【深度学习】Adam优化器九筠机器学习深度学习人工智能
目录1什么是Adam1.1基本概念1.2Adam的数学理解1.2.1计算一阶矩估计（mean）1.2.2计算二阶矩估计（uncenteredvariance）1.2.3矫正一阶矩估计（mean）和二阶矩估计（uncenteredvariance）的偏差1.2.4更新模型参数1.3Adam的简单理解2Adam优化算法怎么用2.1导入所需的库和模块2.2定义模型和损失函数2.3定义优化器2.4在训练循
word2vec（一） CBOW与Skip-Gram模型基础浮汐自然语言处理
1.词向量词向量就是用来将语言中的词进行数学化的一种方式，顾名思义，词向量就是把一个词表示成一个向量。这样做的初衷就是机器只认识01符号。所以，词向量是自然语言到机器语言的转换。Word2Vec其实就是通过学习文本来用词向量的方式表征词的语义信息，即通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。Embedding其实就是一个映射，将单词从原先所属的空间映射到新的多维空间中，也就是把原先词
python自然语言处理—Word2vec模型之Skip-gram 诗雨时 python
Word2vec模型之Skip-gram（跳字）模型一、skip-gram模型图二、skip-gram模型图示例说明举个例子来说明这个图在干嘛：1、假设我们的文本序列有五个词，["the","man","loves","his","son"]。2、假设我们的窗口大小为skip-window=2，中心词为"loves"，那么上下文的词即为："the"、"man"、"his"、"son"。这里的上下文
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他