啊哈JC熙

word2vec理论基础

资料来自于：七月在线https://www.julyedu.com/course/getDetail/55

把词映射成向量，即机器所能理解的数据。

图像+DeepLearning非常火，因为图像是人所能接受的直观感受。
文本是人有智慧的时候token，更加高级。如，语境，语意。

也就是你对原始数据的表达决定了你算法的上线。而我们采用的这些机器学习算法如HMM，SVM、CRF、CNN，RNN...等等只是让我们去更加接近（逼近）这个上线。因此词向量很重要。

word encoding ----》 node encoding
向量是可以做运算的，放到NE上也就是节点局部结构相似，比较邻接的点。

word2vec理论基础_第1张图片

N-gram N元模型

I love you
you love I
为了区分话语的含义

2-gram二元组：把相邻的两个单词放在一起看，两两组合成一个10维的列向量。然后进行词频统计。

word2vec理论基础_第2张图片

形式：1-gram 2-gram 3-gram 4-gram 5-gram .....

贝叶斯公式进行语言（词组）建模

word2vec理论基础_第3张图片

每一词的出现依赖于前一个词。
处理是注意：因为都是小数，乘积会使得数值越来越小，一般我们会取log进行求和运算。

word2vec理论基础_第4张图片

酒店宾馆旅社都是一个含义，但是向量表示的都很稀疏，而且不相同。

无论1-gram，还是2-gram，还是n-gram....他们的形式无非都是one-hot 或者 TF-IDF

Distributed Representation

word2vec理论基础_第5张图片

所谓的分布式就是，你让我一个节点去表达我自己这比较困难，我可以将我的信息分散出去，用我周围的词来代表我。

word2vec理论基础_第6张图片

当你训练的数据量大的时候，即使我不知道banking的含义，但是我知道那些词大概和banking相关。

word2vec理论基础_第7张图片

根据六度分理理论，在复杂网络研究中我们大概可以设计窗口的大小是6
对称的窗函数
对称举证

word2vec理论基础_第8张图片

矩阵的每一行，纯天然的就可以做为一个vector。词向量。

word2vec理论基础_第9张图片

共现矩阵 Cocurrence Matrix 就类似于我们图中的邻接矩阵

解决：降维

word2vec理论基础_第10张图片

word2vec理论基础_第11张图片

word2vec理论基础_第12张图片

观察I与like 和 I与enjoy的距离是不是相一致。

word2vec理论基础_第13张图片

神经网络最怕的东西就是维度太高了，因为它要和后面层的神经元做链接，维度太高计算量跟不上去。

向量压缩：
sparse --》 dense vector

word2vec理论基础_第14张图片

5-gram 很稀疏 sparse 统计不好统计，平滑也不好平滑，要把所有的语料都要过一遍，还要计算概率因此需要很大存储空间，那么用没有一个参数化的方法来构建模型，去完成语言模型建模，就不用统计语料库在进行概率统计了，而是用一组参数来解决这个问题。真正需要计算这个概率的时候，你只要把词喂过这个模型我就可以拿到一个概率。

例如：我爱北京天安门
目标函数值越大越好，代表越接近标准答案。

最大似然
后买就是一个上下文

我爱北京天安门 .....

我们统计的是词wt（天安门）的概率
用w_t-n+1,....,w_t-1（我爱北京）来推断这个词的概率
t是可以滑动的

第二个公式的意思是。w_t-n+1,....,w_t-1（我爱北京）可以接词表中的所有词，这些词加到一起的和为1.

窗口的长度是fixed固定住的。

基础：全链接的人工神经网络。

4-gram 用前面三个词 w1 w2 w3来预测第四个词w4。
w输入的是一个：one-hot表示

word2vec理论基础_第15张图片

投影层

c是300*10w 的参数矩阵

300*10w 乘 10W*1 = 300*1

一般是是300到500维
softmax 线性分类器

word2vec理论基础_第16张图片

word2vec

2013年提出来

word2vec理论基础_第17张图片

word2vec理论基础_第18张图片

我喜欢学习机器学习
用 “我 ” “喜欢 ” “机器” “学习”，预测中间的“学习”。

word2vec 没有做拼接，而是直接做了一个求和。从而直接去预测后面这个词。
把投影层简化为求和

word2vec理论基础_第19张图片

10w维度太长了，把它编码成更加低维的信息。把数据量压缩到logV的样子。做决策的时候也是依据树来做决策，每一个节点都是做一个LR模型决策。往左走正样本，往右边走负样本。
哈夫曼编码的树
我喜欢巴西足球世界杯

连续做决策的分类，树的边上有参数。
1001 足球
每个节点都是一个分类

优势在于数据量的压缩。

word2vec理论基础_第20张图片

10w的词

word2vec理论基础_第21张图片

word2vec理论基础_第22张图片

标准答案就是正样本，

word2vec理论基础_第23张图片

用一个词去预测四个词，

word2vec理论基础_第24张图片

word2vec理论基础_第25张图片

还是说没听懂！！！23333！！！

宝宝不要生气啦～～～

你可能感兴趣的:(word2vec理论基础)

CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
Vite 权威技术指南：新一代前端构建工具
第一部分：Vite的理念与架构本部分旨在阐明Vite存在的根本“原因”。它超越了简单的功能罗列，深入剖析了定义Vite的历史背景与架构革新，为后续所有技术细节的探讨奠定理论基础。第1章：Vite简介：重新定义开发者体验核心定义Vite（法语，意为“快速”，发音/vit/）是一款旨在显著提升现代Web项目开发体验的新一代前端构建工具1。其核心由两个主要部分构成：一个利用原生ES模块（ESM）提供丰富
一文搞懂怎么入门大模型
在人工智能飞速发展的当下，大模型已然成为推动众多领域创新变革的核心力量。无论是在智能客服、内容创作，还是数据分析、科学研究等方面，大模型都展现出了令人瞩目的能力。对于渴望踏入大模型领域的初学者而言，构建一个系统且全面的入门路径至关重要。接下来，我们将以DeepSeek为例，详细阐述如何系统地入门大模型。一、理论基础：搭建认知框架在深入实践之前，理解大模型的基础理论是关键。大模型，通常指具有海量参数
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
Spring 生态创新应用：微服务架构设计与前沿技术融合实践七夜zippoe #Java spring 微服务 java
在数字化转型的深水区，企业级应用正面临从“单体架构”向“分布式智能架构”的根本性跃迁。Spring生态以其二十年技术沉淀形成的生态壁垒，已成为支撑这场变革的核心基础设施。从2002年RodJohnson发布《ExpertOne-on-OneJ2EEDesignandDevelopment》奠定的理论基础，到如今覆盖从开发到运维全链路的技术矩阵，Spring始终以“简化开发”为初心，构建出适配不同业
如果让计算机理解人类语言- One-hot 编码（One-hot Encoding，1950s）
如果让计算机理解人类语言-One-hot编码（One-hotEncoding，1950s）flyfish如果让计算机理解人类语言-One-hot编码（One-hotEncoding，1950s）如果让计算机理解人类语言-词袋模型（BagofWords,BoW，1970s）如果让计算机理解人类语言-Word2Vec（WordtoVector，2013）如果让计算机理解人类语言-Qwen3Embedd
代码训练营DAY13 第六章二叉树part01 _Coin_- 数据结构算法
理论基础二叉树种类存储方式遍历方式深度优先搜索&广度优先搜索深度：前序遍历、中序遍历、后序遍历（中间在前or中or后，左右顺序固定）广度：二叉树定义递归遍历（必须掌握）递归分析三步法1、确定递归函数的参数和返回值2、确定终止条件3、确定单层递归逻辑前序遍历144.二叉树的前序遍历-力扣（LeetCode）/***Definitionforabinarytreenode.*structTreeNod
Rust 仿射类型（Affine Types）萧曵丶 Rust rust 仿射类型
在Rust中，仿射类型（AffineTypes）是所有权系统的理论基础，它规定了每个值有且仅有一次使用机会。这与线性类型（必须恰好使用一次）有所不同，允许值未被使用就被丢弃。Rust中的仿射类型核心特征移动语义（MoveSemantics）fnconsume(s:String){/*...*/}lets1=String::from("hello");consume(s1);//所有权转移给函数//
【数据空间】数据空间基本理论及公司建设方法暴躁小师兄数据学院数据治理大数据人工智能安全网络区块链
数据空间基本理论及公司建设方法数据空间是一种数据管理框架，旨在帮助组织高效存储、访问、集成和分析数据。它强调数据作为战略资产，通过结构化方法提升数据价值。以下我将从基本理论入手，逐步解释公司如何完成建设，确保内容结构清晰、真实可靠。一、数据空间基本理论数据空间理论源于数据管理领域，核心是解决数据孤岛、不一致性和安全风险等问题。其理论基础包括：数据抽象与建模：数据空间将数据视为独立于应用的资源，使用
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
【求职】有没有大疆内推哇，开始找工作，不知所措啊，求硬件工程师的岗位，无人机飞控工程师的岗位
救命！26届的我找工作已经快把自己逼疯了海投无数简历，大多石沉大海，每天都在焦虑和自我怀疑中循环。想找一份无人机相关，或者硬件工程师之类的岗位。本人南京航空航天大学，控制科学与工程专业，是南航的A级双一流学科，学过嵌入式系统设计，最优控制理论，航天器控制仿真等课程，拥有扎实的理论基础，熟练掌握电路设计与分析，如模拟电路、数字电路，能独立完成电路原理图的设计工作。硬件开发流程在嵌入式硬件开发方面，熟
Transformer模型压缩：结构化剪枝与混合精度量化研究 pk_xz123456 仿真模型机器学习深度学习 transformer 剪枝深度学习
Transformer模型压缩：结构化剪枝与混合精度量化研究摘要本文针对Transformer模型在实际部署中面临的计算资源消耗大、内存占用高和推理延迟等问题，提出了一种结合结构化剪枝与混合精度量化的综合压缩方案。我们首先分析了Transformer模型的结构特点及其在计算效率方面的瓶颈，然后系统地研究了结构化剪枝和混合精度量化的理论基础与实现方法。通过实验验证，我们的方法在保持模型性能的同时显著
【NWFSP问题】基于中华穿山甲算法CPO求解零等待流水车间调度问题NWFSP研究（Matlab代码实现）
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述1.引言2.理论基础2.1中华穿山甲算法（CPO）核心原理2.2NWFSP数学模型3.CPO-NWFSP求解框架设计3.1编码与解码3.2离散化位置更新3.3目标函数适配4.实验设计与性能分析4.1实验设置4.2结果分析4.3敏感性分析5.结论与展望
网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了网络安全工程师教学兼职副业黑客技术网络安全 web安全安全人工智能网络运维
一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
《刚刚问世》系列初窥篇-Java+Playwright自动化测试-7-元素基础定位方式-下篇（详细教程）
1.简介上一篇主要是讲解我们日常工作中在使用Playwright进行元素定位的一些比较常用的基础定位方式的理论基础知识以及在什么情况下推荐使用。今天这一篇讲解和分享一下剩下部分的基础定位方式。２.过滤器定位例如以下DOM结构，我们要在其中单击第二个产品卡的购买按钮。我们有几个选项来过滤定位器以获得正确的定位器。2.1按文本过滤定位器可以使用locator.filter（）方法按文本进行过滤。它将搜
基于条件风险价值CVaR的微网动态定价与调度策略（Matlab代码实现） Ps.729 matlab 开发语言
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、CVaR的理论基础及其在微网中的适用性1.CVaR的定义与优势2.微网应用场景适配性二、动态定价与调度模型的联合优化框架1.目标函数设计2.动态定价机制3.不确定性处理方法三、关键算法与求解策略1.随机规划与CVaR集成2.智能优化算法对比四、实证
邻近巷道爆破振动模拟与可视化：计算力学的工程应用碳酸的唐动态规划数学建模
引言隧道爆破施工是现代工程建设中常用的方法，但爆破产生的振动会对周围结构和地质环境产生影响。本文介绍一个基于Python的邻近巷道爆破振动模拟系统，该系统通过数值计算模拟爆破引起的应力波传播过程，并提供多种可视化方式展示振动效应。本研究对于理解爆破振动机理、评估爆破安全距离以及优化爆破参数具有重要意义。理论基础爆破应力波传播模型爆破引起的应力波在岩体中的传播可通过弹性波动理论描述。在均匀介质中，应
隐马尔可夫模型：语音识别系统的时序解码引擎大千AI助手人工智能 Python #OTHER 语音识别人工智能机器学习概率马尔科夫链 HMM
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！1HMM与语音识别的理论基础隐马尔可夫模型（HMM）作为一种双重随机过程的统计模型，其核心在于描述一个包含隐含状态的马尔可夫链，以及这些状态生成可观测输出的概率分布。在语音识别领域，HMM的时序建模能力与语音信号的特性形成了完美契合：隐含状态：对应语音
代码随想录算法训练营第二十一天|回溯算法理论基础，77. 组合丁希希哇力扣算法刷题算法面试 python 力扣数据结构剪枝
系列文章目录代码随想录算法训练营第一天|数组理论基础，704.二分查找，27.移除元素代码随想录算法训练营第二天|977.有序数组的平方，209.长度最小的子数组，59.螺旋矩阵II代码随想录算法训练营第三天|链表理论基础，203.移除链表元素，707.设计链表，206.反转链表代码随想录算法训练营第四天|24.两两交换链表中的节点，19.删除链表的倒数第N个节点，面试题02.07.链表相交，14
【回溯算法】|代码随想录算法训练营第19天|77. 组合、216.组合总和III、17.电话号码的字母组合小白糖的狗狗叫鸡蛋 15-数据结构与算法算法 redis 数据库
刷题神器代码随想录往期回顾>【二叉树】|代码随想录算法训练营第18天|669.修剪二叉搜索树、108.将有序数组转换为二叉搜索树、538.把二叉搜索树转换为累加树、【总结】题目理论基础文章：文章讲解视频：视频讲解回溯算法并不是一个高效算法，它的目的是穷举，替代多层for循环，回溯算法和递归算法相关纠缠，在递归的前后要进行回溯,回溯算法可以理解为树型结构，树的宽度就是for循环的范围，树的深度就是递
第G1周：生成对抗网络（GAN）入门
本文为365天深度学习训练营原作者：K同学啊基础任务：1.了解什么是生成对抗网络2.生成对抗网络结构是怎么样的3.学习本文代码，并跑通代码进阶任务：调用训练好的模型生成新图像一、理论基础生成对抗网络（GenerativeAdversarialNetworks,GAN）是近年来深度学习领域的一个热点方向。GAN并不指代某一个具体的神经网络，而是指一类基于博弈思想而设计的神经网络。GAN由两个分别被称
哈希表经典题目深度解析 - 从理论到实践
哈希表经典题目深度解析-从理论到实践哈希表理论基础回顾哈希表的本质哈希表是一种在时间和空间上做权衡的数据结构，通过哈希函数将键映射到数组索引，实现O(1)平均时间复杂度的查找、插入、删除操作。哈希表的三种经典结构数组-简单直接的哈希表set-集合型哈希表map-键值对哈希表选择指南数组：数据范围有限且连续（如小写字母、固定范围整数）set：需要去重，不需要记录额外信息map：需要记录键值对关系（如
LLM大模型命名规则与部署硬件实践手册
文章目录一、理论基础：从信息编码到系统设计1.1命名系统的信息论基础1.2硬件架构与模型运行的关系1.3量化技术的数学原理二、国际主流模型命名规则深度解析2.1OpenAI：极简主义与功能导向2.2AnthropicClaude：诗意命名的技术内涵2.3GoogleGemini：统一品牌下的分层架构2.4MetaLlama：开源社区的透明化命名三、国内主流模型命名规则与文化内涵3.1百度文心：知识
Hamiltonian Transformer理论：融合哈密顿力学与Transformer架构的新范式墨顿 transformer 架构深度学习
HamiltonianTransformer理论是一种将经典哈密顿力学原理与现代Transformer架构相结合的新型神经网络范式。这一理论框架试图解决当前深度学习模型在效率、动态系统建模和长期依赖处理等方面的核心挑战。本文将系统梳理HamiltonianTransformer的理论基础、关键创新点、实现方法以及应用前景，并分析其相对于传统Transformer架构的优势与潜在限制。哈密顿力学与T
RAG实战指南 Day 2：RAG开发环境搭建与工具选择在未来等你 RAG实战指南 RAG 向量检索 LLM AI开发知识库
【RAG实战指南Day2】RAG开发环境搭建与工具选择开篇欢迎来到"RAG实战指南"系列的第2天！今天我们将聚焦RAG系统的开发环境搭建和工具选择，这是构建高效RAG应用的基础。一个合理的开发环境和工具链不仅能提升开发效率，还能确保系统的稳定性和扩展性。通过本文，你将掌握如何从零开始搭建RAG开发环境，了解主流工具的选择策略，并通过实际案例学习如何将这些工具组合起来构建完整的RAG工作流。理论基础
《P9工作法》：架构师视角下的技术成长与实践吴free 系统架构架构
作为一名程序员和架构师，阅读《P9工作法：夯实技术硬实力、架构力和领导力》这本书让我受益匪浅。书中不仅涵盖了技术硬实力、架构力和领导力的全面提升路径，还结合了大量实战经验，为架构师的成长提供了极具价值的指导。一、技术硬实力：架构设计的基石架构师的核心职责之一是确保系统的健壮性、可扩展性和高性能。《P9工作法》中提到的技术硬实力，为架构设计提供了坚实的理论基础。书中强调了编写优质代码、定义接口契约、
【深度学习:进阶篇】--4.2.词嵌入和NLP 西柚小萌新吖(●ˇ∀ˇ●) #深度学习深度学习自然语言处理人工智能
在RNN中词使用one_hot表示的问题假设有10000个词每个词的向量长度都为10000，整体大小太大没能表示出词与词之间的关系例如Apple与Orange会更近一些，Man与Woman会近一些，取任意两个向量计算内积都为0目录1.词嵌入1.1.特点1.3.word2vec介绍1.3.Word2Vec案例1.3.1.训练语料1.3.2.步骤1.3.3.代码2.测试代码1.词嵌入定义：指把一个维数
[AI笔记]-Word2Vec面试考点 Micheal超 AI笔记人工智能笔记 word2vec
✅一、基础认知类什么是Word2Vec？它的基本思想是什么？关键词：将词语转换为向量表示；捕捉语义关系；基于上下文预测Word2Vec与One-hot编码的区别？关键词：维度灾难(维度过高，存储空间大)、高稀疏性、语义表达能力(没有距离概念，无法计算相似度)、内积关系Word2Vec的两种模型是什么？它们有何区别？答案：Word2Vec的重要假设：文本中离得越近的词语相似度越高。主要有：CBOW（
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他