iiVax

NLP学习-Task1：简介和词向量Word Vectors

NLP学习

更新流程↓
Task 1: 简介和词向量Word Vectors
Task 2: 词向量和词义Word Senses
Task 3: 子词模型Subword Models
Task 4: Contextual词嵌入
Task 5: 大作业

哈哈哈
当外地小伙转学到四川学校
阴阳怪气第一人

简介和Word Vectors

文章目录

- 1. 简介Introduction
- - 1.1. 语言学到自然语言处理简要介绍
  - 1.2. 人类语言和单词含义
- 2. 词表示模型
- - 2.1. 离散表示one-hot representation
  - 2.2. 分布表示distributional representation
  - 2.3. 分布式表示distribution representation
  - - 2.3.1. 词嵌入word embedding
- 3. Word2vec语言模型的简要介绍
- - 3.1.Word2vec目标函数梯度
  - 3.2. 优化基础知识
  - - 3.2.1. 梯度下降
    - 3.2.2. SGD随机梯度下降
- 4. 参考链接

1. 简介Introduction

1.1. 语言学到自然语言处理简要介绍

人类比猩猩更加聪明，是因为人们可以通过语言进行交互，对语言的理解和思考，展现了人类语言的复杂和高效。
每个人对于语言都可以有自己的理解，因此语言不光具有信息传递的功能，还可以通过语言来影响其他人。
当今社会，网络速度不断更新迭代，5G已经油然而生，相对于人类语言，我们使用NLP技术可以高速学习构建更强大的处理能力。
NLP就是对各种文本内容进行处理。

1.2. 人类语言和单词含义

Q1: How do we represent the meaning of a word?

定义含义：

用单词、词组表示概念
人们运用单词、符号表示自己的观点
通过写作作品、艺术来表达观
理解含义最普遍的语言方式 (denotational semantics用语言符号对语义进行转化)：signifier(symbol)⇔signified(idea or thing)

Q2: How do we have usable meaning in a computer?

通常的解决方案：WordNet，Wordnet是一个包含同义词集和上位词（用 “is a”来表示关系的词集列表）的巨大词典。

Q3: Problems with resources like WordNet

WordNet的劣势：

是很好的resources，但忽略了细微的一些差别，例：proficient与good在词典中被认为是同义词，但事实上这只在某些文本上下文中成立。
忽略了一些单词的含义（即含义不完整）
偏主观（缺少客观性）
需要人类来不断地更新和改写
无法计算单词之间的相似度

2. 词表示模型

词向量Word Vectors，将单词编码成向量，将其表示成在词空间中的某一点。每一维都可看作是某些语义信息的编码。

在NLP中有三种方法将词表示在计算机中:离散表示one-hot representation、分布表示distributional representation和分布式表示distribution representation。

Distribution：分布式描述的是若干元素的连续表示形式，如稠密的词嵌入向量表示、Word2vec，与之相反的是独热向量。
Distributional：使用词语的上下文来表示其语义，基于计数的词向量表示就是分布表示，因为我们都使用词语的上下文来表征它的含义。

2.1. 离散表示one-hot representation

传统的基于规则或基于统计的自然语义处理方法将单词看作一个原子符号，被称作离散表示one-hot representation。
离散表示把每个词表示为一个长向量。这个向量的维度是词表大小，向量中只有一个维度的值为1，其余维度为0，这个维度就代表了当前的词。

# e.g.
motel = [0 0 0 0 0 0 0 0 0 0 1 0 0 0 0]
hotel = [0 0 0 0 0 0 0 1 0 0 0 0 0 0 0]

离散表示相当于给每个词分配一个id，这就导致这种表示方式不能展示词与词之间的关系。另外，离散表示将会导致特征空间非常大，但也带来一个好处，就是在高维空间中，很多应用任务线性可分。

2.2. 分布表示distributional representation

分布表示distributional representation：是基于分布假设理论，利用共生矩阵来获取词的语义表示，可以看成是一类获取词表示的方法。

什么是分布假说呢？词是承载语义的最基本的单元，而传统的独热表示仅仅将词符号化，不包含任何语义信息。如何将语义融入到词表示中？Harris 在 1954 年提出的分布假说（distributional hypothesis）为这一设想提供了理论基础：上下文相似的词，其语义也相似。

“这里的分布”与中文“统计分布”一词语义对应，描述的是上下文的概率分布。用上下文描述语义的表示方法（或基于分布假说的方法）都可以称作分布表示，如潜在语义分析模型（Latent Semantic Analysis, LSA）、潜在狄利克雷分配模型（Latent Dirichlet Allocation，LDA）等。

2.3. 分布式表示distribution representation

分布式表示distribution representation包括基于矩阵、基于聚类、基于神经网络的方式，一般将基于神经网络的分布式表示称为词嵌入word embedding。而词嵌入又包括很多不同的算法集合，或者叫做实现工具，比如SEENA、FastText、word2vec等。

分布式表示优点:

词之间存在相似关系：是词之间存在“距离”概念，这对很多自然语言处理的任务非常有帮助。
包含更多信息：词向量能够包含更多信息，并且每一维都有特定的含义。在采用one-hot特征时，可以对特征向量进行删减，词向量则不能。

2.3.1. 词嵌入word embedding

词嵌入word embedding，又叫Word嵌入式自然语言处理（NLP）中的一组语言建模和特征学习技术的统称，其中来自词汇表的单词或短语被映射到实数的向量。从概念上讲，它涉及从每个单词一维的空间到具有更低维度的连续向量空间的数学嵌入。
生成这种映射的方法包括神经网络，单词共生矩阵的降维，概率模型，可解释的知识库方法，和术语的显式表示单词出现的背景。
当用作底层输入表示时，单词和短语嵌入已经被证明可以提高NLP任务的性能，例如语法分析和情感分析。

词嵌入技术是将词转化成为稠密向量，并且对于相似的词，其对应的词嵌入也相近。

3. Word2vec语言模型的简要介绍

如果用一句比较简单的话来总结，word2vec是用一个一层的神经网络(即CBOW)把one-hot形式的稀疏词向量映射称为一个n维(n一般为几百)的稠密向量的过程。为了加快模型训练速度，其中的tricks包括Hierarchical softmax，negative sampling, Huffman Tree等。

在NLP中，最细粒度的对象是词语。如果我们要进行词性标注，用一般的思路，我们可以有一系列的样本数据(x,y)。其中x表示词语，y表示词性。而我们要做的，就是找到一个x -> y的映射关系，传统的方法包括Bayes,SVM等算法。但是我们的数学模型，一般都是数值型的输入。但是NLP中的词语，是人类的抽象总结，是符号形式的（比如中文、英文、拉丁文等等），所以需要把他们转换成数值形式，或者说通过词嵌入的方式将它嵌入到一个数学空间里，而Word2vec就是词嵌入的一种。

在NLP中，把x看做一个句子里的一个词语，y 是这个词语的上下文词语，那么这里的f，便是NLP中经常出现的语言模型（language model），这个模型的目的，就是判断 (x,y) 这个样本，是否符合自然语言的法则，更通俗点说就是：词语x和词语y放在一起。

Word2vec正是来源于这个思想，但它的最终目的，不是要把 f 训练得多么完美，而是只关心模型训练完后的副产物——模型参数（这里特指神经网络的权重），并将这些参数，作为输入 x 的某种向量化的表示，这个向量便叫做——词向量。

Word2vec的特点

包含大量的文本语料
固定词表中的每一个单词由一个词向量表示
遍历本文中的每个位置 $t$ ，包含了center word中心词 $c$ ，和context words上下文 $o$ （除了 $c$ 的外部单词）。
通过 $c$ 和 $o$ 的词向量相似性来计算 $P (o / c)$
调整优化word vectors来最小化似然，最大化概率

Word2vec的目标函数：

对于每一个文本的位置 $t = 1, 2, . . ., T$ ，预测窗口为 $m$ 的上下文，给出中心词 $w_{j}$ :

$likelihood=L(\theta)=\prod_{t=1}^{T}\prod_{-m \le j \le m\ \ \ \ \ j\ne0}^{}p(w_{t+j}|w_t;\theta)$

注： $\theta$ 是需要优化的参数

$J（\theta）=-\frac 1TlogL(\theta)=-\frac1T\sum_{t=1}^T\sum_{-m\le j\le m \ \ \ \ \ j\ne 0}logP(w_{t+j}|w_t;\theta)$

损失函数 $J(\theta)$ 是（平均）负的对数似然(negative log likelihood)；
负号将极大化损失函数转化为极小化损失函数；
log函数方便将乘法转化为求和（优化处理）

Q：如何计算 $P(w_{t+j}|w_t;\theta)$ ?

A：对于每个单词 w 我们使用两个向量 $v_w$ (当 $w$ 是中心词时)和 $u_w$ (当 $w$ 是上下文单词时)，对于中心词 $c$ 和上下文单词 $o$ ，有： $P(o|c)=\frac {exp(u_o^Tv_c)}{\sum_{w\epsilon V}exp(u_w^Tv_c)}$

在概率函数中： $P(o|c)=\frac {exp(u_o^Tv_c)}{\sum_{w\epsilon V}exp(u_w^Tv_c)}$

分子取幂函数使得始终可以为正
向量 $u_o$ 和向量 $v_c$ 点乘，点乘结果越大，向量之间越相似
$u^Tv=u·v=\sum_{i=1}^nu_iv_i$
对整个词表标准化，给出概率分布

softmax函数进行归一化（深度学习中常用）： $\Bbb{R^n}\to \Bbb{R^n}$ $\frac {exp(x_i)}{\sum_{j=1}^nexp(x_j)}=p_i$ 注：用于将任意值 $x_i$ 映射到概率分布 $p_i$ 。

3.1.Word2vec目标函数梯度

通过优化参数的方式训练模型——最小化损失

训练模型：计算所有矢量渐变
整个模型里只有一个参数 $\theta$ ,所以我们只用优化这一个参数就行。

例如：模型在一个 $d$ 维，词典大小为 $V$ :
$\theta =\begin{bmatrix}v_{aardvark}\\ v_{a}\\...\\ v_{zebra}\\ u_{aardvark}\\ u_{a} \\ ...\\ u_{zebra}\end{bmatrix}\in \Bbb R^{2dV}$

2：每个单词有两个向量
通过梯度（导数）下降的方式优化参数
梯度下降会用到链式法则
迭代计算每个中心词向量和上下文词向量随着滑动窗口移动的梯度
依次迭代更新窗口中所有的参数

e.g.

3.2. 优化基础知识

3.2.1. 梯度下降

我们的损失函数 $J(\theta)$ 需要最小化
使用的方法为：梯度下降
对于当前 $\theta$ ,计算 $J(\theta)$ 的梯度
然后小步重复朝着负梯度方向更新方程里的参数 $\alpha=(step\ size)\ or\ (learning\ rate)$ ， $\theta^{new}=\theta^{old}-\alpha \nabla_\theta J(\theta)$
更新唯一的参数 $\theta$ : $\theta_j^{new}=\theta_j^{old}-\alpha \frac \alpha{\alpha\ \theta_j^{old}}J(\theta)$

while True:
	theta_grad = evaluate_gradient(J,corpus,theta)
  theta = theta - alpha * theta_grad

3.2.2. SGD随机梯度下降

由于 $J(\theta)$ 是在语料文本中所有窗口的方程
当语料很大的时候，计算梯度会消耗巨大
解决办法：SGD随机梯度下降
不断sample窗口，不断更新

while True:
  window = sample_window(corpus)
  theta_grad = evaluate_gradient(J,window,theta)
  theta = tehta - alpha * theta_grad

4. 参考链接

【2019 CS224N 中文字幕】Stanford CS224N NLP with Deep Learning Winter
datawhalechina / team-learning / 04 自然语言处理 / Lecture / Lecture1 / reference
百度百科——词向量
什么是词向量？（NPL入门）
小白都能理解的通俗易懂word2vec详解
Lecture1- Introduction and Word Vectors 斯坦福 nlp 教程
词向量Word Vectors学习笔记–word2vec
分布表示（distributional representation）与分布式表示（distributed representation）
word2vec和word embedding有什么区别?
[NLP] 秒懂词向量Word2vec的本质

自然语言处理-词嵌入 (Word Embeddings) 纠结哥_Shrek 自然语言处理人工智能
词嵌入（WordEmbedding）是一种将单词或短语映射到高维向量空间的技术，使其能够以数学方式表示单词之间的关系。词嵌入能够捕捉语义信息，使得相似的词在向量空间中具有相近的表示。常见词嵌入方法基于矩阵分解的方法LatentSemanticAnalysis(LSA)LatentDirichletAllocation(LDA)非负矩阵分解(NMF)基于神经网络的方法Word2Vec（Google提
AIGC时代的Vue或React前端开发 GISer_Jinger Javascript React Vue AIGC vue.js react.js
在AIGC（人工智能生成内容）时代，Vue开发正经历着深刻的变革。以下是对AIGC时代Vue开发的详细分析：一、AIGC技术对Vue开发的影响代码生成与自动化AIGC技术使得开发者能够借助智能工具快速生成和优化Vue代码。例如，通过自然语言处理模型（如ChatGPT），开发者可以描述组件的功能和样式需求，然后自动生成包含模板、脚本和样式的完整组件代码。这不仅大大提高了开发效率，还减少了人为错误的可
WSL开发环境配置（linux + python + nodejs + docker） Lilixxs 环境搭建基础设施 linux 运维服务器
配置要求及目标总体目标：完整的Linux开发环境可开发基于node.js的前端程序可开发基于python的后端程序（仅日常程序，不包含机器学习程序）可运行docker容器，用于快速搭建测试环境Linux环境要求支持centos发行版类似的操作方式和指令（如使用rpm、dnf进行软件包管理）登录用户具有root权限（执行高权限命令，输入sudo即可执行）可从国内源更新软件基本优化：内核指令优化、禁用
python在线编辑器-在线编译或编辑Python的5个最佳工具编程大乐趣
离线Python编辑器和编译器都具有许多功能，但是在线编译器通常在功能上受到限制，并试图满足特定需求而不是满足所有需求，其中在线编译大多数是免费的，所以也受到开发者的热爱。在本文中，我们将浏览各种狂野的在线Python编译器，其中大多数是免费的，我们还列出了一些，它们是有价的，主要用于大型项目开发。在线Python编译器的功能和使用？通常提供的功能范围从简单的外壳到功能齐全的PythonIDE。在
poetry使用经验汇总 enjoy编程程序员实用工具集合 python poetry virtualenv 依赖
什么是poetryPoetry是一个Python依赖管理和打包工具，它旨在解决Python项目中常见的依赖问题，提供更简洁、更可靠的依赖管理方式。以下是Poetry的一些主要功能和特点的总结：依赖解析：Poetry使用pyproject.toml文件来管理项目依赖，它能够自动解析依赖关系，确保依赖的一致性和可重复性。虚拟环境：Poetry为每个项目创建独立的虚拟环境，避免了不同项目之间的依赖冲突。
DeepSeek大模型技术深度解析：揭开Transformer架构的神秘面纱不一样的信息安全网络杂烩 AI DeepSeek
摘要DeepSeek大模型由北京深度求索人工智能基础技术研究有限公司开发，基于Transformer架构，具备卓越的自然语言理解和生成能力。该模型能够高效处理智能对话、文本生成和语义理解等复杂任务，标志着人工智能在自然语言处理领域的重大进展。关键词DeepSeek模型,Transformer架构,自然语言,智能对话,文本生成,语义理解一、DeepSeek大模型的架构解析1.1DeepSeek大模型
Python Poetry 的使用 YOUFDJ python linux 服务器 Python
PythonPoetry的使用PythonPoetry是一个用于管理Python项目依赖的工具。它提供了一个简洁的界面，使得创建、发布和管理Python包变得更加容易。本文将介绍如何安装Poetry，并使用它来创建一个新的Python项目并管理其依赖关系。安装Poetry首先，我们需要安装Poetry。可以通过在命令行中运行以下命令来安装Poetry：curl-sSLhttps://install
几款语言python在线编辑器 Stestack python 编辑器开发语言
在当今数字化时代，编程已成为一项不可或缺的技能。Python作为一种简单易学且功能强大的编程语言，受到了广大编程爱好者和专业开发人员的青睐。为了方便大家随时随地编写和运行Python代码，市面上涌现了许多优秀的在线Python编辑器。本文将为您推荐几款目前非常火爆的Python在线编辑器。1、LightlyPythonIDE支持在线编辑、编译、运行Python代码。它适用于任何操作系统，用户只需打
[python]poetry安装和使用 FL1623863129 Pytorch python
Python新建Poetry环境一、安装Poetry：1、windows直接安装：(Invoke-WebRequest-Urihttps://install.python-poetry.org-UseBasicParsing).Content|python-2、pip安装pipinstallpoetry二、创建项目1、指定虚拟环境存放目录poetryconfigvirtualenvs.pathD:
《DeepSeek-R1 问世，智能搜索领域迎来新变革》黑金IT 智能搜索
DeepSeek-R1是由DeepSeek公司开发的一款创新型人工智能模型，自2024年5月7日发布以来，迅速在AI领域引起广泛关注。该模型凭借其卓越的语言理解能力、高效的数据处理能力、自适应学习能力、高安全性与可靠性以及广泛的应用场景与拓展性，在众多人工智能模型中脱颖而出。DeepSeek-R1的核心特点强大的语言理解能力：DeepSeek-R1采用先进的深度学习算法，能够精准解析复杂的语义结构
AI绘画关键词（咒语）分析与热点研究集eee AI作画 midjourney chatgpt 人工智能 prompt text2img stable diffusion
语义文本图像生成技术关键词分析与热点研究一、研究背景与研究意义随着深度学习的发展，语义文本到图像的生成技术已经取得长足进步，AI绘画也因此快速崛起。只需输入关键词，AI系统就能自动生成符合语义描述的图像，这一技术的出现,使绘画的创作方式发生革命性变化。目前主流的AI绘画模型有Midjourney、Stablediffusion和文心一格等，其使用方式多为输入一段含有图片描述的“prompt（指令）
Python连接MinIO进阶教程：文件类型指定、上传与获取预览链接北海yy python 前端服务器
文章目录概要1.指定文件内容类型2.获取文件的预览链接（PresignedURL）使用fput_object上传文件4.完整示例与总结概要在上一篇文章中，我们介绍了如何使用Python连接MinIO服务器，并进行了基本的文件上传和下载操作。这次，我们将深入探讨一些进阶功能，包括在上传文件时指定内容类型（Content-Type）、获取文件的预览链接（PresignedURL），以及处理文件类型猜测
【ProxyBroker】用Python打破网络限制的利器山河不见老 python python 开发语言
ProxyBroker1.什么是ProxyBroker2.ProxyBroker的功能3.ProxyBroker的优势4.ProxyBroker的使用方法5.ProxyBroker的应用场景6.结语项目地址：1.什么是ProxyBrokerProxyBroker是一个开源工具，它可以异步地从多个来源找到公共代理，并同时对它们进行检查。在当今互联网世界中，隐私保护和访问限制已经成为了许多人关注的焦点
【Healpix】python一种用于将球面划分为均匀区域的技术山河不见老 python python 开发语言
Healpix1、简介2、Healpix的基本原理3、Healpix的优点4、安装及使用4.1安装healpy4.2创建Healpix地图4.3读取和写入Healpix数据4.4数据插值5、案例5.1案例一：宇宙微波背景辐射（CMB）分析5.2案例二：星系分布分析5.3案例三：天文图像处理6、结论1、简介在天文学和宇宙学中，Healpix（HierarchicalEqualAreaisoLatit
【Pydantic】Python 数据验证入门山河不见老 python 数据处理 python 运维开发
Pydantic1.什么是Pydantic?2.安装3.基础使用3.1创建基础模型3.2数据验证3.3嵌套模型4.常用验证规则4.1基础验证规则4.2列表验证4.3自定义验证器4.4条件验证4.5常用验证类型5.实际应用示例5.1API请求验证5.2配置管理6.小技巧6.1.数据转换:6.2错误处理:1.什么是Pydantic?Pydantic是一个功能强大的Python数据验证库，它通过Pyth
ajax实现动态及时刷新表格数据_如何利用Python3和PyQt5来实现控件数据动态刷新... weixin_39904116
最近笔者在做一个pyqt5的界面，由于在日常生活中，一些实际运用的场合都需要对数据进行实时的刷新，例如对某个数值的监控，水温，室温的监控等等，都需要实时的刷新控件显示的数据。对于实现这样的一种功能，pyqt5在面板生成的同时就固定住了UI中的数据，例如我们产生一个QLineEdit控件，然后布局在面板上，但是控件中的数据是固定的，如果这个数据是实时更新的，想要改变空间中的数据时，就要去刷新面板，p
清华镜像安装 Jupyter 并一键启动外网访问时光旅人01号 jupyter 网络 linux python 神经网络
1.安装JupyterNotebook由于国内访问官方Python包源较慢，我们将使用清华大学的镜像源加速安装过程。1.1配置清华镜像源首先，在安装Jupyter之前，建议将pip配置为使用清华大学的镜像源，这样可以加速Python包的下载速度。创建或编辑pip配置文件（~/.pip/pip.conf或C:\Users\pip\pip.ini）并添加以下内容：index-url=https://p
【OpenGL】使用 python + Qt + OpenGL 的现代渲染无水先生 3D图形渲染和OpenGL编程 python qt 计算机图形学
伴随资源目录一、说明二、关于PyQt6.x2.1QOpenGLWidget详细说明2.2绘画技巧三、PyOpenGL四、OpenGL管线五、Python集成开发环境5.1Emacs配置5.2pycharm环境六、你好，OpenGL！七、QGL控件八、平截头体.svg九、定义几何9.1立即模式与保留模式9.2使用VBO定义Cube十、渲染立方体十一、渲染循环十二、添加旋转滑块一、说明在本教程中，我们
Python实现链接MinIO，并将文件数据从MinIO批量下载并保存到本地写python的鑫哥 Python课堂 python MinIO 文件下载数据存储存储桶 Buckets 文件夹下载
前言本文是该专栏的第43篇，后面会持续分享python的各种干货知识，值得关注。MinIO是一个高性能的对象存储服务，它兼容亚马逊S3云存储服务接口，非常适合于存储大容量非结构化的数据，比如说“图片、视频、日志文件、备份数据和容器/虚拟机镜像”等。MinIO原生支持Kubernetes，可以用于构建云存储服务。MinIO可以在标准硬件上运行，非常适合私有云和边缘计算场景。MinIO提供了存储桶级粒
基于深度学习的大规模模型训练 SEU-WYL 深度学习dnn 深度学习人工智能 dnn
基于深度学习的大规模模型训练涉及训练具有数百万甚至数十亿参数的深度神经网络，以处理复杂的任务，如自然语言处理、计算机视觉和语音识别。以下是关于基于深度学习的大规模模型训练的详细介绍：1.背景和动机数据和模型规模增长：随着数据量和模型复杂度的增加，传统的单机或小规模集群训练难以满足需求。计算资源需求：大规模模型训练需要大量计算资源和存储，单一设备无法满足。任务复杂性：处理复杂任务（如GPT-3、BE
Python打印等边三角形 weixin_33720956 python ui 开发工具
示例1:#!/usr/bin/python#-*-coding:UTF-8-*-#根据输入打印rows=int(raw_input('pleaseinputnumber:'))#等边三角形foriinrange(0,rows+1):forjinrange(0,rows-i):print"",j+=1forkinrange(0,2*i-1):ifk==0ork==2*i-2ori==rows:ifi
python输出星号等腰三角形_Python 打印矩形、直角三角形、等腰三角形、菱形 weixin_39594296 python输出星号等腰三角形
#1）打印一个星号print('*')ViewCode#2）打印一行6个星号******foriinrange(6):print('*',end='')ViewCode#3）打印6列星号******
柯西变异和正余弦改进的麻雀搜索算法及python实现闲人编程进阶算法案例 python 人工智能开发语言柯西变异正余弦改进麻雀搜索
目录柯西变异和正余弦改进的麻雀搜索算法第一部分：麻雀搜索算法概述1.1麻雀搜索算法简介1.2算法特点1.3算法流程1.初始化阶段2.觅食者搜索阶段3.监视者逃逸阶段4.判断收敛条件1.4公式描述第二部分：改进方法——柯西变异与正余弦机制2.1改进思路2.2柯西变异公式2.3正余弦公式2.4改进后的流程第三部分：基于改进麻雀搜索算法的Python实现第四部分：案例1——函数优化问题（适配器模式）Ra
Python中的海象运算符（:=）：让代码更简洁高效叫我DPT python python
Python中的海象运算符（:=）：让代码更简洁高效目录引言：什么是海象运算符？语法与基本用法使用场景与优势注意事项与潜在陷阱总结1.引言：什么是海象运算符？海象运算符（:=）是Python3.8版本引入的新特性，因其符号:=形似海象的眼睛和牙齿而得名。它的主要功能是在表达式中同时完成赋值和返回值操作，简化需要重复计算的场景。为什么要用它？传统写法中，若需要在条件判断或循环中使用某个表达式的值，可
python打印等边三角形早日成大佬 python 前端 javascript
i=4num=4whilei>0:i-=1forjinrange(i):print("",end='')forkinrange(num-i):print("*",end='')print()
【SpringMVC】——Json数据交互处理 Y小夜 ssm框架 json
个人主页：【Y小夜】作者简介：一位双非学校的大二学生，编程爱好者，专注于基础和实战分享，欢迎私信咨询！入门专栏：【MySQL，Java基础，Rust】热门专栏：【Python，Javaweb，Vue框架】感谢您的点赞、关注、评论、收藏、是对我最大的认可和支持！❤️目录Json概述Json构成要素JSON与JavaScript的关系JSON的优点JSON的应用JSON工具的使用返回json字符串统一
【python】字典介绍 Yui_ python python 数据库开发语言学习笔记编程
文章目录1.函数2.列表与元组3.字典3.1创建字典3.2查找key3.3新增修改元素3.4删除元素3.5遍历字典元素3.6取出所有key和value3.7合法的key类型1.函数函数2.列表与元组列表与元组3.字典字典是一种存储键值对的结构。和生活中的字典一样，当你查一个英语的意思时：apple就对应着苹果。它们就是一个键值对，其中apple就是key，而苹果就是value。这些键（key）和值
【学习心得】几种特殊但非常必要学习的pip安装小知识小oo呆【学习心得】学习 pip python
在学习Python全栈的过程中要接触非常多的库，很多库都是直接pipinstall就搞定了！但有一些总是特立独行！一、安装时的名字与导包时名字不同的首先举例大名鼎鼎的OpenCV#安装OpenCVpipinstallopencv-python#导包importcv2再来一个大名鼎鼎的sklearn#安装pipinstallscikit-learn#导包举例fromsklearn.preproces
AttributeError: ‘NoneType‘ object has no attribute ‘xxx‘v m0_69514319 python 开发语言
分析：在Python中，NoneType是一个类型，如同int、float一样。如：>>>a=None>>>type(a)>>>a=1>>>type(a)注：Nonetype类型不支持任何运算也没有内建方法解决方法：本案例中通过jsonpath读取json格式的数据时，使用了$.access_token,即路径使用了相对路径，应改成绝对路径。当再次实验时因为移动了文件夹再次导致同样的报错，修改绝对
【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.25 视觉风暴：NumPy驱动数据可视化精通代码大仙 numpy python numpy python 信息可视化
1.25视觉风暴：NumPy驱动数据可视化目录视觉风暴：NumPy驱动数据可视化百万级点云实时渲染优化CT医学影像三维重建实战交互式数据分析看板开发地理空间数据可视化进阶WebAssembly前端渲染融合1.25.1百万级点云实时渲染优化1.25.2CT医学影像三维重建实战1.25.3交互式数据分析看板开发1.25.4地理空间数据可视化进阶1.25.5WebAssembly前端渲染融合视觉风暴：N
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。