扬州小栗旬

cs224笔记：Lecture 6 Language Models and RNNs

Language Models and RNNs

1 Language Model

Language Model is the task of predicting what word comes next.
更正式的：给定一个单词序列， $\mathbf{x}^{(1)},\mathbf{x}^{(2)},...,\mathbf{x}^{(t)}$ ，预测下一个单词 $\mathbf{x}^{(t+1)}$ 的概率分布。
$p(\mathbf{x}^{(t+1)}|\mathbf{x}^{(1)},\mathbf{x}^{(2)},...,\mathbf{x}^{(t)})$
$\mathbf{x}^{(t+1)}$ 可以是单词表 $V=\{w_1,...,w_{|V|}\}$ 中的任意单词。这样的系统成为language model，也可以理解为给一段文本分配概率。
$p(\mathbf{x}^{(1)},\mathbf{x}^{(2)},...,\mathbf{x}^{(t)})=p(\mathbf{x}^{(1)})\times p(\mathbf{x}^{(2)}|\mathbf{x}^{(1)})\times \cdots \times p(\mathbf{x}^{(T)}|\mathbf{x}^{(T-1)},\mathbf{x}^{(T-2)},...,\mathbf{x}^{(1)})\\ =\prod_{t=1}^Tp(\mathbf{x}^{(t)}|\mathbf{x}^{(t-1)},...,\mathbf{x}^{(1)})$

Language Model是一个benchmark task，可以帮助我们评估对语言的理解的程度。
同时，Language Model是许多NLP任务的组成部分(subcomponent)，尤其是对于那些包含文本生成(generating text)和估计给定文本概率(estimating the probability of text)的任务。
• Predictive typing
• Speech recognition
• Handwriting recognition
• Spelling/grammar correction
• Authorship identification
• Machine translation
• Summarization
• Dialogue
• etc.

2 n-gram Language Models

n-gram 就是n个连续的单词，根据n的不同，有不同的类型，比如对于同一句话 the students opened their __ 有：
unigram: “the” “students” “opened” “their”
bigram：“the students” “students opened” “opened their”
trigram: “the students opened” “students opened their”
4-gram: “the students opened their”
可以看出n越大涵盖的信息多，模型相较就会更精准一些。

n-gram language model的思想就是统计不同n-gram出现的频率，用于预测单词。(其实就是简单的counts)
首先，n-gram language model的简单假设就是一个单词 $\mathbf{x^{(t)}}$ 只依赖于它前面的n-1个单词，即：
$p(\mathbf{x}^{(t+1)}|\mathbf{x}^{(t)},\mathbf{x}^{(t-1)},...,\mathbf{x}^{(1)}) = p(\mathbf{x}^{(t+1)}|\mathbf{x}^{(t)},\mathbf{x}^{(t-1)},...,\mathbf{x}^{(t-n+2)})$
然后根据条件概率定义计算它，
$p(\mathbf{x}^{(t+1)}|\mathbf{x}^{(t)},\mathbf{x}^{(t-1)},...,\mathbf{x}^{(t-n+2)})=\frac{p(\mathbf{x}^{(t+1)},\mathbf{x}^{(t)},...,\mathbf{x}^{(t-n+2)})}{p(\mathbf{x}^{(t)},...,\mathbf{x}^{(t-n+2)}))}$
分子是n-gram出现的概率，分母是(n-1)-gram出现的概率，通过对大规模语料库的统计，可以获得这两个概率的近似(statistical approximation)，即：
$\frac{p(\mathbf{x}^{(t+1)},\mathbf{x}^{(t)},...,\mathbf{x}^{(t-n+2)})}{p(\mathbf{x}^{(t)},...,\mathbf{x}^{(t-n+2)}))} \approx \frac{count(x^{(t+1)},x^{(t)},...,x^{(t-n+2)})}{count(x^{(t)},...,x^{(t-n+2)})}$
e.g. 学习一个4-gram language model，句子为：
$__ \text{as the proctor started the clock, the students opened their \_\_ }$

$p(w|\text{ students opened their }) = \frac{count(\text{ students opened their w })}{count(\text{ students opened their })}$

假设在语料库中，"students opened their"出现了1000次，"students opened their books"出线了400次，"students opened their exams"出线了100次，则
$p(\text{books}|\text{ students opened their }) = \frac{count(\text{ students opened their books })}{count(\text{ students opened their })} = 0.4 \\ p(\text{exams}|\text{ students opened their }) = \frac{count(\text{ students opened their examss })}{count(\text{ students opened their })} = 0.1 \\$

N-gram language model的问题

Sparsity Problem(稀疏问题)

$p(w|\text{ students opened their }) = \frac{count(\text{ students opened their w })}{count(\text{ students opened their })}$

首先是分子的问题，“students opened their w”有可能没在语料库出现过，所以这个概率为0。
解决：给每个单词 $w\in V$ 都加上一个很小的值 $\delta$ ，这个方法称为smoothing。

然后是分母的问题，“students opened their”有可能没出现过，这样对于任何概率都无法计算。
解决：backoff(回退)，统计"opened their"作为替代。

Storage Problem(存储问题)

对于每一个出现过的n-gram都需要存储下来，随着n的增大，要存储的规模也会增大。

所以引出了一个矛盾，我们希望大一点n使得模型更加精确，但是n越大会引发sparsity problem和storage problem。

3 Neural Language Models

a fixed-window language model

$__ \text{as the proctor started the clock, the students opened their \_\_}$

还是同样的例子，假设window大小为4，则我们的模型只用到"the students opened their"来预测下一个单词。

其中输入 $\mathbf{x}^{(1)},\mathbf{x}^{(2)},\mathbf{x}^{(3)},\mathbf{x}^{(4)}$ 为one-hot编码的向量，接着将词嵌入(word embedding)后的词向量拼接(concatenation)成一个向量 $\mathbf{e}=[\mathbf{e}^{(1)};\mathbf{e}^{(2)};\mathbf{e}^{(3)};\mathbf{e}^{(4)}]$ ，然后经过一个隐层， $\mathbf{h}=f(\mathbf{W}\mathbf{e}+\mathbf{b_1})$ ，最后softmax输出获得概率分布， $\hat{\mathbf{y}}= softmax(\mathbf{U}\mathbf{h}+\mathbf{b_2})\in \mathbb{R}^{|V|}$

相较n-gram模型的改进：

没有sparsity问题；
不需要存储观测到的所有n-gram。

存在的问题：

固定窗口(fixed window)不够大，扩大窗口就相当于扩大 $\mathbf{W}$ ，因而窗口不能太大；
因为各个单词通过拼接组成的 $\mathbf{e}$ ，使得不同的单词对应 $\mathbf{W}$ 矩阵不同的位置，这样相当于丢失了机器学习很重要的特性–共享权重。例如：
$\mathbf{W}\mathbf{e} = [\mathbf{w_1},\mathbf{w_2},\mathbf{w_3},\mathbf{w_4}] \left [ \begin{array}{ccc}{\mathbf{e_1}} \\{\mathbf{e_2}}\\{\mathbf{e_3}}\\{\mathbf{e_4}} \end{array} \right ]$
可以看出 $\mathbf{W}$ 中不同块对应不同的单词，即丢失了对称性(symmetry)。

4 RNN Language Models

4.1 RNN(Recurrent Neural Network)

Core idea: 重复的运用同一个权重 $\mathbf{W}$ 。可以同上面fixed window neural做比较，RNN中 $\mathbf{W}$ 会重复用在输入序列每个词上面。

4.2 a RNN Language Model

如图，输入为one-hot编码的词向量 $\mathbf{x}^{(t)}$ ，首先词嵌入(word embedding)成稠密向量 $\mathbf{e}^{(t)}=\mathbf{E}\mathbf{x}^{(t)}$ ，接着隐层计算，每个隐层的输入 $\mathbf{h}^{(t)}$ 包括 $\mathbf{x}^{(t)}$ 和上一时刻的隐层 $\mathbf{h}^{(t-1)}$ ， $\mathbf{h}^{(t)}=\sigma(\mathbf{W_h}\mathbf{h}^{(t-1)}+\mathbf{W_e}\mathbf{e}^{(t)}+\mathbf{b_1})$ ，最后输入通过softmax获取概率分布， $\hat{\mathbf{y}}^{(t)}= softmax(\mathbf{U}\mathbf{h}^{(t)}+\mathbf{b_2})\in \mathbb{R}^{|V|}$ 。这里任意时刻都可以获得输出，取决于你想让模型做什么样的预测。此外输入序列可以任意长度。

RNN优点：

可以处理任意长度的序列；
在时刻t的计算，可以获取到很多步前的输入信息；
模型规模不会随着输入序列增大而增大；
权重 $\mathbf{W}$ 应用到每个时刻的输入上，所以对于任意的输入，权重 $\mathbf{W}$ 有对称性(symmetry)。

RNN缺点:

循环计算(recurrent computation)很慢；
很难获取到很多步前的信息；

4.3 训练RNN Language Model

给定一个文本的语料库(corpus)，由单词序列组成 $\mathbf{x}^{(1)},\mathbf{x}^{(2)},...,\mathbf{x}^{(T)}$ 。对于RNN-LM，在每一步t，计算输出概率分布 $\mathbf{\hat{y}}^{(t)}$ ，即根据之前的所有单词，预测下个单词。

每一步t的损失函数定义为预测概率分布 $\mathbf{\hat{y}}^{(t)}$ 与真实的下个个单词 $\mathbf{y}^{(t)}$ ( $\mathbf{x}^{(t+1)}$ 的one-hot)之间的互熵损失(cross entropy):
$J^{(t)}(\theta)=CE(\mathbf{y}^{(t)},\mathbf{\hat{y}}^{(t)})=-\sum_{w\in \mathbf{V}}\mathbf{y}_w^{(t)}\log\mathbf{\hat{y}}_w^{(t)} =-\log\mathbf{\hat{y}}_{\mathbf{x}_{t+1}}^{(t)}$
总的损失(overall loss)为整个训练集loss的均值：
$J(\theta)=\frac{1}{T}\sum_{t=1}^{T} J^{(t)}(\theta)=\frac{1}{T}\sum_{t=1}^{T}-\log\mathbf{\hat{y}}_{\mathbf{x}_{t+1}}^{(t)}$
但是在整个语料库上计算损失(loss)和梯度(gradient) too expensive，实践中在一个句子上或者一个文本上做计算。

4.4 Backpropagation for RNNs

Multivariable Chain Rule

给定一个多变量(multivariable)函数 $f (x, y)$ ，其中 $x (t)$ 和 $y (t)$ 是单变量(single variable)函数，下面是multivariable chain rule：
$\frac{d}{d_t}f\left( x(t),y(t) \right )=\frac{\partial f}{\partial x}\frac{dx}{dt} + \frac{\partial f}{\partial y}\frac{dy}{dt}$

所有对于RNN权重 $\mathbf{W}$ 的梯度计算如图，也就是运用multivariable chain rule将每个时刻对权重 $\mathbf{W}$ 的梯度加起来：

关于 $\frac{\partial J^{(t)}}{\partial \mathbf{W}_h} =\sum_{t=1}^t {\frac{\partial J^{(t)}}{\partial \mathbf{W}_h}}\vert_i$ 的计算为按照时间 $i = t, . . ., 0$ 反向传播，将梯度加起来，算法被称为backpropagation through time(BPTT)。

评估Language Model

对于language model一个标准的评估度量是perplexity (perplexity越小越好)
$\prod_{t=1}^T{\left(\frac{1}{P_{LM}(\mathbf{x}^{(t+1)}|\mathbf{x}^{(t)},...,\mathbf{x}^{(1)}) } \right)} ^{1/T}$
等价于互熵损失的指数：
$\begin{aligned} &=\prod_{t=1}^T{\left(\frac{1}{\mathbf{\hat{y}}_{\mathbf{x}_{t+1}}^{(t)}} \right)} ^{1/T}\\ &= exp(\frac{1}{T}\sum_{t=1}^{T}-\log\mathbf{\hat{y}}_{\mathbf{x}_{t+1}}^{(t)})\\ &=exp(J(\theta)) \end{aligned}$

你可能感兴趣的:(CS224n,NLP,with,DL)

用自定义注解解决excel动态表头导出的问题 Java知识技术分享 java技术 excel java intellij-idea 数据库
导入的excel有固定表头+动态表头如何解决自定义注解：importjava.lang.annotation.*;/***自定义注解，用于动态生成excel表头*/@Target(ElementType.FIELD)@Retention(RetentionPolicy.RUNTIME)public@interfaceFieldLabel{//字段中文Stringlabel();//字段顺序into
【Python】车牌自动识别幽兰的天空 Python python opencv
实现车牌自动识别（LicensePlateRecognition,LPR）是计算机视觉和深度学习领域中的一个常见任务。用Python和OpenCV，结合其他深度学习库，可以建立一个简单的车牌识别系统。以下是一个基于这两者的基本实现思路和示例代码。实现步骤环境准备：安装必要的库：bashpipinstallopencv-pythonopencv-python-headlessnumpypillowp
自定义注解的使用 Java知识技术分享 java技术 java spring 后端
自定义注解/***自定义注解*/@Target(ElementType.FIELD)@Retention(RetentionPolicy.RUNTIME)public@interfaceFieldLabel{//字段中文Stringlabel();//字段顺序intorder()default0;//分组标识Stringgroup()default"default";}解析自定义注解：//1、获取
Day44
1.预训练概念：在大规模数据上训练模型学习通用知识，再迁移到下游任务微调2.常见模型：图像有AlexNet、ResNet、ViT；NLP有BERT、GPT3.图像模型发展：从手工特征到深度学习，从CNN到Transformer、多模态4.预训练策略：数据增强、自监督/监督训练、模型微调、多模态学习作业1.importtorchimporttorch.nnasnnimporttorch.optima
Python, Rust 开发机关事业单位公文写作助手APP
#机关事业单位公文写作助手应用设计基于Python和Rust开发机关事业单位公文写作APP的方案如下：##系统架构设计```桌面端/Web应用(Tauri/Vue.js)|RESTAPI/WebSocket|Rust核心服务(Actix-web/Axum)←───PythonNLP服务(FastAPI)|公文要素提取/模板生成/智能校对PostgreSQL数据库|Redis缓存(模板缓存/会话管理
【大模型面试】大模型Prompt Engineer面试题及参考答案大模型知识 prompt 人工智能开发语言 python chatgpt 深度学习大模型
一、基础概念类1.什么是大模型？大模型通常指具有庞大参数规模的机器学习模型，尤其是在自然语言处理（NLP）和计算机视觉等领域。这些模型能够学习到大量数据中的复杂模式和特征，具备强大的泛化能力，可在多种任务上表现出色，如GPT系列、BERT等。2.大模型与传统机器学习模型的区别是什么？传统机器学习模型参数规模相对较小，往往针对特定任务进行设计和训练，需要较多人工特征工程。而大模型参数数量庞大，通过在
Spring Boot + 本地部署大模型实现：基于 Ollama 的集成实践
在当今的软件开发中，将大语言模型集成到本地应用中已经成为一种趋势。SpringBoot作为Java开发中的一个流行框架，提供了强大的功能来构建和部署应用。本文将介绍如何在SpringBoot应用中集成本地部署的大模型，特别是通过Ollama这个工具来实现。一、环境准备在开始之前，确保你的开发环境已经安装了以下工具和库：JDK1.8或更高版本Maven或Gradle作为项目管理工具SpringBoo
Mathematical Analysis study notes[1] 海边的水水 Computational Mathematics 数学分析
文章目录realnumbersandlimitreferencesrealnumbersandlimitanumberxxxcanbecallrealnumberduetothatitmustberepresentedwithx=abx=\fracabx=bawhenthea,ba,ba,bareintegernumbersandb≠0b\neq0b=0.arealnumberisclosedu
Java 多线程上下文传递在复杂场景下的实践倾听铃的声后端 java jvm 开发语言微服务分布式
一、引言海外商城从印度做起，慢慢地会有一些其他国家的诉求，这个时候需要我们针对当前的商城做一个改造，可以支撑多个国家的商城，这里会涉及多个问题，多语言，多国家，多时区，本地化等等。在多国家的情况下如何把识别出来的国家信息传递下去，一层一层直到代码执行的最后一步。甚至还有一些多线程的场景需要处理。二、背景技术2.1ThreadLocalThreadLocal是最容易想到了，入口识别到国家信息后，丢进
《Spring 中上下文传递的那些事儿》 Part 1：ThreadLocal、MDC、TTL 原理与实践
Part1：ThreadLocal、MDC、TTL原理与实践在Java应用开发中，线程上下文信息传递是一个非常常见但又容易被忽视的问题。尤其是在多线程或异步编程场景下，如何保证当前请求的上下文（如用户身份、traceId、租户信息等）能够在整个调用链中正确传递，是构建稳定系统的关键。本文将带你深入理解三种最常见的上下文管理方案：ThreadLocal、MDC和TTL，并结合Spring框架和实际业
python for android api,python-for-android
python-for-androidpython-for-androidisapackagingtoolforPythonappsonAndroid.YoucancreateyourownPythondistributionincludingthemodulesanddependenciesyouwant,andbundleitinanAPKalongwithyourowncode.Feature
MyBatis-Plus 实战：优雅处理 JSON 字段映射（以 JSONArray 为例） William Dawson mybatis json
MyBatis-Plus实战：优雅处理JSON字段映射（以JSONArray为例）‍作者：WilliamDawson｜更新日期：2025-04-21标签：MyBatis-Plus、JSON、TypeHandler、@TableField、@TableName、FastJSON在使用MyBatis-Plus进行业务开发时，我们时常需要把数据库中的JSON字段（比如字符串形式的数组）自动映射成Java
jenkins maven项目构建踩坑奇缘志骄✘ jenkins maven
jenkinsmaven项目构建踩坑Nogoalshavebeenspecifiedforthisbuild.Youmustspecifyavalidlifecyclephaseoragoalintheformat:or:[:]:.Availablelifecyclephasesare:pre-clean,clean,post-clean,validate,initialize,generate-
设计模式（九）醇醛酸醚酮酯设计模式设计模式
职责链模式（ChainofResponsibility）详解一、核心概念职责链模式将请求的发送者和接收者解耦，使多个对象都有机会处理请求。这些对象连接成一条链，请求沿着链传递，直到有一个对象处理它为止。该模式允许动态调整处理者的顺序或组合，增强系统灵活性。核心组件：抽象处理者（Handler）：定义处理请求的接口，包含对下一个处理者的引用。具体处理者（ConcreteHandler）：实现处理请求
Linux|ubuntu22.04安装CUDA最新完整教程
文章目录一、安装前准备工作查看GPU和型号查看GCC版本*下载gcc12*检查驱动二、安装CUDAToolkit*安装驱动三、安装后的工作必要操作推荐的操作开启守护进程模式删除本地下载安装包四、验证删除CUDA常见问题及解决方案还需要安装cuDNN吗？nvcc:Nosuchfileordirectory“errorwhileloadingsharedlibraries::cannotopensha
命令模式 - Flutter中的操作封装大师，把“动作“变成可管理的对象！明似水 flutter 命令模式 flutter
痛点场景：绘图应用的操作管理假设你在开发一个绘图App，需要支持：添加/删除图形修改图形属性撤销/重做操作批量执行命令传统实现方式：void_handleAddShape(ShapeTypetype){finalshape=_createShape(type);setState(()=>_shapes.add(shape));}void_handleDeleteShape(Shapeshape){
AI产品经理技术篇：AI领域常用术语解析让我看看好学吗人工智能产品经理机器学习深度学习学习
作为AI产品经理，深入理解人工智能领域的核心术语是高效沟通、需求定义和产品落地的关键。无论是与算法工程师协作优化模型，还是向业务方解释技术方案，准确掌握专业术语能显著提升决策效率，避免因概念混淆导致的开发偏差。本文系统梳理了模型与算法、NLP（自然语言处理）、CV（计算机视觉）、数据处理、核心评估指标等领域的核心术语，帮助产品经理快速构建AI技术认知框架。目录1.基础概念2.模型与算法3.自然语言
大模型微调到底有没有技术含量？ DeepSeek-大模型系统教程人工智能语言模型 ai 大模型大模型微调程序员 AI大模型
今天给大家带来知乎好友@ybq的一篇回答-大模型微调到底有没有技术含量，或者说技术含量到底有多大？老生常谈的一句话吧：有没有技术含量取决于这个工作你怎么做，尤其是llm方向，上手门槛相比传统NLP变得更低了。我举一些例子吧，针对大模型微调的几个重要环节，我列举的每一种做法大概率都能完成最终目标，甚至说训出来的模型效果都没什么差别。但对个人能力成长的帮助就大不相同了。数据工作做法1:继承实验室或者同
Android Studio在移动开发中的性能优化案例分析移动开发前沿 android studio 性能优化 android ai
AndroidStudio在移动开发中的性能优化案例分析关键词：AndroidStudio、移动开发、性能优化、内存管理、CPU优化、APK大小优化、工具链摘要：本文深入解析AndroidStudio在移动开发中的核心性能优化能力，通过内存管理、CPU调度、APK体积优化等典型场景的实战案例，系统讲解Profiler、Lint、Gradle等工具链的深度应用。结合具体代码示例和数学模型，分析内存泄
【教程4＞第7章＞第26节】基于FPGA的RS(204,188)译码verilog实现10——RS译码模块整体实现与性能仿真评估 fpga和matlab #第7章·通信—信道编译码 fpga开发 RS verilog RS译码教程4
本课程学习成果预览目录1.软件版本2.RS译码模块整体实现介绍2.1伴随式计算（SyndromeCalculation）2.2擦除位置处理（ErasureHandling）2.3多项式乘法（PolynomialMultiplication）2.4欧几里得算法（EuclideanAlgorithm）2.5钱搜索（ChienSearch）3.RS译码模块整体FPGA实现4.RS译码仿真测试5.视频操作
Llama改进之——SwiGLU激活函数愤怒的可乐 #自然语言处理 NLP项目实战 llama
引言今天介绍LLAMA模型引入的关于激活函数的改进——SwiGLU1，该激活函数取得了不错的效果，得到了广泛地应用。SwiGLU是GLU的一种变体，其中包含了GLU和Swish激活函数。GLUGLU(GatedLinearUnits,门控线性单元)2引入了两个不同的线性层，其中一个首先经过sigmoid函数，其结果将和另一个线性层的输出进行逐元素相乘作为最终的输出：GLU(x,
【SpringBoot】深度解析 Spring Boot 拦截器：实现统一功能处理的关键路径 GGBondlctrl SpringBoot spring boot java 后端拦截器
前言本期讲解关于拦截器的详细介绍~~~感兴趣的小伙伴看一看小编主页：GGBondlctrl-CSDN博客你的点赞就是小编不断更新的最大动力那么废话不多说直接开整吧~~目录️1.拦截器1.1拦截器快速入门1.⾃定义拦截器2.配置拦截器1.2拦截器的详解1.拦截路径2.拦截器执行流程1.3登录校验1.定义拦截器2.配置拦截器️2.总结️1.拦截器强制登录的功能,后端程序根据Session来判断⽤⼾是否
C# 的DllImport CHANGHAI1982 编程交流 C#c#api winapi dll .net google
最近在读《编程之美》，打算用C#实现其中一个题目，就是如何控制CPU的使用率在50%，使得在资源管理器中CPU利用率维持在一条直线。单核的还容易办到，但是现在的机器一般都是多核的，这样就需要调用Win32APISetThreadAffinityMask来给线程制定CPU去执行。但这个API只能在C++调用，那么在C#里如何调用呢？更进一步，就是在C#里为什么没有全部的WIN32API可以调用呢？有
C#基础（DllImport） aaiier C#c#开发语言
‍♂️1.什么是DllImport？一句话解释：DllImport是C#的“借书证”，用来借Windows系统自带的“魔法工具”（比如弹出消息框、播放声音）。2.超简单三步魔法！✅第一步：告诉电脑你要借谁的魔法usingSystem.Runtime.InteropServices;//先拿好“借书证”✅第二步：写下魔法咒语（DllImport）[DllImport("kernel32.dll")]
odbc连接失败，SQLSTATE=IM003，由于系统错误193：指定的驱动无法加载 odbcjt32.dll
问题说明前几天有用户反馈在他电脑上运行我们开发的程序报错，错误信息为“odbc连接失败，SQLSTATE=IM003，由于系统错误193：指定的驱动无法加载odbcjt32.dll”。通过电话联系用户，询问用户是在做什么操作时出现的错误，最终分析发现出错的时机是程序连接本地access数据库的时候。用户电脑是64位的Win7系统，我们的系统是C#编写的x86格式的可执行程序。处理过程通过在
Unity使用讯飞语音模型(语音合成+语音识别+语音唤醒)Window端SDK 苏轼轼语音识别人工智能
1.查看官方文档、登录并下载我们所需的SDK。语音唤醒需要我们设置唤醒词。讯飞智能语音SDK文档官网讯飞智能语音产品介绍官网在控制台下载对应SDK，由于讯飞官方只提供了C++/C语音版本，我们需要用C#调用下载SDK的dll库文件。2.将dll库拖进Unity项目中如果目标设备为64位，我们选择msc_x64.dll；如果是32位，我们选择msc.dll。另外我们如果要使用语音唤醒功能，还需要wa
C++中那些不为人知的秘密独孤求拜1024 c++开发语言
1.换行的秘诀大部分菜鸟接触到C++用的换行都是endl，但是endl太慢!。"\n"比endl快很多倍，举个例子大家就知道了。endl#includeusingnamespacestd;intmain(){for(inti=1;iusingnamespacestd;intmain(){for(inti=1;i#defineendl"\n"usingnamespacestd;intmain(){f
Python爬虫实战：研究stdlib库相关技术 ylfhpy 爬虫项目实战 python 爬虫前端开发语言 stdlib 标准库
1.引言1.1研究背景与意义在当今信息爆炸的时代，互联网上的数据量呈指数级增长。网络爬虫作为一种自动获取网页内容的工具，在信息检索、数据挖掘、舆情分析等领域发挥着重要作用。Python由于其简洁的语法和丰富的库支持，成为开发网络爬虫的首选语言。本文旨在探讨如何利用Python标准库构建一个功能完整的网络爬虫系统，避免依赖过多第三方库，提高系统的可移植性和稳定性。1.2研究目标本文的研究目标是设计并
AWS WebRTC：根据viewer端拉流日志推算视频帧率和音频帧率
viewer端拉流日志是这样的：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId:140092278368896,Size:160,Flags32107293682025-06-1207:19:26.283VERBOSEsampleAudioFrameHandler():AudioFramereceive
AWS WebRTC: 判断viewer端拉流是否稳定的算法 Jasper张 AWS WebRTC webrtc aws 服务器 linux
在使用sdk-cviewer端进行拉流的过程中，viewer端拉取的是视频帧和音频帧，不会在播放器中播放，所以要根据收到的流来判断拉流过程是否稳定流畅。我这边采用的算法是：依据相邻帧之间的时间间隔是否落在期望值的±20%范围内。音频帧、视频帧的日志打印如下：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他