MADAO__G

tensorflow学习笔记(二)-PTBModel初步解析

前言

本人最近正在学习深度学习以及tensorflow，在此记录一些学习过程中看到的有价值的参考资料，并且写下一点我自己的初步理解。

环境

win10 64+anaconda3(python3.5)+tensorflow0.12.1

关于windows下CUDA等配置，请参考下文：

windows 10 64bit下安装Tensorflow+Keras+VS2015+CUDA8.0 GPU加速
部分参考/推荐资料

tensorflow官方引导文档

Udacity深度学习(即谷歌深度学习公开课)

网友multiangle深度学习笔记

运用TensorFlow处理简单的NLP问题
笔记目录
- tensorflow学习笔记(一)-基础模型
- tensorflow学习笔记(二)-PTBModel初步解析

一、PTB

本人所用anaconda3,ptb位于Anaconda3\Lib\site-packages\tensorflow\models\rnn\ptb目录下，共包含

ptb_word_lm.py
reader.py

两个主要文件。其中reader是PTB模型处理数据的工具包。PTBModel、main都位于ptb_word_lm中。

和之前的Tutorial一样，PTB也是分为构建抽象模型和训练两大步骤。

官方文档位于：https://www.tensorflow.org/tutorials/recurrent

配置说明

这份官方代码非常有心的设置了4种不同大小的配置，分别为small，medium、large和test，以small为例：

class SmallConfig(object):
   """Small config."""
   init_scale = 0.1    # 相关参数的初始值为随机均匀分布，范围是[-init_scale,+init_scale]
   learning_rate = 1.0 # 学习速率，此值还会在模型学习过程中下降
   max_grad_norm = 5   # 用于控制梯度膨胀，如果梯度向量的L2模超过max_grad_norm，则等比例缩小
   num_layers = 2      # LSTM层数
   num_steps = 20      # 分隔句子的粒度大小，每次会把num_steps个单词划分为一句话(但是本模型与seq2seq模型不同，它仅仅是1对1模式，句子长度应该没有什么用处)。
   hidden_size = 200   # 隐层单元数目，每个词会表示成[hidden_size]大小的向量
   max_epoch = 4       # epochmax_epoch时,lr_decay逐渐减小
   max_max_epoch = 13  # 完整的文本要循环的次数
   keep_prob = 1.0     # dropout率，1.0为不丢弃
   lr_decay = 0.5      # 学习速率衰减指数
   batch_size = 20     # 和num_steps共同作用，要把原始训练数据划分为batch_size组，每组划分为n个长度为num_steps的句子。
   vocab_size = 10000  # 单词数量(这份训练数据中单词刚好10000种)

另有以下配置，可以设置要选用的config(下面为small)、数据地址、输出存储地址等。

flags = tf.flags
logging = tf.logging

flags.DEFINE_string(
   "model", "small",
   "A type of model. Possible options are: small, medium, large.")
flags.DEFINE_string("data_path", r'C:\Users\hasee\Desktop\tempdata\lstm\simple-examples\data', "data_path")
flags.DEFINE_string("save_path", r'C:\Users\hasee\Desktop\tempdata\lstm\simple-examples\data\res',
                   "Model output directory.")
flags.DEFINE_bool("use_fp16", False,
                 "Train using 16-bit floats instead of 32bit floats")

FLAGS = flags.FLAGS

PTBModel

在class PTBModel的init()中构建了一个抽象LSTM模型。

lstm_cell和initial_state
```
# Slightly better results can be obtained with forget gate biases


# initialized to 1 but the hyperparameters of the model would need to be


# different than reported in the paper.


# 注释指的是如果将forget_bias=0.0改为1.0会得到更好的结果，但是这将与论文中的描述不符。

lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(size, forget_bias=0.0, state_is_tuple=True)
if is_training and config.keep_prob < 1:
 lstm_cell = tf.nn.rnn_cell.DropoutWrapper(
     lstm_cell, output_keep_prob=config.keep_prob)
cell = tf.nn.rnn_cell.MultiRNNCell([lstm_cell] * config.num_layers, state_is_tuple=True)

self._initial_state = cell.zero_state(batch_size, data_type())
```
使用BasicLSTMCell构建一个基础LSTM单元，然后根据keep_prob来为cell配置dropout。最后通过MultiRNNCell将num_layers个lstm_cell连接起来。

在LSTM单元中，有2个状态值，分别是c和h。

更多基础知识请见tensorflow笔记：多层LSTM代码分析
- 问：为什么使用BasicLSTMCell而不是LSTMCell？
答：根据解读tensorflow之rnn ，官方文档给出如下描述：

BasicLSTMCell没有实现clipping，projection layer，peep-hole等一些lstm的高级变种，仅作为一个基本的basicline结构存在，如果要使用这些高级variant要用LSTMCell这个类。

由于我们现在只是想搭建一个基本的lstm-language model模型，现阶段BasicLSTMCell够用。这就是为什么这里用的是BasicLSTMCell这个类而不是别的什么。

embedding

with tf.device("/cpu:0"):
 embedding = tf.get_variable(
     "embedding", [vocab_size, size], dtype=data_type())
 # input_.input_data为外部输入的id形式的数据，通过embedding_lookup()将ids转换为词向量形式inputs。
 inputs = tf.nn.embedding_lookup(embedding, input_.input_data)

在这里embedding表示词向量矩阵。此矩阵共有vocab_size行(在这里为10000)，每一行都是一个hidden_size维向量，随着模型的训练，embedding内部权值会不断更新，最终可以得到各个词的向量表示。

outputs与loss

这里与基础模型的套路大致一致，但是需要注意一下次数为num_steps的循环，他做的就是rnn的展开，每一次会产生一个output和一个状态

outputs = []
state = self._initial_state
with tf.variable_scope("RNN"):
 for time_step in range(num_steps):
     if time_step > 0: tf.get_variable_scope().reuse_variables()
     # 这个cell(inputs[:, time_step, :], state)会调用tf.nn.rnn_cell.MultiRNNCell中的__CALL__()方法
     #  TODO __CALL__()的注释说：Run this multi-layer cell on inputs, starting from state.但是还没看该方法实际做了什么
     (cell_output, state) = cell(inputs[:, time_step, :], state)
     outputs.append(cell_output)

# 下面套路和基础模型一致，y=wx+b


# x=output,y=targets

output = tf.reshape(tf.concat(1, outputs), [-1, size])
softmax_w = tf.get_variable(
 "softmax_w", [size, vocab_size], dtype=data_type())
softmax_b = tf.get_variable("softmax_b", [vocab_size], dtype=data_type())
logits = tf.matmul(output, softmax_w) + softmax_b
self._logits=logits


# 将loss理解为一种更复杂的交叉熵形式：与基础模型中的代码类似：


# cross_entropy=tf.reduce_mean(-tf.reduce_sum(y * tf.log(a), reduction_indices=[1]))

loss = tf.nn.seq2seq.sequence_loss_by_example(
         [logits],
         [tf.reshape(input_.targets, [-1])],
         [tf.ones([batch_size * num_steps], dtype=data_type())])

# 上述loss是所有batch上累加的loss，取平均值作为_cost

self._cost = cost = tf.reduce_sum(loss) / batch_size
self._final_state = state

lr与梯度下降

参考解读tensorflow之rnn

在此lstm模型运行过程中需要动态的更新gradient值。

官方文档说明了这种操作：

并给出了一个例子：


# Create an optimizer.

opt = GradientDescentOptimizer(learning_rate=0.1)


# Compute the gradients for a list of variables.

grads_and_vars = opt.compute_gradients(loss, )


# grads_and_vars is a list of tuples (gradient, variable).  Do whatever you


# need to the 'gradient' part, for example cap them, etc.

capped_grads_and_vars = [(MyCapper(gv[0]), gv[1]) for gv in grads_and_vars]


# Ask the optimizer to apply the capped gradients.

opt.apply_gradients(capped_grads_and_vars)

模仿这个代码，我们可以写出如下的伪代码：

optimizer = tf.train.AdamOptimizer(learning_rate=self._lr)


# gradients: return A list of sum(dy/dx) for each x in xs.

grads = optimizer.gradients(self._cost, )
clipped_grads = tf.clip_by_global_norm(grads, config.max_grad_norm)


# accept: List of (gradient, variable) pairs, so zip() is needed

self._train_op = optimizer.apply_gradients(zip(grads, ))

此时就差一个不知道了，也就是需要对哪些variables进行求导,答案是：trainable variables:

tvars = tf.trainable_variables()

此时再看官方PTBModel中的代码：


# 在运行过程中想要调整gradient值，就不能直接简单的optimizer.minimize(loss)而是要显式计算gradients

self._lr = tf.Variable(0.0, trainable=False)
tvars = tf.trainable_variables()
grads, _ = tf.clip_by_global_norm(tf.gradients(cost, tvars),
                               config.max_grad_norm)
optimizer = tf.train.GradientDescentOptimizer(self._lr)
self._train_op = optimizer.apply_gradients(
 zip(grads, tvars),
 global_step=tf.contrib.framework.get_or_create_global_step())

self._new_lr = tf.placeholder(
 tf.float32, shape=[], name="new_learning_rate")
self._lr_update = tf.assign(self._lr, self._new_lr)

其中tf.clip_by_global_norm()可用于用于控制梯度爆炸的问题。

梯度爆炸和梯度弥散的原因一样，都是因为链式法则求导的关系，导致梯度的指数级衰减。为了避免梯度爆炸，需要对梯度进行修剪。详见tensorflow笔记：多层LSTM代码分析

main()

main首先要读取并处理数据、配置模型并且控制模型运转。

读取数据、设置config


# 在ptb_raw_data中已经将原始文本转换为id形式

raw_data = reader.ptb_raw_data(FLAGS.data_path)
train_data, valid_data, test_data, vocab_size = raw_data


# 原始数据刚好是10000个单词，所以不需要修改config.vocab_size


# 但是我有试过修改训练数据，所以加上了这句

config = get_config()
config.vocab_size=vocab_size

eval_config = get_config()
eval_config.batch_size = 1
eval_config.num_steps = 1
eval_config.vocab_size=vocab_size

重点关注ptb_raw_data()方法。此方法中有几个关键步骤：

根据训练数据构件单词表

word_to_id = _build_vocab(train_path)

def _build_vocab(filename):
 """
 此方法读取原始数据，将换行符替换为，然后根据词频构件一个词汇表并返回。
 """
 data = _read_words(filename)

 counter = collections.Counter(data)
 count_pairs = sorted(counter.items(), key=lambda x: (-x[1], x[0]))

 words, _ = list(zip(*count_pairs))
 word_to_id = dict(zip(words, range(len(words))))

 return word_to_id

def _read_words(filename):
 # 在这里讲换行符替换为了
 with tf.gfile.GFile(filename, "r") as f:
   return f.read().decode("utf-8").replace("\n", "").split()

将原始train/valid/test数据转换为id形式

根据上面得到的word_to_id词汇表对原始数据进行转化：

train_data = _file_to_word_ids(train_path, word_to_id)
valid_data = _file_to_word_ids(valid_path, word_to_id)
test_data = _file_to_word_ids(test_path, word_to_id)

生成/训练模型

以train模式为例：

with tf.name_scope("Train"):
 # PTBInput中根据config设置好batch_size等，还初始化了input(slice0)以及targetOutput(slice1)
 train_input = PTBInput(config=config, data=train_data, name="TrainInput")
 with tf.variable_scope("Model", reuse=None, initializer=initializer):
     m = PTBModel(is_training=True, config=config, input_=train_input)
 tf.scalar_summary("Training Loss", m.cost)
 tf.scalar_summary("Learning Rate", m.lr)

基本是初始化模型的标准套路，但是需要注意PTBInput()

在PTBInput中通过reader.ptb_producer()生成input和targets。

class PTBInput(object):
 """The input data."""

 def __init__(self, config, data, name=None):
     self.batch_size = batch_size = config.batch_size
     self.num_steps = num_steps = config.num_steps
     self.epoch_size = ((len(data) // batch_size) - 1) // num_steps
     # input是当前slice[batchsize*num_steps]，output是下一个slice同样是[batchsize*num_steps]
     self.input_data, self.targets = reader.ptb_producer(data, batch_size, num_steps, name=name)

在ptb_producer()中比较有趣的是最后几句：

def ptb_producer(raw_data, batch_size, num_steps, name=None):


# 其他代码与注释


i = tf.train.range_input_producer(epoch_size, shuffle=False).dequeue()
x = tf.slice(data, [0, i * num_steps], [batch_size, num_steps])
y = tf.slice(data, [0, i * num_steps + 1], [batch_size, num_steps])
return x, y

i的本质是range_input_producer()获得的一个FIFOQueue.dequeue()(个人认为近似一个函数)，外部调用x和y时就可以通过i不断更新自身的值。因为本模型要做的是预测下一个词，所以在这里y(target)就是x(input)右移一位。

tf中的队列和其他变量一样，是一种有状态的节点，其他节点可以把新元素插入到队列后端(rear)，也可以把队列前端(front)的元素删除。有如下例子：

q=tf.FIFOQueue(3,'float')
init=q.enqueue_many(([0.,0.,0.],))

x=q.dequeue()
y=x+1
q_inc=q.enqueue([y])


# 注意，如果不写sess会报错

with tf.Session() as sess:
 init.run()

 q_inc.run()
 q_inc.run()
 q_inc.run()

在sess中从队列前端取走一个元素，加上1之后，放回队列的后端。慢慢地，队列的元素的值就会增加，示意图如下：

更多信息请参考TensorFlow 官方文档中文版-线程和队列，

之后循环max_max_epoch次(文本重复次数)，循环过程中调整学习率，再调用run_epoch()训练模型。

with sv.managed_session() as session:
 for i in range(config.max_max_epoch):
     # 修改学习速率大小
     lr_decay = config.lr_decay ** max(i + 1 - config.max_epoch, 0.0)
     m.assign_lr(session, config.learning_rate * lr_decay)

     train_perplexity = run_epoch(session, m, eval_op=m.train_op,verbose=True)

run_epoch()

首先设置需要run获取的数据，如果eval_op不为空，那么调用它并让模型根据预设代码自动优化。

fetches = {
 "cost": model.cost,
 "final_state": model.final_state,
}
if eval_op is not None:
 fetches["eval_op"] = eval_op

for step in range(model.input.epoch_size):
 feed_dict = {}
 for i, (c, h) in enumerate(model.initial_state):
     feed_dict[c] = state[i].c
     feed_dict[h] = state[i].h

 vals = session.run(fetches, feed_dict)
 cost = vals["cost"]
 state = vals["final_state"]

 costs += cost
 iters += model.input.num_steps

 if verbose and step % (model.input.epoch_size // 10) == 10:
     print("%.3f perplexity: %.3f speed: %.0f wps" %
           (step * 1.0 / model.input.epoch_size, np.exp(costs / iters),
            iters * model.input.batch_size / (time.time() - start_time)))
return np.exp(costs / iters)

RoHS 简介 Channing Lewis 社会其他 rohs
RoHS（RestrictionofHazardousSubstancesDirective，限制有害物质指令）是欧盟制定的一项环保法规，旨在限制电气和电子设备中某些有害物质的使用，以减少这些产品对环境和人体健康的危害。RoHS限制的有害物质及其限量铅（Pb）：0.1%汞（Hg）：0.1%镉（Cd）：0.01%六价铬（Cr6+）：0.1%多溴联苯（PBB）：0.1%多溴二苯醚（PBDE）：0.1%
使用 Python 和 Tesseract 实现验证码识别一休哥助手 mfc c++
验证码识别是一个常见且实用的技术需求，尤其是在自动化测试和数据采集场景中。通过开源OCR（OpticalCharacterRecognition，光学字符识别）工具Tesseract，结合Python的强大生态，我们可以高效实现验证码识别任务。本篇博客将以详细步骤和代码示例，介绍如何使用Python和Tesseract实现验证码识别，包括原理解析、图像预处理、代码实现以及优化策略。一、验证码识别的
Guns框架基本介绍、下载、部署 liban121 Guns
什么是Guns?1、快速构建后台管理系统的框架（注意：是后台管理系统）2、Guns默认提供诸多业务系统的基本功能3、Guns集成诸多优秀的开源框架基本功能权限管理（用户管理，角色管理，部门管理）菜单管理，字典管理，业务日志，登录日志，监控管理，通知管理，代码生成（核心）Guns的部署第一步：下载Guns：https://gitee.com/stylefeng/guns版本选择:第二步：导入IDEA
二分查找算法 mcharleylei 算法 python
目录1、概述2、代码实现（1）递归实现（2）非递归实现1、概述二分查找又称折半查找，优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查
设计模式Python版抽象工厂模式小王子1024 设计模式Python版设计模式 python 抽象工厂模式
文章目录前言一、抽象工厂模式二、抽象工厂模式示例三、抽象工厂模式在Django框架中的应用前言GOF设计模式分三大类：创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式：关注类和对象之间的组合，包括适配器模式、桥接模式、组合模式、装饰模式、外观模式、享元模式和代理模式。行为型模式：关注对象之间的交互，包括职责链模式、命令模式、解
【技术点】用SQL语言操作关系型数据库Mysql中的数据（有练习资料） ^Mark_Zhang^ 后端开发数据库 sql mysql
用SQL语言操作关系型数据库Mysql中的数据一、增删改查增数据删数据改数据查数据二、触发器三、视图练习题目链接前言：之前操作的时候大多时候都是用GPT生成的sql语句（有一说一真的实用），但是缺少自己完整独立完成sql语句书写的能力，直到学校课程上到了数据库原理才意识到好像真的需要认真学一下这些sql语句了，另外为了方便各位练习达到学习效果，如果想要答案可以私我单独发。一、增删改查增删改查，也称
【树莓派入门系列】opencv安装 ^Mark_Zhang^ python opencv 人工智能
树莓派入门之Opencv库安装提示：本文树莓派4B所搭载的系统是Raspi11本教程不需要任何换源，直接用树莓派自带的源就行文章目录一、树莓派版本查看二、Opencv库安装1.扩大系统文件（常规操作）2.安装aptitude软件包3.CMake工具安装4.基础库安装5.opencv-python库5.注意点一、树莓派版本查看代码如下：uanme-a或lsb_release-a二、Opencv库安装
10-2.Android BuildConfig 之获取版本号与版本名（通过 BuildConfig 类方式获取、通过 PackageInfo 方式获取）我命由我12345 Android -简化编程开发语言 java-ee java android android-studio android studio android runtime
一、版本号与版本名版本号（versionCode）是一个整数，用于内部版本控制，每次发布新版本时，版本号必须递增，Android系统使用版本号来判断应用的更新版本名（versionName）是一个字符串，通常用于向用户展示应用的版本信息，它可以是任意格式，常见的格式是主版本号.次版本号.修订号（例如，1.0.0）二、定义版本号与版本名在模块级build.gradle文件中，定义版本号与版本名and
Red Hat 8.1 部署MySQL 5.7 云计算老王 mysql adb android
RedHat8.1部署MySQL5.7文章目录RedHat8.1部署MySQL5.7一、关闭防火墙和Selinux二、配置YUM源三、安装依赖包四、安装MySQL4.1创建安装目录并解压文件到目录中4.2创建快捷方式4.3创建用户组4.4初始化4.5配置环境变量五、启动数据库5.1后台启动，并登陆数据库5.2新增远程用户5.3修改本地用户密码5.4关闭数据库一、关闭防火墙和Selinuxsyste
在Ubuntu上使用Apache+MariaDB安装部署Nextcloud并修改默认存储路径戴草帽的大z ubuntu linux 经验分享 nextcloud php apache mariadb
一、前言Nextcloud是一款开源的私有云存储解决方案，允许用户轻松搭建自己的云服务。它不仅支持文件存储和共享，还提供了日历、联系人、任务管理、笔记等丰富的功能。本文将详细介绍如何在Ubuntu22.04LTS上使用Apache和MariaDB安装部署Nextcloud，并修改默认存储路径为/home/nextcloud_data。二、环境操作系统：Ubuntu22.04LTSWeb服务器：Ap
全面解析物联网信息安全知识体系无声远望
本文还有配套的精品资源，点击获取简介：本资料集详细介绍物联网信息安全的多个重要方面，包括基础概念、数学基础、数据安全与隐私保护、集成安全技术、安全分析、防护策略和身份认证。从基本的物联网安全概念到深度探讨密码学基础，再到数据保护技术，再到全面的系统安全设计，安全分析，防御措施以及身份验证技术，这些内容将为研究者、开发者和管理者提供物联网安全的全面视角。1.物联网信息安全基础概念在现代技术不断发展的
BabylonJS初学习笔记 Marina-37 学习笔记
初步接触Babylonjs，由于学习跨度会比较大，所以就做了一些笔记，在此分享出来，希望能够对那些和我一样学习的新人有所帮助。通过Babylon官网学习这个项目主要就是一些基础方法的学习，以静态HTML为主，附带一些个人笔记，持续更新。项目地址：babylon-learn-byDoc:通过babylon官方网站进行学习，创建一些交互式web文件。Babylon官网：https://www.baby
C#List排序多权重、自定义秋漓 C#
一、对基础类型排序初始化一个list：Listlist=newList(){1,3,2,8,6};方法一：调用sort方法，如果需要降序，进行反转：list.Sort();//升序排序list.Reverse();//反转顺序方法二：使用lambda表达式，在前面加个负号就是降序了list.Sort((x,y)=>x.CompareTo(y));//升序list.Sort((x,y)=>-x.Co
[JS]学习笔记2 -- JAVAScript数据类型 Jizhi_Zhang JavaScript学习笔记 javascript 学习笔记
一、常量概念：使用const声明的变量称为“常量”。使用场景：当某个变量永远不会改变的时候，就可以使用const来声明，而不是let。命名规范：和变量一致注：常量不允许重新赋值，在声明的时候必须要赋值（初始化）二、数据类型1、基本数据类型1.1数字型number学习中的数字，整数、小数、正数、负数可以有很多操作：算数+：求和-：求差*：求积/：求商%：取模（取余数）--开发中经常作为某个数字是否被
golang性能调优工具pprof的使用 KhaD golang golang 开发语言后端
文章目录前言一、cpu1.下载实例代码2.运行项目中的main.go文件3.查看CPU性能数据4.使用topN（N是可选的数量，也可以不加直接运行）命令来查看占用资源最多的函数5.查看可能存在问题的具体函数代码6.使用web命令来调用关系可视化二、堆内存1.查看堆内存性能数据2.在浏览器中进行查看三、goroutine1.查看goroutine性能数据四、mutex1.查看mutex性能数据五、m
[转] mongodb数据库备份和恢复 hi_zf MongoDB mongodb
windows下面mongodb数据库备份和恢复1、mongodump（备份）及mongorestore（还原）→说明：mongodump是一个用于导出二进制数据库内容的实用工具，它导出的bson文档中只会包含着集合文档等信息，不包括索引信息（索引信息会单独导出），所以还原后，索引必须重建（这个不用担心，使用mongorestore会自动重建mongodump生成的索引信息）。3.4版本中添加了对
JCYZ H3CNE-RS+ ZiminLi 网络
JCYZH3CNE-RS+2024041320240414202404202024042120240427H3CNE网络基础技术测试题（一）H3CNE网络基础技术测试题（二）H3CNE网络基础技术测试题（三）20240413https://www.h3c.com/cn/支持–软件下载–其他产品–模拟器官方下载人才研学中心—技术认证—电子资料按范围划分：局域网城域网广域网按拓扑结构划分：总线型环型星
T-SQL语言的语法 Code花园包罗万象 golang 开发语言后端
T-SQL深度解析与应用T-SQL（Transact-SQL）是微软SQLServer使用的一种扩展SQL（结构化查询语言）。它不仅支持标准SQL的所有功能，而且增加了许多实用的扩展和特性，使得数据库的操作更加灵活和强大。本文将对T-SQL的基本语法、数据操作、控制流、存储过程、触发器及其在实际工作中的应用进行深入探讨。一、T-SQL的基本语法T-SQL语法大致可以分为以下几类：1.数据定义语言（
【优选算法】10----无重复字符的最长子串 Rhzkp 算法 c++leetcode
---------------------------------------begin---------------------------------------题目解析：看到这一类题目，有没有那种一眼就感觉时要用到滑动窗口的感觉，铁子们？讲解算法原理：方法一:暴力解法：简单粗暴的地毯式搜索暴力解法就像一个没有什么技巧的探险家，直接把所有可能的子串都找出来，然后一个一个检查是不是有重复字符，最
【第四天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-两种常见的递归算法（持续更新） Long_poem python 算法开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Python数据结构与算法的详细介绍1.Python中的常用的搜索算法2.两种常见的递归算法3.两种详细的递归算法代码1）斐波那契数列2）阶乘总结前言提示：这里可以添加本文要记录的大概内容：第一天Python数据结构与算法的详细介绍第二天五种常见的排序算法第三天两种常见的搜索算法第四天两种常见的递归算法第五天一种常见的
Java 不可变集合全面解析吉安. 开发语言 java
在Java编程中，不可变集合是一种特殊类型的集合，一旦创建，其内容就不能被修改。这种特性使得不可变集合在某些场景下具有独特的优势。创建不可变集合的应用场景数据不可修改的场景：当某个数据不应该被修改时，将其防御性地拷贝到不可变集合中是一种很好的实践。例如，一些配置信息、常量数据等，将它们放在不可变集合中，可以确保在程序运行过程中其内容不会被意外修改。安全调用不可信库：当集合对象需要被不可信的库调用时
Apache Flink 替换 Spark Stream的架构与实践( bilibili 案例解读)_streamsparkflink加载udf 2501_90243308 apache flink spark
3.基于ApacheFlink的流式计算平台为解决上述问题，bilibili希望根据以下三点要求构建基于ApacheFlink的流式计算平台。第一点，需要提供SQL化编程。bilibili对SQL进行了扩展，称为BSQL。BSQL扩展了Flink底层SQL的上层，即SQL语法层。**第二点，**DAG拖拽编程,一方面用户可以通过画板来构建自己的Pipeline，另一方面用户也可以使用原生Jar方式
Java配置文件从XML到Annotation完美转变 xiaoyustudiowww java
首先Java配置XML文件光定义文件DTD（DocumentTypeDefinition）或者XSD（XMLSchemaDefinition）就很麻烦，解析XML虽然很规则但是解析XML的代码复杂，而Annotation很方便。其次XML不是程序代码，而Java中Annotation是程序代码继而非常灵活简洁。
C/C++教程第十四章 —— MFC控件详解余识- C/C++实战入门到精通 mfc c++c语言
注意本系列文章已升级、转移至我的自建站点中，本章原文为：MFC控件详解目录注意一、前言二、项目建立三、Comboxbox四、ListBox五、GroupBox六、Picturecontrol七、ScrollBar八、SpinControl九、ProgressControl十、hotkey十一、ListControl十二、TreeControl十三、TabControl一、前言通过前面两章的学习，现
神经网络|(三)线性回归基础知识西猫雷婶神经网络线性回归机器学习
【1】引言前序学习进程中，已经对简单神经元的工作模式有所了解，这种二元分类的工作机制，进一步使用sigmoid()函数进行了平滑表达。相关学习链接为：神经网络|(一)加权平均法，感知机和神经元-CSDN博客神经网络|(二)sigmoid神经元函数-CSDN博客实际上，上述表达模型的一个基本原则是：元素和对应的权重，线性相乘后再和阈值开关作对比，元素的综合影响在本质上是一个线性函数，类似于y=wx+
自然语言处理（NLP）-总览图学习汤姆和佩琦 NLP 自然语言处理学习人工智能
文章目录自然语言处理（NLP）-总览图学习1.一张总览图的学习1.语音学（Phonology）2.形态学（Morphology）3.句法学（Syntax）4.语义学（Semantics）5.推理（Reasoning）小结自然语言处理（NLP）-总览图学习转自《Python自然语言处理第二版》1.一张总览图的学习这张图片展示了一个自然语言处理的流程模型，涵盖了从语音分析到应用推理和执行的多个阶段，每
LeetCode HOT-100 分类总结悬浮海 #LeetCode HOT 100 leetcode 算法 HOT-100分类总结
文章目录二分搜索排序滑动窗口哈希表位运算前缀和双指针图二叉树回溯贪心：动态规划：背包问题:单调栈（辅助栈）：并查集LRU缓存小技巧二分搜索【NO.4】LeetCodeHOT100—4.寻找两个正序数组的中位数【NO.17】LeetCodeHOT100—33.搜索旋转排序数组【NO.18】LeetCodeHOT100—34.在排序数组中查找元素的第一个和最后一个位置排序排序方法，如果可以确定数值的范
论文阅读：DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection（Deepfake模型快速调参）海拉鲁的小厨娘读论文论文阅读
一、论文信息论文名称：DeepFake-Adapter:Dual-LevelAdapterforDeepFakeDetection作者团队：项目主页：https://github.com/rshaojimmy/DeepFake-Adapter（代码暂未开源）二、动机与创新动机：目前的deepfake检测模型泛化能力差，将其归因于过拟合于低级的伪造模式，现有的deepfake检测方法仅关注低级别的伪
基于Python的自然语言处理系列（2）：Word2Vec（负采样）会飞的Anthony 自然语言处理人工智能信息系统自然语言处理 word2vec 人工智能
在本系列的第二篇文章中，我们将继续探讨Word2Vec模型，这次重点介绍负采样（NegativeSampling）技术。负采样是一种优化Skip-gram模型训练效率的技术，它能在大规模语料库中显著减少计算复杂度。接下来，我们将通过详细的代码实现和理论讲解，帮助你理解负采样的工作原理及其在Word2Vec中的应用。1.Word2Vec（负采样）原理1.1负采样的背景在Word2Vec的Skip-g
如何运用python爬虫获取大型资讯类网站文章，并同时导出pdf或word格式文本？大懒猫软件深度学习 python 网络爬虫自然语言处理
这里，我们以比较知名的商业新知网站https://www.shangyexinzhi.com/为例进行代码编写，下面进行代码应用思路。第一部分，分析网站结构首先，我们来分析，要使用Python技术分析一个网站的结构，通常可以通过以下步骤实现：获取网站的HTML内容：使用requests库来获取网站的HTML源代码。解析HTML内容：使用BeautifulSoup库来解析HTML，提取网站的结构信息
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

tensorflow学习笔记(二)-PTBModel初步解析

前言

一、PTB

你可能感兴趣的:(tensorflow学习笔记(二)-PTBModel初步解析)