tensorflow学习教程之文本分类详析

前言

这几天caffe2发布了，支持移动端，我理解是类似单片机的物联网吧应该不是手机之类的，试想iphone7跑CNN，画面太美~

作为一个刚入坑的，甚至还没入坑的人，咱们还是老实研究下tensorflow吧，虽然它没有caffe好上手。tensorflow的特点我就不介绍了：

基于Python，写的很快并且具有可读性。
支持CPU和GPU，在多GPU系统上的运行更为顺畅。
代码编译效率较高。
社区发展的非常迅速并且活跃。
能够生成显示网络拓扑结构和性能的可视化图。

tensorflow（tf）运算流程：

tensorflow的运行流程主要有2步，分别是构造模型和训练。

在构造模型阶段，我们需要构建一个图(Graph)来描述我们的模型，tensoflow的强大之处也在这了，支持tensorboard:

就类似这样的图，有点像流程图，这里还推荐一个google的tensoflow游乐场，很有意思。

然后到了训练阶段，在构造模型阶段是不进行计算的，只有在tensoflow.Session.run()时会开始计算。

文本分类

先给出代码，然后我们在一一做解释

# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np
import tensorflow as tf
from collections import Counter
from sklearn.datasets import fetch_20newsgroups

def get_word_2_index(vocab):
 word2index = {}
 for i,word in enumerate(vocab):
 word2index[word] = i
 return word2index


def get_batch(df,i,batch_size):
 batches = []
 results = []
 texts = df.data[i*batch_size : i*batch_size+batch_size]
 categories = df.target[i*batch_size : i*batch_size+batch_size]
 for text in texts:
 layer = np.zeros(total_words,dtype=float)
 for word in text.split(' '):
  layer[word2index[word.lower()]] += 1
 batches.append(layer)
 
 for category in categories:
 y = np.zeros((3),dtype=float)
 if category == 0:
  y[0] = 1.
 elif category == 1:
  y[1] = 1.
 else:
  y[2] = 1.
 results.append(y)
 return np.array(batches),np.array(results)

def multilayer_perceptron(input_tensor, weights, biases):
 #hidden层RELU函数激励
 layer_1_multiplication = tf.matmul(input_tensor, weights['h1'])
 layer_1_addition = tf.add(layer_1_multiplication, biases['b1'])
 layer_1 = tf.nn.relu(layer_1_addition)
 
 layer_2_multiplication = tf.matmul(layer_1, weights['h2'])
 layer_2_addition = tf.add(layer_2_multiplication, biases['b2'])
 layer_2 = tf.nn.relu(layer_2_addition)
 
 # Output layer 
 out_layer_multiplication = tf.matmul(layer_2, weights['out'])
 out_layer_addition = out_layer_multiplication + biases['out']
 return out_layer_addition

#main
#从sklearn.datas获取数据
cate = ["comp.graphics","sci.space","rec.sport.baseball"]
newsgroups_train = fetch_20newsgroups(subset='train', categories=cate)
newsgroups_test = fetch_20newsgroups(subset='test', categories=cate)

# 计算训练和测试数据总数
vocab = Counter()
for text in newsgroups_train.data:
 for word in text.split(' '):
 vocab[word.lower()]+=1
 
for text in newsgroups_test.data:
 for word in text.split(' '):
 vocab[word.lower()]+=1

total_words = len(vocab)
word2index = get_word_2_index(vocab)

n_hidden_1 = 100 # 一层hidden层神经元个数
n_hidden_2 = 100 # 二层hidden层神经元个数
n_input = total_words 
n_classes = 3  # graphics, sci.space and baseball 3层输出层即将文本分为三类
#占位
input_tensor = tf.placeholder(tf.float32,[None, n_input],name="input")
output_tensor = tf.placeholder(tf.float32,[None, n_classes],name="output") 
#正态分布存储权值和偏差值
weights = {
 'h1': tf.Variable(tf.random_normal([n_input, n_hidden_1])),
 'h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2])),
 'out': tf.Variable(tf.random_normal([n_hidden_2, n_classes]))
}
biases = {
 'b1': tf.Variable(tf.random_normal([n_hidden_1])),
 'b2': tf.Variable(tf.random_normal([n_hidden_2])),
 'out': tf.Variable(tf.random_normal([n_classes]))
}

#初始化
prediction = multilayer_perceptron(input_tensor, weights, biases)

# 定义 loss and optimizer 采用softmax函数
# reduce_mean计算平均误差
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=prediction, labels=output_tensor))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(loss)

#初始化所有变量
init = tf.global_variables_initializer()

#部署 graph
with tf.Session() as sess:
 sess.run(init)
 training_epochs = 100
 display_step = 5
 batch_size = 1000
 # Training
 for epoch in range(training_epochs):
 avg_cost = 0.
 total_batch = int(len(newsgroups_train.data) / batch_size)
 for i in range(total_batch):
  batch_x,batch_y = get_batch(newsgroups_train,i,batch_size)
  c,_ = sess.run([loss,optimizer], feed_dict={input_tensor: batch_x,output_tensor:batch_y})
  # 计算平均损失
  avg_cost += c / total_batch
 # 每5次epoch展示一次loss
 if epoch % display_step == 0:
  print("Epoch:", '%d' % (epoch+1), "loss=", "{:.6f}".format(avg_cost))
 print("Finished!")

 # Test model
 correct_prediction = tf.equal(tf.argmax(prediction, 1), tf.argmax(output_tensor, 1))
 # 计算准确率
 accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
 total_test_data = len(newsgroups_test.target)
 batch_x_test,batch_y_test = get_batch(newsgroups_test,0,total_test_data)
 print("Accuracy:", accuracy.eval({input_tensor: batch_x_test, output_tensor: batch_y_test}))

代码解释

这里我们没有进行保存模型的操作。按代码流程，我解释下各种函数和选型，其实整个代码是github的已有的，我也是学习学习~

数据获取，我们从sklearn.datas获取数据，这里有个20种类的新闻文本，我们根据每个单词来做分类：

# 计算训练和测试数据总数
vocab = Counter()
for text in newsgroups_train.data:
 for word in text.split(' '):
 vocab[word.lower()]+=1
 
for text in newsgroups_test.data:
 for word in text.split(' '):
 vocab[word.lower()]+=1

total_words = len(vocab)
word2index = get_word_2_index(vocab)

根据每个index转为one_hot型编码，One-Hot编码，又称为一位有效编码，主要是采用N位状态寄存器来对N个状态进行编码，每个状态都由他独立的寄存器位，并且在任意时候只有一位有效。

def get_batch(df,i,batch_size):
 batches = []
 results = []
 texts = df.data[i*batch_size : i*batch_size+batch_size]
 categories = df.target[i*batch_size : i*batch_size+batch_size]
 for text in texts:
 layer = np.zeros(total_words,dtype=float)
 for word in text.split(' '):
  layer[word2index[word.lower()]] += 1
 batches.append(layer)
 
 for category in categories:
 y = np.zeros((3),dtype=float)
 if category == 0:
  y[0] = 1.
 elif category == 1:
  y[1] = 1.
 else:
  y[2] = 1.
 results.append(y)
 return np.array(batches),np.array(results)

在这段代码中根据自定义的data的数据范围，即多少个数据进行一次训练，批处理。在测试模型时，我们将用更大的批处理来提供字典，这就是为什么需要定义一个可变的批处理维度。

构造神经网络

神经网络是一个计算模型（一种描述使用机器语言和数学概念的系统的方式）。这些系统是自主学习和被训练的，而不是明确编程的。下图是传统的三层神经网络：

而在这个神经网络中我们的hidden层拓展到两层，这两层是做的完全相同的事，只是hidden1层的输出是hidden2的输入。

weights = {
 'h1': tf.Variable(tf.random_normal([n_input, n_hidden_1])),
 'h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2])),
 'out': tf.Variable(tf.random_normal([n_hidden_2, n_classes]))
}
biases = {
 'b1': tf.Variable(tf.random_normal([n_hidden_1])),
 'b2': tf.Variable(tf.random_normal([n_hidden_2])),
 'out': tf.Variable(tf.random_normal([n_classes]))
}

在输入层需要定义第一个隐藏层会有多少节点。这些节点也被称为特征或神经元，在上面的例子中我们用每一个圆圈表示一个节点。

输入层的每个节点都对应着数据集中的一个词（之后我们会看到这是怎么运行的）

每个节点（神经元）乘以一个权重。每个节点都有一个权重值，在训练阶段，神经网络会调整这些值以产生正确的输出。

将输入乘以权重并将值与偏差相加，有点像y = Wx + b 这种linear regression。这些数据也要通过激活函数传递。这个激活函数定义了每个节点的最终输出。有很多激活函数。

Rectified Linear Unit(RELU) - 用于隐层神经元输出
Sigmoid - 用于隐层神经元输出
Softmax - 用于多分类神经网络输出
Linear - 用于回归神经网络输出（或二分类问题）

这里我们的hidden层里面使用RELU，之前大多数是传统的sigmoid系来激活。

由图可知，导数从0开始很快就又趋近于0了，易造成“梯度消失”现象，而ReLU的导数就不存在这样的问题。对比sigmoid类函数主要变化是：1）单侧抑制 2）相对宽阔的兴奋边界 3）稀疏激活性。这与人的神经皮层的工作原理接近。

为什么要加入偏移常量？

以sigmoid为例

权重w使得sigmoid函数可以调整其倾斜程度，下面这幅图是当权重变化时，sigmoid函数图形的变化情况：

可以看到无论W怎么变化，函数都要经过（0,0.5),但实际情况下，我们可能需要在x接近0时，函数结果为其他值。

当我们改变权重w和偏移量b时，可以为神经元构造多种输出可能性，这还仅仅是一个神经元，在神经网络中，千千万万个神经元结合就能产生复杂的输出模式。

输出层的值也要乘以权重，并我们也要加上误差，但是现在激活函数不一样。

你想用分类对每一个文本进行标记，并且这些分类相互独立（一个文本不能同时属于两个分类）。

考虑到这点，你将使用 Softmax 函数而不是 ReLu 激活函数。这个函数把每一个完整的输出转换成 0 和 1 之间的值，并且确保所有单元的和等于一。

在这个神经网络中，output层中明显是3个神经元，对应着三种分本分类。

#初始化所有变量
init = tf.global_variables_initializer()

#部署 graph
with tf.Session() as sess:
 sess.run(init)
 training_epochs = 100
 display_step = 5
 batch_size = 1000
 # Training
 for epoch in range(training_epochs):
 avg_cost = 0.
 total_batch = int(len(newsgroups_train.data) / batch_size)
 for i in range(total_batch):
  batch_x,batch_y = get_batch(newsgroups_train,i,batch_size)
  c,_ = sess.run([loss,optimizer], feed_dict={input_tensor: batch_x,output_tensor:batch_y})
  # 计算平均损失
  avg_cost += c / total_batch
 # 每5次epoch展示一次loss
 if epoch % display_step == 0:
  print("Epoch:", '%d' % (epoch+1), "loss=", "{:.6f}".format(avg_cost))
 print("Finished!")

这里的参数设置：

training_epochs = 100 #100次递归训练
display_step = 5 # 每5次print 一次当前的loss值
batch_size = 1000 #训练数据的分割

为了知道网络是否正在学习，需要比较一下输出值（Z）和期望值（expected）。我们要怎么计算这个的不同（损耗）呢？有很多方法去解决这个问题。

因为我们正在进行分类任务，测量损耗的最好的方式是交叉熵误差。

通过 TensorFlow 你将使用 tf.nn.softmax_cross_entropy_with_logits() 方法计算交叉熵误差（这个是 softmax 激活函数）并计算平均误差 (tf.reduced_mean() ) 。

通过权重和误差的最佳值，以便最小化输出误差（实际得到的值和正确的值之间的区别）。要做到这一点，将需使用梯度下降法。更具体些是，需要使用随机梯度下降。

对应代码：

loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=prediction, labels=output_tensor))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(loss)

tensoflow已经将这些发杂的算法封装为函数，我们只需要选取特定的函数即可。

tf.train.AdamOptimizer(learning_rate).minimize(loss) 方法是一个语法糖，它做了两件事情：

compute_gradients(loss, ) 计算
apply_gradients() 展示

这个方法用新的值更新了所有的 tf.Variables ，因此我们不需要传递变量列表。

运行计算

Epoch: 0001 loss= 1133.908114347
Epoch: 0006 loss= 329.093700409
Epoch: 00011 loss= 111.876660109
Epoch: 00016 loss= 72.552971845
Epoch: 00021 loss= 16.673050320
........
Finished!
Accuracy: 0.81

Accuracy: 0.81 表示置信度在81%，我们通过调整参数和增加数据量（本文没做），置信度会产生变化。

结束

就是这样！使用神经网络创建了一个模型来将文本分类到不同的类别中。采用GPU或者采取分布式的TF可以提升训练速度和效率~

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

【机器学习】使用scikit-learn中的KNN包实现对鸢尾花数据集或者自定义数据集的的预测加德霍克机器学习人工智能 python 学习作业
一、KNN算法概念K最近邻(K-NearestNeighbor,KNN)分类算法是数据挖掘分类技术中最简单的方法之一，是著名的模式识别统计学方法，在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一，也是基于实例的学习方法中最基本的，又是最好的文本分类算法之一。二、对鸢尾花数据集进行预测1、代码示例：fromsklearn.datasetsimportl
Linux pstree 命令详解 linuxlinux运维
简介pstree命令用于以分层（树状）格式显示正在运行的进程。它显示进程之间的关系，例如哪些进程是由其他进程生成的。安装#基于Debian/Ubuntu的系统sudoaptinstallpsmisc#基于CentOS/RHEL/Fedora的系统sudoyuminstallpsmisc#使用dnf安装sudodnfinstallpsmisc基本语法pstree[options][pid|user]
“赛教融合”背景下，职业院校教师教学能力提升创新路径武汉唯众智创人工智能职业教育职教赛教融合
自2010年起，教育部启动全国职业院校信息化教学大赛，旨在深化职业教育教学改革与创新。至2018年，该赛事升级为全国职业院校技能大赛教学能力比赛，显著增强了其专业性和实践性，成为推动职业教育发展的强劲动力。2024年下半年，“全国职业院校技能大赛教学能力比赛”官网也已更名为“全国职业院校技能大赛教师赛服务平台”。这一大赛致力于推广信息化教学手段的日常应用，全面提高职业院校教师的教学能力和信息素养，
简述 Java 内存模型（JMM），特别是堆与栈的区别？程序员黄同学 Java java
Java内存模型（JMM）是Java平台定义的一种多线程之间的通信规范，它确保了在不同的线程之间能够正确地共享和协调对内存的访问。JMM的关键目标是解决并发编程中的可见性、原子性和有序性问题。简单来说，它规定了如何在硬件内存、操作系统内存与Java程序之间进行有效的交互，确保程序在多线程环境下能够正确执行。堆与栈的区别在Java中，内存主要分为两大区域：堆（Heap）和栈（Stack）。这两个概念
WPF 自定义布局面板详解：5步轻松掌握墨瑾轩一起学学C#【一】wpf
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣引言WPF（WindowsPresentationFoundation）是一个强大的用户界面框架，提供了丰富的布局控件。然而，有时候内置的布局控件可能无法满足特定的需求。这时，自定义布局面板就显得尤为重要。本文将详细介绍如何在WPF中自定义布局面板，并通过具体
Vue全家桶 - 电商后台管理系统项目开发实录（详） ←か淡定☆ ヾ前端 vue.js javascript html5 node.js css3
目录1.项目概述1.1电商项目基本业务概述1.2电商后台管理系统的功能1.3电商后台管理系统的开发模式（前、后端分离）2.项目初始化2.1前端项目初始化步骤码云相关操作2.2后台项目的环境安装配置3.登录/退出功能3.1登录概述3.2登录-token原理分析3.3实现登录功能3.4实现退出功能处理ESLint警告4.主页布局4.1后台首页基本布局4.2顶部布局，侧边栏布局4.2.1.顶部布局4.2
智能温控风扇——ESP8266 + DS18B20 + OLED + WiFi插座 uote_e 单片机
智能温控风扇——ESP8266+DS18B20+OLED+WiFi插座在现在这个智能家居越来越普及的时代，智能温控风扇已经成为了很受欢迎的产品之一。本文将教大家如何使用ESP8266单片机、DS18B20温度传感器、OLED显示屏和WiFi插座，来实现家用风扇改造成智能温控风扇。材料准备ESP8266开发板DS18B20温度传感器OLED显示屏WiFi插座面包板、杜邦线、三极管、电阻、陶瓷电容等元
python算法毕业设计开题答疑 DD项目分享家毕业设计 python 毕设
文章目录0简介1如何选题2最新软件工程毕设选题3最后0简介丹成学长，搜集分享最新的软件工程业专业毕设选题，难度适中，适合作为毕业设计，大家参考。学长整理的题目标准：相对容易工作量达标题目新颖选题指导,项目分享：见文末1如何选题最近非常多的学弟学妹问学长关于选题的问题，所以今天学长来教大家如何进行毕业设计选题！毕业设计的选题尤为重要，选好题目是最终完成毕业设计的第一步。因为题目的选择跟之后的设计实现
GoLang从入门到实战全攻略：开启高效编程之旅奔跑吧邓邓子项目实战 golang go 编程语言
目录一、GoLang初相识：为何选择它二、环境搭建：踏上GoLang征程（一）下载安装包1.Windows系统2.Mac系统（二）设置环境变量1.GOROOT2.GOPATH3.PATH（三）开发工具推荐1.VisualStudioCode2.GoLand三、语法基础：构建代码大厦的基石（一）变量与数据类型（二）控制结构（三）函数与包四、进阶特性：提升代码能力（一）面向对象编程（二）并发编程（三）
大模型：LangChain技术讲解玉成226 【大模型】langchain
一、什么是LangChain1、介绍LangChain是一个用于开发由大型语言模型提供支持的Python框架。它提供了一系列工具和组件，帮助我们将语言模型集成到自己的应用程序中。有了它之后，我们可以更轻松地实现对话系统、文本生成、文本分类、问答系统等功能。2、LangChain官网文档官网：https://python.langchain.com/docs/introduction/3、LangC
重生之我在异世界学编程之C语言：深入位段篇就爱学编程 C语言 c语言开发语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一位段的基本使用（1）位段的声明（2）位段的访问二位段的大小计算（1）从右向左分配位（2）对齐要求（3）填充位三经典习题习题1：位段存储计算习题2：位段与对齐习题3：位段与结构体数组习题4：位段与位操作习题5：位段与内存映射习题6：位段与网络协
SpringBoot之定义接口返回类型有几种方式？ java熬夜党 Java spring boot java mybatis
SpringBoot系列教程之定义接口返回类型的几种方式实现一个web接口返回json数据，基本上是每一个javaer非常熟悉的事情了；那么问题来了，如果我有一个接口，除了希望返回json格式的数据之外，若也希望可以返回xml格式数据可行么？答案当然是可行的，接下来我们将介绍一下，一个接口的返回数据类型，可以怎么处理I.项目搭建本文创建的实例工程采用SpringBoot2.2.1.RELEASE+
Android Camera Framework Stream(一) miliang1688 android stream jni 通讯 service java
现在我们尝试从最开始的启动流程来熟悉androidcamera的整体framework流程:首先从上图的各个步骤来逐一分析流程，后续会根据具体的一些点进行内容的添加和扩充：?Camera.javapackages/apps/camera/src/com/android/最上层的应用就是从这个文件开始。该文件集中了整个android上层应用的所有相关内容，当然更多的则为界面的代码实现。如果出现了ca
使用ModelScope实现高效句嵌入生成 dagGAIYD python
技术背景介绍在自然语言处理（NLP）任务中，向量化文本（嵌入）是许多下游任务（如语义搜索、文本分类、问答系统等）的核心步骤之一。通过将文本转换为密集向量表示，我们可以在高维向量空间中构建更加高效的表示和检索算法。ModelScope是阿里云开源的一个模型和数据集管理平台，提供了大量预训练模型，涵盖了各种领域和任务。ModelScopeEmbeddings是一个与LangChain社区集成的工具类，
咱们继续学Java——高级篇第二百二十八篇：之Java 2D图形编程之通过系统剪贴板传递Java对象一杯年华@编程空间咱们继续学java高级篇 eclipse maven java-ee spring boot struts java tomcat
咱们继续学Java——高级篇第二百二十八篇：之Java2D图形编程之通过系统剪贴板传递Java对象在Java学习的征程中，我们不断探索知识的边界，每一次对新功能的深入学习都是成长的宝贵机会。我写这篇博客的目的，就是希望与大家一同学习Java2D图形编程中如何通过系统剪贴板传递Java对象，助力大家在图形编程领域掌握更强大的数据交互技术。今天，我们将详细解读利用序列化在Java应用程序之间传递对象的
软件测试目标 yaoyaoyao可爱呀 python 功能测试
P1–方向管理方向：测试组长–测试主管–测试经理–测试负责人–总监（CTO）技术方向：手工测试–自动化测试–测试开发–测试架构–测试专家细心，耐心，逆向思维，互联网行业学习方式主动学习：小组讨论（50%）实作演练（70%）转教别人，立即应用（90%）复习方式根据艾宾浩斯遗忘曲线，在（1，2，4，7）天，20分钟快速复习1遍P2学习目标测试基础：软件及测试相关知识测试设计：如何进行测试缺陷管理：测试
C# 通用缓存类开发指南 —— 缓存管理的奇幻之旅墨瑾轩一起学学C#【一】c#缓存
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣C#通用缓存类开发指南——缓存管理的奇幻之旅引言嘿，小伙伴们！今天我们要一起探索如何在C#中构建一个简单而强大的缓存系统。想象一下，当你访问一个网站时，那些常用的数据总是能瞬间加载出来，这就是缓存的魅力所在。那么，如何在自己的项目中实现这样一个功能呢？让我们一
泷羽sec学习--Shell编程之用户交互索然无味io 网络安全学习网络安全 linux bash
学习内容来自B站UP：泷羽sec微信公众号：泷羽sec1.使用read命令实现交互基本语法：read命令用于从标准输入（通常是键盘）读取用户输入的数据。其基本格式为read[选项]变量名。例如，readname会暂停脚本的执行，等待用户输入一个字符串，并将这个字符串赋值给变量name。选项说明：-p选项：用于在等待用户输入时显示提示信息。例如，read-p"请输入你的名字："name，这样在等待用
Spring Boot 3.0：快速构建微服务的最新指南墨瑾轩一起学学Java【一】spring boot 微服务后端
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣欢迎来到SpringBoot的奇妙世界！在这个充满活力的社区里，我们即将一起探索如何使用SpringBoot3.0快速构建微服务。想象一下，你的应用就像是一座精心设计的花园，而SpringBoot就是那些让花园生机勃勃的工具和种子。引言：微服务的魅力在软件开发
SAP UI5 初学者教程之十三 - 如何添加自定义 CSS 类试读版
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
操作系统3 四代目水门 C++面试常见问题面试
你知道的线程同步的方式有哪些？线程同步机制是指在多线程编程中，为了保证线程之间的互不干扰，而采用的一种机制。常见的线程同步机制有以下几种：互斥锁：互斥锁是最常见的线程同步机制。它允许只有一个线程同时访问被保护的临界区（共享资源）条件变量：条件变量用于线程间通信，允许一个线程等待某个条件满足，而其他线程可以发出信号通知等待线程。通常与互斥锁一起使用。读写锁：读写锁允许多个线程同时读取共享资源，但只允
电商商业平台技术架构系列教程之：电商平台微服务架构 AI天才研究院架构师必知必会系列大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍一、什么是微服务？二、为什么要设计微服务架构？2.核心概念与联系一、微服务架构模式的核心概念二、微服务架构模式的联系3.核心算法原理和具体操作步骤以及数学模型公式详细讲解一、DDD（Domain-DrivenDesign）二、CQRS（CommandQueryResponsibilitySegregation）三、ESB（EnterpriseServ
【MYSQL学习】MySQL内置函数：窗口函数的5大绝招你GET到了吗？墨瑾轩 MySql入门~精通 mysql 学习 android
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣MySQL内置函数：窗口函数的5大绝招你GET到了吗？引言❓在数据分析和报表生成中，窗口函数是一个非常强大的工具，它可以让你在同一个查询中进行复杂的聚合和排序操作。但你真的了解窗口函数吗？今天，我们就来一场深入浅出的探索之旅，带你了解窗口函数的5大绝招，让你在
重生之我在异世界学编程之算法与数据结构：深入堆篇就爱学编程数据结构与算法算法数据结构 c语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录正文一、堆的基本概念二、堆的存储表示三、堆的基本操作1.插入元素（Insert）2.删除最大/最小值（ExtractMax/Min）3.构建堆（BuildHeap）四、源码（1）heap.h（2）heap.c（3）Test.c五、堆的应用1.优先队列2
【OpenAI】获取OpenAI API Key的两种方法，从入门到精通的详解教程！ senger_lcc ai AI编程
文章目录OpenAIAPIKey的使用场景方式一：通过“OpenAI官网”获取APIKey（国外）步骤1：访问OpenAI官网步骤2：创建或登录账户步骤3：进入API管理界面步骤4：生成新的APIKey使用OpenAIAPI代码方式二：通过“CodeMoss”获取APIKey（国内）步骤1：访问CodeMoss工具步骤2：进入API管理界面步骤3：生成新的APIKey使用OpenAIAPI的实战教
uniapp vite+vue3+ts微信小程序项目组合式Api自动导入懒人的烦恼 uniapp微信小程序 uni-app vue 前端框架微信小程序
相信很多新手(博主也是菜鸡,不喜勿喷!),在公司都喜欢自己创建新的项目,搭建自己项目框架。都会遇到vue3组合式Api导入的问题而感到烦恼！这里教大家怎么简单的配置1.安装需要的插件unplugin-auto-import在项目根目录运行：如下代码npminstall-Dunplugin-auto-import2.安装成功后，修改项目的tsconfig.json文件主要时在inclue里面末尾添加
Transformer架构原理详解：编码器（Encoder）和解码器（Decoder） AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
Transformer,编码器,解码器,自注意力机制,多头注意力,位置编码,序列到序列,自然语言处理1.背景介绍近年来，深度学习在自然语言处理（NLP）领域取得了显著进展，其中Transformer架构扮演着至关重要的角色。自2017年谷歌发布了基于Transformer的机器翻译模型BERT以来，Transformer及其变体在各种NLP任务上取得了突破性的成果，例如文本分类、问答系统、文本摘要
计算机网络03（传输层工作原理，TCP/UDP协议） ~须尽欢计算机网络 tcp/ip udp 网络网络协议 tcp
目录一：介绍传输层二：TCP协议1.TCP包头结构信息2.三次握手3.四次挥手4.流量控制5.差错控制三：UDP协议1、UDP介绍2、UDP常用领域四：TCP和UDP的对比1、应用方面及服务端口2、整体对比一：介绍传输层1.作用：传输层是整个网络体系结构中的关键层次之一，主要负责向两个主机中进程之间的通信提供服务。由于一个主机同时运行多个进程，因此运输层具有复用和分用功能。传输层在终端用户之间提供
day 21 qq_50996930 Go语言基础 go 学习
进程、线程、协程的区别进程：操作系统分配资源的最小单位，其中可以包含一个或者多个线程，进程之间是独立的，可以通过进程间通信机制（管道，消息队列，共享内存，信号量，信号，socket套接字）通信，进程的切换涉及到许多资源耗费时间多。线程：轻量级的进程，一个进程之间可以有多个线程，系统调度的最小单位，多个线程之间共享一部分进程的资源，有线程独立的线程栈，程序计数器，寄存器等。可以通过共享内存通信，相对
大数据分析专业毕业设计最新最全选题精华汇总--持续更新中⑤ 源码空间站11 python django 大数据分析数据可视化 hadoop hive 大数据分析毕设
目录前言开题指导建议更多精选选题选题帮助最后前言大家好,这里是源码空间站学长大数据分析专业毕业设计毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据分析专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!以下是学长精心整理的一些选题:21.基于Hadoop和Spa
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

tensorflow学习教程之文本分类详析

你可能感兴趣的:(tensorflow学习教程之文本分类详析)