小宇爱

53、深度学习-自学之路-自己搭建深度学习框架-14、使用自己的架构搭建一个通过学习模仿莎士比亚风格的2000次的文章。并且在关键层配有详细解释。

import numpy as np


class Tensor(object):

    def __init__(self, data,
                 autograd=False,
                 creators=None,
                 creation_op=None,
                 id=None):

        self.data = np.array(data)
        self.autograd = autograd
        self.grad = None
        if (id is None):
            self.id = np.random.randint(0, 100000)
        else:
            self.id = id

        self.creators = creators
        self.creation_op = creation_op
        self.children = {}

        if (creators is not None):
            for c in creators:
                if (self.id not in c.children):
                    c.children[self.id] = 1
                else:
                    c.children[self.id] += 1

    def all_children_grads_accounted_for(self):
        for id, cnt in self.children.items():
            if (cnt != 0):
                return False
        return True

    def backward(self, grad=None, grad_origin=None):
        if (self.autograd):

            if (grad is None):
                grad = Tensor(np.ones_like(self.data))

            if (grad_origin is not None):
                if (self.children[grad_origin.id] == 0):
                    raise Exception("cannot backprop more than once")
                else:
                    self.children[grad_origin.id] -= 1

            if (self.grad is None):
                self.grad = grad
            else:
                self.grad += grad

            # grads must not have grads of their own
            assert grad.autograd == False

            # only continue backpropping if there's something to
            # backprop into and if all gradients (from children)
            # are accounted for override waiting for children if
            # "backprop" was called on this variable directly
            if (self.creators is not None and
                    (self.all_children_grads_accounted_for() or
                     grad_origin is None)):

                if (self.creation_op == "add"):
                    self.creators[0].backward(self.grad, self)
                    self.creators[1].backward(self.grad, self)

                if (self.creation_op == "sub"):
                    self.creators[0].backward(Tensor(self.grad.data), self)
                    self.creators[1].backward(Tensor(self.grad.__neg__().data), self)

                if (self.creation_op == "mul"):
                    new = self.grad * self.creators[1]
                    self.creators[0].backward(new, self)
                    new = self.grad * self.creators[0]
                    self.creators[1].backward(new, self)

                if (self.creation_op == "mm"):
                    c0 = self.creators[0]
                    c1 = self.creators[1]
                    new = self.grad.mm(c1.transpose())
                    c0.backward(new)
                    new = self.grad.transpose().mm(c0).transpose()
                    c1.backward(new)

                if (self.creation_op == "transpose"):
                    self.creators[0].backward(self.grad.transpose())

                if ("sum" in self.creation_op):
                    dim = int(self.creation_op.split("_")[1])
                    self.creators[0].backward(self.grad.expand(dim,
                                                               self.creators[0].data.shape[dim]))

                if ("expand" in self.creation_op):
                    dim = int(self.creation_op.split("_")[1])
                    self.creators[0].backward(self.grad.sum(dim))

                if (self.creation_op == "neg"):
                    self.creators[0].backward(self.grad.__neg__())

                if (self.creation_op == "sigmoid"):
                    ones = Tensor(np.ones_like(self.grad.data))
                    self.creators[0].backward(self.grad * (self * (ones - self)))

                if (self.creation_op == "tanh"):
                    ones = Tensor(np.ones_like(self.grad.data))
                    self.creators[0].backward(self.grad * (ones - (self * self)))

                if (self.creation_op == "index_select"):
                    new_grad = np.zeros_like(self.creators[0].data)
                    indices_ = self.index_select_indices.data.flatten()
                    grad_ = grad.data.reshape(len(indices_), -1)
                    for i in range(len(indices_)):
                        new_grad[indices_[i]] += grad_[i]
                    self.creators[0].backward(Tensor(new_grad))

                if (self.creation_op == "cross_entropy"):
                    dx = self.softmax_output - self.target_dist
                    self.creators[0].backward(Tensor(dx))

    def __add__(self, other):
        if (self.autograd and other.autograd):
            return Tensor(self.data + other.data,
                          autograd=True,
                          creators=[self, other],
                          creation_op="add")
        return Tensor(self.data + other.data)

    def __neg__(self):
        if (self.autograd):
            return Tensor(self.data * -1,
                          autograd=True,
                          creators=[self],
                          creation_op="neg")
        return Tensor(self.data * -1)

    def __sub__(self, other):
        if (self.autograd and other.autograd):
            return Tensor(self.data - other.data,
                          autograd=True,
                          creators=[self, other],
                          creation_op="sub")
        return Tensor(self.data - other.data)

    def __mul__(self, other):
        if (self.autograd and other.autograd):
            return Tensor(self.data * other.data,
                          autograd=True,
                          creators=[self, other],
                          creation_op="mul")
        return Tensor(self.data * other.data)

    def sum(self, dim):
        if (self.autograd):
            return Tensor(self.data.sum(dim),
                          autograd=True,
                          creators=[self],
                          creation_op="sum_" + str(dim))
        return Tensor(self.data.sum(dim))

    def expand(self, dim, copies):

        trans_cmd = list(range(0, len(self.data.shape)))
        trans_cmd.insert(dim, len(self.data.shape))
        new_data = self.data.repeat(copies).reshape(list(self.data.shape) + [copies]).transpose(trans_cmd)

        if (self.autograd):
            return Tensor(new_data,
                          autograd=True,
                          creators=[self],
                          creation_op="expand_" + str(dim))
        return Tensor(new_data)

    def transpose(self):
        if (self.autograd):
            return Tensor(self.data.transpose(),
                          autograd=True,
                          creators=[self],
                          creation_op="transpose")

        return Tensor(self.data.transpose())

    def mm(self, x):
        if (self.autograd):
            return Tensor(self.data.dot(x.data),
                          autograd=True,
                          creators=[self, x],
                          creation_op="mm")
        return Tensor(self.data.dot(x.data))

    def sigmoid(self):
        if (self.autograd):
            return Tensor(1 / (1 + np.exp(-self.data)),
                          autograd=True,
                          creators=[self],
                          creation_op="sigmoid")
        return Tensor(1 / (1 + np.exp(-self.data)))

    def tanh(self):
        if (self.autograd):
            return Tensor(np.tanh(self.data),
                          autograd=True,
                          creators=[self],
                          creation_op="tanh")
        return Tensor(np.tanh(self.data))

    def index_select(self, indices):

        if (self.autograd):
            new = Tensor(self.data[indices.data],
                         autograd=True,
                         creators=[self],
                         creation_op="index_select")
            new.index_select_indices = indices
            return new
        return Tensor(self.data[indices.data])

    def cross_entropy(self, target_indices):

        temp = np.exp(self.data)
        softmax_output = temp / np.sum(temp,
                                       axis=len(self.data.shape) - 1,
                                       keepdims=True)

        t = target_indices.data.flatten()
        p = softmax_output.reshape(len(t), -1)
        target_dist = np.eye(p.shape[1])[t]
        loss = -(np.log(p) * (target_dist)).sum(1).mean()

        if (self.autograd):
            out = Tensor(loss,
                         autograd=True,
                         creators=[self],
                         creation_op="cross_entropy")
            out.softmax_output = softmax_output
            out.target_dist = target_dist
            return out

        return Tensor(loss)

    def softmax(self):
        temp = np.exp(self.data)
        softmax_output = temp / np.sum(temp,
                                       axis=len(self.data.shape) - 1,
                                       keepdims=True)
        return softmax_output

    def __repr__(self):
        return str(self.data.__repr__())

    def __str__(self):
        return str(self.data.__str__())


class Layer(object):

    def __init__(self):
        self.parameters = list()

    def get_parameters(self):
        return self.parameters


class Tanh(Layer):
    def __init__(self):
        super().__init__()

    def forward(self, input):
        return input.tanh()


class Sigmoid(Layer):
    def __init__(self):
        super().__init__()

    def forward(self, input):
        return input.sigmoid()


'''
损失函数（CrossEntropyLoss）
计算交叉熵损失。
功能：定义一个交叉熵损失函数。
作用：计算模型预测值与真实标签之间的交叉熵损失。
'''


class CrossEntropyLoss(object):

    def __init__(self):  # 功能：调用父类的初始化方法。
        super().__init__()  # 作用：确保 CrossEntropyLoss 类继承了父类的属性和方法。

    '''
    input：模型的输出，通常是一个 Tensor 对象，表示预测的概率分布。
    target：真实标签，通常是一个 Tensor 对象，表示真实的类别索引。

    调用 cross_entropy 方法
    input.cross_entropy(target)：
    调用 input 的 cross_entropy 方法，计算交叉熵损失。
    这里的 cross_entropy 方法需要在 Tensor 类中实现。

    返回值
    功能：返回交叉熵损失值。
    作用：用于衡量模型预测值与真实标签之间的差异。 
    '''

    def forward(self, input, target):
        return input.cross_entropy(target)


class Sequential(Layer):

    def __init__(self, layers=list()):
        super().__init__()

        self.layers = layers

    def add(self, layer):
        self.layers.append(layer)

    def forward(self, input):
        for layer in self.layers:
            input = layer.forward(input)
        return input

    def get_parameters(self):
        params = list()
        for l in self.layers:
            params += l.get_parameters()
        return params


'''
(2.1) 嵌入层（Embedding）
将词的索引映射为固定维度的向量。
index_select 方法根据输入索引选择对应的嵌入向量。
说明：
Embedding 类是深度学习中的一个重要组件，用于将离散的符号（如单词、类别等）映射到连续的向量空间。
这种映射通常被称为词嵌入（Word Embedding），是自然语言处理（NLP）任务中的基础操作。
下面我会详细讲解 Embedding 类的实现和功能。
'''


class Embedding(Layer):  # 1. 类的定义 功能：定义一个嵌入层，继承自 Layer 类。 作用：将离散的符号（如单词索引）映射到连续的向量空间。

    def __init__(self, vocab_size, dim):  # 2. 初始化方法：__init__
        super().__init__()  # (1) super().__init__() 功能：调用父类 Layer 的初始化方法。 作用：确保 Embedding 类继承了 Layer 类的属性和方法。

        self.vocab_size = vocab_size  # (2)self.vocab_size = vocab_size  #功能：存储词汇表的大小。  #作用：词汇表的大小决定了嵌入矩阵的行数。
        self.dim = dim  # (3) self.dim = dim

        # 功能：初始化嵌入矩阵。
        # 细节：
        # np.random.rand(vocab_size, dim)：生成一个形状为 (vocab_size, dim) 的随机矩阵，元素值在 [0, 1) 之间。
        # - 0.5：将元素值调整到 [-0.5, 0.5) 之间。
        # / dim：将元素值缩放到 [-0.5/dim, 0.5/dim) 之间，这是一种常见的初始化方法。
        # Tensor(..., autograd=True)：将矩阵封装为 Tensor 对象，并启用自动求导。
        # this random initialiation style is just a convention from word2vec
        self.weight = Tensor((np.random.rand(vocab_size, dim) - 0.5) / dim, autograd=True)

        # 功能：将嵌入矩阵添加到模型的参数列表中。
        # 作用：在训练过程中，优化器会更新这些参数。
        self.parameters.append(self.weight)

    # 3. 前向传播方法：forward
    # (1) 输入参数 input
    # 功能：接受输入数据。
    # 类型：input 是一个 Tensor 对象，通常包含词的索引。
    def forward(self, input):
        return self.weight.index_select(input)

    '''
    self.weight.index_select(input)
    功能：根据输入索引从嵌入矩阵中选择对应的向量。
    细节：
    self.weight 是嵌入矩阵，形状为 (vocab_size, dim)。    
    input 是词的索引，形状为 (batch_size, sequence_length) 或 (batch_size,)。    
    index_select 方法根据索引从嵌入矩阵中选择对应的行（即词向量）
    (3) 返回值
    功能：返回选择的词向量。    
    作用：这些词向量可以作为后续层的输入。
    '''


class Linear(Layer):

    def __init__(self, n_inputs, n_outputs):
        super().__init__()
        W = np.random.randn(n_inputs, n_outputs) * np.sqrt(2.0 / (n_inputs))
        self.weight = Tensor(W, autograd=True)
        self.bias = Tensor(np.zeros(n_outputs), autograd=True)

        self.parameters.append(self.weight)
        self.parameters.append(self.bias)

    def forward(self, input):
        return input.mm(self.weight) + self.bias.expand(0, len(input.data))


class MSELoss(Layer):

    def __init__(self):
        super().__init__()

    def forward(self, pred, target):
        return ((pred - target) * (pred - target)).sum(0)


'''
 优化器（SGD）
 实现随机梯度下降（SGD）优化器。
'''


class SGD(object):

    def __init__(self, parameters, alpha=0.1):
        self.parameters = parameters
        self.alpha = alpha

    def zero(self):
        for p in self.parameters:
            p.grad.data *= 0

    def step(self, zero=True):

        for p in self.parameters:

            p.data -= p.grad.data * self.alpha

            if (zero):
                p.grad.data *= 0


'''
(2.2) RNN 单元（RNNCell）
实现了一个简单的 RNN 单元。
forward 方法计算当前时间步的输出和隐藏状态。
init_hidden 方法初始化隐藏状态。
'''


class RNNCell(Layer):  # 1. 类的定义   #功能：定义一个 RNN 单元，继承自 Layer 类。  #作用：处理序列数据，维护隐藏状态，并输出当前时间步的结果。

    def __init__(self, n_inputs, n_hidden, n_output, activation='sigmoid'):  # 初始化方法：__init__
        super().__init__()  # 功能：调用父类 Layer 的初始化方法。  作用：确保 RNNCell 类继承了 Layer 类的属性和方法。

        self.n_inputs = n_inputs  # n_inputs：输入数据的维度。
        self.n_hidden = n_hidden  # n_hidden：隐藏状态的维度。
        self.n_output = n_output  # n_output：输出数据的维度。

        '''
        activation：激活函数类型（支持 sigmoid 和 tanh）。
        self.activation：根据 activation 参数选择激活函数。
        Sigmoid()：Sigmoid 激活函数。        
        Tanh()：Tanh 激活函数。
        '''
        if (activation == 'sigmoid'):
            self.activation = Sigmoid()
        elif (activation == 'tanh'):
            self.activation == Tanh()
        else:
            raise Exception("Non-linearity not found")

        self.w_ih = Linear(n_inputs, n_hidden)  # self.w_ih：输入到隐藏状态的线性变换层，形状为 (n_inputs, n_hidden)。
        self.w_hh = Linear(n_hidden, n_hidden)  # self.w_hh：隐藏状态到隐藏状态的线性变换层，形状为 (n_hidden, n_hidden)。
        self.w_ho = Linear(n_hidden, n_output)  # self.w_ho：隐藏状态到输出的线性变换层，形状为 (n_hidden, n_output)。
        '''
        self.parameters：将 w_ih、w_hh 和 w_ho 的参数添加到模型的参数列表中。
        作用：在训练过程中，优化器会更新这些参数。
        '''
        self.parameters += self.w_ih.get_parameters()  #
        self.parameters += self.w_hh.get_parameters()  #
        self.parameters += self.w_ho.get_parameters()  #

    '''
    输入参数:
    input：当前时间步的输入数据，形状为 (batch_size, n_inputs)。
    hidden：上一个时间步的隐藏状态，形状为 (batch_size, n_hidden)。
    '''

    def forward(self, input, hidden):
        '''
        计算隐藏状态
        '''
        from_prev_hidden = self.w_hh.forward(hidden)  # 将上一个时间步的隐藏状态 hidden 通过线性变换 w_hh 映射到当前时间步的隐藏状态空间。
        combined = self.w_ih.forward(
            input) + from_prev_hidden  # 将当前时间步的输入 input 通过线性变换 w_ih 映射到隐藏状态空间，并与 from_prev_hidden 相加。
        new_hidden = self.activation.forward(combined)  # 对相加后的结果应用激活函数，得到当前时间步的隐藏状态 new_hidden
        output = self.w_ho.forward(new_hidden)  # 将当前时间步的隐藏状态 new_hidden 通过线性变换 w_ho 映射到输出空间。
        return output, new_hidden  # output：当前时间步的输出，形状为 (batch_size, n_output)。 new_hidden：当前时间步的隐藏状态，形状为 (batch_size, n_hidden)。

    # 初始化隐藏状态方法：init_hidden
    # 作用：初始化隐藏状态。
    # 返回值：一个全零的 Tensor，形状为 (batch_size, n_hidden)。
    def init_hidden(self, batch_size=1):  # batch_size：批量大小，默认为 1
        return Tensor(np.zeros((batch_size, self.n_hidden)), autograd=True)

import sys, random, math
from collections import Counter
import numpy as np
import sys

np.random.seed(0)

f = open('shakesper.txt', 'r')
raw = f.read()
f.close()

vocab = list(set(raw))
print("vocab")
print(vocab)

print("len(vocab)")
print(len(vocab))

word2index = {}
for i,word in enumerate(vocab):
    word2index[word]=i

print("word2index[word]")
print(word2index[word])
indices = np.array(list(map(lambda x:word2index[x],raw)))

embed = Embedding(vocab_size=len(vocab), dim=512)
model = RNNCell(n_inputs=512, n_hidden=512, n_output=len(vocab))

criterion = CrossEntropyLoss()
optim = SGD(parameters=model.get_parameters() + embed.get_parameters(), alpha=0.05)

print(raw[0:5])
print(indices[0:5])
'''
假设你的数据集有 1000 个样本，每个样本是一个长度为 64 的字符序列。批次大小为 32，BPTT 步长为 16。那么：
批次大小（Batch Size）：
每次训练迭代处理 32 个样本。
总共需要1000/32 =3 2 次迭代。
序列长度（Sequence Length）：
每个样本是一个长度为 64 的序列。
BPTT 步长（Truncated Backpropagation Through Time）：
每次反向传播只处理 16 个时间步。
'''
batch_size = 32   #总共分多少次迭代
bptt = 16         #每个序列反向传播的步长
n_batches = int((indices.shape[0]/(batch_size))) #每次迭代包含的序列个数。


'''
截取索引数组以确保其长度是批次大小的整数倍。
将索引数组重新排列为一个二维数组，形状为 (n_batches, batch_size)。
转置数组以方便后续处理。
'''
trimmed_indices = indices[:n_batches*batch_size]
batched_indices = trimmed_indices.reshape(batch_size,n_batches)
batched_indices = batched_indices.transpose()

'''
将输入数据和目标数据分开，输入数据是所有字符的前一个字符，目标数据是对应的下一个字符
'''
input_batched_indices = batched_indices[0:-1]
target_batched_indices = batched_indices[1:]

'''
计算可以进行 BPTT 的批次数量。
将输入和目标数据重新排列为三维数组，形状为 (n_bptt, bptt, batch_size)。
'''
n_bptt= int(((n_batches-1)/bptt))
input_batches = input_batched_indices[:n_bptt*bptt]
input_batches = input_batches.reshape(n_bptt,bptt,batch_size)
target_batches = target_batched_indices[:n_bptt*bptt]
target_batches = target_batches.reshape(n_bptt,bptt,batch_size)


print("batched_indices[0:5]")
print(batched_indices[0:5])

print("input_batches[0][0:5]")
print(input_batches[0][0:5])

print("target_batches[0][0:5]")
print(target_batches[0][0:5])

'''
初始化隐藏状态和输入字符。
使用模型生成文本，每次生成一个字符，直到生成指定数量的字符。
使用 Softmax 分布随机选择下一个字符。
这段代码实现了一个文本生成函数 generate_sample，它使用训练好的 RNN 模型生成指定长度的文本
n：生成文本的长度（默认为 30 个字符）。
init_char：初始字符（默认为空格 ' '），用于启动文本生成。
'''
def generate_sample(n =30, init_char=' '):
    '''
    初始化变量
    s：用于存储生成的文本。
    hidden：初始化隐藏状态。model.init_hidden(batch_size=1) 返回一个初始的隐藏状态，用于单个样本（batch_size=1）。
    input：将初始字符转换为索引，并包装为 Tensor 对象。word2index[init_char] 将字符映射为索引。
    '''
    s = ""
    hidden = model.init_hidden(batch_size=1)
    input = Tensor(np.array([word2index[init_char]]))
    '''
    循环 n 次，每次生成一个字符，直到生成指定长度的文本。
    '''
    for i in range(n):
        '''
        embed.forward(input)：
        将输入字符的索引通过嵌入层（embed）转换为嵌入向量。
        嵌入层的作用是将离散的字符索引映射到连续的向量空间。
        '''
        rnn_input = embed.forward(input)
        '''
        model.forward(input=rnn_input, hidden=hidden)：
        将嵌入向量和当前隐藏状态输入到 RNN 模型中。
        模型返回输出向量 output 和新的隐藏状态 hidden。
        '''
        output,hidden = model.forward(input = rnn_input,hidden=hidden)
        '''
        output.data *= 10：
        将输出向量的值放大 10 倍。这一步是为了调整 Softmax 分布的“锐度”，使得生成的字符更加确定性（减少随机性）。
        '''
        output.data *=10
        '''
        对输出向量应用 Softmax 函数，将其转换为概率分布。
        '''
        temp_dist = output.softmax()
        '''
        将 Softmax 分布归一化，确保概率和为 1。
        '''
        temp_dist /= temp_dist.sum()

        '''
        生成一个随机数（np.random.rand()），并与 Softmax 分布进行比较。
        选择第一个大于随机数的索引 m。这种方法称为“按概率随机选择”，可以生成更自然的文本。
        '''
        m = (temp_dist > np.random.rand()).argmax()
        '''
        根据索引 m 获取对应的字符 c。
        temp_dist > np.random.rand()：生成一个布尔数组，表示每个字符的概率是否大于随机数。
        .argmax()：选择第一个大于随机数的索引 m。
        vocab[m]：根据索引 m 获取对应的字符。
        为什么引入随机性？
        增加多样性：
        如果总是选择概率最大的词，生成的文本可能会非常单调，尤其是在训练数据中某些模式非常频繁的情况下。引入随机性可以生成更多样化的文本。
        避免局部最优：
        在训练数据中，某些字符组合可能非常频繁，直接选择概率最大的词可能会导致模型陷入局部最优，生成重复的模式。随机选择可以避免这种情况。
        模拟人类语言的不确定性：
        人类语言本身具有一定的不确定性。引入随机性可以生成更接近人类语言的文本。
        '''
        c = vocab[m]
        '''
        将新生成的字符索引包装为 Tensor 对象，作为下一次输入。
        '''
        input = Tensor(np.array([m]))
        '''
        将新生成的字符添加到生成的文本中。
        '''
        s += c
    return s
#print(generate_sample(n=2000,init_char='\n'))

'''
这段代码实现了一个简单的 RNN 训练循环，用于训练字符级语言模型
功能：定义训练函数 train，参数 iterations 指定训练的总迭代次数（即训练的轮数）。
'''
def train(iterations=100):
    for iter in range(iterations):
        '''
        功能：在每次迭代开始时，初始化变量：
        total_loss：用于累计当前迭代的总损失。
        n_loss：未使用的变量，可能是为后续扩展预留的。
        '''
        total_loss = 0
        n_loss = 0

        '''
        功能：初始化 RNN 的隐藏状态。model.init_hidden(batch_size=batch_size) 会返回一个初始的隐藏状态，其大小与批次大小一致。隐藏状态用于存储序列的历史信息。
        '''
        hidden = model.init_hidden(batch_size=batch_size)
        '''
        功能：遍历所有输入批次。input_batches 是一个三维数组，形状为 (n_bptt, bptt, batch_size)，表示每个批次的输入数据。
        '''
        for batch_i in range(len(input_batches)):
            '''
            功能：将隐藏状态包装为 Tensor 对象，并启用自动微分（autograd=True），以便在反向传播时计算梯度。
            '''
            hidden = Tensor(hidden.data,autograd=True)
            '''
            loss：用于存储当前批次的累积损失。
            losses：用于存储每个时间步的损失值。
            '''
            loss = None
            losses =list()
            '''
            内层循环：遍历每个时间步
            '''
            for t in range(bptt):
                '''
                将当前时间步的输入数据包装为 Tensor 对象，并启用自动微分。
                '''
                input = Tensor(input_batches[batch_i][t],autograd = True)
                '''
                将输入字符的索引通过嵌入层转换为词向量。
                '''
                rnn_input = embed.forward(input=input)
                '''
                将词向量和当前隐藏状态输入到 RNN 模型中，得到输出和新的隐藏状态。
                '''
                output,hidden = model.forward(input=rnn_input,hidden=hidden)
                '''
                将目标数据包装为 Tensor 对象，并启用自动微分。
                '''
                target = Tensor(target_batches[batch_i][t],autograd=True)
                '''
                计算当前时间步的损失值（例如交叉熵损失）。
                '''
                batch_loss = criterion.forward(output,target)
                '''
                将当前时间步的损失值存储到 losses 列表中。
                '''
                losses.append(batch_loss)
                '''
                累积当前批次的总损失。
                '''
                if(t ==0):
                    loss = batch_loss
                else:
                    loss = loss + batch_loss
            for loss in losses:
                ""
            '''
            loss.backward()：从累积的损失开始反向传播，计算所有参数的梯度。
            '''
            loss.backward()
            '''
            optim.step()：使用优化器（如 SGD）更新模型参数。
            '''
            optim.step()
            '''
            功能：将当前批次的总损失累加到 total_loss 中。
            '''
            total_loss += loss.data
            log = ""
            log += "\r Iter:" + str(iter)
            log += " - Batch " + str(batch_i+1) + "/" + str(len(input_batches))
            #计算困惑度（Perplexity），用于评估模型性能。
            log += " - Loss: " + str(np.exp(total_loss / (batch_i + 1)))
            '''
            在每个迭代的第一个批次生成一段样本文本，展示模型的生成能力。
            '''
            if(batch_i == 0):
                log += " - " + generate_sample(70,'\n').replace("\n"," ")
            if(batch_i % 10 ==0 or batch_i - 1 == len(input_batches)):
                #将日志输出到控制台。
                sys.stdout.write(log)
        #功能：在每个迭代结束时，将优化器的学习率乘以 0.99，实现学习率衰减，有助于模型收敛。
        optim.alpha *= 0.99
        print()
train()
print(generate_sample(n=2000,init_char='\n'))


''' 
训练30次后，按照文章的风格，写的一段2000单词的文本。可以用百度翻译进行翻译了。说明至少单词没有太大的错误。
语句还算通顺。有人想复现可以考虑使用100次训练试试，把损失值更加减少试试，看看能不能写出更好的文章。
实际看自己电脑的算力，我的电脑算了半天才能看着正常点。
Iter:0 - Batch 2171/2178 - Loss: 15.757976440237602
 Iter:1 - Batch 2171/2178 - Loss: 9.206335793419358
 Iter:2 - Batch 2171/2178 - Loss: 8.131693753138245
 Iter:3 - Batch 2171/2178 - Loss: 7.497620743339918
 Iter:4 - Batch 2171/2178 - Loss: 7.052746677924271
 Iter:5 - Batch 2171/2178 - Loss: 6.710357936801665
 Iter:6 - Batch 2171/2178 - Loss: 6.430444691181043
 Iter:7 - Batch 2171/2178 - Loss: 6.199097439061244
 Iter:8 - Batch 2171/2178 - Loss: 6.002201815930014
 Iter:9 - Batch 2171/2178 - Loss: 5.83009425667503
 Iter:10 - Batch 2171/2178 - Loss: 5.676567964264448
 Iter:11 - Batch 2171/2178 - Loss: 5.540036337751631
 Iter:12 - Batch 2171/2178 - Loss: 5.417842874574542
 Iter:13 - Batch 2171/2178 - Loss: 5.308576411114698
 Iter:14 - Batch 2171/2178 - Loss: 5.205805793937915
 Iter:15 - Batch 2171/2178 - Loss: 5.106609738326981
 Iter:16 - Batch 2171/2178 - Loss: 5.0101791402776845
 Iter:17 - Batch 2171/2178 - Loss: 4.917905528329477
 Iter:18 - Batch 2171/2178 - Loss: 4.831088050694672
 Iter:19 - Batch 2171/2178 - Loss: 4.749952210206796
 Iter:20 - Batch 2171/2178 - Loss: 4.669741603857014
 Iter:21 - Batch 2171/2178 - Loss: 4.587301296098097
 Iter:22 - Batch 2171/2178 - Loss: 4.513284317262715
 Iter:23 - Batch 2171/2178 - Loss: 4.440020752749533
 Iter:24 - Batch 2171/2178 - Loss: 4.375834052022757
 Iter:25 - Batch 2171/2178 - Loss: 4.3029276423764244
 Iter:26 - Batch 2171/2178 - Loss: 4.235140186831388
 Iter:27 - Batch 2171/2178 - Loss: 4.162141675322302
 Iter:28 - Batch 2171/2178 - Loss: 4.103686668096435
 Iter:29 - Batch 2171/2178 - Loss: 4.041437694098596
As hour eyest the noble so bear the wordsh we have Warwick, and bear the wordsh we have Warwick, and Warwick, and Warwick, and the wordsh we have Warwick, and the Warwick, and Warwick, and the wordsh we have Warwick, and the wordsh we have bear the wordsh we have bear the wordsh we have Warwick, and the words, and beWarding be not all the plorWed WaWen the Warwick, and the wordsW the wordsh we have Warwick, and the wordsW the Warwick, and bear the Warwick, and Warwick, and the Warwick, and the wordsh we have Warwick, and the Warwick, and the Warwick, and Warwick, and beWarding beWave the noble so bear the wordsh we have bear the noble so bear the Warwick, and the noble so beWarding be Warwick, and the wordsh we have Warwick, and the wordsh we have Warwick, and Warwick, and the wordsh we have Warwick, and the wordsh we have bear the wordsh we have bear the Warwick, and the noble so bear the Warwick, and the wordsh we have Warwick, and the noble so beWarding beWave and Warwick, and the wordsh we have bear the wordsh we have Warwick, and the wordsh Warwick, and the Warwick, and the wordsh we have Warwick, and Warwick, and Warwick, and Warwick, and Warwick, and the wordsh we have Warwick, and Warwick, and the Warwick, and Warwick, and the wordsh we have bear the wordsh the noble so bear the wordsh we have bear the Warwick, and the noble so bear the wordsh we have Warwick, and the Warwick, and the Warwick, and the wordsh we have bear the wordsh we have Warwick, and beWave Warwick, and the wordsh we have bear the wordsW the wordsh we have bear the wordsh we have bear the wordsh we have Warwick, and Warwick, and Warwick, and Warwick, and the noble so beWarding beWWave Warwick, and the wordsh we have bear the Warwick, and Warwick, and the wordsh we have bear the wordsh we have bear the wordsh we have Warwick, and the wordsh we have Warwick, and the wordsh we have Warwick, and beWaWn the noble so bear the wordsW the Warwick, and the noble so bear the wordsh we have bear the 
'''

微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
TestCafe ➜ Playwright fixture 架构迁移指南 Thomas Kant 自动化测试 playwright testcafe typescript 测试架构
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

53、深度学习-自学之路-自己搭建深度学习框架-14、使用自己的架构搭建一个通过学习模仿莎士比亚风格的2000次的文章。并且在关键层配有详细解释。

你可能感兴趣的:(深度学习-自学之路,深度学习,人工智能,神经网络,自然语言处理,rnn)