贪钱算法还我头发

【吴恩达深度学习编程作业】5.1序列模型——搭建循环神经网络及其应用

参考文章：序列模型——搭建循环神经网络及其应用

这周的编程作业好难啊，明明原理都懂的一实践就完蛋，模棱两可的码了好久。

问题：在执行LSTM网络即兴演奏爵士乐代码时出现了AssertError，我将preprocess.py文件第110行的assert len(chords) == len(measures)注释掉了，加了一行del measures[len(measures) - 1]，并将preprocess.py、data_utils.py、music_utils.py文件中所有的78换成了80，成功运行。

1.搭建循环神经网络

main.py

import numpy as np
import Deep_Learning.test5_1.rnn_utils


# 1.1RNN单元
def rnn_cell_forward(xt, a_prev, parameters):
    """
    实现RNN单元的单步前向传播
    :param xt:      -时间步t输入的数据，维度为(n_x,m)
    :param a_prev:  -时间步t-1的隐藏状态，维度为(n_a,m)
    :param parameters:  -字典，包含以下内容：
                            Wax     -矩阵，输入乘以权重，维度为(n_a,n_x)
                            Waa     -矩阵，隐藏状态乘以权重，维度为(n_a,n_a)
                            Wya     -矩阵，隐藏状态与输出相关的权重矩阵，维度为(n_y,n_a)
                            ba      -偏置，维度为(n_a,1)
                            by      -偏置，维度为(n_y,1)
    :return: a_next     -下一个隐藏状态，维度为(n_a,m)
             yt_pred    -在时间步t的预测，维度为(n_y,m)
             cache      -反向传播需要的元组，包含了(a_next,a_prev,xt,parameters)
    """

    # 从parameters获取参数
    Wax = parameters["Wax"]
    Waa = parameters["Waa"]
    Wya = parameters["Wya"]
    ba = parameters["ba"]
    by = parameters["by"]

    # 计算下一个激活值
    a_next = np.tanh(np.dot(Waa, a_prev) + np.dot(Wax, xt) + ba)

    # 计算当前单元的输出
    yt_pred = Deep_Learning.test5_1.rnn_utils.softmax(np.dot(Wya, a_next) + by)

    # 保存反向传播需要的值
    cache = (a_next, a_prev, xt, parameters)

    return a_next, yt_pred, cache

print("==================测试rnn_cell_forward================")
np.random.seed(1)
xt = np.random.rand(3, 10)
a_prev = np.random.randn(5, 10)
Waa = np.random.randn(5, 5)
Wax = np.random.randn(5, 3)
Wya = np.random.randn(2, 5)
ba = np.random.randn(5, 1)
by = np.random.randn(2, 1)
parameters = {"Waa": Waa, "Wax": Wax, "Wya": Wya, "ba": ba, "by": by}

a_next, yt_pred, cache = rnn_cell_forward(xt, a_prev, parameters)
print("a_next[4] = ", a_next[4])
print("a_next.shape = ", a_next.shape)
print("yt_pred[1] = ", yt_pred[1])
print("yt_pred.shape = ", yt_pred.shape)


# 1.2RNN的前向传播
def rnn_forward(x, a0, parameters):
    """
    实现循环神经网络的前向传播
    :param x:   -输入的全部数据，维度为(n_x,m,T_x)
    :param a0:  -初始化隐藏状态，维度为(n_a,m)
    :param parameters: 字典，包含以下内容：
                            Wax     -矩阵，输入乘以权重，维度为(n_a,n_x)
                            Waa     -矩阵，隐藏状态乘以权重，维度为(n_a,n_a)
                            Wya     -矩阵，隐藏状态与输出相关的权重矩阵，维度为(n_y,n_a)
                            ba      -偏置，维度为(n_a,1)
                            by      -偏置，维度为(n_y,1)
    :return: a  -所有时间步的隐藏状态，维度为(n_a,m,T_x)
             y_pred     -所有时间步的预测，维度为(n_y,m,T_x)
             caches     -为反向传播的保存的元组，维度为([列表类型]cache,x)
    """

    # 初始化caches，它将以列表类型包含所有的cache
    caches = []

    # 获取x与Wya的维度信息
    n_x, m, T_x = x.shape
    n_y, n_a = parameters["Wya"].shape

    # 使用0初始化"a"与"y"
    a = np.zeros([n_a, m, T_x])
    y_pred = np.zeros([n_y, m, T_x])

    # 初始化next
    a_next = a0

    # 遍历所有时间步
    for t in range(T_x):
        # 1.使用rnn_cell_forward函数更新next隐藏状态与cache
        a_next, yt_pred, cache = rnn_cell_forward(x[:, :, t], a_next, parameters)

        # 2.使用a保存next隐藏状态(第t)个位置
        a[:, :, t] = a_next

        # 3.使用y保存预测值
        y_pred[:, :, t] = yt_pred

        # 4.把cache保存到caches列表中
        caches.append(cache)

    # 保存反向传播所需要的参数
    caches = (caches, x)

    return a, y_pred, caches

print("=======================测试rnn_forward====================")
np.random.seed(1)
x = np.random.rand(3, 10, 4)
a0 = np.random.randn(5, 10)
Waa = np.random.randn(5, 5)
Wax = np.random.randn(5, 3)
Wya = np.random.randn(2, 5)
ba = np.random.randn(5, 1)
by = np.random.randn(2, 1)
parameters = {"Waa": Waa, "Wax": Wax, "Wya": Wya, "ba": ba, "by": by}

a, y_pred, caches = rnn_forward(x, a0, parameters)
print("a[4][1] = ", a[4][1])
print("a.shape = ", a.shape)
print("y_pred[1][3] = ", y_pred[1][3])
print("y_pred.shape = ", y_pred.shape)
print("caches[1][1][3] = ", caches[1][1][3])
print("len(caches) = ", len(caches))


# 长短时记忆网络LSTM
# 2.1LSTM单元
def lstm_cell_forward(xt, a_prev, c_prev, parameters):
    """
    实现一个LSTM单元的前向传播
    :param xt:      -在时间步t输入的数据，维度为(n_x,m)
    :param a_prev:  -上一个时间步t-1的隐藏状态，维度为(n_a,m)
    :param c_prev:  -上一个时间步t-1的记忆状态，维度为(n_a,m)
    :param parameters:  -字典类型的变量，包含了:
                            Wf  -遗忘门的权值，维度为(n_a,n_a+n_x)
                            bf  -遗忘门的偏置，维度为(n_a,1)
                            Wu  -更新门的权值，维度为(n_a,n_a+n_x)
                            bu  -更新门的偏置，维度为(n_a,1)
                            Wc  -第一个tanh的权值，维度为(n_a,n_a+n_x)
                            bc  -第一个tanh的偏置，维度为(n_a,n_a+n_x)
                            Wo  -输出门的权值，维度为(n_a,n_a+n_x)
                            bo  -输出门的偏置，维度为(n_a,1)
                            Wy  -隐藏状态与输出相关的权值，维度为(n_y,n_a)
                            by  -隐藏状态与输出相关的权值，维度为(n_y,1)
    :return: a_next     -下一个隐藏状态，维度为(n_a,m)
             c_next     -下一个记忆状态，维度为(n_a,m)
             yt_pred    -在时间步t的预测，维度为(n_y,m)
             cache      -包含了反向传播所需要的参数，包含了(a_next,c_next,a_prev,c_prev,xt,parameters)
    """

    # 从parameters中获取相关值
    Wf = parameters["Wf"]
    bf = parameters["bf"]
    Wu = parameters["Wu"]
    bu = parameters["bu"]
    Wc = parameters["Wc"]
    bc = parameters["bc"]
    Wo = parameters["Wo"]
    bo = parameters["bo"]
    Wy = parameters["Wy"]
    by = parameters["by"]

    # 获取xt与Wy的维度信息
    n_x, m = xt.shape
    n_y, n_a = Wy.shape

    # 1.连接a_prev与xt
    contact = np.zeros([n_a + n_x, m])
    contact[: n_a, :] = a_prev
    contact[n_a:, :] = xt

    # 2.计算遗忘门ft，更新门ut，候选值(c tilda)，下一个记忆状态c_next，输出门ot，下一个激活状态a_next
    # 遗忘门
    ft = Deep_Learning.test5_1.rnn_utils.sigmoid(np.dot(Wf, contact) + bf)

    # 更新门
    ut = Deep_Learning.test5_1.rnn_utils.sigmoid(np.dot(Wu, contact) + bu)

    # 更新单元
    cct = np.tanh(np.dot(Wc, contact) + bc)
    # c_next = np.multiply(ft, c_prev) + np.multiply(ut, cct)
    c_next = ft * c_prev + ut * cct

    # 输出门
    ot = Deep_Learning.test5_1.rnn_utils.sigmoid(np.dot(Wo, contact) + bo)
    # a_next = np.multiply(ot, np.tanh(c_next))
    a_next = ot * np.tanh(c_next)

    # 3.计算LSTM单元的预测值
    yt_pred = Deep_Learning.test5_1.rnn_utils.softmax(np.dot(Wy, a_next) + by)

    # 保存包含了反向传播需要的参数
    cache = (a_next, c_next, a_prev, c_prev, ft, ut, cct, ot, xt, parameters)

    return a_next, c_next, yt_pred, cache

print("====================测试lstm_cell_forward=====================")
np.random.seed(1)
xt = np.random.rand(3, 10)
a_prev = np.random.randn(5, 10)
c_prev = np.random.randn(5, 10)
Wf = np.random.randn(5, 5+3)
bf = np.random.randn(5, 1)
Wu = np.random.randn(5, 5+3)
bu = np.random.randn(5, 1)
Wo = np.random.randn(5, 5+3)
bo = np.random.randn(5, 1)
Wc = np.random.randn(5, 5+3)
bc = np.random.randn(5, 1)
Wy = np.random.randn(2, 5)
by = np.random.randn(2, 1)

parameters = {"Wf": Wf, "Wu": Wu, "Wo": Wo, "Wc": Wc, "Wy": Wy, "bf": bf, "bu": bu, "bo": bo, "bc": bc, "by": by}

a_next, c_next, yt, cache = lstm_cell_forward(xt, a_prev, c_prev, parameters)
print("a_next[4] = ", a_next[4])
print("a_next.shape = ", a_next.shape)
print("c_next[2] = ", c_next[2])
print("c_next.shape  = ", c_next.shape)
print("yt[1] = ", yt[1])
print("yt.shape = ", yt.shape)
print("cache[1][3] = ", cache[1][3])
print("len(cache) = ", len(cache))


# 2.2Lstm前向传播，c^<0>使用0初始化
def lstm_forward(x, a0, parameters):
    """
    实现LSTM单元组成的循环神经网络
    :param x:   -所有时间步的输入数据，维度为(n_x,m,T_x)
    :param a0:  -初始化隐藏状态，维度为(n_a,m)
    :param parameters: -字典，包含以下参数：
                            Wf  -遗忘门的权值，维度为(n_a,n_a+n_x)
                            bf  -遗忘门的偏置，维度为(n_a,1)
                            Wu  -更新门的权值，维度为(n_a,n_a+n_x)
                            bu  -更新门的偏置，维度为(n_a,1)
                            Wc  -第一个tanh的权值，维度为(n_a,n_a+n_x)
                            bc  -第一个tanh的偏置，维度为(n_a,n_a+n_x)
                            Wo  -输出门的权值，维度为(n_a,n_a+n_x)
                            bo  -输出门的偏置，维度为(n_a,1)
                            Wy  -隐藏状态与输出相关的权值，维度为(n_y,n_a)
                            by  -隐藏状态与输出相关的权值，维度为(n_y,1)
    :return: a  -所有时间步的隐藏状态，维度为(n_a,m,T_x)
             y  -所有时间步的预测值，维度为(n_y,m,T_x)
             caches -为反向传播保存的元组，维度为([列表类型]cache,x)
    """

    # 初始化“caches”
    caches = []

    # 获取xt和Wy的维度信息
    n_x, m, T_x = x.shape
    n_y, n_a = parameters["Wy"].shape

    # 使用0初始化"a","c","y"
    a = np.zeros([n_a, m, T_x])
    c = np.zeros([n_a, m, T_x])
    y = np.zeros([n_y, m, T_x])

    # 初始化"a_next"、"c_next"
    a_next = a0
    c_next = np.zeros([n_a, m])

    # 遍历所有时间步
    for t in range(T_x):
        # 更新下一个隐藏状态，下一个记忆状态，计算预测值，获取cache
        a_next, c_next, yt_pred, cache = lstm_cell_forward(x[:, :, t], a_next, c_next, parameters)

        # 保存新的下一个隐藏状态到变量a中
        a[:, :, t] = a_next

        # 保存预测值到变量y中
        y[:, :, t] = yt_pred

        # 保存下一个单元状态到变量c中
        c[:, :, t] = c_next

        # 把cache添加到caches中
        caches.append(cache)

    # 保存反向传播需要的参数
    caches = (caches, x)

    return a, y, c, caches

print("===========================测试lstm_forward====================")
np.random.seed(1)
x = np.random.rand(3, 10, 7)
a0 = np.random.randn(5, 10)
Wf = np.random.randn(5, 5+3)
bf = np.random.randn(5, 1)
Wu = np.random.randn(5, 5+3)
bu = np.random.randn(5, 1)
Wo = np.random.randn(5, 5+3)
bo = np.random.randn(5, 1)
Wc = np.random.randn(5, 5+3)
bc = np.random.randn(5, 1)
Wy = np.random.randn(2, 5)
by = np.random.randn(2, 1)

parameters = {"Wf": Wf, "Wu": Wu, "Wo": Wo, "Wc": Wc, "Wy": Wy, "bf": bf, "bu": bu, "bo": bo, "bc": bc, "by": by}

a, y, c, caches = lstm_forward(x, a0, parameters)
print("a[4][3][6] = ", a[4][3][6])
print("a.shape = ", a.shape)
print("y[1][4][3] = ", y[1][4][3])
print("y.shape = ", y.shape)
print("caches[1][1][1] = ", caches[1][1][1])
print("c[1][2][1] = ", c[1][2][1])
print("len(caches) = ", len(caches))

## 2.3RNN反向传播（选学）

运行结果

==================测试rnn_cell_forward================
a_next[4] =  [ 0.78343681  0.99841326  0.3412785   0.74815333  0.06904651 -0.4412712
 -0.96311151 -0.9255633  -0.39331674  0.8259313 ]
a_next.shape =  (5, 10)
yt_pred[1] =  [0.61103326 0.62075852 0.54066066 0.49386023 0.89878639 0.71915386
 0.73411439 0.88215484 0.60354066 0.62300476]
yt_pred.shape =  (2, 10)
=======================测试rnn_forward====================
a[4][1] =  [ 0.74340266 -0.15802485  0.53481814  0.39883487]
a.shape =  (5, 10, 4)
y_pred[1][3] =  [0.59596259 0.44898213 0.44507391 0.50777107]
y_pred.shape =  (2, 10, 4)
caches[1][1][3] =  [0.21162812 0.26554666 0.49157316 0.05336255]
len(caches) =  2
====================测试lstm_cell_forward=====================
a_next[4] =  [ 0.00801245 -0.04933657 -0.01185145  0.01026473 -0.10713704  0.06270573
  0.06914978 -0.01141511  0.01495696 -0.38133372]
a_next.shape =  (5, 10)
c_next[2] =  [ 0.60879308  0.71075478 -0.63003263  1.55707745 -0.12389442  0.9503685
  0.07566992 -1.22707045  0.25010194 -0.15193039]
c_next.shape  =  (5, 10)
yt[1] =  [0.24208087 0.01697087 0.35355734 0.25499077 0.3899106  0.43151056
 0.320404   0.28227159 0.28307044 0.48093818]
yt.shape =  (2, 10)
cache[1][3] =  [-0.36843733  0.92140172 -0.03508767  0.54797075  0.14707127  0.30459933
  0.02522788  0.54096181 -0.22560049 -0.53332628]
len(cache) =  10
===========================测试lstm_forward====================
a[4][3][6] =  -0.01086643920336303
a.shape =  (5, 10, 7)
y[1][4][3] =  0.7850075501598014
y.shape =  (2, 10, 7)
caches[1][1][1] =  [0.34776586 0.7508121  0.72599799 0.88330609 0.62367221 0.75094243
 0.34889834]
c[1][2][1] =  0.6424527847446263
len(caches) =  2

2.字符级语言模型

main.py

"""
    代码实现：
        1.存储文本数据以便使用RNN进行处理
        2.合成数据，通过每次采样预测，并将其传递给下一个RNN单元
        3.构建字符级文本生成循环神经网络
        4.梯度修剪：避免梯度爆炸
"""
import numpy as np
import time
import Deep_Learning.test5_1.cllm_utils


# 1.读取恐龙名称的数据集，创建一个唯一字符列表（如AZ），并计算数据集和词汇量大小
# 获取名称
data = open("dinos.txt", "r").read()

# 转化为小写字符
data = data.lower()

# 转化为无序且不重复的元素列表
chars = list(set(data))

# 获取大小信息
data_size, vocab_size = len(data), len(chars)

print(chars)
print("共计有%d个字符，唯一字符有%d个"%(data_size, vocab_size))


# 创建一个字典，每个字符映射到0-26的索引
char_to_ix = {ch: i for i, ch in enumerate(sorted(chars))}
# 将字典每个索引映射回相应的字符
ix_to_char = {i: ch for i, ch in enumerate(sorted(chars))}

print(char_to_ix)
print(ix_to_char)
"""
    运行结果：
        ['c', 'a', 'l', 'm', 'n', 'h', 'b', 'k', 'd', 'u', 'f', 's', '\n', 'v', 'g', 'e', 'o', 'i', 'q', 'y', 'z', 'j', 'r', 'w', 'p', 't', 'x']
        共计有19909个字符，唯一字符有27个
        {'\n': 0, 'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6, 'g': 7, 'h': 8, 'i': 9, 'j': 10, 'k': 11, 'l': 12, 'm': 13, 'n': 14, 'o': 15, 'p': 16, 'q': 17, 'r': 18, 's': 19, 't': 20, 'u': 21, 'v': 22, 'w': 23, 'x': 24, 'y': 25, 'z': 26}
        {0: '\n', 1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e', 6: 'f', 7: 'g', 8: 'h', 9: 'i', 10: 'j', 11: 'k', 12: 'l', 13: 'm', 14: 'n', 15: 'o', 16: 'p', 17: 'q', 18: 'r', 19: 's', 20: 't', 21: 'u', 22: 'v', 23: 'w', 24: 'x', 25: 'y', 26: 'z'}
"""

# 2.构建模型中的模块
# 2.1梯度修剪，函数接受最大阈值
def clip(gradients, maxValue):
    """
    使用maxValue来修剪梯度
    :param gradients:   -字典类型，包含了以下参数："dWaa","dWax","dWya","db","dby"
    :param maxValue:    -阈值，把梯度值限制在[-maxValue,maxValue]内
    :return:gradients   -修剪后的梯度
    """

    # 获取参数
    dWaa, dWax, dWya, db, dby = gradients['dWaa'], gradients['dWax'], gradients['dWya'], gradients['db'], gradients['dby']

    # 修剪梯度
    for gradient in [dWaa, dWax, dWya, db, dby]:
        np.clip(gradient, -maxValue, maxValue, out=gradient)

    gradients = {"dWaa": dWaa, "dWax": dWax, "dWya": dWya, "db": db, "dby": dby}

    return gradients

print("======================测试clip=========================")
np.random.seed(3)
dWax = np.random.randn(5, 3) * 10
dWaa = np.random.randn(5, 5) * 10
dWya = np.random.randn(2, 5) * 10
db = np.random.randn(5, 1) * 10
dby = np.random.randn(2, 1) * 10
gradients = {"dWaa": dWaa,"dWax": dWax,"dWya": dWya,"db": db,"dby": dby}
gradients = clip(gradients, 10)
print("gradients[\"dWaa\"][1][2] = ", gradients["dWaa"][1][2])
print("gradients[\"dWax\"][3][1] = ", gradients["dWax"][3][1])
print("gradients[\"dWya\"][1][2] = ", gradients["dWya"][1][2])
print("gradients[\"db\"][4] = ", gradients["db"][4])
print("gradients[\"dby\"][1] = ", gradients["dby"][1])
"""
    运行结果：
        gradients["dWaa"][1][2] =  10.0
        gradients["dWax"][3][1] =  -10.0
        gradients["dWya"][1][2] =  0.2971381536101662
        gradients["db"][4] =  [10.]
        gradients["dby"][1] =  [8.45833407]    
"""


# 2.2采样
def sample(parameters, char_to_ix, seed):
    """
    根据RNN输出的概率分布序列对字符序列进行采样
    :param parameters:  -包含了Waa,Wax,Wya,by,b的字典
    :param char_to_ix:  -字符映射到索引的字典
    :param seed:        -随机种子
    :return: indices    -包含采样字符索引的长度为n的列表
    """

    # 从parameters中获取参数
    Waa, Wax, Wya, by, b = parameters['Waa'], parameters['Wax'], parameters['Wya'], parameters['by'], parameters['b']
    vocab_size = by.shape[0]
    n_a = Waa.shape[1]

    # 1.1创建独热向量x
    x = np.zeros((vocab_size, 1))

    # 1.2使用0初始化a_prev
    a_prev = np.zeros((n_a, 1))

    # 创建索引的空列表，这是包含要生成的字符的索引的列表
    indices = []

    # IDX是检测换行符的标志，将其初始化为-1
    idx = -1

    # 循环遍历时间步t，在每个时间步中，从概率分布中抽取一个字符，并将其索引附加到indices上
    # 如果我们达到50个字符（我们应该不太可能有一个训练好的模型），将停止循环，这有助于调试并防止进入无限循环
    counter = 0
    newline_character = char_to_ix["\n"]

    while(idx != newline_character and counter < 50):
        # 2.进行前向传播
        a = np.tanh(np.dot(Wax, x) + np.dot(Waa, a_prev) + b)
        z = np.dot(Wya, a) + by
        y = Deep_Learning.test5_1.cllm_utils.softmax(z)

        # 设定随机种子
        np.random.seed(counter + seed)

        # 3.从概率分布y中抽取词汇表中字符的索引？？？？？？？？？？？？
        idx = np.random.choice(list(range(vocab_size)), p=y.ravel())

        # 添加到索引中
        indices.append(idx)

        # 4.将输入字符重写为与采样索引相对应的字符
        x = np.zeros((vocab_size, 1))
        x[idx] = 1

        # 更新a_prev为a
        a_prev = a

        # 累加器
        seed += 1
        counter += 1

    if(counter == 50):
        indices.append(char_to_ix["\n"])

    return indices

print("==================测试sample===============")
np.random.seed(2)
_, n_a = 20, 100
Wax = np.random.randn(n_a, vocab_size)
Waa = np.random.randn(n_a, n_a)
Wya = np.random.randn(vocab_size, n_a)
b = np.random.randn(n_a, 1)
by = np.random.randn(vocab_size, 1)
parameters = {"Wax": Wax, "Waa": Waa, "Wya": Wya, "b": b, "by": by}

indices = sample(parameters, char_to_ix, 0)
print("Sampling:")
print("list of sampled indices:", indices)
print("list of sampled characters:", [ix_to_char[i] for i in indices])
"""
    运行结果：
        list of sampled indices: [12, 17, 24, 14, 13, 9, 10, 22, 24, 6, 13, 11, 12, 6, 21, 15, 21, 14, 3, 2, 1, 21, 18, 24, 7, 25, 6, 25, 18, 10, 16, 2, 3, 8, 15, 12, 11, 7, 1, 12, 10, 2, 7, 7, 11, 17, 24, 1, 13, 0, 0]
        list of sampled characters: ['l', 'q', 'x', 'n', 'm', 'i', 'j', 'v', 'x', 'f', 'm', 'k', 'l', 'f', 'u', 'o', 'u', 'n', 'c', 'b', 'a', 'u', 'r', 'x', 'g', 'y', 'f', 'y', 'r', 'j', 'p', 'b', 'c', 'h', 'o', 'l', 'k', 'g', 'a', 'l', 'j', 'b', 'g', 'g', 'k', 'q', 'x', 'a', 'm', '\n', '\n']
"""


# 3.构建语言模型
# 3.1梯度下降
def optimize(X, Y, a_prev, parameters, learning_rate = 0.01):
    """
    执行训练模型的单步优化
    :param X:   -整数列表，其中每个整数映射到词汇表中的字符
    :param Y:   -整数列表，与X完全相同，但向左移动了一个索引
    :param a_prev:  -上一个隐藏状态
    :param parameters:  -字典，包含以下参数：
                            Wax     -权重矩阵乘以输入，维度为(n_a,n_x)
                            Waa     -权重矩阵乘以隐藏状态，维度为(n_a,n_a)
                            Wya     -隐藏状态与输出相关的权重矩阵，维度为(n_y,n_a)
                            b       -偏置，维度为(n_a,1)
                            by      -隐藏状态与输出相关的权重偏置，维度为(n_y,1)
    :param learning_rate:   -学习率
    :return:loss    -损失函数的值(交叉熵损失)
            gradients   -字典，包含以下参数
                            dWax     -输入到隐藏的权值的梯度，维度为(n_a,n_x)
                            dWaa     -隐藏到隐藏的权值的梯度，维度为(n_a,n_a)
                            dWya     -隐藏到输出的权值的梯度，维度为(n_y,n_a)
                            db       -偏置的梯度，维度为(n_a,1)
                            dby      -输出偏置向量的梯度，维度为(n_y,1)
            a[len(X)-1]     -最后的隐藏状态，维度为(n_a,1)
    """

    # 前向传播
    loss, cache = Deep_Learning.test5_1.cllm_utils.rnn_forward(X, Y, a_prev, parameters)

    # 反向传播
    gradients, a = Deep_Learning.test5_1.cllm_utils.rnn_backward(X, Y, parameters, cache)

    # 梯度修剪，[-5,5]
    gradients = clip(gradients, 5)

    # 更新参数
    parameters = Deep_Learning.test5_1.cllm_utils.update_parameters(parameters, gradients, learning_rate)

    return loss, gradients, a[len(X) - 1]

print("=====================测试optimize===============")
np.random.seed(1)
vocab_size, n_a = 27, 100
a_prev = np.random.randn(n_a, 1)
Wax = np.random.randn(n_a, vocab_size)
Waa = np.random.randn(n_a, n_a)
Wya = np.random.randn(vocab_size, n_a)
b = np.random.randn(n_a, 1)
by = np.random.randn(vocab_size, 1)
parameters = {"Wax": Wax, "Waa": Waa, "Wya": Wya, "b": b, "by": by}
X = [12, 3, 5, 11, 22, 3]
Y = [4, 14, 11, 22, 25, 26]

loss, gradients, a_last = optimize(X, Y, a_prev, parameters, learning_rate=0.01)
print("loss = ", loss)
print("gradients[\"dWaa\"][1][2] = ", gradients["dWaa"][1][2])
print("np.argmax(gradients[\"dWax\"]) = ", np.argmax(gradients["dWax"]))
print("gradients[\"dWya\"][1][2] = ", gradients["dWya"][1][2])
print("gradients[\"db\"][4] = ", gradients["db"][4])
print("gradients[\"dby\"][1] = ", gradients["dby"][1])
print("a_last[4] = ", a_last[4])
"""
    运行结果：
        loss =  126.50397572165382
        gradients["dWaa"][1][2] =  0.1947093153471637
        np.argmax(gradients["dWax"]) =  93
        gradients["dWya"][1][2] =  -0.007773876032002977
        gradients["db"][4] =  [-0.06809825]
        gradients["dby"][1] =  [0.01538192]
        a_last[4] =  [-1.]
"""


# 3.2训练模型
def model(data, ix_to_char, char_to_ix, num_iterations=3500,
          n_a=50, dino_names=7, vocab_size=27):
    """
    训练模型并生成恐龙名字
    :param data:    -语料库
    :param ix_to_char:      -索引映射字符字典
    :param char_to_ix:      -字符映射索引字典
    :param num_iterations:  -迭代次数
    :param n_a:             -RNN单元数量
    :param dino_names:      -每次迭代中采样的数量
    :param vocab_size:      -在文本中的唯一字符的数量
    :return: parameters     -学习后了的参数
    """

    # 从vocab_size中获取n_x, n_y
    n_x, n_y = vocab_size, vocab_size

    # 初始化参数
    parameters = Deep_Learning.test5_1.cllm_utils.initialize_parameters(n_a, n_x, n_y)

    # 初始化损失
    loss = Deep_Learning.test5_1.cllm_utils.get_initial_loss(vocab_size, dino_names)

    # 构建恐龙名称列表
    with open("dinos.txt") as f:
        examples = f.readlines()
    examples = [x.lower().strip() for x in examples]

    # 打乱全部的恐龙名称
    np.random.seed(0)
    np.random.shuffle(examples)

    # 初始化LSTM隐藏状态
    a_prev = np.zeros((n_a, 1))

    # 循环
    for j in range(num_iterations):
        # 定义一个训练样本
        index = j % len(examples)
        X = [None] + [char_to_ix[ch] for ch in examples[index]]
        Y = X[1:] + [char_to_ix["\n"]]

        # 执行单步优化：前向传播 -> 反向传播 -> 梯度修剪 -> 更新参数
        # 选择学习率为0.01
        curr_loss, gradients, a_prev = optimize(X, Y, a_prev, parameters)

        # 使用延迟来保持损失平衡，这是为了加速训练
        loss = Deep_Learning.test5_1.cllm_utils.smooth(loss, curr_loss)

        # 每2000次迭代，通过sample()生成"\n"字符，检查模型是否学习正确
        if j % 2000 == 0:
            print("第" + str(j + 1) + "次迭代，损失值为：" + str(loss))

            seed = 0
            for name in range(dino_names):
                # 采样
                sampled_indices = sample(parameters, char_to_ix, seed)
                Deep_Learning.test5_1.cllm_utils.print_sample(sampled_indices, ix_to_char)

                # 为了得到相同的效果，随机种子＋1
                seed += 1

            print("\n")
    return parameters

# 训练

# 开始时间
start_time = time.clock()

# 开始训练
parameters = model(data, ix_to_char, char_to_ix, num_iterations=3500)

# 结束时间
end_time = time.clock()

# 计算时差
minium = end_time - start_time

print("执行了：" + str(int(minium / 60)) + "分" + str(int(minium % 60)) + "秒")
"""
    运行结果：
        第1次迭代，损失值为：23.087336085484605
        Nkzxwtdmfqoeyhsqwasjkjvu
        Kneb
        Kzxwtdmfqoeyhsqwasjkjvu
        Neb
        Zxwtdmfqoeyhsqwasjkjvu
        Eb
        Xwtdmfqoeyhsqwasjkjvu
        
        
        第2001次迭代，损失值为：27.884160491415777
        Liusskeomnolxeros
        Hmdaairus
        Hytroligoraurus
        Lecalosapaus
        Xusicikoraurus
        Abalpsamantisaurus
        Tpraneronxeros
        
        
        执行了：0分4秒
"""

3.写出莎士比亚风格的文字

main.py

import time

# 开始时间
start_time = time.clock()

import numpy as np
from keras.callbacks import LambdaCallback
from keras.models import Model, load_model, Sequential
from keras.layers import Dense, Activation, Dropout, Input, Masking
from keras.layers import LSTM
from keras.utils.data_utils import get_file
from keras.preprocessing.sequence import pad_sequences
from Deep_Learning.test5_1.shakespeare_utils import *
import sys
import io
from IPython.display import SVG
from keras.utils.vis_utils import model_to_dot
from keras.utils import plot_model


# 结束时间
end_time = time.clock()

# 计算时差
minium = end_time - start_time

print("执行了：" + str(int(minium / 60)) + "分" + str(int(minium % 60)) + "秒")

print_callback = LambdaCallback(on_epoch_end=on_epoch_end)

model.fit(x, y, batch_size=128, epochs=1, callbacks=[print_callback])

# 运行此代码尝试不同的输入，而不必重新训练模型
generate_output()

# 绘制模型细节
plot_model(model, to_file='shakespeare.png')
SVG(model_to_dot(model).create(prog='dot', format='svg'))

运行结果

Loading text data...
Creating training set...
number of training examples: 31412
Vectorizing training set...
Loading model...

执行了：0分42秒

246/246 [==============================] - 47s 190ms/step - loss: 2.5501
Write the beginning of your poem, the Shakespeare machine will complete it. Your input is: Why don't we start over

Here is your poem: 

Why don't we start overfreprite,
on cithons he to e'su, on my my luvings do dield,
her bilthou of make pu  
isfla sompter me autelone dyet man rehained.
hif tray to preary is meling that cry gunntfich beend.
to evevy aguhes to cossance for now
her hin try, mand my all my desting fide,
that the pary suy i well my comprave chess,
mistur kelps the to fate,, and my,
do be of farmeded as to: the creballe you entery.
so much

4.用LSTM网络即兴演奏爵士乐

main.py

"""
    代码实现：
        使用LSTM生成音乐
        使用深度学习生成自己的爵士乐
"""
import tensorflow as tf
tf.compat.v1.disable_eager_execution()
import time
from keras.models import load_model, Model
from keras.layers import Dense, Activation, Dropout, Input, LSTM, Reshape, Lambda, RepeatVector
from keras.initializers import glorot_uniform
from keras.utils import to_categorical
from keras.optimizers import Adam
from keras import backend as K
import numpy as np
import IPython
import sys
from music21 import *
from Deep_Learning.test5_1.grammar import *
from Deep_Learning.test5_1.qa import *
from Deep_Learning.test5_1.preprocess import *
from Deep_Learning.test5_1.music_utils import *
from Deep_Learning.test5_1.data_utils import *


# 1.1查看训练集的音乐片段 pycharm不支持播放音乐，jupyter支持
IPython.display.Audio('./data/30s_seq.mp3')

# 加载原始音乐数据并将其预处理为值
X, Y, n_values, indices_values = load_music_utils()
print('shape of X:', X.shape)
print('number of training examples:', X.shape[0])
print('Tx (length of sequence):', X.shape[1])
print('total # of unique values:', n_values)
print('Shape of Y:', Y.shape)


# 2.构建模型
# 使用64维隐藏状态的LSTM模块
n_a = 64
# 将需要的层对象定义为全局变量
reshapor = Reshape((1, 80))
LSTM_cell = LSTM(n_a, return_state=True)
densor = Dense(n_values, activation='softmax')

def djmodel(Tx, n_a, n_values):
    """
    实现模型
    :param Tx:      -语料库的长度
    :param n_a:     -激活值的数量
    :param n_values:    -音乐数据中唯一数据的数量
    :return: model      -Keras模型实体
    """

    # 定义输入数据的维度
    X = Input((Tx, n_values))

    # 定义a0，初始化隐藏状态
    a0 = Input(shape=(n_a, ), name="a0")
    c0 = Input(shape=(n_a, ), name="c0")
    a = a0
    c = c0

    # 1.创建一个空的outputs列表来保持LSTM的所有时间步的输出
    outputs = []

    # 2.循环
    for t in range(Tx):
        # 2.1从X中选择第t个时间步向量
        x = Lambda(lambda x: X[:, t, :])(X)

        # 2.2使用reshapor来对x进行重构为(1,n_values)
        x = reshapor(x)

        # 2.3单步传播
        a, _, c = LSTM_cell(x, initial_state=[a, c])

        # 2.4使用densor()应用于LSTM_Cell的隐藏状态输出
        out = densor(a)

        # 2.5把预测值添加到outputs列表中
        outputs.append(out)

    # 3.创建模型实体
    model = Model(inputs=[X, a0, c0], outputs=outputs)

    return model

# 获取模型，这里Tx=30,n_a=64,n_values=80
model = djmodel(Tx=30, n_a=64, n_values=80)

# 编译模型，使用Adam优化器与分类熵损失
opt = Adam(lr=0.01, beta_1=0.9, beta_2=0.999, decay=0.01)
model.compile(optimizer=opt, loss='categorical_crossentropy', metrics=['accuracy'])

# 初始化a0和c0，使LSTM的初始化状态为零
m = 60
a0 = np.zeros((m, n_a))
c0 = np.zeros((m, n_a))

# 开始时间
start_time = time.clock()

# 开始拟合
model.fit([X, a0, c0], list(Y), epochs=100)

# 结束时间
end_time = time.clock()

# 计算时差
minium = end_time - start_time

print("执行了：" + str(int(minium / 60)) + "分" + str(int(minium % 60)) + "秒")



# 3.生成音乐
def music_inference_model(LSTM_cell, densor, n_values=80, n_a=64, Ty=100):
    """
    :param LSTM_cell:   -来自model()的训练过后的LSTM单元，是keras层对象
    :param densor:      -来自model()的训练过后的densor，是keras层对象
    :param n_values:    -整数，唯一值的数量
    :param n_a:         -LSTM单元的数量
    :param Ty:          -整数，生成的是时间步的数量
    :return:inference_model     -keras模型实体
    """

    # 定义模型输入的维度
    x0 = Input(shape=(1, n_values))

    # 初始化隐藏状态
    a0 = Input(shape=(n_a,), name="a0")
    c0 = Input(shape=(n_a,), name="c0")
    a = a0
    c = c0
    x = x0

    # 1.创建一个空的outputs列表保存预测值
    outputs = []

    # 2.遍历Ty,生成所有时间步的输出
    for t in range(Ty):

        # 2.1在LSTM中单步传播
        a, _, c = LSTM_cell(x, initial_state=[a, c])

        # 2.2使用densor()应用于LSTM_Cell的隐藏状态输出
        out = densor(a)

        # 2.3预测值添加到outputs列表中
        outputs.append(out)

        # 根据out选择下一个值，并将x设置为所选值的一个独热编码
        # 该值将在下一步作为输入传递给LSTM_cell,我们已经提供了执行此操作所需的代码
        x = Lambda(one_hot)(out)

    # 创建模型实体
    inference_model = Model(inputs=[x0, a0, c0], outputs=outputs)

    return inference_model

# 获取模型实体，模型被硬编码产生50个值
inference_model = music_inference_model(LSTM_cell, densor, n_values=80, n_a=64, Ty=50)

# 创建用于初始化x和LSTM状态变量a和c的零向量
x_initializer = np.zeros((1, 1, 80))
a_initializer = np.zeros((1, n_a))
c_initializer = np.zeros((1, n_a))


# 预测该输入对应的输出
def predict_and_sample(inference_model, x_initializer=x_initializer, a_initializer=a_initializer,
                       c_initializer=c_initializer):
    """
    使用模型预测当前值的下一个值
    :param inference_model:     -keras的实体模型
    :param x_initializer:       -初始化的独热编码，维度为(1,1,80)
    :param a_initializer:       -LSTM单元的隐藏状态初始化，维度为(1,n_a)
    :param c_initializer:       -LSTM单元的状态初始化，维度为(1,n_a)
    :return: results        -生成值的独热编码向量，维度为(Ty,80)
             indices        -所生成值的索引矩阵，维度为(Ty,1)
    """

    # 1.模型来预测给定x_initializer,a_initializer,c_initializer的输出序列
    pred = inference_model.predict([x_initializer, a_initializer, c_initializer])

    # 2.将pred转换为具有最大概率的索引数组np.array()
    indices = np.argmax(pred, axis=-1)

    # 3.将索引转换为它们的一个独热编码
    results = to_categorical(indices, num_classes=80)

    return results, indices

results, indices = predict_and_sample(inference_model, x_initializer, a_initializer, c_initializer)
print("np.argmax(results[12]) = ", np.argmax(results[12]))
print("np.argmax(results[17]) = ", np.argmax(results[17]))
print("list(indices[12:18]) = ", list(indices[12:18]))


# 生成音乐
out_stream = generate_music(inference_model)

IPython.display.Audio('./data/30s_trained_model.mp3')

运行结果

shape of X: (60, 30, 80)
number of training examples: 60
Tx (length of sequence): 30
total # of unique values: 80
Shape of Y: (30, 60, 80)

Train on 60 samples
Epoch 1/100
60/60 [==============================] - 
...
执行了：1分40秒

np.argmax(results[12]) =  19
np.argmax(results[17]) =  68
list(indices[12:18]) =  [array([19], dtype=int64), array([20], dtype=int64), array([20], dtype=int64), array([14], dtype=int64), array([19], dtype=int64), array([68], dtype=int64)]
Predicting new values for different set of chords.
Generated 50 sounds using the predicted values for the set of chords ("1") and after pruning
Generated 50 sounds using the predicted values for the set of chords ("2") and after pruning
Generated 51 sounds using the predicted values for the set of chords ("3") and after pruning
Generated 50 sounds using the predicted values for the set of chords ("4") and after pruning
Generated 50 sounds using the predicted values for the set of chords ("5") and after pruning
Your generated music is saved in output/my_music.midi

你可能感兴趣的:(AI,#,Deep,Learning,深度学习,nlp,python,神经网络)

Deepseek文生图、文生音乐、文生视频操作步骤（详细版） SoulQuestor Deepseek 音视频人工智能 deepseek
目录一、文生图方法一1.启动浏览器双击桌面上的浏览器图标，启动浏览器程序。2.访问DeepSeek官网3.进入对话界面4.输入图片生成代码方法二1.获取绘画提示词2.复制提示词3.使用AI绘画软件生成图4.优化和保存图片二、文生音乐1.启动浏览器并访问DeepSeek官网2.进入DeepSeek对话界面3.输入音乐主题并获取描述4.获取详细描述5.访问音疯平台6.进入音乐创作界面7.输入音乐描述并
在 Python 中执行 BASH 命令——在同一进程中潮易 python bash chrome
在Python中执行BASH命令——在同一进程中在Python中执行BASH命令，可以使用`os.system()`或`subprocess`模块。以下是两种方法的详细步骤：方法一：使用`os.system()````pythonimportos#执行一个bash命令，例如显示当前目录下的所有文件command="ls"output=os.system(command)print("Command
Python 爬虫实战：全球公司财报数据抓取与财务健康分析西攻城狮北 python 爬虫开发语言
一、引言在当今数字化时代，数据已成为企业决策、投资分析和市场研究的关键要素。公司财报数据作为企业经营状况的重要反映，对于投资者、分析师以及企业管理者来说具有极高的价值。通过获取和分析全球公司的财报数据，我们可以深入了解企业的财务健康状况，为投资决策提供有力支持。本文将详细介绍如何使用Python爬虫技术抓取全球公司财报数据，并进行财务健康分析。二、爬虫环境搭建在开始爬取数据之前，我们需要先搭建好P
Linux的权限巷子里的童年ya linux 运维服务器 centos
基本权限与归属读取：允许查看内容-readr写入：允许修改内容-writew可执行：允许运行和切换-excutex1、对于文本文件：r读取权限：cat、less、grep、head、tailw写入权限：vim、>、>>x可执行权限：Shell与Python\Go2、对于目录：r读取权限：ls命令查看目录内容w写入权限：能够创建、删除、修改等目录的内容x执行权限：能够cd切换到此目录下（进入此目录）
大模型微调方法之Delta-tuning 空白II 大语言模型论文解读微调方法介绍微调方法 delta-tuning 论文解读大语言模型
大模型微调方法之Delta-tuning大模型微调方法自从23年之后可谓是百花齐放，浙大有团队在8月将关于大模型微调方法的综述上传了ArXiv。论文将微调方法总结为等几个类别。本次讨论的1大模型业务分类当前的大模型行业可谓百花齐放，自然语言处理（naturallanguageprocessing,NLP）、计算机视觉（computervision,CV）、音频处理（audioprocessing,
Python 学习笔记1 - 认识Python Scora_liu Python 学习笔记 python
一、什么是Python1989年圣诞节期间，荷兰数学和计算机科学研究学会的GuidovanRossum（吉多.范罗苏姆）决心开发一个新的解释程序，作为ABC语言的替代品。这门ABC语言的替代语言被取名为Python,命名来自Guido爱看的的电视剧MontyPython'sFlyingCircus（蟒蛇马戏团）。二、什么是Python（⭐⭐）Python是一门解释型语言。计算机不能识别任何除了机器
3.19刷题山遥路源算法刷题 c++
P6443[COCI2010/2011#1]TIMSKO-洛谷#includeusingnamespacestd;intmain(){intn,m,k,maxp=0;cin>>m>>n>>k;for(inti=0;iusingnamespacestd;chara[15][15];intmain(){intr,c,k;cin>>r>>c;for(inti=0;i>a[i][j];}}cin>>k;i
3.21刷题山遥路源算法刷题 c++
P6723[COCI2015/2016#5]ZAMKA-洛谷#includeusingnamespacestd;intweisum(intn){intsum=0;while(n){sum+=n%10;n/=10;}returnsum;}intmain(){intl,d,x,minn=10000,maxm=0;cin>>l>>d>>x;for(inti=l;imaxm)maxm=i;}}coutus
3.15刷题山遥路源算法刷题 c++
P6337[COCI2007/2008#2]CRNE-洛谷#includeusingnamespacestd;intmain(){intn;cin>>n;//横加竖最大。n/2,n/2+1if(n%2==0){coutusingnamespacestd;chara[25][25];intmain(){intr,c;stringmins="zz",t;cin>>r>>c;for(inti=1;i>a
2.22-2.27刷题记录山遥路源算法刷题 c++
2.22P1420最长连号-洛谷#includeusingnamespacestd;inta[10010];intmain(){intn,ans=0,l=1;cin>>n;for(inti=0;i>a[i];}for(inti=1;ians)ans=l;}coutusingnamespacestd;intmain(){inta,b,bi=19,yu;cin>>a>>b;yu=a*10+b;cout
从零开始学AI——1 人工智能
前言最近总算有想法回到学习上来，这次就拿AI开刀吧。本系列叫从零开始学AI不是骗人的，我对AI的了解几乎就是道听途说，所以起了这么一个标题，希望学完从0变1（？此外，我应该不会特别关注代码实现上的内容，因为我对python也是一窍不通。本笔记为学习周志华老师《机器学习》（西瓜书）的个人学习记录，内容基于个人理解进行整理和再阐述。由于理解可能存在偏差，欢迎指正。引用模块说明：在笔记中，我会使用引用模
寻找通义灵码 AI 程序员 {头号玩家} ，体验 QwQ-Plus、DeepSeek 满血版的通义灵码云原生
2025年1月，通义灵码AI程序员全面上线，同时支持VSCode、JetBrainsIDEs，是国内首个真正落地的AI程序员。近期，通义灵码能力再升级全新上线模型选择功能，目前已经支持QwQ-plus、DeepSeek满血版模型，用户可以在VSCode和JetBrains里搜索并下载最新通义灵码插件，在输入框里选择模型，即可轻松切换模型。通义灵码联合CHERRY中国全网发起寻找AI程序员{头号玩家
从阅读空间到知识孵化器，AI时代智慧图书馆何为？技能咖生成式人工智能认证 GAI认证人工智能
在人工智能（AI）浪潮席卷全球的当下，图书馆作为知识传播与文化传承的重要场所，正面临着前所未有的变革。从传统的阅读空间到如今的知识孵化器，智慧图书馆在AI时代肩负着新的使命与挑战。本文将探讨智慧图书馆在AI时代的发展方向，并引入生成式人工智能认证（GAI）认证，为图书馆从业者的技能提升提供新思路。AI时代智慧图书馆的新角色知识资源整合与挖掘者在AI时代，信息爆炸式增长，图书馆不再仅仅是纸质书籍的收
Python 正则表达式超详细解析：从基础到精通 2201_75491841 python 正则表达式开发语言
Python正则表达式超详细解析：从基础到精通一、引言在Python编程的广阔领域中，文本处理占据着极为重要的地位。而正则表达式，作为Python处理文本的强大工具，能够帮助开发者高效地完成诸如查找、替换、提取特定模式字符串等复杂任务。无论是在数据清洗、网页爬虫，还是日志分析、自然语言处理等应用场景中，正则表达式都展现出了无可比拟的优势。本文将深入且全面地剖析Python正则表达式，从最基础的概念
3.22刷题山遥路源算法刷题 c++
B3763[语言月赛202305]团体程序设计天梯赛-洛谷#includeusingnamespacestd;intmain(){intx,jichu=0,jinjie=0,dingbu=0;for(inti=0;i>x;jichu+=x;}if(jichu>=80){for(inti=0;i>x;jinjie+=x;}if(jinjie>=40){for(inti=0;i>x;dingbu+=x
Python如何实现粒子效果如烟雾、火焰、雨滴等. openwin_top python编程示例系列二 python 开发语言
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位在Panda3D中实现粒子效果主要依赖于其内置的粒子系统。这个系统允许开发者创建各种动态的视觉效果，如烟雾、火焰、雨滴等。下面我将详细介绍如何在Panda3D中添加一个简单的粒子效果。步骤1:准备粒
（一）stm32F411RE点亮板上LED——基于HAL库（微控第一周MCU验收） yxt230791 stm32 嵌入式硬件单片机
近期有点懒，还是先直接上链接通过网盘分享的文件：led.rar链接:https://pan.baidu.com/s/1GUI7wd9dtNwqPhpS9GfLag提取码:XDer--来自百度网盘超级会员v2的分享
Python中的机制：全局解释锁和回收机制林十一npc Python语言 python 开发语言
Python中的机制：全局解释锁和回收机制一、全局解释锁GIL1.基础原理全局解释锁：是CPython中引入的一种机制，确保同一时刻保持一个线程执行Python的字节码。锁的粒度：GIL是全局唯一的锁，线程在执行Pyhton代码前必须要获取GIL,执行完毕后进行释放。线程切换：CPython解释器通过固定间隔（如python字节码指令或遇到I/O操作），释放GIL,触发线程切换。底层实现GIL的实
大模型的应用与微调：如何调用 LLM？从 OpenAI API 到本地部署晴天彩虹雨 AI 大模型 ai 语言模型 gpt 人工智能
本篇文章将详细介绍如何调用大语言模型（LLM），涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式，并探讨如何在本地部署LLM进行推理。1.调用OpenAIAPI（GPT系列）OpenAI提供了RESTfulAPI供开发者调用GPT系列模型。示例：使用Python调用OpenAIAPIimportopenaiopenai.api_key="your_api_key"re
idear 出现unable to save setting:failed to save settings.please restart intellij idea异常不开心就吐槽 intellij-idea
1.idea出现一下异常unabletosavesetting:failedtosavesettings.pleaserestartintellijidea2.解决办法先关闭IDEA，然后找到C:\Users\wuxin.IntelliJIdea2019.3\system\caches（管理员目录中的位置），删除caches目录中所有的文件（不要删除caches目录），再启动IDEA就可以了。3.
Oracle不支持的字符集 (在类路径中添加 orai18n.jar): ZHS16GBK 不开心就吐槽 oracle jar java
1.报错内容出现java.sql.SQLException:不支持的字符集(在类路径中添加orai18n.jar):ZHS16GBKExceptioninthread"main"java.sql.SQLException:不支持的字符集(在类路径中添加orai18n.jar):ZHS16GBKatoracle.sql.CharacterSetUnknown.failCharsetUnknown(C
python实现简易任务管理器 Roc-xb python 服务器 linux
本章教程，主要利用python实现一个简单的任务管理器，可以快速结束任务进程。目录一、实例代码二、效果演示一、实例代码#!/usr/bin/python#-*-coding:UTF-8-*-"""@author:Roc-xb"""#encoding:utf-8importsubprocessdefexecute_cmd(command):subprocess.run('chcp65001',she
Chapter 27: Expression Templates_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
ExpressionTemplatesKeyConcepts:Part1:CoreConcepts&CodeImplementationPart2:AdvancedConcepts&ExtensionsPart3:OptimizationAnalysisMultipleChoiceQuestions(HardDifficulty)DetailedDesignQuestionsAnswers&Exp
Java实现生日悖论的算法，计算至少有两个人生日相同的概率 YiWait java 算法
importjava.util.Random;publicclassBirthdayParadox{publicstaticvoidmain(String[]args){intn=23;//邀请的人数inttrials=1000000;//实验次数intcount=0;//至少有两个人生日相同的实验次数Randomrand=newRandom();for(inti=0;i
AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
前端高级 CSS 用法实战指南 Real Man★ 前端 css
前端高级CSS用法实战指南CSS的高级用法能显著提升开发效率、优化页面性能并实现复杂的视觉效果。以下是现代CSS的核心高级技巧和实战案例，涵盖布局、动画、优化等方向：一、现代布局系统CSSGrid复杂布局场景：实现不规则网格（如杂志排版、仪表盘）。示例：定义网格模板与区域命名：css.container{display:grid;grid-template-columns:200px1fr300p
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
HTTP Cookie header 中set-cookie格式 qq_35577990 fiddler selenium
Cookie相关的Http头有两个Http头部和Cookie有关：Set-Cookie和Cookie。Set-Cookie由服务器发送，它包含在响应请求的头部中。它用于在客户端创建一个CookieCookie头由客户端发送，包含在HTTP请求的头部中。注意，只有cookie的domain和path与请求的URL匹配才会发送这个cookie。Set-CookieHeaderSet-Cookie响应头
解锁云原生后端开发新姿势：腾讯云大模型API深度整合实战 Loving_enjoy 实用技巧腾讯云
在云原生与AI技术深度融合的今天，如何将大模型能力无缝嵌入后端架构，已成为开发者构建下一代智能应用的核心命题。本文将深入解析腾讯云大模型API（如DeepSeek-R1/V3、混元大模型）与云原生技术的创新结合方案，通过架构设计、实战案例与高阶技巧，揭示一条从0到1构建AI增强型服务的完整路径。---##一、云原生与大模型的融合新范式###1.1技术趋势的双向奔赴云原生后端的核心优势在于弹性扩展、
普通人怎么利用AI赚钱？AI 变现的 8 种神操作，最后一个你绝对想不到！ AI设计酷卡人工智能 stable diffusion AI作画 AIGC midjourney
在国内外，几百款AI工具竞争激烈，衍生出各种需求与市场。下面我们就来盘点AI变现的八大生意，看看你能猜到几个？一、AI文本生成：打造公众号矩阵提到AI，ChatGPT无疑是最为知名的工具之一，其核心功能在于生成高质量文本，写出热门文章。许多人利用AI文本生成的能力，成功构建公众号矩阵，创造出大量10w+的文章，甚至有流量主月入过万。今年上半年，一些知名账号每分钟发布数篇文章，依靠AI技术和自动化手
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f