IT之一小佬

文本张量的表示方法

概念：

将一段文本使用张量进行表示，将词汇表示成向量，成为词向量，再由各个词向量按顺序组成矩阵形成文本表示。

为什么？

因为文本不能够直接被模型计算，所以需要将其转化为向量

作用：

将文本转化为张量表示形式，能够将文本作为计算机程序的输入，然后进行下一步一系列的操作。

把文本转化为向量有两种方法：

one-hot编码
word2vec
word embedding

1. one-hot 编码【使用稀疏的向量表示文本，占用空间多】

又称为独热编码，将每个词表示成具有n个元素的向量，这个向量只有一个元素是1，其余的元素都是0，不同词汇的1和0的位置是不同的，其中n的大小是整个语料中不同词汇的总数。

即：把待处理的文档进行分词或者是N-gram处理，然后进行去重得到词典，例如有一个文档：深度学习，那么进行one-hot处理后的结果如下：

token	one-hot encoding
深	1000
度	0100
学	0010
习	0001

one-hot编码实现：

# 导入用于对象保存与加载的joblib
import joblib
# 导入keras中的词汇映射器Tokenizer
from keras.preprocessing.text import Tokenizer

# 假定vocab为语料集所有不同词汇集合
vocab = {"张三", "李四", "王五", "赵六", "孙七"}

#  实例化一个词汇映射器对象
t = Tokenizer(num_words=None, char_level=False)

#  使用映射器拟合现有文本数据
t.fit_on_texts(vocab)

for token in vocab:
    zero_list = [0] * len(vocab)
    # 使用映射器转化现有文本数据, 每个词汇对应从1开始的自然数
    # 返回样式如: [[2]], 取出其中的数字需要使用[0][0]
    token_index = t.texts_to_sequences([token])[0][0] - 1
    zero_list[token_index] = 1
    print(token, "的one-hot编码是：", zero_list)
    
# 使用joblib工具保存映射器, 以便之后使用
tokenizer_path = "./Tokenizer"
joblib.dump(t, tokenizer_path)

输出结果：

one-hot编码的使用：

# 导入用于对象保存与加载的joblib
import joblib
# 加载之前保存的Tokenizer, 实例化一个t对象
t = joblib.load(tokenizer_path)

#  编码token为“李四”
token = '李四'
#  使用t获得token_index
token_index = t.texts_to_sequences([token])[0][0] - 1
print(token_index)

#  初始化一个zero_list
zero_list = [0] * len(vocab)

#  令zero_list的对应索引为1
zero_list[token_index] = 1
print(token, '的one-hot编码是：', zero_list)

运行效果：

one-hot编码的优劣势：

优势：操作简单，容易理解.
劣势：完全割裂了词与词之间的联系，而且在大语料集下，每个向量的长度过大，占据大量内存.

2. word2vec

将词汇表示成向量的无监督训练方法，将构建神经网络模型，将网络参数作为词汇的向量表示，它包含CBOW和Skipgram两种训练方式。

CBOW(Continuous bag of words)模式：

给定一段用于训练的文本语料, 再选定某段长度(窗口)作为研究对象, 使用上下文词汇预测目标词汇.

图中窗口大小为9, 使用前后4个词汇对目标词汇进行预测.

CBOW模式下的word2vec过程说明:

假设给定的训练语料只有一句话: Hope can set you free ，窗口大小为3，因此模型的第一个训练样本来自Hope can set，因为是CBOW模式，所以将使用Hope和set作为输入，can作为输出，在模型训练时， Hope，can，set等词汇都使用它们的one-hot编码. 如图所示: 每个one-hot编码的单词与各自的变换矩阵(即参数矩阵3x5, 这里的3是指最后得到的词向量维度)相乘之后再相加, 得到上下文表示矩阵(3x1).

接着, 将上下文表示矩阵与变换矩阵(参数矩阵5x3, 所有的变换矩阵共享参数)相乘, 得到5x1的结果矩阵, 它将与我们真正的目标矩阵即can的one-hot编码矩阵(5x1)进行损失的计算, 然后更新网络参数完成一次模型迭代.

最后窗口按序向后移动，重新更新参数，直到所有语料被遍历完成，得到最终的变换矩阵(3x5)，这个变换矩阵与每个词汇的one-hot编码(5x1)相乘，得到的3x1的矩阵就是该词汇的word2vec张量表示.

skipgram模式

给定一段用于训练的文本语料, 再选定某段长度(窗口)作为研究对象, 使用目标词汇预测上下文词汇.

图中窗口大小为9, 使用目标词汇对前后四个词汇进行预测.

skipgram模式下的word2vec过程说明：

假设给定的训练语料只有一句话: Hope can set you free ，窗口大小为3，因此模型的第一个训练样本来自Hope can set，因为是skipgram模式，所以将使用can作为输入，Hope和set作为输出，在模型训练时， Hope，can，set等词汇都使用它们的one-hot编码. 如图所示: 将can的one-hot编码与变换矩阵(即参数矩阵3x5, 这里的3是指最后得到的词向量维度)相乘, 得到目标词汇表示矩阵(3x1).

接着, 将目标词汇表示矩阵与多个变换矩阵(参数矩阵5x3)相乘, 得到多个5x1的结果矩阵, 它将与我们Hope和set对应的one-hot编码矩阵(5x1)进行损失的计算, 然后更新网络参数完成一次模型迭代.

最后窗口按序向后移动，重新更新参数，直到所有语料被遍历完成，得到最终的变换矩阵即参数矩阵(3x5)，这个变换矩阵与每个词汇的one-hot编码(5x1)相乘，得到的3x1的矩阵就是该词汇的word2vec张量表示.

第一步: 获取训练数据

# 获取烹饪相关的数据集, 它是由facebook AI实验室提供的演示数据集
# 首先创建一个存储数据的文件夹data
$ mkdir data
# 使用wget下载数据, 存储在data目录中
$ wget https://dl.fbaipublicfiles.com/fasttext/data/cooking.stackexchange.tar.gz -P data
# 解压data目录中的数据
$ tar xvzf ./data/cooking.stackexchange.tar.gz

查看数据的前10条：

$ head cooking.stackexchange.txt

数据说明：

cooking.stackexchange.txt中的每一行都包含一个标签列表，后跟相应的文档, 标签列表以类似 "__label__sauce __label__cheese"的形式展现, 代表有两个标签sauce和cheese, 所有标签__label__均以前缀开头，这是fastText识别标签或单词的方式. 标签之后的一段话就是文本信息.如: How much does potato starch affect a cheese sauce recipe?

第二步: 训练集与验证集的划分:

# 查看数据总数
$ wc cooking.stackexchange.txt

# 12404条数据作为训练数据
$ head -n 12404 cooking.stackexchange.txt > cooking.train
# 3000条数据作为验证数据
$ tail -n 3000 cooking.stackexchange.txt > cooking.valid

第三步: 训练词向量:

import fasttext
# 使用fasttext的train_supervised方法进行文本分类模型的训练
# 它的参数是数据集的持久化文件路径'../data/nlp/composition.txt'
model = fasttext.train_unsupervised('../data/nlp/cooking.train')
model

# 通过get_word_vector方法来获得指定词汇的词向量
model.get_word_vector('We')

第四步: 模型超参数设定:

# 在训练词向量过程中, 我们可以设定很多常用超参数来调节我们的模型效果, 如:
# 无监督训练模式: 'skipgram' 或者 'cbow', 默认为'skipgram', 在实践中，skipgram模式在利用子词方面比cbow更好.
# 词嵌入维度dim: 默认为100, 但随着语料库的增大, 词嵌入的维度往往也要更大.
# 数据循环次数epoch: 默认为5, 但当你的数据集足够大, 可能不需要那么多次.
# 学习率lr: 默认为0.05, 根据经验, 建议选择[0.01，1]范围内.
# 使用的线程数thread: 默认为12个线程, 一般建议和你的cpu核数相同.
model = fasttext.train_unsupervised('../data/nlp/cooking.train', "cbow", dim=300, epoch=1, lr=0.1, thread=8)
model

# 通过get_word_vector方法来获得指定词汇的词向量
model.get_word_vector('We')

array([ 1.8798960e-04,  3.9608974e-04,  1.2488964e-04, -9.2796411e-04,
       -6.1711291e-04, -6.2431244e-04, -1.4772391e-04, -3.5378849e-04,
       -3.0792586e-04,  5.1501358e-04,  1.6098269e-03,  1.0018016e-03,
        1.6719052e-03, -5.6049239e-04,  7.6037890e-04,  6.1507529e-04,
       -1.8648471e-03, -7.2232017e-04, -2.7811489e-04, -4.6330268e-04,
       -9.9416811e-04, -2.8092955e-04, -9.3677954e-06,  1.6349037e-03,
        4.3381727e-04, -6.1742309e-04,  9.5424021e-04, -3.5220262e-04,
       -2.4382970e-03, -1.9431422e-03, -6.0295616e-04,  6.0434028e-05,
        5.1125861e-04,  2.8696796e-04, -3.2288337e-04, -1.0013091e-03,
       -1.0437337e-03, -8.3238486e-04, -4.9110944e-04,  1.1270840e-03,
        8.6425280e-04, -1.9255802e-03, -1.9251168e-03, -1.6462419e-03,
       -1.8576446e-03,  7.5667788e-04,  6.6057773e-04, -6.5994063e-05,
       -1.6498434e-03, -2.5676386e-04, -4.6431762e-04,  3.8234689e-04,
       -6.8796007e-04,  1.0940077e-03, -2.7840986e-04, -3.9451220e-04,
        1.7935492e-03,  4.8564124e-04, -2.9137146e-04,  1.9880496e-03,
        2.9593395e-04,  7.1078213e-04, -5.0951108e-05, -2.1633005e-04,
       -5.9387996e-04,  1.3559591e-05,  4.3469830e-04, -1.5066195e-03,
        8.5074385e-04, -1.6271046e-03, -2.6409666e-04,  1.3218648e-03,
       -7.4308616e-04,  1.0227414e-03, -1.6490914e-03, -6.4410793e-04,
        6.9497466e-05,  3.5593982e-04,  2.6490851e-03, -5.3268351e-04,
        1.2321163e-03,  1.0681837e-03, -4.7990127e-04,  3.8721034e-04,
        9.9227787e-04, -5.4918707e-04, -1.4470376e-03,  1.2126429e-03,
       -4.3907342e-04, -3.9304476e-04, -6.5747555e-04,  3.0149959e-04,
        5.4582942e-04, -5.9078913e-04, -2.3132609e-03, -2.2930815e-03,
        2.5756651e-04, -4.4075365e-04, -1.6666949e-05,  1.4334652e-03,
        1.7858138e-03,  2.2278397e-04,  9.0640283e-04,  3.0442880e-04,
        1.3243086e-03, -7.0690678e-04, -6.4097706e-04,  4.2106956e-05,
       -5.3881318e-04,  2.0223754e-03,  8.1660668e-04,  9.3027781e-04,
        8.9407474e-04,  7.0259813e-04, -1.0891645e-03, -1.5033981e-03,
        1.2447413e-03, -5.1550893e-04,  7.8015483e-04, -1.8651132e-04,
       -1.5457397e-03,  2.3224749e-04, -7.1424220e-05,  2.5053683e-05,
       -5.3998549e-04,  2.8403290e-04,  7.0932624e-04,  1.0760939e-03,
        9.5664262e-04, -1.2577500e-03, -1.3050484e-03, -9.9220476e-04,
       -1.1326331e-03, -3.9973820e-04,  1.8455237e-03, -1.2213863e-03,
        4.4848816e-04,  1.1577337e-04, -1.3397774e-04, -1.1544895e-03,
       -2.4254384e-04, -1.1866910e-03,  9.7491080e-05, -1.5464274e-03,
       -5.7074567e-04, -6.0549628e-05,  4.0644035e-04, -1.9360933e-03,
        8.4747089e-04,  1.4777582e-03, -8.4022677e-04,  5.1099074e-04,
        2.1948041e-04, -1.5321872e-03,  9.0355752e-05, -1.8932702e-04,
       -8.6888927e-04,  3.4475196e-04,  1.1358424e-03,  5.9262745e-04,
        1.4131053e-03, -6.2828342e-04, -2.0598862e-03,  3.5489188e-04,
       -9.5051492e-04,  5.5754336e-04,  1.5305297e-04, -2.2592241e-04,
       -1.2468253e-03,  2.1133265e-03,  2.0393701e-03, -7.5453354e-05,
        2.2464308e-03, -2.7793306e-03, -2.7650670e-04, -5.6757347e-04,
       -1.2623724e-03,  2.4185526e-04, -2.1872879e-04, -1.3029057e-03,
        1.2648103e-03, -1.7081172e-04, -5.1090492e-06,  2.0209840e-03,
       -4.6539324e-04, -4.3347658e-04,  2.6551257e-03, -4.7769718e-05,
       -1.5018480e-03, -2.7433509e-04, -1.1514550e-03, -9.0617285e-04,
        6.4340071e-05, -1.4025187e-04,  1.6628280e-03, -2.0780518e-04,
        1.2190402e-03, -5.0332031e-04,  9.3403400e-04, -2.3752507e-03,
       -1.6558596e-03, -2.7870771e-04, -5.1363997e-05, -3.8631755e-04,
       -1.2252243e-03, -8.8181972e-05, -8.7797281e-04,  4.6918890e-04,
        2.8892321e-04, -3.6389800e-05, -3.7714560e-04,  1.6713038e-03,
       -6.1489409e-06, -9.9299802e-04,  2.9321382e-04,  3.4070999e-04,
       -9.1769427e-05,  4.3389792e-04,  2.8307032e-04,  1.8194178e-03,
       -2.1896229e-04, -8.7369949e-04,  1.1310980e-03,  2.5185114e-03,
       -2.8928742e-05,  3.6371639e-05, -3.4053749e-04, -1.3872653e-03,
        1.9170906e-03, -1.9865986e-03,  2.5991439e-03,  7.5947837e-04,
        4.3592113e-04,  6.6652254e-04, -2.0494119e-04, -9.2760939e-04,
       -1.5355994e-04, -9.6773081e-05, -4.9556443e-04,  1.1428313e-03,
        1.4962892e-03,  1.0212720e-03, -3.8397498e-05,  5.6903791e-05,
       -5.9897255e-04, -2.0230697e-03, -1.7971732e-05, -2.3715696e-04,
       -7.2849606e-04, -9.0493623e-04,  7.3953054e-04, -1.4050563e-03,
       -1.4323555e-03, -4.4240867e-04,  5.6989986e-04,  2.5848616e-03,
        4.2838976e-04, -6.8223989e-04, -6.6442939e-05,  6.2906457e-04,
       -1.3130277e-03, -2.7790554e-03,  3.0586561e-05, -8.8957418e-04,
       -7.8230907e-05,  9.6563809e-04, -8.4480271e-04,  1.8562011e-03,
        4.5768984e-04, -9.2681765e-04,  5.0427485e-04,  1.6942159e-03,
       -2.4133138e-04,  1.6701745e-04, -8.1996943e-05,  1.8672661e-04,
       -3.0396209e-04, -1.5319184e-03,  6.3104037e-04,  3.0288688e-04,
        9.7920932e-04,  1.0130615e-03, -6.8494043e-04, -1.3638380e-03,
        1.4863213e-03,  9.4224850e-04,  7.5208559e-04, -3.8108899e-04,
       -9.1517594e-04,  1.0825705e-03, -6.2862772e-04, -7.2933477e-04,
       -1.1180628e-03,  7.0936600e-04, -6.9769856e-04,  1.8013072e-03,
        1.9647011e-03, -2.0243833e-03, -1.0390377e-03,  7.8340177e-04],
      dtype=float32)

第五步: 模型保存与加载:

# 使用save_model保存模型
model.save_model("../data/nlp/cooking.train.bin")

# 使用fasttext.load_model加载模型
model = fasttext.load_model("../data/nlp/cooking.train.bin")
model.get_word_vector("We")

3. word embedding

word embedding是深度学习中表示文本常用的一种方法。和one-hot编码不同，word embedding使用了浮点型的稠密矩阵来表示token。根据词典的大小，我们的向量通常使用不同的维度，例如100,256,300等。其中向量中的每一个值是一个参数，其初始值是随机生成的，之后会在训练的过程中进行学习而获得。

如果文本中有20000个词语，如果使用one-hot编码，那么我们会有20000*20000的矩阵，其中大多数的位置都为0，但是如果我们使用word embedding来表示的话，只需要20000* 维度，比如20000*300

形象的表示就是：

token	num	vector
词1	0	`[w11,w12,w13...w1N]` ,其中N表示维度（dimension）
词2	1	`[w21,w22,w23...w2N]`
词3	2	`[w31,w23,w33...w3N]`
...	….	...
词m	m	`[wm1,wm2,wm3...wmN]`,其中m表示词典的大小

我们会把所有的文本转化为向量，把句子用向量来表示

但是在这中间，我们会先把token使用数字来表示，再把数字使用向量来表示。

即：token---> num ---->vector

3.1 word embedding API

torch.nn.Embedding(num_embeddings,embedding_dim)

参数介绍：

num_embeddings：词典的大小
embedding_dim：embedding的维度

使用方法：

embedding = nn.Embedding(vocab_size,300) #实例化
input_embeded = embedding(input)         #进行embedding的操作  # input传入的只能是数字，字符串无法操作

3.2数据的形状变化

思考：每个batch中的每个句子有10个词语，经过形状为[20，4]的Word emebedding之后，原来的句子会变成什么形状？

每个词语用长度为4的向量表示，所以，最终句子会变为[batch_size,10,4]的形状。

增加了一个维度，这个维度是embedding的dim

让旅游更智能：基于AR的旅游导览应用解析 Echo_Wish Python 笔记 Python算法旅游 ar restful
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
模型压缩与优化技术——神经架构搜索（Neural Architecture Search, NAS） DuHz 轻量化模型机器学习计算机视觉人工智能神经网络深度学习数据挖掘语音识别
模型压缩与优化技术中的神经架构搜索（NeuralArchitectureSearch,NAS）技术1.引言在深度学习领域，神经网络的架构设计对模型的性能至关重要。传统的手动设计网络架构的过程费时费力，且通常依赖于经验和直觉。为了提升效率与效果，神经架构搜索（NeuralArchitectureSearch,NAS）作为一种自动化的方法，能够通过算法寻找和优化最佳的神经网络架构。NAS可以在图像识别
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶人工智能机器学习深度学习
摘要随着系统规模的扩大和复杂性增加，传统基于规则的日志分析方法难以识别隐藏的复杂异常模式。本文将介绍基于机器学习的日志异常检测技术，包括模型选择、特征工程及实现步骤。通过具体的代码示例与图表，展示如何高效检测异常日志，并提供应用场景与优化策略。引言日志是系统运行状态的关键数据来源，但面对海量日志数据，传统规则式分析显得力不从心。机器学习能够根据日志的历史数据和行为模式，通过训练模型检测异常情况，不
大模型密度定律：AI代码生成器将迎来爆发式增长？前端
近年来，人工智能（AI）技术飞速发展，尤其是在代码生成领域，涌现出许多强大的AI代码生成器。清华大学刘知远团队近期提出的“大模型密度定律”，为我们理解AI技术的发展速度提供了新的视角，也预示着AI代码生成技术的未来发展趋势。该定律指出，模型能力密度每3.3个月翻倍，这将如何改变我们对AI发展的认知，并对AI代码生成器产生怎样的影响呢？让我们深入探讨。大模型密度定律：能力密度与指数级增长“大模型密度
面向 Data+AI 的统一数据目录探索 | Data Infra NO.22 回顾（含资料发布）数据库
随着生成式人工智能（GenerativeAI）的崛起，从图像生成、自然语言处理到个性化推荐系统，生成式AI技术正迅速改变着各行各业的面貌。而在这场变革背后，数据的管理和治理显得尤为重要。对于企业来说，数据不仅是基础资源，更是构建AI应用和增强业务能力的关键。ApacheGravitino（incubating）与Databend作为数据领域两个知名的开源项目，正通过各自的创新技术和实践，为数据管理
大模型密度定律：AI代码生成器将迎来爆发式增长？前端
近年来，人工智能（AI）技术飞速发展，尤其是在代码生成领域，涌现出许多强大的AI代码生成器。清华大学刘知远团队近期提出的“大模型密度定律”，为我们理解AI技术的发展速度提供了新的视角，也预示着AI代码生成技术的未来发展趋势。该定律指出，模型能力密度每3.3个月翻倍，这将如何改变我们对AI发展的认知，并对AI代码生成器产生怎样的影响呢？让我们深入探讨。大模型密度定律：能力密度与指数级增长“大模型密度
QAT与PTQ模型量化方法的区别 old_power 计算机视觉模型量化深度学习计算机视觉
QAT（QuantizationAwareTraining）和PTQ（PostTrainingQuantization）是两种常见的模型量化方法，用于减少深度学习模型的计算和存储开销，同时尽量保持模型的性能。1.QAT（QuantizationAwareTraining）定义：QAT是在模型训练过程中引入量化操作，使模型在训练时就能感知到量化带来的影响，从而更好地适应量化后的精度损失。流程：在训练
毕设分享深度学习街道行人流量计数系统 fawubio_A 毕业设计 python 毕设
文章目录0前言1项目运行效果2设计概要2原理介绍2.1目标检测概况什么是目标检测？发展阶段2.2行人检测行人检测简介行人检测技术难点行人检测实现效果4最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要
Python语法总结彧侠脚本处理 Python
Python作为一种解释型的脚本语言，无论从自动化运维、大数据处理还是人工智能都得到了广泛的应用，而且它好理解、易学习、上手快的特点也使它成为了当下最火热的开发语言之一。下面就对Python语言中的各种语法做一个总结，以备后用数据类型一、整数二、浮点数三、字符串四、布尔值五、空值print语句注释什么是变量比如：定义字符串raw字符串与多行字符串Unicode字符串字符串还有一个编码问题。整数和浮
Keras、TensorFlow、PyTorch框架对比及服务器配置揭秘小深ai硬件分享人工智能深度学习服务器
深度学习框架：开启智能大门的钥匙在数字化浪潮中，深度学习如明星照亮众多领域。从智能安防的人脸识别，到医疗图像分析、电商商品推荐、智能语音助手等，其身影无处不在，改变着生活与工作方式。在深度学习领域，Keras、TensorFlow和PyTorch是主流框架，能助开发者构建强大智能模型。但这些框架要充分发挥作用，离不开合适的服务器配置，就像魔法师需要魔法棒和魔力，下面我们就来看看这些具体的框架吧:框
python+ollama本地大模型批量识别PDF，总结摘要以及关键词并输出EXCEL。月野难浔丶 python pdf 开发语言
现在市场上有很多PDF文件的识别，转化，等等。有些业务可能需要总结摘要和关键词等等一系列的操作。然而随着AI的兴起，本地大模型的部署，这些成为一种很方便的方法，接下来我将为各位介绍我所使用的方法。本篇文章旨在自动化处理PDF文档，提取并清理文本数据，然后使用一种大型模型生成摘要和关键词。最后，处理结果会被整理并输出到Excel文件中，便于后续分析和查看。人工智能（AI）是一种模拟人类智能的科技，它
深度学习｜表示学习｜卷积神经网络｜局部链接是什么？｜06 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：局部连接（LocalConnectivity），是卷积神经网络（CNN）中的一个关键特性。什么是局部连接（LocalConnectivity）？局部连接指的是：在卷积操作中，每个神经元（或输出单元）只与输入数据的一个局部区域相关联，而不是与整个输入数据相连。换句话说：全连接网络（FullyConnectedLayer）中，每个神经元会与上一层所有的神经元相连。卷积网络（Convoluti
多Agent框架之-CrewAI-人工智能代理团队的未来 WorkAgent 人工智能 ai langchain
CrewAI-aroleplayingAIAgentsgit地址：https://github.com/joaomdmoura/crewai#why-crewailangchain地址：CrewAIUnleashed:FutureofAIAgentTeamsAgent具有与另一个Agent联系的能力，以委派工作或提出问题。任务可以使用特定的代理工具覆盖，这些工具应该被使用，同时还可以指定特定的代理
机器人学习的范式转变：从专用走向通用基础模型 XianxinMao 机器人
标题：机器人学习的范式转变：从专用走向通用基础模型文章信息摘要：机器人学习正经历从特定任务向通用基础模型的范式转变，这一演进路径与大语言模型相似。通过多机器人协作和跨任务泛化能力的成功，基础模型方向展现出实现通用人工智能的潜力。然而，这一转变面临两大关键挑战：机器人硬件的高昂成本限制了大规模部署和数据采集，以及获取足够规模和多样性的训练数据存在实际困难。突破这些瓶颈需要在制造工艺创新、数据共享生态
AI写代码工具Claude：惊悚小说创作的意外热潮与全球用户偏好差异前端
近年来，人工智能在各个领域的应用日新月异，其中AI代码生成器的兴起更是为开发者带来了前所未有的效率提升。Anthropic最近发布的一份Claude使用报告，基于百万级用户数据，揭示了这款强大的AI模型的广泛应用，以及不同语言用户对其偏好差异的惊人发现。报告的核心发现之一，便是中文用户对使用Claude创作惊悚小说的强烈偏好，这一现象引发了广泛关注。这篇文章将深入探讨这一现象背后的原因，并对比分析
《人工智能新质生产力：GDP增长的未来引擎，究竟能贡献多少？》人工智能深度学习
在当今科技飞速发展的时代，人工智能作为新质生产力的代表，正以前所未有的态势冲击着全球经济格局，其对GDP增长的贡献率备受关注。从全球视角来看，诸多研究和专家观点都对人工智能的经济贡献给出了积极预测。普华永道曾在2017年发布报告指出，到2030年，人工智能的发展将带动全球GDP增长14％，相当于15.7万亿美元。莫干山研究院学术委员会主任朱嘉明认为，当前人工智能对全球GDP的平均影响约为0.1%，
AI写代码工具Claude：惊悚小说创作的意外热潮与全球用户偏好差异前端
近年来，人工智能在各个领域的应用日新月异，其中AI代码生成器的兴起更是为开发者带来了前所未有的效率提升。Anthropic最近发布的一份Claude使用报告，基于百万级用户数据，揭示了这款强大的AI模型的广泛应用，以及不同语言用户对其偏好差异的惊人发现。报告的核心发现之一，便是中文用户对使用Claude创作惊悚小说的强烈偏好，这一现象引发了广泛关注。这篇文章将深入探讨这一现象背后的原因，并对比分析
[python][whl]pyltp的whl格式文件所有版本下载地址汇总 FL1623863129 Python python 开发语言
pyltp：Python中的中文自然语言处理工具在数字化时代，自然语言处理（NLP）成为了与机器进行交互的关键技术。对于中文，由于其独特的语言结构和复杂性，专门的工具和库显得尤为重要。pyltp正是这样一个为中文NLP任务设计的Python库，它封装了LTP（LanguageTechnologyPlatform）的核心功能，使得开发者能够轻松地在Python环境中进行中文文本的处理和分析。pylt
深度学习中交叉熵函数的导数:(极简) 洪小帅深度学习人工智能神经网络 python
文章目录前言一.交叉熵函数的导数二.Z,y为有n条数据的矩阵前言另一个博主有更详细的推导https://blog.csdn.net/chaipp0607/article/details/101946040一.交叉熵函数的导数softmax:令一条数据最后的输出为[z1,z2,z3,z4,…,z10],这里令输出层的神经元数量为10pi=ezi∑j=110ezjpi=\frac{e^{z_i}}{\
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
基于Python的三种主流网络爬虫技术吃肉肉335 python 爬虫开发语言
一、网络爬虫是什么网络爬虫，通常也被称为网络蜘蛛或网络机器人，是一种按照一定方法，获取网络各种信息的自动化脚本程序，也可以将其理解为一个在互联网上自动提取网页信息并进行解析抓取的程序。网络爬虫的功能不仅局限于复制网页内容、下载音视频文件，更包括自动化执行行为链以及模拟用户登录等复杂操作。在当前大数据背景下，无论是人工智能应用还是数据分析工作，均依赖于海量的数据支持。如果仅依赖人工采集这一种方式，不
下载马斯克Grok-1模型的实战代码 herosunly 大模型 grok-1 下载模型实战代码
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了下载马斯克Grok-1模型的实战代码，希望能对学习大模型的同学们有所帮助
吴恩达深度学习笔记（七）——机器学习策略子非鱼icon 深度学习自学笔记深度学习机器学习人工智能神经网络吴恩达
一、正交化通俗的理解就是：要能够诊断出系统性能瓶颈在哪里，以有策略刚好解决这个问题。一个“按钮”只负责解决一件事情。二、单一数字评估指标准确率（precision）：在分类器中标记为猫的例子中，有多少是真的猫召回率（recall）：对于所有的真猫图片，你的分类器正确识别了多少。但如果有两个评估指标，就很难去选择一个更好的分类器，如下图所示。所以有一个结合这两个指标的标准方法，也即F1分数，定义如下
Java 大视界 -- Java 大数据文本分析与自然语言处理：从文本挖掘到智能对话一只蜗牛儿 java 大数据自然语言处理
在当今的信息化时代，数据成为了重要的资源。特别是文本数据，随处可见，如社交媒体、新闻网站、技术文档、客户反馈等，这些都包含着大量的潜在信息。因此，如何从海量的文本中提取有价值的信息，成为了大数据分析领域的重要课题。Java作为一种高效、灵活的编程语言，在大数据文本分析与自然语言处理（NLP）中发挥着至关重要的作用。本文将介绍如何利用Java开发大数据文本分析和自然语言处理（NLP）应用，带领你从文
商汤善惠获金沙江创投领投A轮融资，聚焦零售AI业务 TMT星球人工智能人工智能零售大数据
1月20日，商汤善惠宣布完成A轮融资，本轮融资由金沙江创投数千万元领投，微木资本、嘉实基金和金弘基金等知名资管平台和产业资本数千万元跟投，鞍羽资本担任长期财务顾问。此次融资将重点投向零售AI算法研发创新、海外市场拓展战略方向，助力公司全球化布局迈入新阶段。商汤善惠脱胎于全球领先的AI人工智能软件公司商汤集团，聚焦零售领域的商品识别算法与智能运营提效算法，目前，公司已推出引领行业的新一代无人零售智能
科技赋能，商贸物流新速度 —— 智慧供应链商城加速企业成长呆码科技科技
科技赋能，商贸物流新速度——智慧供应链商城加速企业成长随着科技的飞速发展，AI（人工智能）、大数据、物联网等先进技术正深刻重塑着商贸物流行业，推动其向更高效、更智能、更环保的方向迈进。这些技术的应用不仅提升了物流效率，降低了运营成本，还增强了供应链的透明度和可控性，为商贸物流行业带来了前所未有的变革。智慧供应链商城是一个集成了AI、大数据、物联网等先进技术的综合服务平台，旨在通过科技手段提升物流效
数据挖掘：定义、挑战与应用黑色叉腰丶大魔王数据挖掘人工智能
一、数据挖掘的定义（一）概念阐述数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它融合了数据库技术、统计学、机器学习、人工智能等多学科的理论和方法，旨在通过对数据的深入分析和处理，发现有价值的模式、关联、趋势等，从而为决策提供支持。（二）与相关概念的区别与联系数据库管理：数据库管理侧重于数据的存储、组织、检索和维护
深度学习中的通道(Channel)概念详解小·恐·龙大模型深度学习人工智能
1.通道的基本概念通道(Channel)是深度学习中的一个重要概念，它在不同场景下有不同的具体含义。理解通道概念对于理解深度学习模型的结构和工作原理至关重要。2.大语言模型中的通道2.1全连接层的通道概念2.1.1基本结构输入：[batch_size,input_features]权重：[input_features,output_features]输出：[batch_size,output_fe
lisp不是函授型语言_LISP语言 sunlee0520 lisp不是函授型语言
[拼音]：LISPyuyan[外文]：LISP为非数值符号运算而设计的表处理语言。LISP是英文LISTPROCESSING(表处理)的缩写。LISP语言是1960年J.麦卡锡在递归函数论基础上首先设计出来的。LISP语言的形式化程度高，表达力强，适合于描述各种知识和编写问题求解的程序，因此一直是用来研究人工智能的一种基本语言。自然语言中词可以认为是能单独用来构成句子的最小单元，由词可以构成词组，
lisp语言与python_Lisp 语言优点那么多，为什么国内很少运用？特殊后勤小干事 lisp语言与python
为什么Lisp没有流行起来本文探讨的是为什么Lisp语言不再被广泛使用的。很久以前，这种语言站在计算机科学研究的前沿，特别是人工智能的研究方面。现在，它很少被用到，这一切并不是因为古老,类似古老的语言却被广泛应用.其他类似的古老的语言有FORTRAN,COBOL,LISP,BASIC,和ALGOL家族,这些语言的唯一不同之处在于,他们为谁设计,FORTRAN是为科学家和工程师设计的,他们在计算机上
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户