账户不存在

pytorch实现TextCnn文本分类

1.模型结构图

图中的kernel size = [2,3,4], 每个size下的卷积核个数是2，而代码中是kernel size = [3,4,5]，每个size下的卷积核个数是16。
要保证池化后向量长度为1： [(pool_input_len - pool_kernel_size) / stride] +1 = 1, 一般stride取值为1，那么pool_kernel_size = input_len
就是说：池化层的卷积核尺寸应该等于输入到该层的向量的长度(pool_input_len)，而输入到该层的向量长度是原向量长度(origin_len)经过卷积之后得到的，那么反推可以得到该层输入向量长度：
[(origin_len - conv_kernel_size) / stride]+1 = pool_input_len
文章后面写的 Textcnn 没有简化，是为了方便理解，而简化版的用了 nn.ModuleList
下面是简化版代码

config.vocab_size ## 已知词库大小
config.embedding_size ##每个词向量长度
config.num_clas ##类别数
config.out_channels = 16 ## 输出卷积核的个数
args.kernel_sizes ## 卷积核list，形如[3,4,5]
class TextCNN(nn.Module):
    def __init__(self, config):
        super(TextCNN, self).__init__()
        self.dropout_rate = config.dropout_rate
        self.num_class = config.num_clas
 
        self.embedding = nn.Embedding(num_embeddings=config.vocab_size, 
                                embedding_dim=config.embedding_size)  
        self.convs = nn.ModuleList([
                       nn.Sequential(
                			  nn.Conv1d(in_channels=config.embedding_size,
                			  out_channels=config.out_channels, 
                              kernel_size= ks),  						
                              nn.ReLU(), 
                              nn.MaxPool1d(kernel_size=config.max_len-ks+1)) 
                       for ks in config.kernel_size ]) # 创建3个nn.Sequential，包含了 图中的convolution层、activation function层 和 maxPooling层, 其中每个层的参数都有变化
        self.fc = nn.Linear(in_features=config.out_channels*len(config.kernel_size),
                            out_features=config.num_class) # 每种类别的卷积核个数相乘，得到的长度就是全连接层输入的长度 
    
    def forward(self, x):
        embed_x = self.embedding(x) # b x src_len
        embed_x = embed_x.permute(0, 2, 1) 
        # b x src_len x embed_size --> b x embed_size x src_lem
        out = [conv(embed_x) for conv in self.convs]  #计算每层卷积的结果，这里输出的结果已经经过池化层处理了
        out = torch.cat(out, dim=1)  # 对池化后的向量进行拼接
        out = out.view(-1, out.size(1)) # 拉成一竖条作为全连接层的输入
        out = F.dropout(input=out, p=self.dropout_rate) # 这里也没有在图中的表现出来，这里是随机让一部分的神经元失活，避免过拟合。它只会在train的状态下才会生效。进入train状态可查看nn.Module。train()方法
        out = self.fc(out)
        return out

2.代码

代码参考博文NLP学习之使用pytorch搭建textCNN模型进行中文文本分类
主要记录自学NLP的一些心得。前面和该博主代码一样，只是样本只选择了2000，因为我的电脑没有GPU，后面模型那块想自己试着写写看。模型正确率差不多70%，因为只迭代了10次，大家可以增大样本量和迭代次数来提高准确率。代码中有很多可以改进的地方，代码中也会有一些错误，欢迎大家指出来中文数据是数据
具体是第3个百科问答Json版，下载下来得到两个文件：baike_qa_train.json和baike_qa_valid.json。大概内容如下:

{“qid”: “qid_1815059893214501395”, “category”: “烦恼-恋爱”, “title”: "请问深入骨髓地喜欢一个人怎么办我不能确定对方是不是喜欢我，我却想 ", “desc”: “我不能确定对方是不是喜欢我，我却想分分秒秒跟他在一起，有谁能告诉我如何能想他少一点”, “answer”: "一定要告诉他你很喜欢他很爱他!! 虽然不知道你和他现在的关系是什么！但如果真的觉得很喜欢就向他表白啊！！起码你努力过了！女生主动多少占一点优势的！！呵呵只愿曾经拥有！到以后就算感情没现在这么强烈了也不会觉得遗憾啊~！与其每天那么痛苦的想他恋他还不如直接告诉他！不要怕回破坏你们现有的感情！因为如果不告诉他你可能回后悔一辈子！！ "}

下下来的数据类别非常多，为了简化，我从中筛选了少量的样本进行学习。具体来说，只选择了标题前2个字为教育、健康、生活、娱乐和游戏五个类别，同时各个类别各2000个。代码如下：

1.sample_select.py

'''
从原始数据中选取部分样本2000；
选取数据的“category”前两个字符在字典wanted_classes中；
且各个类别的数量在wanted_num中；
'''
import jieba
import json
TrainJsonFile = r"J:\NLP语料\baike_qa2019\baike_qa_train.json"
ValidJsonFile = r"J:\NLP语料\baike_qa2019\baike_qa_valid.json"
# MyTrainFile用来存筛选好的训练数据
#MyValidFile用来存筛选好的验证数据                                     
MyTrainFile = r"J:\NLP语料\my_baike_qa_train.json                           
#MyValidFile = r"J:\NLP语料\my_baike_qa_valid.json" # 对验证集数据也做样本筛选
StopWordFile = r"J:\NLP语料\baike_qa2019\stopword.txt"
wanted_classes = {"教育":0, "健康":0, "生活":0, "娱乐":0, "游戏":0}
wanted_num = 2000
wanted_all = 2000 * 5
def main()
    f_read = open(ValidJsonFile, "r", encoding="utf-8")
    f_write = open(MyTrainFile, "w", encoding= "utf-8")
    #f_write = open(MyValidFile, "w", encoding="utf-8"
    numind = 0
    for line in f_read.readlines():  #list,每个元素都是json字符串(句子）
       data = json.loads(line)  #将json字符串转化为python字典
       cla = data['category'][:2] 
       if cla in wanted_classes and wanted_classes[cla] < wanted_num:
           json_data = json.dumps(data) # 把data转化为json字符串
           f_write.write(json_data)
           f_write.write("\n")
           wanted_classes[cla] += 1
           numind += 1
           if numind >= wanted_all:
               break
if __name__ ==  "__main__":
   main()

2.word_corpus.py

我们需要得到训练数据中所有的“title”对应的词表。也就是说我们首先对每个标题使用jieba分词工具进行分词，之后去除停用词，剩下的就构成了我们的词表。

词表的每一行的内容为：词 词的序号 词的频次

from tqdm import tqdm
import json
import jieba
MytrainFile = r"J:\NLP语料\my_baike_qa_train.json"
stopwordFile = r"J:\NLP语料\baike_qa2019\stopword.txt"
wordLabelFile = r"J:\NLP语料\wordLabel.txt"
LengthFile = r"J:\NLP语料\Length.txt"
def read_stopword(fp):
    f_stopword = open(fp,"r",encoding="utf-8")
    data = f_stopword.read().split("\n")
    return data

def main():
   worddict = {}
   stopword_list = read_stopword(stopwordFile)
   datas = open(MytrainFile, "r", encoding="utf-8").read().split("\n")
   datas = list(filter(None,datas))
   print("len(datas):", len(datas)) 
   data_num = len(datas)
   lenth_dict = {}
   for data in datas:
       data = json.loads(data)
       title = data["title"]
       title_seg = jieba.cut(title) # jieba.cut返回迭代器
       lenth = 0
       for word in title_seg:
           if word in stopword_list:
               continue
           lenth += 1  # 一个title中去掉停用词的长度
           if word in worddict:
               worddict[word] += 1
           else:
               worddict[word] = 1
        if lenth in lenth_dict:
           lenth_dict[lenth] += 1
        else:
           lenth_dict[lenth] = 1                                                
    wordlist = sorted(worddict.items(), key= lambda item:item[1], reverse=True)# 从大到小排列
   #print("wordlist:", wordlist)
    f = open(wordLabelFile, "w", encoding="utf-8")
    ind = 0
    for tup in wordlist:
       d = tup[0] + " " + str(ind) + " " + str(tup[1]) + "\n"
       ind += 1
       f.write(d)
   for k, v in lenth_dict.items():
       lenth_dict[k] = round(v * 1.0 / data_num, 3)
   #print(lenth_dict.items())
   lenlist = sorted(lenth_dict.items(), key=lambda item:item[0], reverse=True)
   print("lenlist:",lenlist)
   f = open(LengthFile,"a", encoding="utf-8")
   for tup in lenlist:
       d = str(tup[0]) + " "+ str(tup[1]) + "\n"f.write(d)
if __name__ == "__main__":
   main()

3. word2token.py

有了词表，我们就可以把文本转化为数字了。比如下面这句话：
我爱NLP啊 （原始句子）
我 / 爱 / NLP/啊 （jieba分词结果）
我 / 爱 / NLP（去除停用词啊）
1 5 102 0 0（将其数字化，“我”对应1，人工智能对应102。假设我们设定句子长度为5.则需要在后面加两个0）

import json
import jieba
import random
trainFile = r"J:\NLP语料\my_baike_qa_train.json"
#validFile = r"J:\NLP语料\my_baike_qa_valid.json"  #也需要将验证集转化为数字
stopwordFile = r"J:\NLP语料\baike_qa2019\stopword.txt"
wordlabelFile = r"J:\NLP语料\wordLabel.txt"
trainDataVecFile = r"J:\NLP语料\traindata_vec.txt"
validDataVecFile = r"J:\NLP语料\validdata_vec.txt"
labelFile = r"J:\NLP语料\label.txt"
maxLen = 20

def read_labelFile(fp)：
    data = open(fp, "r", encoding="utf-8").read().split("\n")
        #print(data)
    label_w2n = {}
    label_n2w = {}
    for labelItem in data:
        labelItem = labelItem.split(" ") # list
        label_w = labelItem[0]
        label_ind = int(labelItem[1])
        label_w2n[label_w] = label_ind
        label_n2w[label_ind] = label_w

    return label_w2n, label_n2w
# label_w2n, label_n2w = read_labelFile(labelFile)
# print(label_n2w)
# print(label_w2n)

def read_stopword(fp):
    f_stopword = open(fp,"r",encoding="utf-8")
    data = f_stopword.read().split("\n") # list,每个元素是句子字符串
    return data

def get_wordtoken(fp):
    datas = open(fp, "r", encoding="utf-8").read().split("\n")
    print(len(datas))
    datas = list(filter(None, datas)) # 过滤空句子
    #print(len(datas))
    word2ind = {}
    for i in datas:
        i = i.split(" ")
        word2ind[i[0]] = int(i[1])
    ind2word = {word2ind[w] : w for w in word2ind}
    return word2ind, ind2word
#get_wordtoken(wordlabelFile)

def title2Vec():
    label_w2n, label_n2w = read_labelFile(labelFile)
    word2ind, ind2word = get_wordtoken(wordlabelFile)
    trainDataFile = open(trainDataVecFile, "w")
    #validDataFile = open(validDataVecFile, "w")
    stoplist = read_stopword(stopwordFile)
    datas = open(validFile, "r",encoding="utf-8").read().split("\n")
    datas =list(filter(None, datas))
    random.shuffle(datas)

    for line in datas:
        line_dict = json.loads(line)
        title = line_dict["title"]
        cls = line_dict["category"][:2]
        cls_ind = label_w2n[cls]
        title_seg = jieba.cut(title)
        title_ind = [cls_ind]
        
        for word in title_seg:
            if word in stoplist:
                continue
            title_ind.append(word2ind[word])
        #print("title_ind:",title_ind)
        length = len(title_ind)
        if length > maxLen:  # 句子截断
            title_ind = title_ind[:20]
        else:   # 句子填充0，句子的总长度是20，第一个数字其实是类别的索引（0,1,2,3,4)
            title_ind.extend([0] * (maxLen - length))
        #print(len(title_ind))
        for num in title_ind: #list
            trainDataFile.write(str(num) + ",")
        trainDataFile.write("\n")
            #validDataFile.write(str(num) + ",")
        #validDataFile.write("\n")
    return word2ind, label_w2n

def main():
    word2ind, label_w2n = title2Vec()
    return word2ind, label_w2n
if __name__ == "__main__":
    main()

4.textCNN.py

'''
模型包含embedding层，卷积层，dropout层和全连接层
'''
from word2token import title2Vec
word2ind, label_w2n = title2Vec()
#print(word2ind) maxLen = 19  # 长度的第一个数字是标签，去掉之后是19了
textcnn_param = {
        "vocab_size": len(word2ind),
        "embed_size": 50,
        "class_num":len(label_w2n),
        "kernel_num": 16,
        "kernel_size":[3,4,5],
        "dropout_p": 0.5
            }

import torch
import torch.nn as nn
import torch.functional as F
import math

class textCNN(nn.Module):

    def __init__(self):
        super().__init__()
        # nn.embedding 生成了一个矩阵，当制定padding = ind时，那么矩阵的第ind行元素会置零
        #padding会让矩阵的某些行置为0
        # 用什么数字num填充padding， padding就应该设置为num
        self.vocab_size = textcnn_param["vocab_size"]
        self.embed_size = textcnn_param["embed_size"]
        self.class_num = textcnn_param["class_num"]
        self.kernel_num = textcnn_param["kernel_num"]
        self.kernel_size = textcnn_param["kernel_size"]
        self.dropout_p = textcnn_param["dropout_p"]
        self.embedding = nn.Embedding(self.vocab_size, self.embed_size, padding_idx=0)

        self.textcnn1 = nn.Conv1d(in_channels = self.embed_size, out_channels=self.kernel_num,kernel_size= self.kernel_size[0])

        self.textcnn2 = nn.Conv1d(in_channels = self.embed_size, out_channels=self.kernel_num,kernel_size= self.kernel_size[1])

        self.textcnn3 = nn.Conv1d(in_channels = self.embed_size, out_channels=self.kernel_num,kernel_size= self.kernel_size[2])
        self.pool1 = nn.MaxPool1d(kernel_size= (maxLen - self.kernel_size[0] + 1))
        self.pool2 = nn.MaxPool1d(kernel_size=(maxLen - self.kernel_size[1] + 1))
        self.pool3 = nn.MaxPool1d(kernel_size=(maxLen - self.kernel_size[2] + 1))
        self.relu = nn.ReLU()
        self.linear = nn.Linear(in_features= len(self.kernel_size) * self.kernel_num, out_features= self.class_num)

    def forward(self, x):
        #x : b x src_len
        x = self.embedding(x) # b x src_len x embed_size
        #print("input x:", x.size())
        x = x.permute(0,2,1)
        x1 = self.textcnn1(x)  # conver1d 的输入输出格式
        # input : b x in_channel x src_len (in_channel == embed_size)
        # output: b x out_channel x out_len1
        #print("x1 conv", x1.size())  # 16 x 16 x 17
        x1 = self.relu(x1)
        x1 = self.pool1(x1)
        #print("x1 pool",x1.size())
        # output: b x out_channel x pool_len ( pool_len = out_len - pool_kernel_size + 1)
        x2 = self.textcnn2(x)  # input : b x in_channel x src_len (in_channel == embed_size)
        # output: b x out_channel x out_len2
        #print("x2 conv", x2.size())
        x2 = self.relu(x2)
        x2= self.pool2(x2)
        # output: bx out_channel x pool_len ( pool_len = out_len - pool_kernel_size + 1)
        #print("x2 pool", x2.size())
        x3 = self.textcnn3(x)  # input : b x in_channel x src_len (in_channel == embed_size)
        # output: b x out_channel x out_len3
        x3 = self.relu(x3)
        x3 = self.pool3(x3)
        # output: b x out_channel x pool_len ( pool_len = out_len - pool_kernel_size + 1)
        x = torch.cat([x1,x2,x3], dim = 1) # b x 3*out_channel x 1
        #print("x.size:", x.size())
        nn.Dropout(self.dropout_p)
        # self.linear 的input: b x in_channel
        x = x.squeeze(2) # x: b x 3*out_channel(即:3*kernel_num)
        out = self.linear(x) # b x class_num
        return out

5.数据集构建DataLoader.py

from torch.utils.data import Dataset, DataLoader
import torch
import random
trainDataVecFile = r"J:\NLP语料\traindata_vec.txt"
class TextCnnData(Dataset):
    def __init__(self, fp = trainDataVecFile):   # 不需要继承父类的init，只需填写自己需要的信息就好
        DataVec = open(fp, "r", encoding="utf-8").read().split("\n") # list的每个元素都是字符串

        DataVec = list(filter(None, DataVec)) # ["2, 6720,54,186,9,0,0,0,0", ""2,467,175,1959,2619,5,10,0,0, "1,234,678,9,",...]
        #print(trainDataVec) 每个字符串开头第一个数字代表该句子的类别
        # 原地打乱
        random.shuffle(DataVec)
        self.trainDataVec = DataVec
        #print("trainDataVec:", self.trainDataVec)

    def __getitem__(self, item):
        sent = self.trainDataVec[item] # str
        sent = sent.split(",") # list 里面每个元素为数字字符
        sent = list(filter(None, sent))
        sents = [int(digit_str) for digit_str in sent]
        #print("sent: ", sents)
        idx = sents[0]
        #print("idx",idx)
        sentence = torch.LongTensor(sents[1:]) # 转为tensor格式
        return idx, sentence

    def __len__(self):
        return len(self.trainDataVec)

if __name__ == "__main__":
    # from tqdm import tqdm
    # idx, sent = TextCnnData().__getitem__(1)
    # print("idx",idx) # tensor(4)
    # print("sent _ size: ",sent, sent.size())  # tensor([3334, 2376,9,883,1287,681,....]
    BATCH_SIZE = 5
    TextCnnDataLoader = DataLoader(TextCnnData(), batch_size=BATCH_SIZE, shuffle=True)
    for  i, data in enumerate(TextCnnDataLoader):
        # forward
        idx_, sents = data
        print("idx___",idx_)
        print(len(sents))
        break

6.训练train.py

'''模型训练过程：5步

1.数据

2.模型

3.损失函数

4.优化器

5.训练'''

import torch
import os
import torch.nn as nn
import numpy as np
import time
from textCNN import textCNN
from DataLoader import TextCnnData
import word2token
from torch.utils.data import DataLoader
import torch.optim as optim
from matplotlib import pyplot as plt
from tqdm import tqdm

MAX_EPOCH = 10
BATCH_SIZE = 16
LR = 0.01
log_interval = 10
val_interval = 1
 ===============================step1 数据

trainDataVecFile = r"J:\NLP语料\traindata_vec.txt"

validDataVecFile = r"J:\NLP语料\validdata_vec.txt"

# 构建MyDataset实例

train_data = TextCnnData(fp= trainDataVecFile)

valid_data = TextCnnData(fp = validDataVecFile)

# 构建DataLoder

train_loader = DataLoader(dataset=train_data, batch_size=BATCH_SIZE, shuffle=True)

valid_loader = DataLoader(dataset=valid_data, batch_size=BATCH_SIZE)

================================ step 2 模型 

net = textCNN()

================================ step 3 损失函数 

criterion = nn.CrossEntropyLoss()

================================ step 4 优化器 

optimizer = optim.SGD(net.parameters(), lr=LR, momentum=0.9)  # 选择优化器"

scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.1)  # 设置学习率下降策略"

================================ step 5训练 

train_curve = list()
valid_curve = list()
for epoch in tqdm(range(MAX_EPOCH)):
    loss_mean = 0.
    correct = 0.
    total = 0.
    net.train()
    for i, data in tqdm(enumerate(train_loader)):
        # forward
        label, sents = data
        outputs = net(sents)
        # backward

        optimizer.zero_grad()
        loss = criterion(outputs, label)
        loss.backward()

        # update weights
        optimizer.step()

        # 统计分类情况
        _, predicted = torch.max(outputs.data, 1)
        total += label.size(0)
        crrrect += (predicted == label).squeeze().sum().numpy()
        # 打印训练信息

        loss_mean += loss.item()
        train_curve.append(loss.item())
        if (i + 1) % log_interval == 0:
            loss_mean = loss_mean / log_interval
            print("Training:Epoch[{:0>3}/{:0>3}] Iteration[{:0>3}/{:0>3}] Loss: {:.4f} Acc:{:.2%}".format(
                epoch, MAX_EPOCH, i+1, len(train_loader), loss_mean, correct / total))
            loss_mean = 0

    scheduler.step()  # 更新学习率
    # validate the model
    print("save model...........")
    model_path = r"J:\NLP语料\model\{}_model_iter_{}_{}_loss_{:.2f}.pkl".format(time.strftime("%y-%m-%d:%H"), epoch, i, loss.item())
    f = open(model_path, "w")
    torch.save(net.state_dict(),model_path)

    ====================================  验证 ===============================

    if (epoch+1) % val_interval == 0:
        correct_val = 0.
        total_val = 0.
        loss_val = 0.
        net.eval()
        with torch.no_grad():
            for j, data in tqdm(enumerate(valid_loader)):
                label, inputs = data
                outputs = net(inputs)
                loss = criterion(outputs, label)
                _, predicted = torch.max(outputs.data, 1)
                total_val += label.size(0)
                correct_val += (predicted == label).squeeze().sum().numpy()
                loss_val += loss.item()
            loss_val_epoch = loss_val / len(valid_loader)
            valid_curve.append(loss_val_epoch)
            # valid_curve.append(loss.item())    #记录整个epoch样本的loss，注意要取平均
            print("Valid:\t Epoch[{:0>3}/{:0>3}] Iteration[{:0>3}/{:0>3}] Loss: {:.4f} Acc:{:.2%}".format(
                epoch, MAX_EPOCH, j+1, len(valid_loader), loss_val_epoch, correct_val / total_val))
                
train_x = range(len(train_curve))
train_y = train_curve
train_iters = len(train_loader)

valid_x = np.arange(1, len(valid_curve)+1) * train_iters*val_interval # 由于valid中记录的是epochloss，需要对记录点进行转换到iterations
valid_y = valid_curve

plt.plot(train_x, train_y, label='Train')
plt.plot(valid_x, valid_y, label='Valid')
plt.legend(loc='upper right')
plt.ylabel('loss value')
plt.xlabel('Iteration')
plt.show()

Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
Adam-mini：深度学习内存效率新突破 XianxinMao 人工智能深度学习人工智能
标题：Adam-mini：深度学习内存效率新突破文章信息摘要：Adam-mini优化器在深度学习领域展现出突破性潜力，尤其在内存效率和计算性能上表现卓越。相比AdamW，Adam-mini将内存效率提升了一倍，并通过减少学习率数量显著降低了内存消耗，同时保持了与AdamW相当甚至更好的性能。在训练十亿参数级别的大语言模型（LLM）时，Adam-mini实现了49.6%的吞吐量提升，并减少了33%的
Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
使用 OpenAI Chat 模型进行对话开发的入门指南 eahba python
技术背景介绍OpenAI的对话模型（ChatOpenAI）为开发者提供了强大的自然语言处理功能，可以实现高度交互的AI应用。这篇文章将帮助您快速入门，了解如何在您的应用中集成和使用这些模型，并探讨不同的功能特性。核心原理解析ChatOpenAI模型是基于OpenAI的GPT家族，能够理解上下文并产生对话式回应。最新版的模型不仅支持标准文本输入输出，还支持工具调用、结构化输出等高级特性，满足多种复杂
高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
【自学笔记】NFT基础知识点总览-持续更新 Long_poem 笔记区块链
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录NFT（非同质化代币）基础知识点总览1.NFT简介2.NFT的应用场景3.NFT的工作原理4.NFT的创建和发行5.代码示例代码解释总结NFT（非同质化代币）基础知识点总览1.NFT简介NFT（Non-FungibleToken，非同质化代币）是一种基于区块链技术的独特数字资产，每个NFT都是唯一的、不可互换的。与同质化代币（
金融风控算法透明度与可解释性优化智能计算研究中心其他
内容概要金融风控算法的透明化研究面临模型复杂性提升与监管合规要求的双重挑战。随着深度学习框架在特征提取环节的广泛应用，算法可解释性与预测精度之间的平衡成为核心议题。本文从联邦学习架构下的数据协作机制出发，结合特征工程优化与超参数调整技术，系统性分析逻辑回归、随机森林等传统算法在召回率、F1值等关键指标上的表现差异。研究同时探讨数据预处理流程对风控决策鲁棒性的影响，并提出基于注意力机制的特征权重可视
H800核心性能优化技术智能计算研究中心其他
内容概要作为新一代AI加速卡的核心创新载体，H800通过异构计算架构与动态能效管理技术的协同设计，实现了从硬件底层到应用层的系统性优化。其技术突破聚焦于张量核心重构带来的计算密度提升、混合精度运算对资源利用率的增强，以及智能散热方案在复杂负载场景下的稳定性保障。这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的
详解如何通过Python的BeautifulSoup爬虫+NLP标签提取+Dijkstra规划路径和KMeans聚类分析帮助用户规划旅行路线 mosquito_lover1 python beautifulsoup 爬虫 kmeans 自然语言处理
系统模块：数据采集模块（爬虫）：负责从目标网站抓取地点数据（如名称、经纬度、描述等）数据预处理模块（标签算法）：对抓取到的地点数据进行清洗和分类。根据地点特征（如经纬度、描述文本）打上标签（如“适合家庭”、“适合冒险”）。地理数据处理模块（地图API）：使用地图API获取地点的详细信息（如地址、距离、路径等）。计算地点之间的距离或路径。路径规划模块：根据用户输入的起点和终点，规划最优路径。支持多种
TikTokenizer 项目常见问题解决方案齐飞锴Timothea
TikTokenizer项目常见问题解决方案tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目基础介绍TikTokenizer是一个开源项目，主要用于文本处理，特别是将文本转化为可用于深度学习的格式。该项目是基于TensorFlow和Keras开发
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
YOLO11改进-模块-引入频率谱动态聚合模块FSDA 去除噪声一勺汤 YOLOv11模型改进系列目标检测魔改模块 YOLO YOLOv11 YOLOv11改进改进
在图像去雾领域，深度学习在白天图像去雾方面成果显著，但夜间雾图研究较少。夜间雾图面临诸多挑战，其中包括雾、辉光和噪声因多个低强度有源彩色光源而具有复杂特性，以及模拟与真实数据的域差异导致的亮度问题。为解决这些，我们使用FSDA模块，处理频率不一致特性。FSDA先对频谱信息聚合，再计算通道权重并应用，最后映射回空间域，以此优化频谱信息，使模型更好处理复杂干扰。本文将其与YOLOv11相结合，增强YO
基于多头注意机制的多尺度特征融合的GCN的序列数据（功率预测、故障诊断）模型及代码详解清风AI 深度学习算法详解及代码复现人工智能神经网络深度学习 python conda pip pandas
GCN基础在深度学习领域中，图卷积网络(GCN)是一种强大的图数据处理工具。它将卷积操作扩展到图结构上，能够有效捕捉图中节点之间的关系信息。GCN的核心思想是通过聚合邻居节点的特征来更新目标节点的表示，这种局部聚合机制使得GCN能够学习到图的拓扑结构和节点属性。GCN的主要构成要素包括节点特征矩阵、邻接矩阵和卷积核。通过多次迭代，GCN可以逐步学习到图中节点的高阶表示，为后续的分类、预测等任务提供
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
向量数据库 PieCloudVector 进阶系列丨打造以 LLM 为基础的聊天机器人
本系列前两篇文章深入探讨了PieCloudVector在图片和音频数据上的应用之后，本文将聚焦于文本数据，探索PieCloudVector对于文本数据的向量化处理、存储以及检索，并最终结合LLM打造聊天机器人的全流程。在自然语言处理任务中涉及到大量对文本数据的处理、分析和理解，而向量数据库在其中发挥了重要的作用。本文为《PieCloudVector进阶系列》的第三篇，将为大家介绍如何利用PieCl
【十自然语言处理项目实战】【10.2 数据收集与预处理】再见孙悟空_ #自然语言处理人工智能知识图谱 transformer 自然语言处理数据收集自然语言处理预处理自然语言处理项目
各位在数据泥潭里打滚的勇士们，今天咱们要聊的这个话题，就像学做川菜必须掌握的"火锅底料炒制法"——数据收集与预处理！这玩意儿看着像脏活累活，实则是决定你模型上限的生死关卡。作为一个曾把BERT训成人工智障的老司机，这就把五年掉坑经验熬成一锅十全大补汤！（戴上橡胶手套准备掏数据）一、数据收集的野路子：比盗墓还刺激的冒险1.1公开数据集寻宝图（附藏宝坐标）①正道的光：Kaggle（数据界的沃尔玛）：搜
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n