十年一梦实验室

【机器学习】条件随机场

一、马尔可夫随机场

1.1 概率图模型

什么是有向图模型和无向图模型？

https://www.jianshu.com/p/dabbc78471d7 团、极大团、最大团 - 简书 (jianshu.com)

1.2 马尔可夫随机场

二、条件随机场概述

2.1 条件随机场简介

条件随机场（Conditional Random Field，简称 CRF）是一种用于序列标注（sequence labeling）的概率模型。它是马尔可夫随机场（Markov Random Field，简称 MRF）的一种扩展，可以用无向图来表示输入序列和输出序列之间的条件依赖关系。条件随机场的每个节点对应一个输出标签，每条无向边表示两个相邻标签之间的相关性，每个节点的概率分布由输入序列和相邻节点的取值共同决定。

条件随机场的主要优点是：

它可以利用丰富的特征来描述输入序列和输出序列之间的复杂关系，而不受马尔可夫假设的限制。
它可以在全局范围内对输出序列进行建模，而不是局部地对每个输出标签进行建模，从而避免了标注偏置（Label Bias）问题。
它可以通过无向图来表示输出序列的依赖结构，而不是有向图，从而避免了循环依赖（Cyclic Dependency）问题。

条件随机场的主要缺点是：

它的训练和预测过程都比较耗时，特别是当特征的个数和标签的个数很大时，计算归一化因子和最优序列的代价很高。
它的特征选择和权重调整都需要人工干预，没有自动化的方法来确定最优的特征组合和权重分配。
它的模型参数和特征函数都是固定的，不能随着数据的变化而自适应地更新和调整。

2.2 线性链条件随机场（LCCRF）

线性链条件随机场的每个节点对应一个输出标签，每条无向边表示两个相邻标签之间的相关性，每个节点的概率分布由输入序列和相邻节点的取值共同决定。

要建立条件随机场，需要定义特征函数集，因为特征函数是条件随机场的核心组成部分，它们用于描述输入序列和输出序列之间的关系，从而决定了条件随机场的概率模型和图结构。

特征函数集可以分为两类：转移特征函数和状态特征函数。转移特征函数表示两个相邻标签之间的特征，状态特征函数表示一个标签的特征。特征函数可以包含输入序列和位置的信息，也可以包含其他的信息，如词性、词典、语法等。特征函数的选择取决于具体的应用场景和数据特点，一般需要根据经验和实验来确定。

特征函数集的大小和多样性影响了条件随机场的模型复杂度和表达能力，一般来说，特征函数越多越丰富，条件随机场的性能越好，但也会增加计算的代价和过拟合的风险。因此，特征函数集的定义需要平衡特征的有效性和效率，以达到最佳的效果。

模型训练完成后，每一个特征函数有一个权重，这个权重表示该特征函数对标注序列的评分和概率的贡献程度。特征函数的权重可以通过最大似然估计（Maximum Likelihood Estimation，简称 MLE）或最大后验估计（Maximum A Posteriori，简称 MAP）来求解，这两种方法都是基于训练数据来优化对数似然函数或对数后验概率的方法，可以用梯度下降（Gradient Descent）或拟牛顿法（Quasi-Newton Method）等优化算法来实现。

三、推断算法

四、训练算法

采用最大似然估计训练条件随机场

最大似然估计L-BFGS求解

采用最大后验估计训练条件随机场

五、应用场景

六、示例：NER-命名实体识别

这是一个基于条件随机场(CRF)的中文命名实体识别代码实现。主要步骤如下:

CorpusProcess类:

实现了语料的预处理,包括全半角转换、合并分词、转换词性标签等
初始化了字序列、词性序列、标签序列
提取特征

CRF_NER类:

初始化CRF模型的参数
训练模型:使用训练集训练CRF模型
预测:加载模型,对输入句子进行词性标注和命名实体识别

主要依赖库:

sklearn_crfsuite:条件随机场模型
joblib:模型保存和加载

训练过程:

使用人民日报1998年语料进行训练
训练好的模型保存为model.pkl

使用方式:

直接加载模型预测,无需重新训练
输入汉字句子,输出识别的命名实体

评价:

实现了中文命名实体识别的条件随机场模型
语料预处理和特征提取设计合理
模型训练和预测流程清晰
对中文分词、词性标注和命名实体识别任务提供了很好的参考

综上所述,这是一份比较完整和典型的基于CRF的中文NER实现,内容充实,代码结构清晰,可以很好地帮助理解CRF在NER任务中的应用和实现过程。

输出结果：

源码

import re # 导入正则表达式模块
import sklearn_crfsuite # 导入条件随机场模块
from sklearn_crfsuite import metrics # 导入评估指标模块
import joblib # 导入模型保存和加载模块




class CorpusProcess(object): # 定义一个语料处理类


    def __init__(self): # 初始化方法
        """初始化"""
        self.train_corpus_path ="1980_01.txt" # 训练语料的路径
        self.process_corpus_path ="result-rmrb.txt" # 处理后的语料的路径
        self._maps = {u't': u'T', u'nr': u'PER', u'ns': u'ORG', u'nt': u'LOC'} # 词性标注和实体标注的映射关系


    def read_corpus_from_file(self, file_path): # 定义一个从文件中读取语料的方法
        """读取语料"""
        f = open(file_path, 'r', encoding='utf-8') # 以只读模式打开文件
        lines = f.readlines() # 读取所有行
        f.close() # 关闭文件
        return lines # 返回读取的内容


    def write_corpus_to_file(self, data, file_path): # 定义一个将语料写入文件的方法
        """写语料"""
        f = open(file_path, 'wb') # 以二进制写入模式打开文件
        f.write(data) # 写入数据
        f.close() # 关闭文件


    def q_to_b(self, q_str): # 定义一个将全角字符转换为半角字符的方法
        """全角转半角"""
        b_str = "" # 初始化一个空字符串
        for uchar in q_str: # 遍历全角字符串中的每个字符
            inside_code = ord(uchar) # 获取字符的 Unicode 编码
            if inside_code == 12288:  # 如果是全角空格，直接转换为半角空格
                inside_code = 32
            elif 65374 >= inside_code >= 65281:  # 如果是其他全角字符（除空格），根据关系转化为半角字符
                inside_code -= 65248
            b_str += chr(inside_code) # 将转换后的字符拼接到半角字符串中
        return b_str # 返回半角字符串


    def b_to_q(self, b_str): # 定义一个将半角字符转换为全角字符的方法
        """半角转全角"""
        q_str = "" # 初始化一个空字符串
        for uchar in b_str: # 遍历半角字符串中的每个字符
            inside_code = ord(uchar) # 获取字符的 Unicode 编码
            if inside_code == 32:  # 如果是半角空格，直接转化为全角空格
                inside_code = 12288
            elif 126 >= inside_code >= 32:  # 如果是其他半角字符（除空格），根据关系转化为全角字符
                inside_code += 65248
            q_str += chr(inside_code) # 将转换后的字符拼接到全角字符串中
        return q_str # 返回全角字符串


    def pre_process(self): # 定义一个语料预处理的方法
        """语料预处理 """
        lines = self.read_corpus_from_file(self.train_corpus_path) # 从训练语料的路径读取语料
        new_lines = [] # 初始化一个空列表，用于存储处理后的语料
        for line in lines: # 遍历每一行语料
            words = self.q_to_b(line.strip()).split(u'  ') # 将全角字符转换为半角字符，并去除首尾空格，然后按空格分割成词
            pro_words = self.process_t(words) # 处理时间词
            pro_words = self.process_nr(pro_words) # 处理人名
            pro_words = self.process_k(pro_words) # 处理大粒度分词
            new_lines.append('  '.join(pro_words[1:])) # 将处理后的词拼接成一行，并添加到新的语料列表中
        self.write_corpus_to_file(data='\n'.join(new_lines).encode('utf-8'), file_path=self.process_corpus_path) # 将新的语料列表写入到处理后的语料的路径


    def process_k(self, words): # 定义一个处理大粒度分词的方法
        """处理大粒度分词,合并语料库中括号中的大粒度分词,类似：[国家/n  环保局/n]nt """
        pro_words = [] # 初始化一个空列表，用于存储处理后的词
        index = 0 # 初始化一个索引，用于遍历词列表
        temp = u'' # 初始化一个空字符串，用于存储括号中的词
        while True: # 循环直到遍历完所有词或者遇到空词
            word = words[index] if index < len(words) else u'' # 获取当前索引对应的词，如果索引超出词列表的长度，就返回空字符串
            if u'[' in word: # 如果词中包含左括号
                temp += re.sub(pattern=u'/[a-zA-Z]*', repl=u'', string=word.replace(u'[', u'')) # 去除词性标注，并去除左括号，然后添加到临时字符串中
            elif u']' in word: # 如果词中包含右括号
                w = word.split(u']') # 按右括号分割词
                temp += re.sub(pattern=u'/[a-zA-Z]*', repl=u'', string=w[0]) # 去除词性标注，并添加到临时字符串中
                pro_words.append(temp + u'/' + w[1]) # 将临时字符串和右括号后的词性标注拼接起来，并添加到处理后的词列表中
                temp = u'' # 清空临时字符串
            elif temp: # 如果临时字符串不为空
                temp += re.sub(pattern=u'/[a-zA-Z]*', repl=u'', string=word) # 去除词性标注，并添加到临时字符串中
            elif word: # 如果词不为空
                pro_words.append(word) # 直接添加到处理后的词列表中
            else: # 如果词为空，表示遍历完所有词
                break # 跳出循环
            index += 1 # 索引加一
        return pro_words # 返回处理后的词列表
    
    def process_nr(self, words):
        """ 处理姓名，合并语料库分开标注的姓和名，类似：温/nr  家宝/nr"""
        pro_words = [] # 初始化一个空列表，用于存储处理后的词
        index = 0 # 初始化一个索引，用于遍历词列表
        while True: # 循环直到遍历完所有词或者遇到空词
            word = words[index] if index < len(words) else u'' # 获取当前索引对应的词，如果索引超出词列表的长度，就返回空字符串
            if u'/nr' in word: # 如果词中包含人名词性标注
                next_index = index + 1 # 获取下一个索引
                if next_index < len(words) and u'/nr' in words[next_index]: # 如果下一个词也包含人名词性标注
                    pro_words.append(word.replace(u'/nr', u'') + words[next_index]) # 去除词性标注，并将两个词合并为一个词，添加到处理后的词列表中
                    index = next_index # 更新索引为下一个索引
                else: # 如果下一个词不包含人名词性标注
                    pro_words.append(word) # 直接添加当前词到处理后的词列表中
            elif word: # 如果词不为空
                pro_words.append(word) # 直接添加当前词到处理后的词列表中
            else: # 如果词为空，表示遍历完所有词
                break # 跳出循环
            index += 1 # 索引加一
        return pro_words # 返回处理后的词列表


    def process_t(self, words):
        """处理时间,合并语料库分开标注的时间词，类似：（/w  一九九七年/t  十二月/t  三十一日/t  ）/w   """
        pro_words = [] # 初始化一个空列表，用于存储处理后的词
        index = 0 # 初始化一个索引，用于遍历词列表
        temp = u'' # 初始化一个空字符串，用于存储时间词
        while True: # 循环直到遍历完所有词或者遇到空词
            word = words[index] if index < len(words) else u'' # 获取当前索引对应的词，如果索引超出词列表的长度，就返回空字符串
            if u'/t' in word: # 如果词中包含时间词性标注
                temp = temp.replace(u'/t', u'') + word # 去除词性标注，并将词添加到临时字符串中
            elif temp: # 如果临时字符串不为空
                pro_words.append(temp) # 将临时字符串添加到处理后的词列表中
                pro_words.append(word) # 将当前词添加到处理后的词列表中
                temp = u'' # 清空临时字符串
            elif word: # 如果词不为空
                pro_words.append(word) # 直接添加当前词到处理后的词列表中
            else: # 如果词为空，表示遍历完所有词
                break # 跳出循环
            index += 1 # 索引加一
        return pro_words # 返回处理后的词列表


    def pos_to_tag(self, p):
        """由词性提取标签"""
        t = self._maps.get(p, None) # 根据词性在映射关系中查找对应的标签，如果没有找到，就返回 None
        return t if t else u'O' # 如果找到了标签，就返回标签，否则返回 O


    def tag_perform(self, tag, index):
        """标签使用BIO模式"""
        if index == 0 and tag != u'O': # 如果是第一个词并且标签不是 O
            return u'B_{}'.format(tag) # 返回 B_标签
        elif tag != u'O': # 如果不是第一个词并且标签不是 O
            return u'I_{}'.format(tag) # 返回 I_标签
        else: # 如果标签是 O
            return tag # 返回 O


    def pos_perform(self, pos):
        """去除词性携带的标签先验知识"""
        if pos in self._maps.keys() and pos != u't': # 如果词性在映射关系的键中并且不是时间词
            return u'n' # 返回 n
        else: # 否则
            return pos # 返回原词性


    def initialize(self):
        """初始化 """
        lines = self.read_corpus_from_file(self.process_corpus_path) # 从处理后的语料的路径读取语料
        words_list = [line.strip().split('  ') for line in lines if line.strip()] # 将每一行语料去除首尾空格，并按空格分割成词，存储到一个列表中
        del lines # 删除语料变量，释放内存
        self.init_sequence(words_list) # 调用初始化字序列、词性序列、标记序列的方法


    def init_sequence(self, words_list):
        """初始化字序列、词性序列、标记序列 """
        words_seq = [[word.split(u'/')[0] for word in words] for words in words_list] # 将每个词按 / 分割，取第一个元素作为字，存储到一个列表中
        pos_seq = [[word.split(u'/')[1] for word in words] for words in words_list] # 将每个词按 / 分割，取第二个元素作为词性，存储到一个列表中
        tag_seq = [[self.pos_to_tag(p) for p in pos] for pos in pos_seq] # 将每个词性转换为对应的标签，存储到一个列表中
        self.pos_seq = [[[pos_seq[index][i] for _ in range(len(words_seq[index][i]))]
                         for i in range(len(pos_seq[index]))] for index in range(len(pos_seq))] # 将每个词性复制为与字相同的个数，存储到一个列表中
        self.tag_seq = [[[self.tag_perform(tag_seq[index][i], w) for w in range(len(words_seq[index][i]))]
                         for i in range(len(tag_seq[index]))] for index in range(len(tag_seq))] # 将每个标签按 BIO 模式转换，并复制为与字相同的个数，存储到一个列表中
        self.pos_seq = [[u'un'] + [self.pos_perform(p) for pos in pos_seq for p in pos] + [u'un'] for pos_seq in
                        self.pos_seq] # 将每个词性去除先验知识，并在首尾添加 un 标记，存储到一个列表中
        self.tag_seq = [[t for tag in tag_seq for t in tag] for tag_seq in self.tag_seq] # 将每个标签展平为一维列表，存储到一个列表中
        self.word_seq = [[u''] + [w for word in word_seq for w in word] + [u''] for word_seq in words_seq] # 将每个字展平为一维列表，并在首尾添加  和  标记，存储到一个列表中


    def extract_feature(self, word_grams):
        """特征选取"""
        features, feature_list = [], [] # 初始化两个空列表，用于存储特征和特征列表
        for index in range(len(word_grams)): # 遍历每个字窗口的索引
            for i in range(len(word_grams[index])): # 遍历每个字窗口中的每个字的索引
                word_gram = word_grams[index][i] # 获取当前字窗口中的当前字
                feature = {u'w-1': word_gram[0], u'w': word_gram[1], u'w+1': word_gram[2], # 构造一个特征字典，包含当前字的前一个字、当前字、后一个字，以及它们的组合
                           u'w-1:w': word_gram[0] + word_gram[1], u'w:w+1': word_gram[1] + word_gram[2],
                           # u'p-1': self.pos_seq[index][i], u'p': self.pos_seq[index][i+1], # 注释掉的部分是词性特征，这里不使用
                           # u'p+1': self.pos_seq[index][i+2],
                           # u'p-1:p': self.pos_seq[index][i]+self.pos_seq[index][i+1],
                           # u'p:p+1': self.pos_seq[index][i+1]+self.pos_seq[index][i+2],
                           u'bias': 1.0} # 添加一个偏置项，用于增加模型的灵活性
                feature_list.append(feature) # 将特征字典添加到特征列表中
            features.append(feature_list) # 将特征列表添加到特征中
            feature_list = [] # 清空特征列表，用于下一个字窗口
        return features # 返回特征


    def segment_by_window(self, words_list=None, window=3):
        """窗口切分"""
        words = [] # 初始化一个空列表，用于存储字窗口
        begin, end = 0, window # 初始化开始和结束的索引，分别为 0 和窗口大小
        for _ in range(1, len(words_list)): # 遍历字列表的长度
            if end > len(words_list): break # 如果结束的索引超出了字列表的长度，就跳出循环
            words.append(words_list[begin:end]) # 将字列表中从开始到结束的部分添加到字窗口中
            begin = begin + 1 # 更新开始的索引为原来加一
            end = end + 1 # 更新结束的索引为原来加一
        return words # 返回字窗口


    def generator(self):
        """训练数据"""
        word_grams = [self.segment_by_window(word_list) for word_list in self.word_seq] # 将每个字序列按窗口切分，得到字窗口
        features = self.extract_feature(word_grams) # 提取字窗口的特征
        return features, self.tag_seq # 返回特征和标签序列


class CRF_NER(object): # 定义一个命名实体识别的类
    def __init__(self): # 初始化方法
        """初始化参数"""
        self.algorithm = "lbfgs" # 指定优化算法为 LBFGS
        self.c1 = "0.1" # 指定正则化系数 c1
        self.c2 = "0.1" # 指定正则化系数 c2
        self.max_iterations = 100 # 指定最大迭代次数
        self.model_path ="model.pkl" # 指定模型保存的路径
        self.corpus = CorpusProcess()  # 创建一个语料处理的实例
        self.corpus.pre_process()  # 对语料进行预处理
        self.corpus.initialize()  # 初始化语料
        self.model = None # 初始化模型为 None


    def initialize_model(self): # 定义一个初始化模型的方法
        """初始化"""
        algorithm = self.algorithm # 获取优化算法
        c1 = float(self.c1) # 获取正则化系数 c1
        c2 = float(self.c2) # 获取正则化系数 c2
        max_iterations = int(self.max_iterations) # 获取最大迭代次数
        self.model = sklearn_crfsuite.CRF(algorithm=algorithm, c1=c1, c2=c2, # 创建一个条件随机场的模型，传入相应的参数
                                          max_iterations=max_iterations, all_possible_transitions=True)


    def train(self): # 定义一个训练模型的方法
        """训练"""
        self.initialize_model() # 调用初始化模型的方法
        x, y = self.corpus.generator() # 从语料中生成特征和标签
        x_train, y_train = x[500:], y[500:] # 将后 500 个样本作为训练集
        x_test, y_test = x[:500], y[:500] # 将前 500 个样本作为测试集
        self.model.fit(x_train, y_train) # 用训练集拟合模型
        labels = list(self.model.classes_) # 获取模型的所有标签
        labels.remove('O') # 移除 O 标签，表示非实体
        y_predict = self.model.predict(x_test) # 用模型对测试集进行预测
        metrics.flat_f1_score(y_test, y_predict, average='weighted', labels=labels) # 计算加权平均的 F1 分数，只考虑实体标签
        sorted_labels = sorted(labels, key=lambda name: (name[1:], name[0])) # 对标签按照 BIO 模式进行排序
        print(metrics.flat_classification_report(y_test, y_predict, labels=sorted_labels, digits=3)) # 打印分类报告，包括精确度、召回率、F1 分数等指标
        self.save_model() # 调用保存模型的方法


    def predict(self, sentence): # 定义一个预测方法，输入一个句子，输出实体
        """预测"""
        self.load_model() # 调用加载模型的方法
        u_sent = self.corpus.q_to_b(sentence) # 将句子中的全角字符转换为半角字符
        word_lists = [[u''] + [c for c in u_sent] + [u'']] # 将句子中的每个字作为一个词，并在首尾添加特殊标记
        word_grams = [self.corpus.segment_by_window(word_list) for word_list in word_lists] # 将每个词按照窗口切分，得到字窗口
        features = self.corpus.extract_feature(word_grams) # 提取字窗口的特征
        y_predict = self.model.predict(features) # 用模型对特征进行预测，得到标签
        entity = u'' # 初始化一个空字符串，用于存储实体
        for index in range(len(y_predict[0])): # 遍历每个预测的标签的索引
            if y_predict[0][index] != u'O': # 如果标签不是 O，表示是实体
                if index > 0 and y_predict[0][index][-1] != y_predict[0][index - 1][-1]: # 如果不是第一个字，并且当前标签的实体类型和前一个标签的实体类型不同
                    entity += u' ' # 在实体字符串中添加一个空格，用于分隔不同的实体
                entity += u_sent[index] # 在实体字符串中添加当前字
            elif entity[-1] != u' ': # 如果标签是 O，表示不是实体，并且实体字符串的最后一个字符不是空格
                entity += u' ' # 在实体字符串中添加一个空格，用于分隔不同的实体
        return entity # 返回实体字符串


    def load_model(self): # 定义一个加载模型的方法
        """加载模型 """
        self.model = joblib.load(self.model_path) # 从模型保存的路径加载模型


    def save_model(self): # 定义一个保存模型的方法
        """保存模型"""
        joblib.dump(self.model, self.model_path) # 将模型保存到指定的路径




if __name__=="__main__": # 如果是主程序


    ner = CRF_NER() # 创建一个命名实体识别的实例
    #训练模型，当训练完毕后，就可以直接加载模型参数，不用再次训练了
    #mode=ner.train() # 调用训练模型的方法，这里注释掉，表示不用再次训练


    result1=ner.predict(u'新华社北京十二月三十一日电(中央人民广播电台记者刘振英、新华社记者张宿堂)今天是一九九七年的最后一天。') # 调用预测方法，输入一个句子
    print(result1) # 打印预测的结果
    result2=ner.predict(u'中国，我爱你。') # 调用预测方法，输入另一个句子
    print(result2) # 打印预测的结果

参考网址：

https://www.jianshu.com/p/7fa260e91382

AI人工智能领域多模态大模型的技术瓶颈与解决方案 AI学长带你学AI 人工智能 ai
AI人工智能领域多模态大模型的技术瓶颈与解决方案关键词：多模态大模型、技术瓶颈、跨模态对齐、计算效率、数据稀缺、模型泛化、解决方案摘要：本文深入探讨了AI人工智能领域多模态大模型发展过程中面临的主要技术瓶颈，包括跨模态对齐困难、计算资源消耗巨大、高质量多模态数据稀缺、模型泛化能力不足等问题。针对这些挑战，我们提出了系统性的解决方案，涵盖算法优化、架构创新、数据增强等多个维度。文章通过理论分析、数学
【杂谈】-人工智能：从无序部署到可问责治理的转型之路
人工智能：从无序部署到可问责治理的转型之路文章目录人工智能：从无序部署到可问责治理的转型之路1、失控的人工智能与“漂移”现象的潜在危机2、穿透迷雾：探寻人工智能治理的真谛3、民主化进程中的治理觉醒4、迈向未来：构建可问责的人工智能生态体系5、抉择时刻：关乎人工智能发展走向的关键权衡人工智能已然步入一个关键的转折阶段。当下，众多企业竞相投身于各类人工智能系统的部署浪潮之中，从功能多样的生成式人工智能
从“直觉抢答”到“深度思考”：大模型的“慢思考”革命，思维链、树、图如何让AI越来越像人？陈敬雷-充电了么-CEO兼CTO 《GPT多模态大模型与AI Agent智能体》新书内容人工智能 chatgpt AIGC 神经网络 python 大模型思维链
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列十六从“直觉抢答”到“深度思考”：大模型的“慢思考”革命，思维链、树、图如何让AI越来越像人？引言：当AI从“快
【机器学习&深度学习】什么是量化？一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、量化的基本概念1.1量化对比示例1.2量化是如何实现的？二、为什么要进行量化？2.1解决模型体积过大问题2.2降低对算力的依赖2.3加速模型训练和推理2.4优化训练过程2.5降低部署成本小结：量化的应用场景三、量化的类型与实现3.1权重量化（WeightQuantization）3.2激活量化（ActivationQuantization）3.3梯度量化（GradientQuantiz
MATLAB 基于图像处理的杂草识别技术鱼弦 matlab 图像处理计算机视觉
MATLAB基于图像处理的杂草识别技术1.系统介绍杂草识别是精准农业中的重要环节，基于图像处理的杂草识别技术利用计算机视觉和机器学习算法，自动识别田间杂草，为精准施药提供决策支持。本系统基于MATLAB实现杂草图像处理，包括图像预处理、特征提取、分类识别等模块。2.应用场景精准农业:自动识别田间杂草，实现精准施药，减少农药使用量。生态监测:监测农田杂草种类和分布，评估生态环境。植物保护:识别有害杂
Python 机器学习：NumPy 实现朴素贝叶斯分类器 Python编程之道 Python编程之道 python 机器学习 numpy ai
Python机器学习：NumPy实现朴素贝叶斯分类器关键词：朴素贝叶斯分类器、NumPy、机器学习、概率模型、条件概率、拉普拉斯平滑、向量化计算摘要：本文系统讲解朴素贝叶斯分类器的核心原理，基于NumPy实现高效的算法框架，涵盖从概率理论到工程实现的完整流程。通过数学公式推导、代码实现和鸢尾花数据集实战，展示如何利用向量化计算优化概率估计，解决特征独立性假设下的分类问题。同时分析算法优缺点及实际应
运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
基于蜣螂算法优化多头注意力机制的卷积神经网络结合双向长短记忆神经网络实现温度预测DBO-CNN-biLSTM-Multihead-Attention附matlab代码 matlab科研助手神经网络算法 cnn
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍温度预测在气象学、农业、能源等领域具有重要的应用价值。随着大数据和人工智能技术的快速发
迁移学习让深度学习更容易城市中迷途小书童
摘要：一文读懂迁移学习及其对深度学习发展的影响！深度学习在一些传统方法难以处理的领域有了很大的进展。这种成功是由于改变了传统机器学习的几个出发点，使其在应用于非结构化数据时性能很好。如今深度学习模型可以玩游戏，检测癌症，和人类交谈，自动驾驶。深度学习变得强大的同时也需要很大的代价。进行深度学习需要大量的数据、昂贵的硬件、甚至更昂贵的精英工程人才。在ClouderaFastForward实验室，我们
股票基金量化开源平台对比 Mr.小海开源开源金融
股票基金量化开源平台对比分析报告引言研究背景与意义在金融科技快速发展的背景下，量化交易已成为现代金融市场中投资者追求高效与精准交易的核心工具。通过程序化方式，投资者能够迅速处理海量市场数据，制定并执行复杂交易策略，其高效性、低情绪干扰及策略多样性等优势显著[1]。特别是随着人工智能技术的深化，2025年基于深度学习与机器学习的开源量化工具持续涌现，推动行业向数据驱动转型——量化交易将决策逻辑从经验
开源基金/股票量化平台调研报告 Mr.小海金融
开源基金/股票量化平台调研报告引言调研背景与目的近年来，随着人工智能技术的持续深化，量化交易领域迎来了深刻变革。2025年，基于深度学习和机器学习的开源工具不断涌现，不仅在技术层面实现突破，更在实际应用中展现出强大竞争优势，推动行业创新与升级[1].作为融合数学、统计与计算机技术的科技驱动型金融策略，量化交易通过自动化与数据驱动方法提升投资决策效率与准确性，已成为金融机构与投资者追求超额收益的重要
同步发电机与逆变型电源故障电流特性对比实验研究神经网络15044 MATLAB专栏仿真模型生成对抗网络学习人工智能开发语言 matlab
同步发电机与逆变型电源故障电流特性对比实验研究前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.研究背景与意义随着可再生能源在电力系统中的渗透率不断提高，逆变型电源(Inverter-BasedResources,IBR)在电网中的比重日益增加。与传统同步发电机相比，IBR的故障响应特性存在显著差异，这对电力系统的保护设计和运行控制提出了新的挑战
AIGC革命：基于魔搭社区的LLM应用开发实战——从模型微调到系统部署 Liudef06小白 AIGC 人工智能特殊专栏人工智能魔搭 AIGC LLM
AIGC革命：基于魔搭社区的LLM应用开发实战——从模型微调到系统部署1.AIGC技术演进与魔搭社区生态解析人工智能生成内容（AIGC）正在重塑内容创作、软件开发和人机交互的边界。从OpenAI的GPT系列到StabilityAI的StableDiffusion，生成式AI技术正以惊人的速度发展。在这场技术革命中，魔搭社区（ModelScope）作为中国领先的AI模型开源平台，正成为开发者探索AI
人工智能界的“黑话“大揭秘：AI新词汇速成指南
人工智能界的"黑话"大揭秘：AI新词汇速成指南你是否曾在科技大佬们讨论AI时一头雾水？听到RAG、Agent、PromptEngineering时以为他们在说天书？别担心，今天我们就来一场AI术语的"通俗化运动"，让你轻松混入AI圈子，秒变内行人！LLM（大型语言模型）：AI界的"大胃王"LLM是吞噬了互联网大部分文字的"数据饕餮"。特点：训练数据以TB（万亿字节）计算参数动辄上千亿计算能力堪比小
解密Claude系列：从原理到实践的全方位解析软考和人工智能学堂强化学习人工智能 Claude快速入门 Claude
引言：Claude系列模型的崛起在人工智能领域，大型语言模型(LLM)的发展日新月异。OpenAI的GPT系列和Anthropic的Claude系列无疑是这一领域的双子星。Claude系列模型以其独特的"ConstitutionalAI"理念和强大的对话能力，正在重塑人机交互的未来。本文将深入探讨Claude系列的技术原理、架构特点，并通过实践代码展示其强大能力。Claude系列的技术演进1.Cl
元宇宙：中国数字经济的新赛道——基于游戏生态、AI与区块链的创新实践 boyedu 元宇宙域名游戏人工智能区块链元宇宙
引言：数字经济时代的“新大陆”在数字技术的浪潮中，元宇宙正从科幻概念跃升为全球科技竞争的焦点。中国，作为全球数字经济规模第二大的经济体，正以独特的路径探索元宇宙的发展——以游戏生态为起点，融合人工智能（AI）与区块链技术，构建一个虚实融合的数字新世界。这一路径不仅契合中国在5G、AI、区块链等领域的技术积累，更与“数字经济”“新质生产力”等国家战略形成共振。本文将从技术融合、经济价值、社会影响三个
智能体架构设计的五大核心原则：构建下一代AI系统的工程基石一休哥助手人工智能
引言：智能体架构的范式演进人工智能领域正经历从孤立模型向自主智能体的范式转变。2025年，全球AI智能体市场规模突破200亿美元，在金融、医疗、制造等领域的渗透率超40%。然而，智能体开发仍面临协作效率低（多智能体任务重叠率达30%）、安全风险高（工具调用错误率18%）和系统僵化（需求变更迭代周期超2周）三大痛点。本文基于产业实践提炼五大核心设计原则，为构建下一代智能体系统提供架构指南。传统LLM
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
昇思MindSpore创新训练营·长三角站开始报名！昇思MindSpore 人工智能自然语言处理深度学习
一、介绍为充分发挥长三角研究型大学联盟教学实践基地共建共享功能，加强华东高校优秀青年学子的交流与互动，提供学生与产业界接触的机会，上海交通大学与华为技术有限公司共同发起，面向长三角研究型大学学生开设昇思MindSpore创新训练营。本次训练营以实践项目和业界需求为牵引，以学生实践为主线，让学生在实践的过程中学习和实践人工智能相关知识，掌握相关技术和工具，紧跟业界最新趋势，加深对人工智能行业的认识，
OPPO未来科技大会，科技感满满！你最爱哪些黑科技呢？冬天不冷了
#OPPO未来科技大会#OPPO携手IHSMarkit发布《智能互融：借助5G、人工智能和云技术，释放机遇》白皮书，表明人工智能、云技术和边缘设备、互联和物联网的协同努力，将为企业和消费者带来价值。看了一下早上的，是说明年绿厂要发不少好玩的产品，比如智能手表AR眼镜之类的，有些可能跟Reno3一块发，对外是说构建生态万物互联，其实就是多卖几样多赚钱，然后用这钱砸了搞技术赚更大的钱，毕竟现场说了未来
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
2025年最流行跑分最高的图片理解大模型调研报告
2025年最流行跑分最高的图片理解大模型调研报告引言当前，图片理解大模型正处于快速演进阶段，其技术发展呈现多维度深化与融合的特征。从技术演进方向来看，多模态融合已成为核心趋势之一，文本、图像、视频等不同模态的交互与协同能力显著提升。大型视觉-语言模型（LVLMs）作为人工智能领域的重要突破，标志着多模态理解与交互进入变革性发展阶段，尽管当前模型在各类任务中表现出色，但在细粒度视觉任务等基础能力层面
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
Java云原生安全矩阵：从代码到运行时的量子级防御墨夶 Java学习资料6 java 云原生安全
核心架构：SpringSecurity与Envoy的“量子态防御”基于声明式安全的“波函数坍缩”API网关的“暗物质过滤”代码示例：SpringSecurity的量子态权限控制威胁检测的“超弦理论”基于行为分析的“量子隧穿”异常检测实时日志的“引力波监测”代码示例：机器学习驱动的异常行为检测加密与密钥管理的“暗能量引擎”敏感数据的“量子态加密”密钥的“黑洞事件视界”保护代码示例：BCrypt与JW
入门勤学奋进小郎君
了解机器学习标签需要通过机器学习模型判断出的结果特征机器学习模型进行判断的条件（可以是很多的变量）模型机器学习判断的工具降低损失线性回归y=mx+b其中：y指的是温度（以摄氏度表示），即我们试图预测的值。m指的是直线的斜率。x指的是每分钟的鸣叫声次数，即输入特征的值。b指的是y轴截距。2018-10-31_155803.png但是这样会对一些样本有误差，而我们的目的就是得到将误差降到最低的模型降低
第 20 课时：GPU 管理和 Device Plugin 工作机制（车漾）阿里云云原生 CNCF X 阿里巴巴云原生技术公开课阿里云 Kubernetes CNCF 专家团队 CNCF 专家团队 CNCF 专家团队 Kubernetes
本文将主要分享以下几个方面的内容：需求来源GPU的容器化Kubernetes的GPU管理工作原理课后思考与实践需求来源2016年，随着AlphaGo的走红和TensorFlow项目的异军突起，一场名为AI的技术革命迅速从学术圈蔓延到了工业界，所谓AI革命从此拉开了帷幕。经过三年的发展，AI有了许许多多的落地场景，包括智能客服、人脸识别、机器翻译、以图搜图等功能。其实机器学习或者说是人工智能，并不是
智慧后厨检测算法构建智能厨房防护网智驱力人工智能人工智能算法高温预警行为识别口罩识别食品安全手套识别
智慧后厨检测：构建安全洁净厨房的智能解决方案背景：传统后厨管理的痛点与智慧化需求餐饮行业后厨管理长期面临操作规范难落实、安全隐患难察觉、卫生状况难追溯等痛点。传统人工巡检效率低、覆盖面有限，难以实现24小时无死角监管。例如，厨师未佩戴口罩或手套、违规使用手机、动火离人等行为，可能引发食品安全事故或火灾风险。随着人工智能技术的成熟，智慧后厨检测系统通过集成多种算法，实现了对后厨人员行为、环境卫生、设
《Python Web 框架深度剖析：Django、Flask 与 FastAPI 的选择之道》清水白石008 课程教程学习笔记开发语言 python 前端 django
《PythonWeb框架深度剖析：Django、Flask与FastAPI的选择之道》开篇引入：从“胶水语言”到Web架构核心Python，自1991年由GuidovanRossum发布以来，凭借其简洁优雅的语法和强大的生态系统，逐渐成为全球最受欢迎的编程语言之一。它不仅在数据科学、人工智能、自动化脚本等领域大放异彩，更在Web开发领域构建起一套成熟的技术体系。作为一位长期从事Python开发与教
【DeepSeek实战】10、模型上下文协议（MCP）全解析：从核心架构到实战应用，揭秘AI协作的“凤雏”之力无心水人工智能架构 DeepSeek实战模型上下文协议MCP CSDN技术干货 DeepSeek AI大模型
在人工智能技术飞速发展的今天，大型语言模型（LLM）的能力不断突破，但跨模型协作、上下文一致性维护等问题却成为制约AI系统向更智能、更协同方向发展的瓶颈。模型上下文协议（ModelContextProtocol，MCP）作为专为大模型设计的标准化通信框架，如同“凤雏”之于“卧龙”，为解决这些核心问题提供了关键方案。本文将全面解析MCP的核心概念、架构设计、实操代码、应用案例及未来趋势，通过5000
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

【机器学习】条件随机场

你可能感兴趣的:(机器学习,人工智能)