常鸿宇

NPL工具——NER任务的多模型投票器

NER任务的多模型投票器

0. 介绍
1.数据格式
2.投票规则
3.代码实现
3.使用方法
4.其它情况

0. 介绍

最近在做命名实体识别（NER）相关的任务，在做一个集成的模型，涉及到多个模型结果融合的问题，需要用某种方法把多个模型预测出来的结果进行投票，得出最终的结果。由于任务是flat的NER，所以在投票的过程中需要避免实体重叠的问题。

为了实现这个功能我写了一个投票器类，把它记录下来，方便以后需要的时候再次使用。

1.数据格式

假设所有k个模型预测出来的结果保存为list格式的result，result的长度即为k，每一个元素对应一个dict，记录模型的预测结果，dict的键为类别名称，值为所有检测为该类的实体。

result = [{'类别1': [],
  '类别2': [],
  '类别3': [[25, 31]],
  '类别4': [[118, 123]],
  '类别5': [[70, 71], [94, 99]],
  '类别6': []},
 {'类别1': [[182, 183]],
  '类别2': [],
  '类别3': [[25, 31], [44, 52], [79, 92]],
  '类别4': [[118, 123]],
  '类别5': [[70, 71], [94, 99]],
  '类别6': []},
  ……
 {'类别1': [],
  '类别2': [],
  '类别3': [[25, 31], [44, 52]],
  '类别4': [[118, 123]],
  '类别5': [[44, 52], [70, 71], [96, 99]],
  '类别6': []}]

2.投票规则

首先回顾一下一般的分类任务中，bagging的策略是如何进行的，最简单的规则就是少数服从多数的规则，例如10个模型中，如果有8个将它分为A类，两个分为B类，那么最终结果就判定为A类，但是在NER任务中，由于涉及到实体的区间（span），便没有办法只采用简单的投票法将实体标出，因为可能某一个位置附近确定出现有一个实体，但是还需要判断①这个位置的实体的起始位置，②这个位置的实体所属的类别。

例如，某句话中，模型1将“粉色海星派大星”识别为人物类，模型2将“海星派大星”识别为人物类，模型3将“粉色海星”识别为人物类，那最终投票的结果又该如何判定呢？

于是我设计了一种投票的规则，规则或许仍然存在不合理的地方，但可以输出一个逻辑完整的，较为可靠的结果。

规则&流程：
1.生成初始化：读取所有模型的结果results，遍历其中识别到的每一个实体（不论类型），将所有的开始和结束位置记录下来，生成一个初始化的计数‘字典’，计数‘字典’的键为这个位置，值为这个位置作为开始或者结束位置出现的次数。由于在python中dict对象在迭代中是不可变的，所以用一个list来模拟这个‘字典’，list的index模拟‘字典’的键，然后建立一个从index到位置的映射就可以了。
2.统计出现次数：再次读取results，对初始化计数‘字典’中出现的所有位置，记录这个位置在所有模型中作为所有类型的起始和结束位置出现过的次数（后来这个次数改成了加权，权重为每个模型的f1的值），填到‘字典’的值上，至此‘字典’的每个位置上对应的都是一个p*2的array，p是实体类别的数量。
3.寻找第一显著位：在上面生成的计数‘字典’中，寻找第一显著位置，如果大于‘显著阈值’就去匹配与它相对应的开始或结束位置。如果第一显著位置是start位，则向右去寻找这个实体的end位；如果是end位，则向左去寻找这个实体的start位。找到第一显著位置之后，将计数‘字典’的这个位置的数值置为0.
4.匹配第一显著位：以向右寻找end位为例，说明匹配规则。这个匹配位置应当满足：（1）生成的span不能与已有的span重叠；（2）匹配位置应当是所有该类型（与3中找到的第一显著位同类）中，最显著的位置；（3）匹配位置的计数值满足‘显著阈值’。匹配成功后，将匹配位置在计数‘字典’中的计数值置为0，并将新生成的实体span添加到已有span中去。
5.循环：继续执行3和4两步，在剩下的位置中寻找第一显著位并匹配出实体，直到第一显著位的显著程度小于设定的显著阈值，则跳出循环。

3.代码实现

import numpy as np
import copy

class Voter():
    def __init__(self, threshold, results):
        self.threshold = threshold   #  显著阈值
        self.results = results         #  所有模型的结果
        self.spans = []              #  现有实体的所有span
    
    
    def predicate2id(self, predicate):
        pr2id = {'类别1':0, '类别2':1, '类别3':2, '类别4':3}
        return pr2id[predicate]
    
    
    def id2predicate(self, id):
        id2pr = {0:'类别1', 1:'类别2', 2:'类别3', 3:'类别4'}
        return id2pr[id]
    
    
    def model_point(self, model_id):
    	'''
    	这里记录的是所有模型的f1的值，作为权重，注意修改
    	'''
        point = [0.6153846153847338, 0.6177606177607161, 0.6169014084508121, 0.5877318116976925, 0.573333333333447,
                0.6627043090639932, 0.630225080385971, 0.6635514018692636, 0.6210720887247242]
        return point[model_id]
    
    def sub_of(self, sub_inter, inter):
        '''
        辅助工具：判断一个区间是不是另一个区间的子区间
        '''
        a1, a2 = sub_inter[0], sub_inter[1]
        # print(a1)
        # print(a2)
        if a1 > a2:
            return False
        if len(inter):
            b1, b2 = inter[0], inter[1]
            assert b1 < b2
        else:
            b1, b2 = 0, 0
        if a1 >= b1 and a2 <= b2:
            return True
        else:
            return False
        
        
    def find_all_spans_by_cls(self, cls):
        '''
        辅助工具：获取所有模型中某类别所有实体对应区间
        '''
        all_spans_by_cls = []
        results = self.results
        for result in results:   # 对每一个模型的结果
            for span in result[self.id2predicate(cls)]:   # 对当前模型结果中这一类的所有span
                if span not in all_spans_by_cls:   # 如果不在已经选出来的span中
                    all_spans_by_cls.append(span)
        return all_spans_by_cls
    
    
    def generate_init(self):
        '''
        生成初始化字典
        由于字典在迭代过程中不能改变其中数值
        所以将计数的存储方式改为list
        并建立一个从position到list的index的映射，模拟字典的key
        '''
        count_dict = []
        key2index = {}   # 这两个映射一旦生成了就不用在动它了
        index2key = {}
        i = 0
        for model_res in self.results:
            for key in model_res:   # 对每一类
                # print(model_res[key])   # 每一类对应的实体
                for v in model_res[key]:    # 每一类对应的每一个实体
                    # print(v)
                    for vv in v:             # 每一类对应的每一个实体对应的start和end
                        # print(vv)
                        # print(count_dict)
                        if str(vv) not in key2index.keys():
                            key2index[str(vv)] = i
                            index2key[i] = str(vv)
                            count_dict.append(np.zeros((4,2)))
                            i += 1
        return count_dict, key2index, index2key
        

    def fill_count(self):
        '''
        每个位置计数
        '''
        count_dict, key2index, index2key = self.generate_init()
        for model_id, model_res in enumerate(self.results):
            for key in model_res:
                for v in model_res[key]:  # v 是每一个实体对应的start和end的list
                    if key == '试验要素':
                        count_dict[key2index[str(v[0])]][0][0] += self.model_point(model_id)  # v的start位置的第一行第一列  代表试验要素的开始
                        count_dict[key2index[str(v[1])]][0][1] += self.model_point(model_id)  # v的end位置的第一行第二列  代表试验要素的结束
                    elif key == '性能指标':
                        count_dict[key2index[str(v[0])]][1][0] += self.model_point(model_id)
                        count_dict[key2index[str(v[1])]][1][1] += self.model_point(model_id)
                    elif key == '任务场景':
                        count_dict[key2index[str(v[0])]][2][0] += self.model_point(model_id)
                        count_dict[key2index[str(v[1])]][2][1] += self.model_point(model_id)
                    elif key == '系统组成':
                        count_dict[key2index[str(v[0])]][3][0] += self.model_point(model_id)
                        count_dict[key2index[str(v[1])]][3][1] += self.model_point(model_id)
        return count_dict
    
    
    def search_first(self, count_dict, key2index, index2key):
        '''
        寻找count_dict中出现次数最多的位置
        返回其是start还是end，其分类码，以及其对应数值
        并在count_dict中将这个位置置为0
        '''
        print('searching first...')
        
        max_pos = 0   # 当前最大计数对应位置
        max_count = 0  # 当前最大计数

        for i in range(len(count_dict)):
            pos = index2key[i]
            cur_count = np.max(count_dict[i])
            if cur_count > max_count:
                mx = np.where(count_dict[i] == cur_count)
                cls = int(mx[0])        # 对应类别编号
                se = int(mx[1])         # 对应开始结束
                max_pos = pos
                max_count = cur_count
                
        print('got max_pos: %s' %max_pos)
        print('current max_count is %s' % max_count)
        # print('remove pos: %s' %max_pos)
        count_dict[key2index[max_pos]] = np.zeros((4,2))  # 这个位置置为0
        return se, cls, int(max_pos), count_dict, max_count

    
    def search_backward(self, cls, base_pos, count_dict, spans, key2index, index2key):
        '''
        当search_first函数搜索到的是se为1（end），则向后找start
        cls：search_first搜索到的cls
        base_pos：基准位置
        返回：搜索到的最匹配位置
        '''
        print('----------')
        print('searching backward...')
        max_pos = -1
        max_count = 0
        base_pos = int(base_pos)
        print('match for pos: %s' %base_pos)
        # print(spans)
        span_to_append = []
        
        for i in range(len(count_dict)):
            '''
            规则：
            1.所选点在base之前
            2.所选点在潜在点集中（已满足）
            3.所选点与base之间所有点都在至少一个模型的实体结果中
            4.所选点在上一个同类span的end之后（当前span不是第一个时，才判断规则4）
            '''
            pos = index2key[i]
            
            # tmp_span用于判断base在已有span中的位置
            tmp_span = copy.copy(spans)
            if [base_pos, base_pos] not in tmp_span:
                tmp_span.append([base_pos, base_pos])
            # print([base_pos,base_pos])
            # print(tmp_span)
            tmp_span.sort()
            
            # 开始对规则3进行判断
            all_spans_by_cls = self.find_all_spans_by_cls(cls)
            prncp3 = False
            for span in all_spans_by_cls:     # 对每一个同类实体，判断所选区间是不是其子集
                prncp3 = prncp3 or self.sub_of([int(pos), base_pos], span)
             
            if len(spans):       # 如果spans这个时候已经是非空的
                # print('base_pos 在tmp_span中前边紧接着的span：%s' %(tmp_span[tmp_span.index([base_pos, base_pos])-1]))
                
                if tmp_span.index([base_pos, base_pos]) == 0:
                    # 如果base_pos在tmp_span中已经是第一个，前面没有了，那么就可以往前随便选
                    if int(pos) < base_pos and prncp3:
                        cur_count = count_dict[i][cls][0]
                        if cur_count > max_count:
                            max_count = cur_count
                            max_pos = int(pos)
                elif tmp_span.index([base_pos, base_pos]) > 0:
                    # 如果base在tmp中不是第一个，前面还有，那么需要保证找的匹配点在前面一个span之后（prncp4）
                    prncp4 = tmp_span[tmp_span.index([base_pos, base_pos])-1][1] < int(pos)
                    if int(pos) < base_pos and prncp3 and prncp4:   # 向前搜索，并且不在已有的span中
                        cur_count = count_dict[i][cls][0]
                        if cur_count > max_count:
                            max_count = cur_count
                            max_pos = int(pos)
            else:                                   # 初始情况下spans为空，不需要判断在不在已有的span中
                if int(pos) < base_pos and prncp3:
                    cur_count = count_dict[i][cls][0]
                    if cur_count > max_count:
                        max_count = cur_count
                        max_pos = int(pos)
                        # print(max_pos)
        if max_pos >= 0:
            print('got max_pos at %s' % max_pos)
            count_dict[key2index[str(max_pos)]] = np.zeros((4,2))   # 置为0
            # print('remove pos: %s' % max_pos)
            span_to_append = [max_pos, base_pos]   # 准备追加的span
            # print(span_to_append)
                    
        if span_to_append not in spans and len(span_to_append):
            print('doing backward append...')
            if len(spans):
                spans.sort()
                for span in spans:
                    if span[0] == span_to_append[1]+1 and span != span_to_append:      # 跟下一个span连起来了
                        span_to_append = [span_to_append[0], span[1]]   # 取首尾，中间不要
                        spans.append(span_to_append)
                        spans.remove(span)                             # 原来的删掉
                    elif span[1] == span_to_append[0]-1 and span != span_to_append:     # 跟上一个span连起来了
                        span_to_append = [span[0], span_to_append[1]]    # 取首尾
                        spans.append(span_to_append)
                        spans.remove(span)
                    else:
                        if span != span_to_append:
                            spans.append(span_to_append)                  # 没有接起来的情况，直接append
            elif len(spans) == 0:
                spans.append(span_to_append)
        # print('spans after searched backward: %s' % spans)
        return int(max_pos), count_dict, spans

    
    def search_forward(self, cls, base_pos, count_dict, spans, key2index, index2key):
        '''
        当search_first函数搜索到的是se为0（start），则向前找end
        cls：search_first搜索到的cls
        base_pos：基准位置
        返回：搜索到的最匹配位置
        '''
        print('----------')
        print('searching forward...')
        max_pos = -1
        max_count = 0
        base_pos = int(base_pos)
        # print(spans)
        print('match for pos: %s' %base_pos)
        span_to_append = []
        
        for i in range(len(count_dict)):
            '''
            规则：
            1.所选点在base之后
            2.所选点在潜在点集中（已满足）
            3.所选点与base之间所有点都在至少一个模型的实体结果中
            4.所选点在下一个同类span的start之前（当前span不是最后一个时，才判断规则4）
            '''
            pos = index2key[i]  # 找出所有潜在的pos，str类型，并对每一个pos进行循环
            
            tmp_span = copy.copy(spans)      # 复制一个spans，并把当前位置加进去，以寻找其相邻的span
            if [base_pos, base_pos] not in tmp_span:
                tmp_span.append([base_pos, base_pos])
            # print(spans)
            # print([base_pos,base_pos])
            # print(tmp_span)
            tmp_span.sort()
            
            # 开始对规则3进行判断
            all_spans_by_cls = self.find_all_spans_by_cls(cls)
            prncp3 = False
            for span in all_spans_by_cls:     # 对每一个同类实体，判断所选区间是不是其子集
                prncp3 = prncp3 or self.sub_of([base_pos, int(pos)], span)
            
            if len(spans):       # 如果spans这个时候已经是非空的
                # print(spans)
                # print('tmp_span:%s' %tmp_span)
                # print(tmp_span.index([base_pos, base_pos]))
                # print(len(tmp_span))
                if tmp_span.index([base_pos, base_pos])+1 == len(tmp_span):   
                    # base_pos是tmp_span中的最后一个，后边没有了，那么后面的所有点都可选
                    # print('后面没有了')
                    if int(pos) > base_pos and prncp3:
                        cur_count = count_dict[i][cls][1]
                        if cur_count > max_count:
                            max_count = cur_count
                            max_pos = int(pos)
                elif tmp_span.index([base_pos, base_pos])+1 < len(tmp_span):
                    # 如果base_pos后面还有别的实体，那么只能选到这个实体之前
                    # print('base_pos 在tmp_span中后边紧接着的span：%s' %(tmp_span[tmp_span.index([base_pos, base_pos])+1]))
                    prncp4 = tmp_span[tmp_span.index([base_pos, base_pos])+1][0] > int(pos)
                    if int(pos) > base_pos and prncp3 and prncp4:   # 向前搜索，并且不在已有的span中
                        cur_count = count_dict[i][cls][1]
                        if cur_count > max_count:
                            max_count = cur_count
                            max_pos = int(pos)
            else:                                   # 初始情况下spans为空，不需要判断在不在已有的span中
                if int(pos) > base_pos and prncp3:
                    cur_count = count_dict[i][cls][1]
                    if cur_count > max_count:
                        max_count = cur_count
                        max_pos = int(pos)
                        # print(max_pos)
        if max_pos >= 0:
            print('got max_pos at %s' % max_pos)
            count_dict[key2index[str(max_pos)]] = np.zeros((4,2))
            # print('remove pos: %s' % max_pos)
            span_to_append = [base_pos, max_pos]
            # print(span_to_append)
                    
        if span_to_append not in spans and len(span_to_append): # 如果准备追加的不在原有spans中
            if len(spans):   # 如果spans已有内容
                print('doing backward append...')
                spans.sort()
                for span in spans:
                    if span[0] == span_to_append[1]+1 and span != span_to_append:     # 跟下一个span连起来了
                        span_to_append = [span_to_append[0], span[1]]   # 取首尾，中间不要
                        spans.append(span_to_append)
                        spans.remove(span)                             # 原来的删掉
                    elif span[1] == span_to_append[0]-1 and span != span_to_append:     # 跟上一个span连起来了
                        span_to_append = [span[0], span_to_append[1]]    # 取首尾
                        spans.append(span_to_append)
                        spans.remove(span)
                    else:
                        if span != span_to_append:
                            spans.append(span_to_append)                  # 没有接起来的情况，直接append
            elif len(spans) == 0:      # 如果现在spans还没有内容,但是有内容可以加入
                spans.append(span_to_append)
        # print('spans after searched forward: %s' % spans)
        return int(max_pos), count_dict, spans
    
    
    def generate_res(self):
        '''
        生成最终的结果
        '''
        res = {'类别1':[], '类别2':[], '类别3':[], '类别4':[]}
        spans = self.spans
        threshold = self.threshold
        print('=======================')
        print('set threshold: %s' % threshold)
        print('=======================')
        _, key2index, index2key = self.generate_init()  # 只是为了保存两个dict
        count_dict = self.fill_count()  # 初始化
        
        while True:                   # 满足阈值条件时，一直执行，不满足时，跳出
            # cur_se, cur_cls, cur_pos, self.count_dict, max_count = self.search_first(count_dict, key2index, index2key)
            try:
                cur_se, cur_cls, cur_pos, self.count_dict, max_count = self.search_first(count_dict, key2index, index2key)
            except Exception as e:
                print(e)
                break
            if max_count < threshold:
                break
            if cur_se == 0:    # 如果找到的是一个start，接下来就找它对应的end
                cur_end, count_dict, spans = self.search_forward(cls=cur_cls, base_pos=cur_pos, count_dict=count_dict, spans=spans, key2index=key2index, index2key=index2key)
                if cur_end != -1:
                    res[self.id2predicate(cur_cls)].append([cur_pos, cur_end])       # 保存结果，最终保存的不是spans而是res
            elif cur_se == 1:    # 如果找到的是一个end，接下来就找它对应的start
                cur_start, count_dict, spans = self.search_backward(cls=cur_cls, base_pos=cur_pos, count_dict=count_dict, spans=spans, key2index=key2index, index2key=index2key)
                if cur_start != -1:
                    res[self.id2predicate(cur_cls)].append([cur_start, cur_pos])
            
        return res

3.使用方法

首先注意修改model_point函数中对应的f1的分数，然后注意类别数量和名称要与自己的数据集对应。
还有np.zeros生成的array的维度要与自己的类别数量对应上。

V = Voter(threshold, results)
final_res = V.generate_res()

4.其它情况

这种投票规则会出现一种情况没有办法解决，就是search_first寻找第一显著位的时候，如果两个位置具有相同的显著计数，则代码无法继续进行，当遇到这种情况我是单独用f1值最大的结果作为最终结果的。

这篇博客主要是写给我自己看的，如果你有其他的更好的投票方法，或者认为我的方法有明显的BUG，欢迎留言。如果这篇文章对你有帮助，麻烦点个赞吧。

自然语言处理(NLP)中的文本生成控制技术 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据自然语言处理 easyui 人工智能 ai
自然语言处理(NLP)中的文本生成控制技术关键词：文本生成、可控生成、语言模型、Prompt工程、解码策略、条件控制、评估指标摘要：本文深入探讨自然语言处理中文本生成控制技术的最新进展。我们将从基础概念出发，系统分析各种控制方法的原理和实现，包括Prompt设计、解码策略优化、条件控制机制等核心内容。文章将结合数学模型、算法实现和实际案例，全面展示如何实现高质量、可控的文本生成，并探讨该领域面临的
Python爬虫实战：研究difflib库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui 开发语言前端 difflib
1.引言1.1研究背景与意义在信息爆炸的数字时代，互联网每天产生海量文本内容。据统计，全球新闻网站日均发布文章超过300万篇，社交媒体平台产生的文本信息量更以亿级单位增长。这种信息过载带来了内容同质化、抄袭剽窃等问题，给新闻媒体行业、学术研究领域和搜索引擎优化等带来了挑战。文本相似度分析作为自然语言处理的重要分支，能够有效识别内容间的相似程度，具有重要的应用价值：新闻媒体行业：通过检测新闻抄袭和重
DeepSeek：AI驱动的效率革命与实战案例解 weixin_45788582 人工智能 ai DeepSeek
在人工智能技术的浪潮中，DeepSeek作为一款专注实现AGI（通用人工智能）的先锋工具，正通过其强大的自然语言处理（NLP）与分布式计算能力，重新定义高效办公的边界。以下通过技术解析与实战案例，展现DeepSeek如何赋能个人与企业，开启职场效率革命。一、技术革新：DeepSeek的核心竞争力深度学习赋能DeepSeek的技术架构基于BERT、Transformer等先进深度学习模型，通过构建复
AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
Java AI 新纪元：Spring AI 与 Spring AI Alibaba 的崛起小沛9 Spring AI Alibaba Spring AI java 人工智能 spring spring ai SAA
此章节没什么营养，只是一个描述，同时也能看到AI的能力（文章基本都是AI进行生成的），小沛觉得开始不写点引言好像差了点什么东西，好像鱼离开了自行车。引言：AI时代对Java开发者的机遇与挑战，Java在AI领域的现状在当今技术飞速发展的时代，人工智能（AI）已不再是遥不可及的未来概念，而是深刻地融入到我们生活的方方面面，从智能推荐系统到自动驾驶，从自然语言处理到计算机视觉，AI正以前所未有的速度改
大模型本地部署，拥有属于自己的ChatGpt 小妖同学学AI chatgpt
ChatGpt以其强大的信息整合和对话能力惊艳了全球，在自然语言处理上面表现出了惊人的能力。不管用于文案撰写还是程序辅助开发都大大提高了我们的工作效率，但是其使用有一定的门槛，让我们大多数人都望而却步，今天我们利用ollama实现本地大模型的步骤，让我们轻松拥有自己的人工智能。Ollama作为一个轻量级的工具，可以帮助用户在本地运行这些大型语言模型，无需持续依赖云服务，既保护了数据隐私，又能减少网
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
信息抽取领域关键Benchmark方法：分类体系
信息抽取领域关键Benchmark方法：分类体系摘要信息抽取（InformationExtraction,IE）作为自然语言处理的核心任务之一，旨在从非结构化文本中识别并结构化关键信息（如实体、关系、事件等），广泛应用于知识图谱构建、智能问答和数据分析等领域。近年来，随着深度学习技术的快速发展，信息抽取方法在性能和应用范围上取得了显著进步，但同时也面临着任务多样性、跨领域泛化性以及低资源场景下的适
TensorFlow：开启智能时代的引擎科技林总 DeepSeek学AI 人工智能
想象一下，计算机能看懂病历、汽车能自动驾驶、机器能创作艺术——这一切的核心，正是深度学习的力量。而推动这场革命的引擎之一，就是今天的主角：**TensorFlow**。---###**一、背景：为什么需要TensorFlow？1.**深度学习的爆发**-传统编程无法解决图像识别、自然语言处理等复杂问题。-神经网络需要高效工具处理海量数据和计算。2.**Google的答案**-2015年开源Tens
浅谈卷积神经网络(CNN) cyc&阿灿 cnn 人工智能神经网络
卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习领域最具影响力的架构之一，已在计算机视觉、自然语言处理、医学影像分析等领域取得了革命性突破。本文将系统全面地剖析CNN的核心原理、关键组件、经典模型、数学基础、训练技巧以及最新进展，通过理论解析与代码实践相结合的方式，帮助读者深入掌握这一重要技术。一、CNN基础与核心思想1.1传统神经网络的局限性在处理图像等
卷积神经网络亿只小灿灿 Python 算法与数据结构人工智能 cnn 人工智能神经网络
一、引言在当今人工智能的浪潮中，卷积神经网络（ConvolutionalNeuralNetwork，CNN）无疑是一颗璀璨的明星。它在图像识别、语音处理、自然语言处理等众多领域取得了巨大的成功，极大地推动了人工智能技术的发展。那么，什么是卷积神经网络？它的算法原理是什么？本文将深入探讨这些问题，并通过Python代码实现一个简单的卷积神经网络，以帮助读者更好地理解和掌握这一强大的技术。二、卷积神经
理解不同层的表示（layer representations）科学禅道高维表示人工智能深度学习
在机器学习和深度学习领域，特别是在处理音频和自然语言处理（NLP）任务时，"层的表示"（layerrepresentations）通常是指神经网络不同层在处理输入数据时生成的特征或嵌入。这些表示捕获了输入数据的不同层次的信息。1.层的表示（layerrepresentations）为了更好地理解这一概念，我们可以从以下几个方面进行解释：1.深度神经网络结构深度神经网络（DNN）通常由多个层组成，每
微软人工智能证书AI-102 | 如何快速通过？全球认证考试中心人工智能微软
微软AI-102考试，全称“DesigningandImplementingaMicrosoftAzureAISolution”，是微软推出的用于验证考生在Azure平台上设计和实施AI解决方案核心能力的认证考试。以下是具体介绍：考试描述：考试主要衡量考生实施计划和管理Azure认知服务解决方案、计算机视觉解决方案、自然语言处理解决方案、知识挖掘解决方案、对话式AI解决方案的能力。考试题型通常包括
embedding模型有哪些？如何选择合适的embedding模型？行云流水AI笔记 embedding
embedding模型是一种将数据映射到低维空间的模型，常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型：Word2Vec：CBOW（ContinuousBag-of-Words）：通过上下文预测中心词。Skip-Gram：通过中心词预测上下文。GloVe（GlobalVectorsforWordRepresentation）：结合了词频统计和Word2Vec的
Transformer底层原理解析及基于pytorch的代码实现 LiRuiJie 人工智能 transformer pytorch 深度学习
1.Transformer底层原理解析1.1核心架构突破Transformer是自然语言处理领域的革命性架构，其核心设计思想完全摒弃了循环结构，通过自注意力机制实现全局依赖建模。整体架构图如下：以下是其核心组件：1）自注意力机制（Self-Attention）-输入序列的每个位置都能直接关注所有位置-数学公式（缩放点积注意力）：-Q：查询矩阵（当前关注点）-K：键矩阵（被比较项）-V：值矩阵（实际
Python爬虫实战：研究TextBlob相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 html TextBlob
1.引言1.1研究背景与意义随着互联网技术的飞速发展，社交媒体已成为人们获取信息和表达观点的重要平台。每天在社交媒体上产生的海量文本数据蕴含着丰富的情感信息和社会舆情，分析这些文本情感倾向，有助于企业了解消费者对产品和服务的评价，政府部门监测社会舆论动态，研究机构探索公众对热点事件的态度。情感分析（SentimentAnalysis）作为自然语言处理的重要分支，旨在通过计算方法识别和提取文本中的主
对话云蝠智能：大模型如何让企业呼叫系统从 “成本中心” 变身 “价值枢纽”？ MARS_AI_ 人工智能自然语言处理信息与通信交互
在人工智能重塑企业服务的浪潮中，云蝠智能（南京星蝠科技有限公司旗下品牌）以深厚的技术积累和行业实践，逐步成长为国内智能外呼领域的标杆企业。其发展路径揭示了技术自主创新与场景深度结合的必然性。一、技术架构：全栈自研奠定领先基础云蝠智能的核心竞争力源于其全链路自研技术体系。该架构覆盖语音识别（ASR）、自然语言处理（NLP）、语音合成（TTS）及软交换六大层级，实现从基础设施到操作层的闭环设计。这一分
入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15% hyperai
在人工智能技术突飞猛进的当下，大型视觉-语言模型（LVLMs）正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域，这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持，已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域，LVLMs通过对TB级文本语料的学习，在机器翻译、文本摘要、情感分析等任务上达到专业级水准，其生成的学术摘要甚至能精准提炼医学文献的核心结论。然而当
合规视角下银行智能客服风险防控 AI 智能服务智能客服人工智能 AIGC 数据库 chatgpt
1.AI驱动金融变革的政策与技术背景政策导向：我国《新一代人工智能发展规划》明确提出发展智能金融，要求：构建金融大数据平台，提升多媒体数据处理能力；创新智能金融产品与服务形态；推广智能客服、监控等技术应用；建立智能风控预警体系。技术支撑：云计算、大数据技术成熟为AI发展奠定了基础。深度学习算法的突破则引爆了本轮AI浪潮，显著提升了复杂任务处理精度，进而推动了计算机视觉、机器学习、自然语言处理（NL
GRU与Transformer结合：新一代序列模型 AI大模型应用工坊 gru transformer 深度学习 ai
GRU与Transformer结合：新一代序列模型关键词：GRU、Transformer、序列模型、结合、深度学习摘要：本文深入探讨了GRU与Transformer结合所形成的新一代序列模型。先介绍了GRU和Transformer各自的核心概念及工作原理，然后阐述了二者结合的原因、方式和优势。通过代码实际案例展示了如何搭建结合的模型，还探讨了其在自然语言处理、语音识别等领域的实际应用场景。最后对未
《AI办公类工具PPT系列之七——智谱清言》再见孙悟空_ 【2025 AI工具合集】人工智能 iSlide AI AI智能PPT powerpoint AI PPT PPT
一.简介官网地址为chatglm.cn智谱清言（也被称为ChatGLM）是一款基于大模型技术的人工智能产品，旨在通过其强大的自然语言处理能力，为用户提供高效、智能的交互体验。该产品不仅具备广泛的应用场景，还能够在多个领域内实现深度学习和自我优化。二.功能介绍内容创作：创意写作：帮助用户进行故事、诗歌等文学作品的创作。媒体写作：辅助撰写新闻稿、社交媒体帖子等内容。写作辅助：提供写作建议、结构安排和编
PDF 问答工具对比 - 询问有关 PDF 的任何问题 ComPDFKit pdf PDF AI PDF问答
很好，我研究了面向普通用户、以英语支持为重点的顶级PDF问答AI工具。我将通过准确性、速度、价格、隐私和第三方集成等标准，对基于Web和可下载工具进行比较。最终的文章将包含一个对比表以便更清晰地呈现。顶级PDF问答AI工具借助AI技术的PDF问答工具让您可以上传PDF文件并通过对话方式提问其内容。这些工具无需手动阅读，而是会对文档进行索引，并使用自然语言处理模型从文本中提取答案、摘要或翻译。它们可
Java对接Dify API接口完整指南小侠C deepseek AI Dify Java
Java对接DifyAPI接口完整指南一、DifyAPI简介Dify是一款AI应用开发平台，提供多种自然语言处理能力。通过调用Dify开放API，开发者可以快速集成智能对话、文本生成等功能到自己的Java应用中。二、准备工作获取API密钥登录Dify平台控制台在「API密钥」模块创建新的密钥添加依赖org.apache.httpcomponentshttpclient4.5.13com.faste
借力提示词检索解码与 OpenVINO™ GenAI 全面提升 LLM 推理 OpenVINO 中文社区经验分享
大语言模型（LLM）彻底改变了自然语言处理，推动了聊天机器人、摘要和内容生成等应用的发展。然而，推理效率依然是一个关键挑战，尤其在需要低延迟响应的场景下更为突出。试想你在一家餐厅，经常点同样的菜。服务员不必每次都询问你的订单再传达给厨房，而是直接认出你常点的菜品并立即上菜，这样既缩短了等待时间，也加快了整个服务流程。同样，在文本生成中，模型常常遇到输入提示中的重复模式。与每次都从零开始生成toke
100个AI大模型基础概念（收藏版）程序员鑫港人工智能大模型 ai 开发语言 java 大语言模型 LLM
在人工智能技术快速发展的时代背景下，大模型作为核心驱动力，正深刻改变着各行业的发展模式与应用场景。从自然语言处理到计算机视觉，从智能对话系统到科学研究辅助，大模型展现出强大的通用性和适应性。本文将从基础概念、核心技术、数据处理、训练方法、评估体系、应用场景、伦理安全等多个维度，系统阐述100个AI大模型的关键基础知识，帮助读者全面理解这一前沿技术领域。前排提示，文末有大模型AGI-CSDN独家资料
深度学习应用于情感识别：利用YOLOv8进行AffectNet情感分类 YOLO实战营深度学习 YOLO 分类人工智能目标检测目标跟踪数据挖掘
引言情感识别（EmotionRecognition）是计算机视觉和自然语言处理中的一个重要研究方向，广泛应用于人机交互、智能客服、心理健康监测、视频分析等领域。随着深度学习技术的发展，情感识别取得了显著进展，特别是在面部表情识别方面。面部表情作为人类情感的自然表现之一，能在很大程度上反映个体的情感状态。AffectNet数据集是一个广泛使用的情感识别数据集，它包含了大量带有标注情感标签的面部表情图
AI 销售系统：重塑销售格局的科技利器小柔说科技人工智能科技 java
在数字化浪潮汹涌澎湃的当下，人工智能（AI）正以前所未有的速度渗透到各个行业，销售领域也不例外。AI销售系统作为一种融合了先进人工智能技术的创新工具，正逐渐成为企业提升销售效率、优化客户体验、增强市场竞争力的关键因素。一、AI销售系统的概念与核心技术AI销售系统是基于人工智能技术构建的一套综合性销售管理平台，它整合了自然语言处理（NLP）、机器学习（ML）、数据分析、预测建模等多种核心技术。通过这
Unity AR构建维护系统的以AI驱动增强现实知识检索系统 Morpheon unity ar 人工智能
本博客概述了为维护开发的AI驱动增强现实（AR）知识检索系统的开发过程，该系统集成了Unity用于AR、Python服务器用于后端处理，以及ChatGPT用于自然语言处理。该系统允许维护工人通过AR设备（如HoloLens2）查询特定任务的知识（例如，故障排除步骤），并以全息图形式显示上下文感知的响应。Unity账户注册中文账户注册比较困难。它需要额外的验证码验证步骤，有时即使验证成功也不会重定向
使用LangChain与Solar进行文本嵌入 Zbb159 langchain
使用LangChain与Solar进行文本嵌入在处理自然语言处理中，文本嵌入是将文本转换为数字向量的一种技术，它使计算机能够理解和处理文本数据。在这篇文章中，我们将探索如何使用LangChain与Solar进行文本嵌入。技术背景介绍文本嵌入可以用于多种自然语言处理任务，例如文本分类、情感分析和语义搜索等。Solar是一种简单易用的嵌入服务，提供了强大的推理能力，可以轻松地将文本转换为嵌入向量。核心
医疗大模型深度剖析：腾讯医疗大模型案例，引领智能医疗新时代！
腾讯医疗大模型是混元大模型的医疗版。在DeepSeek爆火之前，腾讯健康已经依据医疗细分场景的具体需求，以腾讯自研的混元大模型，打造出医疗行业大模型。DeepSeek-R1发布后，腾讯健康第一时间完成了混元大模型与DeepSeek的融合。腾讯医疗大模型深度融合医学知识库与自然语言处理技术，旨在为医疗行业提供智能化的辅助解决方案。通过海量医学文献、临床指南、电子病历等专业数据训练，具备强大的医学知识
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理