马苏比拉米G

【聊天机器人】深度学习构建检索式聊天机器人原理

一、检索式与生成式聊天机器人对比

1、基于检索的chatterbot

2、基于生成的chatterbot

3、聊天机器人的一些思考：

（1）基于检索的chatterbot

根据input和context，结合知识库的算法得到合适回复。
从一个固定的数据集中找到合适的内容作为回复
检索和匹配的方式有很多种（可以基于机器学习判断属于那种类型的匹配，利用关键字+word2vec进行文本相似度匹配）
数据和匹配方法对质量有很大影响

（2）基于生成模型的chatterbot

典型的是用seq2seq方法
生成的结果需要考虑通畅度和准确度
深度学习是学习数据的特征。对于认为很重要的特征，可以最后在全连接层时进行矩阵拼接加入，而不参与特征之间的学习，以免造成影响。

以前者为主，后者为辅；检索方法过程中当模型需要算法是，可以考虑加入深度学习。

4、chatterbot的问题

（1）应答模式的匹配方法太粗暴

编辑距离无法捕获深层语义信息
核心词+word2vec无法捕获整句话语义（对于我爱你和你爱我，词向量表示是一样的）
LSTM等RNN模型能捕获序列信息
用深度学习来提高匹配阶段准确率

（2）特定领域+检索+合适的知识库能做到还不错。但开放域比较难

5、转化为机器学习或深度学习能够解决的问题，应该怎么做

（1）匹配本身是一个模糊的场景
转成排序问题
（2）排序问题怎么处理？
转成能输出概率的01分类
（3）数据构建？
需要正样本（正确的答案）和负样本（不对的答案）
（4）Loss function
分类问题采用对数损失（二元的交叉熵损失）
)

二、使用深度学习完成问答：

1、论文

IMPLEMENTING A RETRIEVAL-BASED MODEL IN TENSORFLOW，WILDML BLOG，2016

2、论文框架图

三、深度学习问答数据

1、中文：

Microsoftz做法是，从其他不同的场景里，以相同的概率抽取答案，成为负样本。当前场景的问答作为正样本。

2、Ubuntu对话语料库：

（1）训练集：

Ubuntu对话数据集，来自Ubuntu的IRC网络上的对话日志
训练集1000000条实例，一半是正例（label为1），一半是负例（label为0，负例为随机生成）
样本包括上下文信息（context，即Query）和一段可能的回复内容，即Response；Label为1表示Response和Query的匹配，Label为0表示不匹配
query的平均长度为86个word,而response的平均长度为17个word。

（2）验证集/测试集：

每个样本有一个正样本和9个负样本（也称为干扰样本）
建模的目标是给正例的得分尽可能高（排序越靠前），而负例的得分尽可能低（有点类似分类问题）
语料做过分词、stemmed、lemmatized等文本预处理
用NER（命名实体识别）将文本中的实体，如姓名、地点、组织、URL等替换成特殊字符。

（3）评估准则：

recall@k（在前k个位置，能够找回标准答案的概率有多高）
经模型对候选的response排序后，前k个候选中存在正例数据（正确的那个）的占比
k值越高，指标值越高，对模型性能的要求越松。

四、基线模型代码实现：

import pandas as pd
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.feature_extraction.text import TfidfTransformer

#导入数据
train_df = pd.read_csv("../data/train.csv")
test_df = pd.read_csv("../data/test.csv")
validation_df = pd.read_csv("../data/valid.csv")
y_test = np.zeros(len(test_df))
#定义评估指标
def evaluate_recall(y,y_test,k=n):
    num_examples = float(len(y))
    num_correct = 0
    for predictions,label in zip(y,y_test):
        if label in predictions[:k]:
            num_correct += 1
    return num_correct/num_examples
#从len(utterances)中随机抽取数字，生成size=10的数组

1、基线模型：

#定义随机预测函数
#从len(utterances)中随机抽取数字，生成size=10的数组
#replace:True表示可以取相同数字，False表示不可以取相同数字
def predict_random(context,utterances):
    return np.random.choice(len(utterances),10,replace=False) 
#生成随机预测结果 
y_random = [predict_random(test_df.Context[x],test_df.iloc[x,1:].values) for x in range(len(test_df))]
#对前k=1，2，5，10分别进行评存在的正样本概率评估
for n in [1,2,5,10]:
    print(f'Recall @ ({n},10):{evaluate_recall(y_random,y_test,n):g}')

输出结果：
Recall @ (1,10):0.0992072
Recall @ (2,10):0.199313
Recall @ (5,10):0.50037
Recall @ (10,10):1

2、基线模型：TF-IDF检索

class TFIDFPredictor():
    def __init__(self):
        self.vectorizer = TfidfVectorizer()
    def train(self, data):
        self.vectorizer.fit(np.append(data.Context.values,data.Utterance.values))
    def predict(self,context,utterances):
        #将输入问题Q转化为向量
        vector_context = self.vectorizer.transform([context])
        #将回答A转化为向量
        vector_doc = self.vectorizer.transform(utterances)
        #将回答向量与问题向量做矩阵相乘
        result = np.dot(vector_doc,vector_context.T).todense()
        result = np.asarray(result).flatten()
        ##将result中的元素从小到大排列，提取其对应的index(索引)。再将索引进行倒叙排列（越在前面，概率越大）
        #argsort
        return np.argsort(result,axis=0)[::-1] 
pred = TFIDFPredictor()
pred.train(train_df)
y = [pred.predict(test_df.Context[x],test_df.iloc[x,1:].values) for x in range(len(test_df))]

for n in [1,2,5,10]:
    print(f'Recall @ ({n},10):{evaluate_recall(y,y_test,n):g}')

输出结果：
Recall @ (1,10):0.485624
Recall @ (2,10):0.586681
Recall @ (5,10):0.762474
Recall @ (10,10):1

五、神经网络建模原理

1、Query 和Response都是经过分词和embedding映射的。初始向量使用GloVe/word2vec
2、分词且向量化的Query和Response经过相同的RNN（word by word）（同一组参数）。RNN最终生成一个向量表示，捕捉了Query和Reponse之间的【语义联系】（图中的c和r）；这个
向量的维度是可以指定的，这里指定为256维。
3、将向量c与一个矩阵M相乘，来预测一个可能的回复r‘。如果c为一个256维的向量，M维是256*256的矩阵，两者相乘的结果为另一个256维向量，我们可以将其解释为【一个生成式的回复向量】。矩阵M是需要训练的参数
4、通过点乘的方式来预测生成的回复r’和候选的回复r之间的相似程度，点乘结果越大表示候选回复最为回复的可信度越高；之后通过sigmoid函数归一化，转成概率形式。（sigmoid作为压缩函数经常使用）
5、损失函数：二元的交叉熵函数/对数函数。回想逻辑回归，交叉熵损失函数为L = -y * ln(y’)- (1 - y) * ln(1 - y’)。（公式的意义是直观的，即当y=1时，L=-ln(y’),我们希望y’尽量接近1，使得损失韩式的值越小‘反之亦然。）

使用Tensorflow的话训练速度主要受2方面影响。一、读数据（例如，训练数据是512兆的文本数据，100w个长文本。是很大的数据集），开销会很大。可以使用Tensorflow能都读进去的格式tdrecords。可以用Tensorflow自带的工具进行读入和处理。如一个batch或构建一个队列。二、GPU处理的速度。可以构建一个队列 query，在队列里不断去数据，以跟的上入读数据的速度。

神经网络代码实现在下篇文章中具体阐述

你可能感兴趣的:(聊天机器人)

钉钉自定义机器人 AlphaHinex
原文地址：https://alphahinex.github.io/2022/03/06/dingtalk-custom-robot/description:"像发手机短信一样方便"date:2022.03.0610:34categories:-DevOpstags:[Dingtalk,Robot]keywords:dingtalk,robot,钉钉,机器人,聊天机器人聊天机器人从hubot起接触
基于 LangChain 开发应用程序第三章-储存明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与语言模型交互时，你可能已经注意到一个关键问题：它们并不记忆你之前的交流内容，这在我们构建一些应用程序（如聊天机器人）的时候，带来了很大的挑战，使得对
[AI资讯·0605] GLM-4系列开源模型，OpenAI安全疑云，ARM推出终端计算子系统，猿辅导大模型备案…… 老牛同学 AI 人工智能 ai 大模型 AI资讯
AI资讯1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？AI「末日」突然来临，公司同事集体变蠢！只因四大聊天机器人同时宕机OpenAI员工们开始反抗了！AI手机PC大爆发，Arm从软硬件到生态发力，打造行业AI百宝箱GLM-4开源版本：超越Llama3，多模态比肩GPT4V，MaaS平台也大升级猿辅导竟然是一家AI公司？大模型全家桶曝光｜甲子光年FineChatBI，帆软在AI方
[python][gradio]chatbot控件用法 FL1623863129 Python python 前端服务器
chatbot模块是Gradio中的一个组件，用于展示聊天机器人的输出，包括用户提交的消息和机器人的回复。它支持一些Markdown语法，包括粗体、斜体、代码和图片等。Chatbot模块的输入不接受用户输入，而是通过函数返回的列表来设置聊天内容。返回的列表应包含多个内部列表，每个内部列表包含两个元素：用户消息和机器人回复。消息可以是字符串、元组或None。如果消息是字符串，可以包含Markdown
新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析皮皮冰燃新技术前沿人工智能
参考国内主流AI大模型架构及应用场景深度分析20241厂商总览1.1国外(1)OpenAI：GPT-4【美国旧金山的人工智能研究公司】GPT-4于2023年3月14日发布，是千亿级参数的多模态预训练模型，能够支持图像和文本的输入。(2)Anthropic(人类的)：Claude【美国人工智能初创公司】Claude于2023年3月14日发布，是Anthropic开发的类似ChatGPT的聊天机器人，
如何利用AI技术来提升用户的个性化体验和社区参与度？ Itfuture03 AI前沿技术人工智能
要利用AI技术提升用户的个性化体验和社区参与度，可以采取以下几种策略：个性化推荐系统：通过AI算法分析用户的行为和偏好，提供定制化的服务和内容推荐，如智能推荐活动、健康管理等，让居民感受到社区的温暖和关怀。智能助手与聊天机器人：引入AI驱动的虚拟助手，提供实时帮助、个性化建议和交互式对话，改善客户体验。自然语言处理（NLP）：实现具有AI能力的NLP，创建对用户友好的应用程序，简化用户体验，如客服
【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人寻道AI小兵 AI大模型Qwen系列探索实践人工智能 AIGC 语言模型 AI编程 Qwen
系列篇章No.文章1【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践2【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人3【Qwen2部署实战】探索Qwen2-7B：通过FastApi框架实现API的部署与调用4【Qwen2部署实战】Ollama上的Qwen2-7B：一键部署大型语言模型指南5【Qwen2部署实战】llama.cpp：
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人海哥python AI langchain python 机器人
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
威斯康星大学教授的这本书把大模型（LLM）一次性讲明白了！ AI小白龙* 大模型人工智能 langchain transformer LLM ai大模型大模型微调
在当今人工智能技术飞速发展的时代，大型语言模型（LLM）作为聊天机器人、文本生成和理解等应用的核心，已经成为研究和商业领域关注的焦点。然而，尽管这些模型的应用无处不在，但对于大多数开发者来说，它们的工作原理仍然是一个黑箱，更不用说如何从头开始构建一个这样的模型了。《从头开始构建大型语言模型》这本书，正是填补了这一知识的空白，成为了一本重量级且稀缺的资源。CSDN大礼包：这本《从头开始构建大型语言模
RAG 聊天机器人：用 Langchain 和 Streamlit开启与 PDF 的智能对话 Soyoger 大模型应用落地架构实战机器人 langchain pdf 大数据 chatgpt
与大量PDF文档的交互如今变得前所未有地便捷与智能。想象一下，您可以轻松与您的笔记、书籍和各种文档进行无缝对话，不再需要繁琐的手动查找和处理。这篇文章将带您逐步构建一个基于Multi-RAG和Streamlit的Web应用程序，该应用程序通过AI驱动的聊天机器人来读取、解析和处理PDF数据，提供前所未有的用户体验。让我们一起深入探讨开发这一创新应用的完整过程，了解如何通过先进技术实现高效的文档管理
100天精通Python丨黑科技篇 —— 21、大语言模型_100天精通python快速入门到黑科技前端收割机程序员 python 科技语言模型
ChatGPT是OpenAI推出的一种基于GPT-3/4的聊天机器人。chatgpt的颠覆性影响主要体现在提高语言交流的便捷性、个性化服务、自动化客服和教育娱乐等方面，这些应用可以为用户带来更多的便利和乐趣，同时也为企业提供了更多的服务和商机。本文收录于《100天精通Python专栏-快速入门到黑科技》，是由CSDN内容合伙人丨全站排名Top4的硬核博主不吃西红柿倾力打造，分基础知识篇和黑科技应用
人工智能聊天机器人未来趋势：AI聊天机器人演变中会期待什么 AI甲子光年人工智能机器人
AI聊天机器人正在改变公司与客户沟通的方式，提供24/7的支持和个性化体验。随着技术的不断发展，AI聊天机器人也在变得越来越复杂和高效。本文将探讨AI聊天机器人的未来趋势，并指出预期将在未来几年塑造其发展的主要创新和发展。了解这些趋势对于希望在AI驱动的客户服务动态领域中保持领先地位的企业和开发者来说至关重要。当前的AI聊天机器人趋势1.自然语言处理的改进在最近过去的一段时间里，自然语言处理（NL
连续上多个热搜的chatgpt到底是什么？高省张导师
近日，一款名为ChatGPT的人工智能聊天机器人火了。ChatGPT能做什么呢？除了简单的对话，它能帮你写代码、写文章、写诗、翻译，只要你能想到...，甚至有人用它来写作业。大家好我是氧惠APP最大团队张导师，氧惠首批邀请码520888，注册就帮你推广，一起做到百万团队。氧惠APP，2023全新模式，我的直推也会放到你下面，我曾经1年做到百万团队，现在加入我也会帮你做到百万团队。【氧惠】百度有几百
如何在5个步骤中编写更好的ChatGPT提示 AI脑极体 chatgpt 人工智能
ChatGPT是一个风靡全球的生成式人工智能(AI)工具。虽然它有可能编造一些东西，但是通过精心设计提示，可以确保获得最佳结果。在这篇文章中，我们将探讨如何做到这一点。在本文中，我将向你展示如何编写提示，激励驱动ChatGPT的大语言模型（LLM）提供最佳答案。另请参阅:自从ChatGPT问世以来，我测试了几十个AI聊天机器人。这里是我最新的首选编写有效提示，通常被称为提示工程，已经成为一个高薪职
Gemini AI 与 ChatGPT：哪个更适合为我策划婚礼？ AI科研视界 chatgpt 人工智能
我在六月订婚后，一心想着婚礼钟声，但在看到这些婚礼场地报价后，更像是警铃声响起。“叮咚”已经被重新混音成“哗啦啦”——我需要帮助。我甚至不知道如何开始计划婚礼。第一步是什么？我需要优先考虑什么？哪些任务紧迫——哪些可以先放一两年？我决定请一位AI助手来帮忙。更进一步，我觉得看看哪款聊天机器人——GeminiAdvanced还是ChatGPTPlus（即ChatGPT4.0）——是更好的婚礼策划师会
火狐浏览器现在可以让你在不切换标签的情况下访问你最喜欢的AI聊天机器人 - 具体方法如下 AI新智元人工智能机器人
希望快速使用生成式AI的Firefox用户，现在无需离开当前页面即可实现。周二发布的Firefox130版带有一个设置选项，可以将您选择的聊天机器人添加到侧边栏中。这一AI功能是设置界面中新的Firefox实验室页面的一部分，您可以通过该页面试验由Mozilla团队设计的实验功能。这一AI聊天机器人功能在六月的FirefoxNightly测试版中启动，现在正式在正式版本中亮相。另请参阅：Googl
深度学习项目实践——qq聊天机器人（transformer）（二）配置环境与部署 Linductor qq聊天机器人项目深度学习机器人人工智能
深度学习项目实践——qq聊天机器人（transformer）（二）配置环境与部署上一节我们讲解了qq聊天的原理和qq机器人的框架以及运行流程，这一节我们来讲怎么配置环境，部署qq机器人。第一步——配置环境有关代替qq客户端实现反向websocket连接这一部分内容由于一些原因，我无法在这里具体讲解，我把这部分内容放到了github中我的项目内,请自行查看。机器人主体——nonebot2nonebo
一文了解LangChain 程序员二飞 langchain 算法人工智能深度学习数据结构
什么是LangChain?LangChain是为我们开发基于大语言模型(LLM)的应用提供了框架，简单一点说：LangChain提供了一个标准接口，用于将不同的语言模型连接在一起，以及与其他工具和数据源进行集成。LangChain核心思想：将不同的组件组合或集成在一起，以此创造更高级的大语言模型应用程序。LangChain为常见应用程序提供端到端链：如聊天机器人、文档分析和代码生成等。LangCh
基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人老牛同学 AI 专业技术 llama 机器人人工智能 ai Ollama
前面两篇博文，我们分别在个人笔记本电脑部署了Llama38B参数大模型，并使用Ollama搭建了基于Web可视化对话聊天机器人，可以在自己电脑上愉快的与Llama大模型Web机器人对话聊天了。但在使用过程中，笔者发现Llama大模型经常出现中文问题英文回答的问题，需要使用中文回答等提示词告诉大模型用中文回答，体验还不是最好的。今天，本博文就来解决这个问题，让我们有个中文版的Llama3Web对话机
数据科学简讯 2023-03-24 数科每日
头条GitHubCopilotXCopilot即将推出新的对话界面、GPT-4升级、错误修复建议、文档编写和自动拉取请求。这些发布是GitHub成为开发者工具包强国目标的下一步。谷歌和微软的聊天机器人在错误信息的对决中相互引用根据TheVerge上的一篇评论文章，微软、谷歌和OpenAI等大型科技公司仓促推出AI聊天机器人有可能破坏网络的信息生态系统。作者举了一个例子，微软的Bing聊天机器人错误
【itchat+python】24年从0搭建微信聊天机器人全过程分享捕捉阳光微信聊天机器人 python 微信机器人
文章目录前言开整准备部署方法1部署方法2代码demo异常小结（含数据结构/心跳修改的源码位置）前言初学python，很多都并不是很熟练。就搞了好几天。目前初步已经搭建完成。之前使用的wechaty的uos版本感觉并不是很稳定，总是宕机，那个是nodejs的版本我并不会调整。nodejs我更加不会。所以就重新找个尝试。想尝试之前的版本的请阅读：【python+wechaty+docker+nodej
Ilya新公司获10亿美元融资；支付宝将发布AI独立App支小宝 | AI头条 AI科技大本营人工智能搜索引擎
整理|王启隆出品|AI科技大本营（ID：rgznai100）一分钟速览新闻点！前OpenAI联合创始人新公司获10亿美元融资支付宝将发布AI独立App支小宝Transformer作者创业公司Sakana.AI获1亿美元A轮融资2024外滩大会开幕，凯文・凯利谈AI时代三大趋势零一万物发布Yi-Coder系列模型微软Win11中发现国产开源大模型RWKVOpenAI定制聊天机器人市场乱象丛生AI初创
chatgpt免费接口|付费接口｜chatgpt对接小爱同学红匣子实力推荐
在当前技术的发展时代，网络支付逐渐成为主流支付方式。诸如“chatgpt”支付渠道也普及开来。chatgpt是一个聊天机器人，它通过其自然语言处理技术实现与用户的交互，为用户提供方便、快捷的付费服务。本文将详细介绍chatgpt付费接口，让大家了解如何使用此接口实现安全快捷的网络支付。CHATGPT接入-联系电话13642679953（微信同号）chatgpt是一家创业团队。chatgpt服务器上
ChatGPT3.5/4.0新手使用手册，国内中文版使用教程斯克AI gpt-3 chatgpt
引言欢迎使用ChatGPT！无论你是刚开始接触AI聊天机器人，还是已经有了一些使用经验，这篇新手使用手册将帮助你快速上手，并且从ChatGPT中获得最优的体验。本文主要聚焦于提示词（Prompt）的使用教学，通过正确的提示词引导，你将能够更好地与ChatGPT进行互动。什么是提示词？提示词是你与ChatGPT交流时使用的指令或问题。它们告诉模型你想要得到什么样的信息、建议或创意。有效的提示词能够帮
OpenAI AI 聊天机器人周活跃用户超 2 亿 go2coding AI日报人工智能机器人
AI新闻OpenAIAI聊天机器人周活跃用户超2亿摘要：科技媒体Axios报道，OpenAI的AI聊天机器人在短短一年内实现了周活跃用户超过2亿的增长。该公司表示，全球财富500强企业中已有92%使用其产品，并且自7月份发布GPT-4omini以来，其自动API使用量也翻了一番。首席执行官山姆・阿尔特曼指出，该工具已有效融入医疗和教育等领域，帮助用户完成日常任务和解决问题。同时，Meta公司的Ll
AI在科研中的应用：chatgptgpt4的数据分析与机器学习 zmjia111 人工智能深度学习 gpt 人工智能数据分析机器学习 chatgpt 深度学习 pytorch 数据挖掘
2022年11月30日，可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5，将人工智能的发展推向了一个新的高度。2023年4月，更强版本的ChatGPT4.0上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。2023年11月7日，OpenAI首届开发者大会被称为“科技界的春晚”，吸引了全球广大用户的关注，GPT商店更
人工智能相关资源代码论文教程Tutorials 等 Prompt-Engineering 深度学习辅助驾驶语言模型文本生成图片开源实现 OCR 通用聊天机器人 EwenWanW 人工智能 prompt 深度学习
人工智能相关学习资源https://github.com/luban-agi/Awesome-AIGC-Tutorialshttps://github.com/BradyFU/Awesome-Multimodal-Large-Language-Modelshttps://github.com/dair-ai/Prompt-Engineering-Guidehttps://github.com/Vi
ChatGPT办公与科研应用、论文撰写、数据分析、机器学习、深度学习及AI绘图 PhyliciaFelicia ChatGPT python 深度学习人工智能 chatgpt 深度学习机器学习数据分析 python
2022年11月30日，可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5，将人工智能的发展推向了一个新的高度。2023年4月，更强版本的ChatGPT4.0上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。2023年11月7日，OpenAI首届开发者大会被称为“科技界的春晚”，吸引了全球广大用户的关注，GPT商店更
深度学习项目实践——QQ聊天机器人（transformer）（三）功能实现的方法——NoneBot2插件结构与编写 Linductor qq聊天机器人项目机器人 transformer nonebot
深度学习项目实践——QQ聊天机器人（transformer）（三）功能实现的方法——NoneBot2插件结构与编写在前两节中，我们详细讲解了QQ聊天的原理、QQ机器人的框架与环境配置的流程。本节将重点介绍NoneBot2的插件构成，以及如何从零开始编写一个属于自己的插件。这一篇文章主要就是充当搬运工，参考了nonebot2的官方文档第一步：了解NoneBot2的架构在开始编写插件之前，我们先来了解
文字模型训练分析评论（算法实战）富士达幸运星算法人工智能机器学习
文字模型训练，尤其是在自然语言处理（NLP）领域，是构建能够理解、解释、生成人类语言系统的核心步骤。这类模型广泛应用于文本分类、情感分析、机器翻译、聊天机器人、摘要生成等多个方面。针对文字模型训练后的分析评论，可以从以下几个方面进行：1.性能评估准确率/错误率：评估模型在测试集上的准确率或错误率是最直接的方式，这能反映模型的基本性能。混淆矩阵：对于分类任务，混淆矩阵可以详细展示模型在各个类别上的表
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他