Hai Liang Wang

聊天机器人之文本聚类分析

目录

文本聚类
聚类算法

Affinity propagation

算法概述
特点

K-means

算法概述
特点

Chinese Whispers

算法概述
特点

选择算法

计算过程优化
聚类API设计
参考资料

文本聚类

文本聚类(Text Clustering)，是依据同类文档的相似度较大，而不同类的文档相似度较小的原则，使用无监督的机器学习方法，将同类文档从目标语料库聚集到一簇的任务。聚类不需要训练过程，也不需要预先对文档进行手工标注类别，因此具有一定的灵活性和较高的自动化处理能力，是对文本信息进行有效的组织、摘要和导航的重要手段。

使用场景：

自动文摘
优化搜索引擎结果
文档集合自动整理
改善文本分类
知识图谱语料处理
优化知识库，分析历史数据
增强聊天机器人知识库检索能力
发现新业务、新意图
提升数据标注效率

总之，任何机器学习的问题，都可以视为分类问题，而分类问题的对立就是聚类，如果可以实现美好的无监督聚类算法，可以说是巨大的飞跃。分析聚类问题就是寻找上帝造物的秘密。

聚类算法

常见的聚类算法包括：Affinity propagation, K-means, Chinese Whispers。

Affinity propagation

算法概述

Affinity propagation 简称AP算法，AP算法的基本思想是将全部样本看作网络的节点，然后通过网络中各条边的消息传递计算出各样本的聚类中心。聚类过程中，共有两种消息在各节点间传递，分别是吸引度( Responsibility)和归属度(Availability)。AP算法通过迭代过程不断更新每一个点的吸引度和归属度值，直到产生m个高质量的Exemplar（类似于质心），同时将其余的数据点分配到相应的聚类中。

在AP算法中有一些特殊名词：

Exemplar：指的是聚类中心，K-Means中的质心。

Similarity：数据点 $i$ 和点 $j$ 的相似度记为 $s (i, j)$ ，是指点 $j$ 作为点 $i$ 的聚类中心的相似度。一般使用欧氏距离来计算，一般点与点的相似度值全部取为负值；因此，相似度值越大说明点与点的距离越近，便于后面的比较计算。

Preference：数据点 $i$ 的参考度称为 $p (i)$ 或 $s (i, i)$ ，是指点 $i$ 作为聚类中心的参考度。一般取 $s$ 相似度值的中值。

Responsibility： $r (i, k)$ 用来描述点 $k$ 适合作为数据点 $i$ 的聚类中心的程度。

Availability： $a (i, k)$ 用来描述点 $i$ 选择点 $k$ 作为其聚类中心的适合程度。

Damping factor (阻尼系数)：主要是起收敛作用的。

在实际计算应用中，最重要的两个参数是Preference和Damping factor。前者定了聚类数量的多少，值越大聚类数量越多；后者控制算法收敛效果。这两个值需要手动指定。

特点

[1] 与众多聚类算法不同，AP聚类不需要指定描述聚类个数的参数。

[2] 一个聚类中最具代表性的点在AP算法中叫做Examplar，与其他算法中的聚类中心不同，examplar是原始数据中确切存在的一个数据点，而不是由多个数据点求平均而得到的聚类中心(K-Means)。

[3] 多次执行AP聚类算法，得到的结果是完全一样的，即不需要进行随机选取初值步骤。

[4] 算法复杂度较高 $\times N \times \log_2(N))$ ，为，而K-Means只是 $\times K)$ 的复杂度。因此当N比较大时 $(N > 300)$ ，AP聚类算法往往需要算很久。

[5] 若以误差平方和来衡量算法间的优劣，AP聚类比其他方法的误差平方和都要低。无论k-center clustering重复多少次，都达不到AP那么低的误差平方和。

[6] AP通过输入相似度矩阵来启动算法，因此允许数据呈非欧拉分布，也允许非常规的“点-点”距离度量方法。

K-means

算法概述

K-means算法也被成为K均值算法，它的计算过程如下：

[1] 从所有文档中随机取K个元素，作为k个簇的各自的中心。

[2] 分别计算剩下的元素到K个簇中心的相异度，将这些元素分别划归到相异度最低的簇。

[3] 根据聚类结果，重新计算K个簇各自的中心，计算方法是取簇中所有元素各自维度的算术平均数。

[4] 将文档中全部元素按照新的中心重新聚类。

[5] 重复第4步，直到聚类结果不再变化。

[6] 将结果输出。

特点

[1] 可以按照给定的簇的数量进行聚类，在预先知道聚簇数量时，是相对可伸缩和高效的。

[2] 计算速度快，时间复杂度为 $\times K)$ 。

K-means的主要缺点是要预先设定聚类数量，如果在聚类数据中存在“噪声”，即明显的孤立点数据，会对结果产生极大影响。

Chinese Whispers

算法概述

Chinese Whispers算法基于图进行聚类，它的计算过程如下：

[1] 构建无向图，将每个文档作为无向图中的一个节点，文档之间的相似度作为节点之间的边，设定一个阀值，如果文档之间的相似度小于这个阀值，就不建立边。

[2] 初始化，为每个节点设定一个“类”属性，并且值初始化为该文档的标识ID。

[3] 开始迭代，随机选取某个节点，对该节点进行下面的处理：

a. 遍历所有邻居，寻找边的权重最大的邻居，并且这个邻居节点的类设置为该节点的类。
b. 如果经过第1次迭代，有可能出现多个邻居属于同一个类，那么就讲同一个类的邻居权重累加，最后，看哪个类的权重大，则设置为当前节点的类。

[4] 当所有节点都完成[3]，就完成了一次迭代，重复多次迭代。

特点

Chinese Whispers算法具有计算速度快，需要设置的参数少的特点，比较适合通用文本的聚类任务。

选择算法

经过算法层面的分析和实际使用的经验，Chinese Whispers更符合预期的目标：较少而且灵活的参数，计算速度快。

计算过程优化

在Chinese Whisper算法中，建立图的过程涉及到给每个节点建立邻居节点，使用两种召回方案，然后将结果合并，作为同一聚簇的候选。

倒排索引保证了召回到最匹配的若干文档，KDTree则是建立从向量空间召回到语义距离“最近”的文档。然后将二者结果合并，最后计算这些候选项与当前文档的相似度，这里会设定一个阀值，根据聚类任务的需要设定便可，比如0.4为宽泛的相等，0.7以上为基本相等。0.9则为相等。

聚类API设计

聚类任务通常用于处理大量文本的聚类工作。当数据量超过1w时，就会变成长时任务，比如，客户每天会产生1w的日志，每天都会进行聚类分析，那么就需要支持异步处理。同时，每个聚类都有其明显特点，需要在返回结果中，返回这个聚簇的关键词。另外，不同部门数据也要同时处理，所以，还需要支持同时处理多个聚类任务。

基于以上需求，聚类API包括：

1）提交聚类任务；

2）查询聚类任务执行状态；

3）取回聚类任务执行结果。

参考资料

AP(affinity propagation)聚类算法

CW聚类算法原理 – 译自《Chinese Whispers》论文

中文近义词：聊天机器人，智能问答工具包

你可能感兴趣的:(聊天机器人)

钉钉自定义机器人 AlphaHinex
原文地址：https://alphahinex.github.io/2022/03/06/dingtalk-custom-robot/description:"像发手机短信一样方便"date:2022.03.0610:34categories:-DevOpstags:[Dingtalk,Robot]keywords:dingtalk,robot,钉钉,机器人,聊天机器人聊天机器人从hubot起接触
基于 LangChain 开发应用程序第三章-储存明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与语言模型交互时，你可能已经注意到一个关键问题：它们并不记忆你之前的交流内容，这在我们构建一些应用程序（如聊天机器人）的时候，带来了很大的挑战，使得对
[AI资讯·0605] GLM-4系列开源模型，OpenAI安全疑云，ARM推出终端计算子系统，猿辅导大模型备案…… 老牛同学 AI 人工智能 ai 大模型 AI资讯
AI资讯1毛钱1百万token，写2遍红楼梦！国产大模型下一步还想卷什么？AI「末日」突然来临，公司同事集体变蠢！只因四大聊天机器人同时宕机OpenAI员工们开始反抗了！AI手机PC大爆发，Arm从软硬件到生态发力，打造行业AI百宝箱GLM-4开源版本：超越Llama3，多模态比肩GPT4V，MaaS平台也大升级猿辅导竟然是一家AI公司？大模型全家桶曝光｜甲子光年FineChatBI，帆软在AI方
[python][gradio]chatbot控件用法 FL1623863129 Python python 前端服务器
chatbot模块是Gradio中的一个组件，用于展示聊天机器人的输出，包括用户提交的消息和机器人的回复。它支持一些Markdown语法，包括粗体、斜体、代码和图片等。Chatbot模块的输入不接受用户输入，而是通过函数返回的列表来设置聊天内容。返回的列表应包含多个内部列表，每个内部列表包含两个元素：用户消息和机器人回复。消息可以是字符串、元组或None。如果消息是字符串，可以包含Markdown
新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析皮皮冰燃新技术前沿人工智能
参考国内主流AI大模型架构及应用场景深度分析20241厂商总览1.1国外(1)OpenAI：GPT-4【美国旧金山的人工智能研究公司】GPT-4于2023年3月14日发布，是千亿级参数的多模态预训练模型，能够支持图像和文本的输入。(2)Anthropic(人类的)：Claude【美国人工智能初创公司】Claude于2023年3月14日发布，是Anthropic开发的类似ChatGPT的聊天机器人，
如何利用AI技术来提升用户的个性化体验和社区参与度？ Itfuture03 AI前沿技术人工智能
要利用AI技术提升用户的个性化体验和社区参与度，可以采取以下几种策略：个性化推荐系统：通过AI算法分析用户的行为和偏好，提供定制化的服务和内容推荐，如智能推荐活动、健康管理等，让居民感受到社区的温暖和关怀。智能助手与聊天机器人：引入AI驱动的虚拟助手，提供实时帮助、个性化建议和交互式对话，改善客户体验。自然语言处理（NLP）：实现具有AI能力的NLP，创建对用户友好的应用程序，简化用户体验，如客服
【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人寻道AI小兵 AI大模型Qwen系列探索实践人工智能 AIGC 语言模型 AI编程 Qwen
系列篇章No.文章1【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践2【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人3【Qwen2部署实战】探索Qwen2-7B：通过FastApi框架实现API的部署与调用4【Qwen2部署实战】Ollama上的Qwen2-7B：一键部署大型语言模型指南5【Qwen2部署实战】llama.cpp：
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人海哥python AI langchain python 机器人
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
威斯康星大学教授的这本书把大模型（LLM）一次性讲明白了！ AI小白龙* 大模型人工智能 langchain transformer LLM ai大模型大模型微调
在当今人工智能技术飞速发展的时代，大型语言模型（LLM）作为聊天机器人、文本生成和理解等应用的核心，已经成为研究和商业领域关注的焦点。然而，尽管这些模型的应用无处不在，但对于大多数开发者来说，它们的工作原理仍然是一个黑箱，更不用说如何从头开始构建一个这样的模型了。《从头开始构建大型语言模型》这本书，正是填补了这一知识的空白，成为了一本重量级且稀缺的资源。CSDN大礼包：这本《从头开始构建大型语言模
RAG 聊天机器人：用 Langchain 和 Streamlit开启与 PDF 的智能对话 Soyoger 大模型应用落地架构实战机器人 langchain pdf 大数据 chatgpt
与大量PDF文档的交互如今变得前所未有地便捷与智能。想象一下，您可以轻松与您的笔记、书籍和各种文档进行无缝对话，不再需要繁琐的手动查找和处理。这篇文章将带您逐步构建一个基于Multi-RAG和Streamlit的Web应用程序，该应用程序通过AI驱动的聊天机器人来读取、解析和处理PDF数据，提供前所未有的用户体验。让我们一起深入探讨开发这一创新应用的完整过程，了解如何通过先进技术实现高效的文档管理
100天精通Python丨黑科技篇 —— 21、大语言模型_100天精通python快速入门到黑科技前端收割机程序员 python 科技语言模型
ChatGPT是OpenAI推出的一种基于GPT-3/4的聊天机器人。chatgpt的颠覆性影响主要体现在提高语言交流的便捷性、个性化服务、自动化客服和教育娱乐等方面，这些应用可以为用户带来更多的便利和乐趣，同时也为企业提供了更多的服务和商机。本文收录于《100天精通Python专栏-快速入门到黑科技》，是由CSDN内容合伙人丨全站排名Top4的硬核博主不吃西红柿倾力打造，分基础知识篇和黑科技应用
人工智能聊天机器人未来趋势：AI聊天机器人演变中会期待什么 AI甲子光年人工智能机器人
AI聊天机器人正在改变公司与客户沟通的方式，提供24/7的支持和个性化体验。随着技术的不断发展，AI聊天机器人也在变得越来越复杂和高效。本文将探讨AI聊天机器人的未来趋势，并指出预期将在未来几年塑造其发展的主要创新和发展。了解这些趋势对于希望在AI驱动的客户服务动态领域中保持领先地位的企业和开发者来说至关重要。当前的AI聊天机器人趋势1.自然语言处理的改进在最近过去的一段时间里，自然语言处理（NL
连续上多个热搜的chatgpt到底是什么？高省张导师
近日，一款名为ChatGPT的人工智能聊天机器人火了。ChatGPT能做什么呢？除了简单的对话，它能帮你写代码、写文章、写诗、翻译，只要你能想到...，甚至有人用它来写作业。大家好我是氧惠APP最大团队张导师，氧惠首批邀请码520888，注册就帮你推广，一起做到百万团队。氧惠APP，2023全新模式，我的直推也会放到你下面，我曾经1年做到百万团队，现在加入我也会帮你做到百万团队。【氧惠】百度有几百
如何在5个步骤中编写更好的ChatGPT提示 AI脑极体 chatgpt 人工智能
ChatGPT是一个风靡全球的生成式人工智能(AI)工具。虽然它有可能编造一些东西，但是通过精心设计提示，可以确保获得最佳结果。在这篇文章中，我们将探讨如何做到这一点。在本文中，我将向你展示如何编写提示，激励驱动ChatGPT的大语言模型（LLM）提供最佳答案。另请参阅:自从ChatGPT问世以来，我测试了几十个AI聊天机器人。这里是我最新的首选编写有效提示，通常被称为提示工程，已经成为一个高薪职
Gemini AI 与 ChatGPT：哪个更适合为我策划婚礼？ AI科研视界 chatgpt 人工智能
我在六月订婚后，一心想着婚礼钟声，但在看到这些婚礼场地报价后，更像是警铃声响起。“叮咚”已经被重新混音成“哗啦啦”——我需要帮助。我甚至不知道如何开始计划婚礼。第一步是什么？我需要优先考虑什么？哪些任务紧迫——哪些可以先放一两年？我决定请一位AI助手来帮忙。更进一步，我觉得看看哪款聊天机器人——GeminiAdvanced还是ChatGPTPlus（即ChatGPT4.0）——是更好的婚礼策划师会
火狐浏览器现在可以让你在不切换标签的情况下访问你最喜欢的AI聊天机器人 - 具体方法如下 AI新智元人工智能机器人
希望快速使用生成式AI的Firefox用户，现在无需离开当前页面即可实现。周二发布的Firefox130版带有一个设置选项，可以将您选择的聊天机器人添加到侧边栏中。这一AI功能是设置界面中新的Firefox实验室页面的一部分，您可以通过该页面试验由Mozilla团队设计的实验功能。这一AI聊天机器人功能在六月的FirefoxNightly测试版中启动，现在正式在正式版本中亮相。另请参阅：Googl
深度学习项目实践——qq聊天机器人（transformer）（二）配置环境与部署 Linductor qq聊天机器人项目深度学习机器人人工智能
深度学习项目实践——qq聊天机器人（transformer）（二）配置环境与部署上一节我们讲解了qq聊天的原理和qq机器人的框架以及运行流程，这一节我们来讲怎么配置环境，部署qq机器人。第一步——配置环境有关代替qq客户端实现反向websocket连接这一部分内容由于一些原因，我无法在这里具体讲解，我把这部分内容放到了github中我的项目内,请自行查看。机器人主体——nonebot2nonebo
一文了解LangChain 程序员二飞 langchain 算法人工智能深度学习数据结构
什么是LangChain?LangChain是为我们开发基于大语言模型(LLM)的应用提供了框架，简单一点说：LangChain提供了一个标准接口，用于将不同的语言模型连接在一起，以及与其他工具和数据源进行集成。LangChain核心思想：将不同的组件组合或集成在一起，以此创造更高级的大语言模型应用程序。LangChain为常见应用程序提供端到端链：如聊天机器人、文档分析和代码生成等。LangCh
基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人老牛同学 AI 专业技术 llama 机器人人工智能 ai Ollama
前面两篇博文，我们分别在个人笔记本电脑部署了Llama38B参数大模型，并使用Ollama搭建了基于Web可视化对话聊天机器人，可以在自己电脑上愉快的与Llama大模型Web机器人对话聊天了。但在使用过程中，笔者发现Llama大模型经常出现中文问题英文回答的问题，需要使用中文回答等提示词告诉大模型用中文回答，体验还不是最好的。今天，本博文就来解决这个问题，让我们有个中文版的Llama3Web对话机
数据科学简讯 2023-03-24 数科每日
头条GitHubCopilotXCopilot即将推出新的对话界面、GPT-4升级、错误修复建议、文档编写和自动拉取请求。这些发布是GitHub成为开发者工具包强国目标的下一步。谷歌和微软的聊天机器人在错误信息的对决中相互引用根据TheVerge上的一篇评论文章，微软、谷歌和OpenAI等大型科技公司仓促推出AI聊天机器人有可能破坏网络的信息生态系统。作者举了一个例子，微软的Bing聊天机器人错误
【itchat+python】24年从0搭建微信聊天机器人全过程分享捕捉阳光微信聊天机器人 python 微信机器人
文章目录前言开整准备部署方法1部署方法2代码demo异常小结（含数据结构/心跳修改的源码位置）前言初学python，很多都并不是很熟练。就搞了好几天。目前初步已经搭建完成。之前使用的wechaty的uos版本感觉并不是很稳定，总是宕机，那个是nodejs的版本我并不会调整。nodejs我更加不会。所以就重新找个尝试。想尝试之前的版本的请阅读：【python+wechaty+docker+nodej
Ilya新公司获10亿美元融资；支付宝将发布AI独立App支小宝 | AI头条 AI科技大本营人工智能搜索引擎
整理|王启隆出品|AI科技大本营（ID：rgznai100）一分钟速览新闻点！前OpenAI联合创始人新公司获10亿美元融资支付宝将发布AI独立App支小宝Transformer作者创业公司Sakana.AI获1亿美元A轮融资2024外滩大会开幕，凯文・凯利谈AI时代三大趋势零一万物发布Yi-Coder系列模型微软Win11中发现国产开源大模型RWKVOpenAI定制聊天机器人市场乱象丛生AI初创
chatgpt免费接口|付费接口｜chatgpt对接小爱同学红匣子实力推荐
在当前技术的发展时代，网络支付逐渐成为主流支付方式。诸如“chatgpt”支付渠道也普及开来。chatgpt是一个聊天机器人，它通过其自然语言处理技术实现与用户的交互，为用户提供方便、快捷的付费服务。本文将详细介绍chatgpt付费接口，让大家了解如何使用此接口实现安全快捷的网络支付。CHATGPT接入-联系电话13642679953（微信同号）chatgpt是一家创业团队。chatgpt服务器上
ChatGPT3.5/4.0新手使用手册，国内中文版使用教程斯克AI gpt-3 chatgpt
引言欢迎使用ChatGPT！无论你是刚开始接触AI聊天机器人，还是已经有了一些使用经验，这篇新手使用手册将帮助你快速上手，并且从ChatGPT中获得最优的体验。本文主要聚焦于提示词（Prompt）的使用教学，通过正确的提示词引导，你将能够更好地与ChatGPT进行互动。什么是提示词？提示词是你与ChatGPT交流时使用的指令或问题。它们告诉模型你想要得到什么样的信息、建议或创意。有效的提示词能够帮
OpenAI AI 聊天机器人周活跃用户超 2 亿 go2coding AI日报人工智能机器人
AI新闻OpenAIAI聊天机器人周活跃用户超2亿摘要：科技媒体Axios报道，OpenAI的AI聊天机器人在短短一年内实现了周活跃用户超过2亿的增长。该公司表示，全球财富500强企业中已有92%使用其产品，并且自7月份发布GPT-4omini以来，其自动API使用量也翻了一番。首席执行官山姆・阿尔特曼指出，该工具已有效融入医疗和教育等领域，帮助用户完成日常任务和解决问题。同时，Meta公司的Ll
AI在科研中的应用：chatgptgpt4的数据分析与机器学习 zmjia111 人工智能深度学习 gpt 人工智能数据分析机器学习 chatgpt 深度学习 pytorch 数据挖掘
2022年11月30日，可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5，将人工智能的发展推向了一个新的高度。2023年4月，更强版本的ChatGPT4.0上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。2023年11月7日，OpenAI首届开发者大会被称为“科技界的春晚”，吸引了全球广大用户的关注，GPT商店更
人工智能相关资源代码论文教程Tutorials 等 Prompt-Engineering 深度学习辅助驾驶语言模型文本生成图片开源实现 OCR 通用聊天机器人 EwenWanW 人工智能 prompt 深度学习
人工智能相关学习资源https://github.com/luban-agi/Awesome-AIGC-Tutorialshttps://github.com/BradyFU/Awesome-Multimodal-Large-Language-Modelshttps://github.com/dair-ai/Prompt-Engineering-Guidehttps://github.com/Vi
ChatGPT办公与科研应用、论文撰写、数据分析、机器学习、深度学习及AI绘图 PhyliciaFelicia ChatGPT python 深度学习人工智能 chatgpt 深度学习机器学习数据分析 python
2022年11月30日，可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5，将人工智能的发展推向了一个新的高度。2023年4月，更强版本的ChatGPT4.0上线，文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。2023年11月7日，OpenAI首届开发者大会被称为“科技界的春晚”，吸引了全球广大用户的关注，GPT商店更
深度学习项目实践——QQ聊天机器人（transformer）（三）功能实现的方法——NoneBot2插件结构与编写 Linductor qq聊天机器人项目机器人 transformer nonebot
深度学习项目实践——QQ聊天机器人（transformer）（三）功能实现的方法——NoneBot2插件结构与编写在前两节中，我们详细讲解了QQ聊天的原理、QQ机器人的框架与环境配置的流程。本节将重点介绍NoneBot2的插件构成，以及如何从零开始编写一个属于自己的插件。这一篇文章主要就是充当搬运工，参考了nonebot2的官方文档第一步：了解NoneBot2的架构在开始编写插件之前，我们先来了解
文字模型训练分析评论（算法实战）富士达幸运星算法人工智能机器学习
文字模型训练，尤其是在自然语言处理（NLP）领域，是构建能够理解、解释、生成人类语言系统的核心步骤。这类模型广泛应用于文本分类、情感分析、机器翻译、聊天机器人、摘要生成等多个方面。针对文字模型训练后的分析评论，可以从以下几个方面进行：1.性能评估准确率/错误率：评估模型在测试集上的准确率或错误率是最直接的方式，这能反映模型的基本性能。混淆矩阵：对于分类任务，混淆矩阵可以详细展示模型在各个类别上的表
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他