云博士的AI课堂

【自然语言处理-NLP】情感分析与主题建模

以下内容详细剖析了NLP 中情感分析（Sentiment Analysis）和主题建模（Topic Modeling）的技术与方法，分别展示如何从文本中提取情感倾向和潜在主题，并提供示例代码和讲解，可在 Python 环境下直接运行。

目录

情感分析（Sentiment Analysis）
1.1 概念与方法概览
1.2 传统机器学习方法
1.3 深度学习与预训练模型
1.4 代码示例：基于机器学习的情感分类
主题建模（Topic Modeling）
2.1 概念与 LDA 基本原理
2.2 LDA 以外的主题建模方法
2.3 代码示例：Gensim 实现 LDA 主题建模
总结与扩展

1. 情感分析（Sentiment Analysis）

1.1 概念与方法概览

情感分析旨在判断文本在情感上的倾向，例如产品评论中的正面/负面/中性评价。

常见分类粒度

二分类（positive/negative）
多分类（positive/neutral/negative）
更细粒度的情绪标签（如愤怒、高兴、悲伤等）

主要方法

基于规则：使用情感词典或人工规则，适用于简单场景，维护成本高。
机器学习：将文本特征（Bag-of-Words、TF-IDF 等）输入分类器（逻辑回归、朴素贝叶斯、SVM 等）进行监督训练。
深度学习：
- CNN/RNN/LSTM 等网络可捕捉上下文信息，提升效果。
- 预训练大模型（BERT、GPT）在情感分析上表现优异，可进行少量微调。

1.2 传统机器学习方法

经典流程：

文本预处理：分词、去停用词、必要时词干化/词形还原
特征提取：如 Bag-of-Words、TF-IDF
训练分类器：如逻辑回归、SVM、朴素贝叶斯、随机森林
模型预测：输入新文本的向量化表示后，输出情感标签

优点：实现简单、易解释
缺点：难以捕捉深层语义，效果受限于特征工程

1.3 深度学习与预训练模型

RNN/LSTM/CNN

将文本分词并用 词嵌入 表示，然后通过 RNN/CNN 结构捕捉序列或局部特征，比传统机器学习效果更好。

预训练语言模型（BERT、GPT 等）

BERT 通过大规模预训练学习丰富语义信息，对下游情感分析任务仅需少量微调即可达高性能。

1.4 代码示例：基于机器学习的情感分类

以下示例使用 sklearn 展示简化流程：

构建模拟数据
TF-IDF 向量化
训练逻辑回归模型
预测和评估

import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

# 1) 模拟数据
corpus = [
    ("I love this movie. It's fantastic!", "positive"),
    ("Absolutely terrible. Waste of time.", "negative"),
    ("Pretty good overall, but not the best.", "positive"),
    ("I hate this product, it's awful!", "negative"),
    ("The design is beautiful and I am satisfied.", "positive"),
    ("It's okay, not too bad, not too good.", "positive"),  # 将“中性”视为positive示例
    ("Horrible experience, I'm disappointed.", "negative"),
    ("Could be better, I'm not fully happy with it.", "negative")
]

texts = [item[0] for item in corpus]
labels = [item[1] for item in corpus]

# 2) 数据切分
X_train, X_test, y_train, y_test = train_test_split(
    texts, labels, test_size=0.25, random_state=42
)

# 3) TF-IDF 向量化
vectorizer = TfidfVectorizer(lowercase=True, stop_words='english')
X_train_vec = vectorizer.fit_transform(X_train)
X_test_vec = vectorizer.transform(X_test)

# 4) 训练逻辑回归
clf = LogisticRegression()
clf.fit(X_train_vec, y_train)

# 5) 测试与评估
y_pred = clf.predict(X_test_vec)
print("预测结果:", y_pred)
print("真实标签:", y_test)

print("\nClassification Report:")
print(classification_report(y_test, y_pred))

运行后可得到分类指标，如准确率、精确率、召回率等。

2. 主题建模（Topic Modeling）

2.1 概念与 LDA 基本原理

主题建模旨在从大量无标签文本中发现潜在主题。

LDA（Latent Dirichlet Allocation）：最经典的概率主题模型
- 假设每篇文档由若干主题混合生成，每个主题由特定的词分布构成
- 通过统计词在文档中的共现关系，推断文档-主题分布及主题-词分布

2.2 LDA 以外的主题建模方法

PLSA：LDA 的前身，但缺乏先验分布
HDP：层次狄利克雷过程，可自动确定主题数
神经主题模型：结合深度学习（如 VAE 或 BERT Embeddings + 聚类）进行主题发现

2.3 代码示例：Gensim 实现 LDA 主题建模

以下示例使用 Gensim 库进行简单的 LDA 训练，演示流程。

# pip install gensim
import gensim
from gensim import corpora
import nltk
# 如果需要下载nltk资源
# nltk.download('stopwords')
# nltk.download('punkt')
from nltk.corpus import stopwords

documents = [
    "I love to watch football games. Football is a great sport!",
    "The bank is closing soon, check your bank account quickly.",
    "I prefer basketball to football, it is more dynamic.",
    "The investment bank raised interest rates yesterday.",
    "He watches basketball and football every weekend.",
    "Financial institutions are impacted by interest rate changes."
]

stop_words = set(stopwords.words('english'))

def tokenize_and_clean(text):
    tokens = nltk.word_tokenize(text.lower())
    filtered = [w for w in tokens if w.isalpha() and w not in stop_words]
    return filtered

processed_docs = [tokenize_and_clean(doc) for doc in documents]

# 构建词典
dictionary = corpora.Dictionary(processed_docs)
dictionary.filter_extremes(no_below=1, no_above=0.9)

# 文档转换为词袋
corpus_bow = [dictionary.doc2bow(doc) for doc in processed_docs]

from gensim.models.ldamodel import LdaModel

num_topics = 2
lda_model = LdaModel(
    corpus=corpus_bow,
    id2word=dictionary,
    num_topics=num_topics,
    random_state=42,
    passes=10,
    alpha='auto'
)

for i in range(num_topics):
    print(f"主题 {i}:")
    print(lda_model.print_topic(i))
    print("------")

# 对新文档进行推断
new_doc = "The interest rate for bank deposits is increasing."
bow_new_doc = dictionary.doc2bow(tokenize_and_clean(new_doc))
topic_probs = lda_model.get_document_topics(bow_new_doc)
print("\n新文档主题分布:", topic_probs)

num_topics=2 表示我们希望模型分出 2 个主题
训练后可以查看每个主题的关键词及权重，也可对新文档推断其主题分布

3. 总结与扩展

情感分析与主题建模分别解决文本的“情感倾向”与“潜在话题”问题。
情感分析常用有监督学习，深度学习、预训练模型表现更佳；主题建模通常用无监督的 LDA 或其改进版本。
实际应用中，两者可结合使用：
- 根据主题建模先发现主要话题，然后对各个话题单独进行情感分析
- 或先做情感分类，再在正/负面文本里挖掘主题差异
若数据规模大、任务复杂，可尝试神经网络主题建模或BERT/GPT 等大模型，在提取更深层语义的同时，实现更加精准的情感分析和主题发现。

通过以上示例和讲解，你应该对如何从文本中提取情感倾向与潜在主题有了系统认识。无论是在舆情监测、产品评价分析、媒体聚类、学术文献整理等领域，情感分析与主题建模都能提供宝贵洞见，帮助深入洞察文本数据背后的价值。

【哈佛博后带小白玩转机器学习】 哔哩哔哩_bilibili

总课时超400+，时长75+小时

你可能感兴趣的:(深度学习,哈佛博后带你玩转机器学习,自然语言处理,人工智能,情感分析,主题建模,深度学习,机器学习,NLP)

Linux|ubuntu22.04安装CUDA最新完整教程
文章目录一、安装前准备工作查看GPU和型号查看GCC版本*下载gcc12*检查驱动二、安装CUDAToolkit*安装驱动三、安装后的工作必要操作推荐的操作开启守护进程模式删除本地下载安装包四、验证删除CUDA常见问题及解决方案还需要安装cuDNN吗？nvcc:Nosuchfileordirectory“errorwhileloadingsharedlibraries::cannotopensha
工厂模式 - Flutter中的UI组件工厂，按需生产各种“产品
想要动态创建不同风格的按钮？想一键切换整个主题？工厂模式就是你的"生产流水线"！想象一下这个场景：你决定扩大奶茶店业务，推出两个品牌系列：经典系列：传统珍珠奶茶，红白配色清新系列：水果茶，蓝绿配色每个系列都有自己风格的：杯子设计吸管样式包装袋会员卡问题来了：当顾客点单时，你如何确保：经典系列的奶茶配经典杯+经典吸管+经典包装？清新系列的水果茶配清新杯+清新吸管+清新包装？避免经典杯配清新吸管这种"
！LangChain链的并行执行与异步处理深度解析(32) Android 小码蜂测试专栏 langchain
LangChain链的并行执行与异步处理深度解析一、LangChain链的基础概念与执行逻辑1.1LangChain链的定义与作用LangChain链（Chain）是LangChain框架的核心组件之一，它通过将多个组件（如提示模板、大语言模型、输出解析器等）串联起来，形成一个完整的处理流程，以实现特定的自然语言处理任务。例如，在问答系统中，链可以先使用提示模板构建问题，然后调用大语言模型生成回答
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、深度优先搜索dfs第6天、广度优先搜索bfs第7天、动态规划六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605、
flutter flutter_vlc_player播放视频设置循环播放失效、初始化后获取不到视频宽高小蜜蜂嗡嗡 flutter
插件：flutter_vlc_player:^7.4.3问题1：设置循环播放_controller.setLooping(true);无用。解决方法：//vlcPlayer设置循环播放失效，以这种方式失效循环播放_setLoopListener()async{if(_videoController!.value.hasError){esLoadingToast('视频加载失败');}else{if
每天一个前端小知识 Day 20 - 服务端渲染（SSR）与前后端一体化开发详解蓝婷儿前端面试前端
服务端渲染（SSR）与前后端一体化开发详解什么是服务端渲染（SSR）？SSR（Server-SideRendering）是指在服务端生成HTML页面并返回给浏览器，由浏览器完成后续的交互逻辑绑定。✅SSR与CSR（客户端渲染）的对比特点SSRCSR首屏速度更快（服务端返回完整HTML）慢（JS加载后再渲染）SEO友好，搜索引擎可抓取完整内容差（默认JS执行后才有内容）页面加载方式首次由服务端渲染，
AI产品经理技术篇：AI领域常用术语解析让我看看好学吗人工智能产品经理机器学习深度学习学习
作为AI产品经理，深入理解人工智能领域的核心术语是高效沟通、需求定义和产品落地的关键。无论是与算法工程师协作优化模型，还是向业务方解释技术方案，准确掌握专业术语能显著提升决策效率，避免因概念混淆导致的开发偏差。本文系统梳理了模型与算法、NLP（自然语言处理）、CV（计算机视觉）、数据处理、核心评估指标等领域的核心术语，帮助产品经理快速构建AI技术认知框架。目录1.基础概念2.模型与算法3.自然语言
43.Textbox的数据绑定 C#例子 WPF例子军训猫猫头 c#wpf java
固定最简步骤，包括XAML：题头里引入命名空间标题下面引入类box和block绑定属性C#：通知的类，及对应固定的任务引入字段引入属性属性双触发，其中一个更新block的属性block=>指向box的属性从Textbox这行看binding是绑定的意思，后面的inputtext是类里的一个属性意思就是它的文本和这个属性绑定了updatesourcetrigger是一个触发，后面等号后的内容是不同的
元宇宙养老社区:数字化照护的创新实践 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《元宇宙养老社区：数字化照护的创新实践》关键词元宇宙养老社区数字化照护虚拟现实人工智能大数据物联网摘要本文深入探讨了元宇宙养老社区的概念、技术架构及其在数字化照护中的应用。通过分析虚拟现实、人工智能、大数据和物联网等核心技术，本文详细阐述了元宇宙养老社区的架构设计、项目实施、运营管理与用户体验优化。同时，本文还展望了元宇宙养老社区的潜在市场、技术发展趋势以及未来挑战与机遇。文章目录《元宇宙养老社区
机器学习-三大SOTA Boosting算法总结和调优小新学习屋机器学习机器学习 boosting 集成学习决策树人工智能
参考书籍：《机器学习公式推导和代码实现》书籍页码：P197～205简介除了深度学习适用的文本、图像、语音、视频等非结构化数据，对于训练样本较少的结构化数据，Boosting算法仍是第一选择。XGBoost、LightGBM、CatBoost是目前经典的SOTABoosting算法算法对比维度XGBoostLightGBMCatBoos说明算法的继承性是对GBDT的改进是对XGBoost的改进是对X
大模型微调到底有没有技术含量？ DeepSeek-大模型系统教程人工智能语言模型 ai 大模型大模型微调程序员 AI大模型
今天给大家带来知乎好友@ybq的一篇回答-大模型微调到底有没有技术含量，或者说技术含量到底有多大？老生常谈的一句话吧：有没有技术含量取决于这个工作你怎么做，尤其是llm方向，上手门槛相比传统NLP变得更低了。我举一些例子吧，针对大模型微调的几个重要环节，我列举的每一种做法大概率都能完成最终目标，甚至说训出来的模型效果都没什么差别。但对个人能力成长的帮助就大不相同了。数据工作做法1:继承实验室或者同
AIGC领域MCP模型上下文协议：推动行业数字化转型的新引擎 SuperAGI2025 AI大模型应用开发宝典 AIGC ai
AIGC领域MCP模型上下文协议：推动行业数字化转型的新引擎关键词：AIGC、MCP模型、上下文协议、数字化转型、人工智能、内容生成、语义理解摘要：本文深入探讨AIGC(人工智能生成内容)领域的MCP(多模态上下文感知)模型及其上下文协议，揭示其如何成为推动行业数字化转型的新引擎。我们将从基础概念出发，逐步解析MCP模型的技术原理、实现方法和应用场景，并通过实际案例展示其在各行业的创新应用。文章还
Elasticsearch索引模板：自动化索引管理搜索引擎技术搜索引擎实战 elasticsearch 自动化 jenkins ai
Elasticsearch索引模板：自动化索引管理关键词：Elasticsearch、索引模板、自动化管理、索引映射、索引设置、生命周期管理、数据建模摘要：本文深入解析Elasticsearch索引模板的核心原理与实践方法，通过系统化的步骤演示如何利用索引模板实现索引的自动化创建与统一管理。内容涵盖模板结构设计、映射与设置配置、动态字段处理、优先级策略、实战案例及最佳实践，帮助读者掌握高效管理大规
iOS 26 beta1 真机无法执行hot reload
哈喽，我是老刘总是劝你们不要激进的升级，你们不听，这回又来问题了吧，这次又是苹果。最近iOS26beta1更新后，不少Flutter开发者发现真机调试的HotReload直接挂了，但模拟器还能用。这到底咋回事？会不会影响正式版？我们该怎么应对？今天就来聊聊这个事儿。发生了啥？简单来说就是iOS26beta1真机调试时，Flutter的HotReload失效了！模拟器不受影响：在macOS上跑iOS
K8S之Pod资源调度
文章目录Pod资源调度总览LabelAnnotationTaint和Toleration污点（Taints）容忍（Tolerations）亲和性节点亲和性（NodeAffinity）Pod亲和性（PodAffinity）Pod反亲和性（PodAnti-Affinity）Pod资源调度总览APIServer在接受客户端提交Pod对象创建请求后，然后是通过调度器（kube-schedule）从集群中选
使用pyarmor对python文件进行加密 robot_future ubuntu pycharm linux
在pycharm上开发python后，需要对python文件进行加密。进行了调研，采用pyarmor进行加密。PyArmor是一个用于加密和保护Python脚本的工具。它能够在运行时刻保护Python脚本的二进制代码不被泄露。因为代码是python3代码，windows上的默认python是2.7版本。所以换到ubuntu上进行操作。ubuntu上：sudoapt-getinstallpython
领域驱动设计（Domain-Driven Design DDD)——模型驱动设计的构造块1 阿波罗.2012 软件架构系统架构架构设计模式软件构建
一、概述为了保证软件实现简洁且与模型保持一致，不管实际情况如何复杂，必须运用建模和设计的最佳实践，即设计模式GoF等。领域驱动设计能够使模型和程序紧密结合一起，互相促进对方的效用。这种结合要求我们注意每个设计的细节。这种设计风格沿续了“职责驱动设计”的原则，也用利了其他面向对象的设计原则如“SOLID”原则等为了使领域驱动设计过程更加灵活，开发人员需理解上述原则是如何支持Model-DrivenD
RabbitMQ(rabbitmq-delayed-message-exchange)实现延时任务 qiang_gege rabbitmq rabbitmq 分布式 spring boot 中间件
引言：什么是延时任务？在我们生活中比较常业务见场景的如下：红包24小时未被查收，需要延迟执退还业务；订单下单之后30分钟后，用户如果没有付钱，系统需要自动取消订单在如上场景中延时周期为固定时段。另外还有一种延时周期不固定的业务场景如下：业务场景：平台方发布预运行计划，预计划中需限定申报截至时间，参与方需在截止前申报各自实际运行计划给平台后由平台统筹运行计划安排。需求分析：由于是预计划，会存在截至时
RabbitMQ 如何实现延迟队列？肥肥技术宅 java rabbitmq 分布式
延迟队列是指当消息被发送以后，并不是立即执行，而是等待特定的时间后，消费者才会执行该消息。延迟队列的使用场景有以下几种：未按时支付的订单，30分钟过期之后取消订单。给活跃度比较低的用户间隔N天之后推送消息，提高活跃度。新注册会员的用户，等待几分钟之后发送欢迎邮件等。1.如何实现延迟队列？延迟队列有以下两种实现方式：通过消息过期后进入死信交换器，再由交换器转发到延迟消费队列，实现延迟功能；使用官方提
增刊第5章：模型性能优化技术与健康人工智能 python
第5章：模型性能优化完成DeepSeek大模型的部署和基本运维后，下一步就是对其进行性能优化。在大模型推理场景下，性能优化主要关注两个核心指标：推理速度（Latency）和吞吐量（Throughput）。本章将详细介绍几种关键的优化技术，帮助您在现有硬件条件下，榨干模型的每一滴性能。5.1量化策略进阶(INT4/INT8)在第2章中我们简要介绍了量化，这里我们将深入探讨量化策略。**量化（Quan
react控制打印机打印_React实现浏览器打印指定内容 weixin_39637179 react控制打印机打印
近期着手项目任务的打印功能，在此作个记录，本文介绍基于React的一种调用浏览器打印页面指定内容的方法。整体思路：通过构建一个隐藏的元素(该元素包裹需打印的内容)，当打印行为触发时，将页面其他的一些不需要打印的元素隐藏，然后将需打印的元素追加到body中，打印完成后，再恢复初始状态即可。浏览器打印的本质还是将web页面中的元素打印出来而已。1.构建待打印元素在页面中构建一个display为none
TryHackMe-进攻性渗透测试-02_Alfred
Alfred在这个房间里，我们将学习如何利用广泛使用的自动化服务器上的常见错误配置（Jenkins-此工具用于创建持续集成/持续开发管道，允许开发人员在更改代码后自动部署其代码）。之后，我们将使用一种有趣的权限提升方法来获得完整的系统访问权限。由于这是一个Windows应用程序，我们将使用Nishinang来获得初始访问权限。存储库包含一组有用的脚本，用于初始访问、枚举和权限提升。在本例中，我们将
Python 进攻性渗透测试（二）
原文：annas-archive.org/md5/dccde1d96c9ad81f97529d78e3e69c9b译者：飞龙协议：CCBY-NC-SA4.0第四章：追捕我吧！在今天的世界里，绕过和劫持软件在互联网上到处都是。然而，明确的使用和执行方式才是让你成为一名优秀的业余黑客的关键。这可以通过正确选择工具并遵循必要的过程，完美地完成手头的任务来实现。在本章中，我们将涵盖以下主题，帮助你实现这一
vue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npm install出现一堆warn，然后运行npm run dev报错，项目启动失败 67号人生 vue小白学习 vue.js 学习 npm crypto.hash vue官方示例项目失败
日期：2025年6月27日星期五农历六月初三VUE版本：vue3IDE：vscodevue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npminstall出现一堆warn，然后运行npmrundev报错，项目启动失败运行npminstall出现一堆warn运行npmrundev报错解决办法通过nvm安装较高版本的nodejs，或者手动冲nodejs官网下载。虽然vue官方推荐node
人脸识别接口&sdk，两张人脸相似度比对
人工智能时代，人脸识别技术正在被广泛应用于金融支付、安防监控、身份验证等多个领域，基于深度学习算法于海量样本训练，人脸识别接口以高精度、低延迟的特性出现在大众视野，成为开发者和企业用户集成人脸识别功能的首要选择之一。人脸识别接口技术服务原理：格式转换：支持BMP、JPG、PNG、TIF等多种常见图像格式；尺寸调整与压缩：建议图像大小控制在200KB左右，确保传输效率与识别质量；图像增强：自动旋转、
家用充电桩远程监控安全管理系统解决方案蓝蜂物联网物联网远程监控边缘计算物联网
家用充电桩远程监控安全管理系统解决方案在当今电动汽车日益普及的背景下，家用充电桩的安全管理成为了广大车主关注的重点问题。为了实现对充电桩的高效、精准、远程监控，一套完善的家用充电桩远程监控安全管理系统解决方案应运而生。本方案旨在通过先进的物联网技术、云计算、大数据分析以及人工智能等科技手段，构建一个集实时监测、异常预警、故障诊断、数据统计、远程控制于一体的智能化平台，确保充电桩的安全运行及用户充电
【公司环境下发布个人NPM包完整教程】
公司环境下发布个人NPM包完整教程创建时间:2025年7月2日适用场景:公司电脑，需要临时切换个人账户发布npm包教程概述场景说明环境:公司电脑，已配置公司npm账户目标:临时使用个人账户发布npm包，发布后恢复公司环境关键:确保不影响公司日常工作，保护隐私信息前置条件拥有个人npm账户公司允许临时切换npm账户具备基本命令行操作能力第一步：环境准备和信息收集1.1检查当前npm状态#查看当前登录
为什么 Python 是 AI 的首选语言？
文章目录一、简洁优雅，易于上手二、丰富的库和框架1.数据处理与分析2.数据可视化3.机器学习与深度学习框架三、强大的社区支持四、跨平台性和可移植性五、与其他语言的互操作性文章配套代码已上传，点击查看：https://download.csdn.net/download/2501_92578370/91180848在人工智能（AI）技术飞速发展的今天，编程语言的选择对AI开发者来说至关重要。当你翻开
TypeScript基本类型
一、前言TypeScript是JavaScript的一个超集，它通过添加静态类型系统帮助开发者写出更健壮、可维护性更强的代码。而理解TypeScript的基本类型是学习TypeScript的第一步。本文将带你全面了解TypeScript中的常用基本类型，包括：✅数值类型✅字符串类型✅布尔类型✅null与undefined✅any与unknown✅never与void✅数组类型✅元组类型并通过大量代
TypeScript编译选项
一、前言在开发TypeScript项目时，一个非常关键的文件就是tsconfig.json。它不仅定义了项目的根目录、模块解析方式，还控制着TypeScript编译器的行为。本文将带你全面了解：✅tsconfig.json的作用✅常用编译选项（compilerOptions）详解✅不同环境下的配置建议（开发/生产）✅配置继承与共享设置✅实际开发中的常见问题与解决方法并通过完整的代码示例帮助你掌握如
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他