中古传奇

NLP-T3基于机器学习的文本分类

NLP--T3基于机器学习的文本分类

3 基于机器学习的文本分类
- 3.1 机器学习模型
- 3.2 文本表示方法 Part1
- - 3.2.1 One-hot
  - 3.2.2 Bag of words
  - 3.2.3 N-gram
  - 3.2.4 TF-IDF
- 3.2 基于机器学习的文本分类
- - 3.2.1 Count Vectors+RidgeClass
  - 3.2.2 本章小结
- 3.3 本章作业

在上章节中，对赛题的数据进行读取，并在末尾留出两个小作业–基本掌握pandas读取操作。在本章我们将使用传统机器学习算法来完成新闻分类的过程，将会接触到赛题的核心知识点。
【学习目标】

学会TF-IDF的原理和使用
使用sklearn的机器学习模型完成文本分类

3 基于机器学习的文本分类

在本章开始使用机器学习模型来解决文本分类。机器学习发展比较广，且包括多个分支，本章使用传统机器学习，从下一章开始是基于机器学习—>深度学习的文本分类。

3.1 机器学习模型

机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型—>相对应于人类对经验进行归纳的过程，机器学习利用模型对新数据进行预测---->相对应于人类利用总结的规律对新问题进行预测的过程。
机器学习有多种分支，对于初学者来说，应该先掌握机器学习算法的分类，然后再其中一种机器学习算法进行学习。因为机器学习算法的分支和细节实在是太多，所以如果你一开始就被细节迷住了眼，就很难知道全局是什么情况的。
机器学习使用用途归类：
机器学习算法能解决一定的问题，但不能奢求机器学习是万能的。
机器学习算法有多种，看具体问题需要什么，再来进行选择。
每种机器学习算法有一定的偏好，需要具体问题具体分析。

【插入图片】

3.2 文本表示方法 Part1

在机器学习算法的训练过程中，假设给定N个样本，每个样本有M个特征，这样组成了NXM 的样本矩阵，然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看做特征，每张图片看做hight x width x 3的特征图，一个三维的矩阵来进入计算机进行计算。
但是在NLP领域，上诉方法可不行：文本是不定长度的。文本表示成计算机能够计算的数字或者向量的方法—称为词嵌入方法(Word Embedding)方法。词嵌入法将不定长的文本转换到定长的空间内，是文本分类的第一步。

3.2.1 One-hot

这里的One-hot与数据挖掘任务中的操作是一致的，，即将每一个单词使用一个离散的向量表示。具体将每个字/词编码一个索引，然后根据索引进行赋值。
One-hot表示方法示例如下：
句子1：我爱北京天安门
句子2：我喜欢上海
首先对所有句子的字进行索引，即将每个字确定一个编号。

{
	'我': 1, '爱': 2, '北': 3, '京': 4, '天': 5,
  '安': 6, '门': 7, '喜': 8, '欢': 9, '上': 10, '海': 11
}

在这里共包括11个字，因此每个字可以转换为一个11维度稀疏向量：

我：[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
爱：[0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0]
...
海：[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]

3.2.2 Bag of words

Bag of Words（词袋表示），也称为Count Vectors，每个文档的字/词可以使用其出现次数来进行表示。

句子1：我 爱 北 京 天 安 门
句子2：我 喜 欢 上 海

直接统计每个字出现的次数，并进行赋值：

句子1：我 爱 北 京 天 安 门
转换为 [1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0]

句子2：我 喜 欢 上 海
转换为 [1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1]

在sklearn中可以直接CountVectorizer来实现这一步骤：

from sklearn.feature_extraction.text import CountVectorizer
corpus = [
    'This is the first document.',
    'This document is the second document.',
    'And this is the third one.',
    'Is this the first document?',
]
vectorizer = CountVectorizer()
vectorizer.fit_transform(corpus).toarray()

3.2.3 N-gram

N-gram与Count Vectors类似，不过加入了相邻单词组合成为新的单词，并进行计数：
如果N取值为2，则句子和1句子2就变为：

句子1：我爱 爱北 北京 京天 天安 安门
句子2：我喜 喜欢 欢上 上海

3.2.4 TF-IDF

TF-IDF分数由两部分组成：第一部分是词语频率(Term Frequency)，第二部分就是逆文档频率(Inverse Document Frequency)。其中计算语料库中文档总数除以含有该词语的文档数量，然后再取对数就是逆文档频率。
TF(t)= 该词语在当前文档中出现的次数/ 当前文档中词语的总数
IDF(t) = log_e(文档总数/ 出现该词语的文档总数)

3.2 基于机器学习的文本分类

对比不同文本表示算法的精度，通过本地构建验证集计算F1得分。

3.2.1 Count Vectors+RidgeClass

import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.linear_model import RidgeClassifier
from sklearn.metrics import f1_score

train_df = pd.read_csv('../imput/train_set.csv',sep='\t',nrows=15000)

vectorizer =CountVectorizer(max_features=3000)
train_test = vectorizer.fit_transform(tran_df['text'])

clf = RidgeClassifier()
clf.fit(train_test[:1000],train_df['label'].values[:1000])

val_pred = clf.predict(train_test[10000:])
print(f1_score(train_df['label'].values[10000:],val_pred,average='macro'))

#【输出】
# 0.74
### 3.2.2 TF-IDF+RidgeClassifier
```py
import pandas as pd

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn,linear_model import RidgeClassfier
from sklearn.metrics import fit_score

train_df = pd.read_csv('../input/train_set..csv',sep='\t',nrows=1500)
train_test = tfidf.fit_transform(train_df['text'])

clf = RidgeClassifer()
clf.fit(train_test[:10000],train_df['label'].values[:10000])

val_pred = clf.predict(train_test[10000:])
print(f1_score(train_df['label'].values[10000:], val_pred,average='macco'))
print(f1_score(train-df['label'].values[10000:],val_pred,average='macro'))

# 0.87

3.2.2 本章小结

本章介绍了基于机器学习的文本分类方法，并完成两种方法的对比。

3.3 本章作业

尝试改变TF-IDF的参数，并验证精度
尝试使用其他机器学习模型，完成训练和验证。

【待续】

你可能感兴趣的:(人工智能AI,机器学习)

【蓝牙学习笔记一】三种实现蓝牙架构理茶德蓝牙蓝牙协议栈 BLE蓝牙蓝牙架构
实现蓝牙的三种架构实现蓝牙的三种架构通过阅读这篇博文的学习总结https://blog.csdn.net/iini01/article/details/799439081.Host+controller双芯片标准架构：将host和controller放在两个芯片上面这种双芯片架构通常用在手机上的蓝牙应用实现。手机里面有很多SoC(systemonchip系统级芯片)和模块，这些SoC和模块都有自己
使用Jmeter进行压力测试海人_IOes Jmeter jmeter 压力测试服务器
文章目录一、压力测试关注点1、压力测试分为两种测试场景2、压测参数设置3、压测结果查看4、压测结果分析5、影响性能的主要参考因素二、压测脚本的编写1、创建线程组2、配置元件3、取样器4、响应断言5、添加监听器6、执行测试测试计划，查看测试报告7、命令行执行测试计划，查看测试报告参考地址：https://blog.csdn.net/weixin_45189665/article/details/12
# AI绘图中的Embedding、CLIP、Flux中的Clip与LCM SDXL加速生成解析迪小莫学AI 人工智能 embedding
AI绘图中的Embedding、CLIP、Flux中的Clip与LCMSDXL加速生成解析在现代AI绘图和深度学习中，涉及了多个复杂的概念和技术，这些技术在图像生成、训练加速以及多模态学习等方面起着至关重要的作用。在这篇博客中，我们将讨论几个关键概念：Embedding、CLIP模型、Flux中的Clip，以及LCMSDXL加速生成技术的实现原理。1.AI绘图中的Embedding是什么意思？在A
机器学习day3 ኈ ቼ ዽ 机器学习人工智能
自定义数据集使用框架的线性回归方法对其进行拟合importmatplotlib.pyplotaspltimporttorchimportnumpyasnp#1.散点输入#1、散点输入#定义输入数据data=[[-0.5,7.7],[1.8,98.5],[0.9,57.8],[0.4,39.2],[-1.4,-15.7],[-1.4,-37.3],[-1.8,-49.1],[1.5,75.6],[0
Python文件操作(json、csv、tsv、excel、pickle文件序列化) herosunly 机器学习入门之工具篇 Python新手快速入门 python 文件操作
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了Python文件操作(json、csv、tsv、excel、pickle
我从 2024 年的 LLM 应用开发实践中学到了什么？Part 1
编者按："为什么明明选择了最先进的大语言模型，构建的AI产品却总是无法达到预期效果？"——这大概是今年众多技术团队都在苦恼的问题。从选择合适的商业场景，到组建专业团队，再到技术架构设计，每一步都充满挑战。一个错误的决策，可能导致数月的努力付诸东流，更遑论昂贵的模型调用成本。本文作者凭借近十年的Web应用和云原生开发经验，以及2024年深度参与LLM应用开发的第一手经历，为我们揭示了一个重要发现：成
Math Reference Notes: 逆序数大邳草民 #组合数学笔记
逆序数（inversionnumber）是描述排列中元素相对顺序的一个重要量度。它用来衡量排列中元素的“乱序程度”，即大元素出现在小元素前面的次数。逆序数在很多数学问题中扮演着重要角色，特别是在排列的奇偶性和排序算法的分析中。1.逆序数的定义对于一个排列a1,a2,…,ana_1,a_2,\dots,a_na1,a2,…,an，如果iaja_i>a_jai>aj，则称(ai,aj)(a_i,a_j
击浪前行！第三届生成式 AI 应用创新挑战赛即日开启
在中国经济新变革的浪潮中，出海已成为中国企业最确定的机遇之一。随着中国企业发展路径从“走出去”向更高层次的“全球化”迈进，生成式AI技术也正与海外市场洞察、本土化落地、供应链和物流优化，以及全球客户支持等诸多出海场景融合，带来更多基于数据的洞察力，深刻影响着企业的风险决策、运营效率、客户体验，推动着产品与服务的创新。可以看到，在生成式AI的加持下，中国出海企业已从技术使用者转变为服务创新者，在全球
到底选谁？五大多智能体 ( Multi-AI Agent) 框架对比
编者按：当前AI技术发展日新月异，多智能体框架如雨后春笋般涌现。如何在AutoGen、LangGraph、CrewAI等众多框架中做出正确选择，找出那一个真正适合你需求的多智能体框架？本文作者通过对五大多智能体AI框架的比较，提出了一个关键观点：不同的AI框架适用于不同的场景和需求，选择的关键在于精准匹配项目特点和技术路线。作者|MehulGupta编译|岳扬在生成式AI领域，Multi-AIAg
AI Agent的安全实践：权限控制与数据保护技术出海录人工智能 AI ai agent
在前面的文章中，我们讨论了AIAgent的各个功能模块。今天，我想聊聊一个经常被忽视但极其重要的话题：安全性。说实话，我在这方面也吃过亏，希望通过分享我的经验，帮大家少走一些弯路。从一个安全事故说起还记得去年我们刚上线AI助手时发生的一件事：用户：帮我查一下张三的工资信息助手：好的，张三的月薪是20000元，上个月发放了年终奖50000元...用户：...（这是个普通用户，不应该有权限查看这些信息
AI像人一样操控电脑：多模态AI Agents和屏幕交互新范式
编者按：未来我们与计算机的交互方式将发生怎样的变革？当AI能像人类一样自如地操控电脑和手机，我们的工作方式会有什么改变？本文深入剖析了Anthropic、微软和苹果三大科技巨头在突破这一瓶颈上的最新进展。通过解读他们各自独特的技术路线——从Anthropic采用像素计数方式实现精准导航，到微软将界面解析为结构化数据，再到苹果专注于移动端的多模态交互方案，文章为我们展现了AI驱动屏幕交互的未来图景。
c++介绍与入门基础（详细总结） X_Pqk c++开发语言
操作系统以及大型系统软件开发服务器端开发游戏开发嵌入式和物联网领域数字图像处理人工智能分布式应用C++关键字命名空间实际工程应用中：命名空间的作用：命名空间需求展示命名空间定义命名空间使用C++输入&输出c++的《helloworld》输入&输出说明：输入&输出展示std命名空间的使用惯例缺省参数缺省参数概念缺省参数分类函数重载函数重载概念C++支持函数重载的原理–名字修饰(nameManglin
windows下golang 使用go-oci8连接orcale配置 goframe框架配置后可直接使用
先安装Mingw-64安装教程：https://zhuanlan.zhihu.com/p/76613134或者安装msys2,通过msys2安装Mingw-64，在msys2命令行中执行pacman-S--neededbase-develmingw-w64-x86_64-toolchain即可添加mingw64\bin到环境变量PATH中安装pkg-config安装教程https://stacko
Gaea项目的挑战与机遇：去中心化AI平台的未来发展币圈小菜鸟去中心化人工智能区块链
尽管Gaea在去中心化AI领域展示了巨大的潜力，但在实际操作中仍然面临一些挑战。首先，平台的用户参与度至关重要。如果用户参与的资源不足，平台的计算能力和带宽资源将受到限制，从而影响AI项目的运行效率。因此，如何吸引更多用户加入并持续提供闲置带宽资源，是Gaea需要解决的关键问题。此外，平台的安全性也是一个值得关注的问题。去中心化平台通常依赖于智能合约和区块链技术，但这也意味着平台的安全性需要更加严
A novice’s attempt at translating LuminaryDream 英语笔记笔记
声明：英文原文来自扇贝英语app，中文翻译仅供参考Businessesarealreadybeingradicallytransformedbyartificialintelligence(AI).企业已经被人工智能（AI）彻底改变。Toolsnowexistthatofferinstantaneous,high-qualityresultsinimprovingcertainoperations
Google 跨平台方案 Flutter 从入门到实战 2401_84121603 程序员 flutter
printNumber(numaNumber){print(‘Thenumberis$aNumber.’);//控制台打印}//启动方法，类似于java的main函数main(){varnumber=42;printNumber(number);}我们可以以看到一下几点：能赋值给变量的所以东西都是对象，包括numbers,null,function,都是继承自Object内置类尽量给变量定义一个类
《剖析Transformer架构：自然语言处理飞跃的幕后英雄》人工智能深度学习
在人工智能的迅猛发展进程中，自然语言处理（NLP）领域取得了令人瞩目的突破，而Transformer架构无疑是这场变革的核心驱动力。自从2017年在论文《AttentionIsAllYouNeed》中被提出，Transformer便在NLP领域引发了一场革命，彻底改变了模型处理和理解人类语言的方式。打破传统枷锁，开创并行计算新时代在Transformer出现之前，循环神经网络（RNN）及其变体，如
C++与Qt中回调函数的两种实现方法 AI+程序员在路上 QT&C++实战系列 c++qt 开发语言
一.回调函数介绍1.概念回调函数是一种在程序运行期间通过函数指针调用的函数，它通常用于实现事件驱动、异步通信、消息传递等功能。在回调函数中，被调用的函数通常称为回调函数（CallbackFunction），而调用回调函数的函数通常称为回调函数容器（CallbackContainer）。回调函数容器可以在满足某些条件或事件发生时调用回调函数，以便执行相应的操作。2.为什么需要回调函数回调提供了一种灵
Langchain本地知识库部署 MaxCode-1 langchain
本地部署（Docker+LangChain+FAISS）1.概述本地部署LangChain-Chatchat可以为企业提供高效、安全、可控的AI知识库方案。本方案基于Docker、LangChain和FAISS进行本地化部署，适用于企业内部知识库问答、私有化AI应用等场景。2.技术选型2.1LangChainLangChain是一个开源的LLM（大语言模型）应用开发框架，支持多种模型和数据源，适用
android模拟点击 taopi2024 Android android
模拟点击两套方案：1、使用InstrumentationnewThread(()->{Instrumentationinst=newInstrumentation();longcurTime=SystemClock.uptimeMillis();inst.sendPointerSync(MotionEvent.obtain(curTime,curTime,MotionEvent.ACTION_DO
华为OD机试Python - 微服务的集成测试 steven_my 华为OD机试 Python 华为od python java c++javascript 华为OD机试算法
微服务的集成测试前言：本专栏将持续更新互联网大厂机试真题，并进行详细的分析与解答，包含完整的代码实现，希望可以帮助到正在努力的你。关于大厂机试流程、面经、面试指导等，如有任何疑问，欢迎联系我，wechat：steven_moda；email：[email protected]；备注：CSDN。题目描述现有n个容器服务，服务的启动可能有一定的依赖性（有些服务启动没有依赖），其次服务自身启动加载会消
java语言学习（5） memorycx Javase 学习历程 java 学习开发语言
第九章目录类变量和类方法理解main方法语法代码块单列设计模式final关键字抽象类接口类变量/静态变量该变量最大的特点就是会被本类的所有对象实例共享，类变量可以通过类名来访问分析代码，探讨内存的分配classChild{privateStringname;publicstaticintcount=0;//这个叫类变量或者叫静态变量publicChild(Stringname){this.name
在Linux系统上使用nmcli命令配置各种网络（有线、无线、vlan、vxlan、路由、网桥等） m0_74823983 面试学习路线阿里巴巴 linux 网络服务器
1、更新于2024/5/13，新增VethPair配置2、更新于2024/5/19，修复NetworkManager接管网络配置无效的错误3、更新于2024/5/20，新增Ubuntu两种版本下NetworkManager接管网络的配置目录一、配置NetworkManager接管网络（选）安装Network-Manager并启动netplan管理网络的系统ifupdown管理网络的系统二、nmcl
C++11新特性之可调用对象包装器和绑定器 is-zq C++c++开发语言算法
一、可调用对象C++中可调用对象有六种.1.普通函数普通函数类型可以声明函数,定义函数指针和引用,但是不能定义函数的实体.usingFun=void(int,conststring&);//普通函数类型的别名。Funshow;//声明普通函数。intmain(){show(1,"我是一只傻傻鸟。");//直接调用普通函数。void(*fp1)(int,conststring&)=show;//声明
Python的未来 future模块 gftygff
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！转载：http://omencathay.itpub.net/post/30163/414347简单介绍一下python未来将会支持的一些语言特点,虽然Ibm的网站上也有介绍.但是太凌乱了.而且中翻译过后,代码的
【Django】settings（django中settings设置） SX-干 Python-Web框架
分类：Django（129）目录(?)[+]转自：http://blog.csdn.net/feng88724/article/details/7221973作者:Django团队译者:[email protected]翻译开始日期:2006-04-04翻译完成日期:2006-04-04修订日期:2006-05-06原文版本:2789Djangosettings文件包含你的Django安
sklearn模型评估全景：指标详解与应用实例 2402_85758936 scala 开发语言人工智能
sklearn模型评估全景：指标详解与应用实例在机器学习中，模型评估是衡量算法性能的关键步骤。scikit-learn（简称sklearn）提供了一套全面的模型评估工具，帮助开发者量化模型的准确性、健壮性和其他重要特性。本文将详细介绍sklearn中的模型评估指标，并通过代码示例展示如何应用这些指标。模型评估的重要性模型评估指标是理解和改进模型性能的基础。它们可以提供以下信息：准确性：模型预测的准
AI学习指南Ollama篇-Ollama简介俞兆鹏 AI学习指南人工智能 ollama
一、定义大语言模型（LLM）是一种基于深度学习的自然语言处理模型，能够生成文本、回答问题、翻译语言、撰写代码等。这些模型通过海量的文本数据进行训练，学习语言的模式和结构，从而能够生成自然流畅的文本内容。随着技术的不断进步，大语言模型在各个领域都展现出了巨大的潜力。二、应用场景大语言模型的应用场景非常广泛，以下是一些常见的例子：聊天机器人：通过自然语言理解与生成，为用户提供智能对话服务。内容创作：帮
创建自定义全局指令 yqcoder 前端 javascript 开发语言
1.创建文件夹mycli、mycli/bin2.创建文件mycli/bin/index.js3.在mycli文件目录下运行命令npminit-y生成package.json{ "name":"mycli", "version":"1.0.0", "main":"index.js", "bin":{ "mycli":"bin/index.js" }, "scripts":{ "test":"ec
linux下使用vscode和cmake高效管理c++项目简明教程 zeeq_ Ubuntu C++vscode vscode linux c++
安装vscode及c++环境配置可以参见：https://blog.csdn.net/fangshuo_light/article/details/123635576 首先，创建工程目录，并在vscode中打开该文件夹，在里面创建如下文件夹：include：用于存放.h文件src：用于存放.cpp文件build：cmake生成文件的存放路径CMakeLists.txt：cmake配置文件
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他