叶锦小兴

Task3 基于机器学习的文本分类

Task3 基于机器学习的文本分类

本章将使用传统机器学习算法来完成新闻分类的过程。

3.1 学习目标

1.学会TF-IDF的原理和使用
2.使用sklearn的机器学习模型完成文本分类

3.2 机器学习模型

机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应人类对经验进行归纳的过程；机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程。
机器学习有很多分支，初学者应该优先掌握机器学习算法的分类，然后对其中一种机器学习算法进行学习。作为一名机器学习初学者，你应该要知道：
1.机器学习能解决一定的问题，但它并不是万能的；
2.机器学习算法有很多种，它们有各自的偏好，需要根据具体问题选择具体算法。

3.3文本表示方法

在机器学习算法的训练过程中，假设给定N个样本，每个样本有M个特征，组成N×M的样本矩阵，然后完成算法的训练和预测。例如在计算机视觉领域，可以将图片的像素看作特征，每张图片看作hight×width×3的特征图，对一个三维的矩阵来进行计算。
但是在自然领域，上述方法却不可行，因为文本是不定长度的。我们需要将文本表示为计算机能够运行的数字或者向量，这种方法称为词嵌入（Word Embedding）方法。词嵌入将不定长的文本转换到定长的空间，是文本分类的第一步。

3.3.1 One-hot

独热编码，即将每一个单词使用一个离散的向量表示。具体操作就是将每个字/词编码一个索引，然后根据索引进行赋值。
例子：

对所有句子的字进行索引，给每个字确定一个编号：

一共有11个字，可以转换为一个11维度的稀疏向量：

3.3.2 Bag of Words

Bag of Words（词袋表示），也称为Count Vectors，使用每个字 /词出现的次数来进行表示。

sklearn中可以使用CountVectorizer来实现。

3.3.3 N-gram

N-gram与Count Vectors类似，是将相邻字/词组合成新的字词，并进行计数。
如果N取2，则句子1和句子2变为：

CountVectorizer中ngram_range参数改为（2,2）则为2-gram。

3.3.4 TF-IDF

TF-IDF分数由两部分组成，第一部分是词语频率(Term Frequency)，第二部分是逆文档频率（Inverse Document Frequency）。其中计算语料库中文档总数除以含有该词语的文档数量，然后再去对数就是逆文档频率。
TF(t)= 该词语在当前文档出现的次数 / 当前文档中词语的总数。
IDF(t)= log_e（⽂档总数 / 出现该词语的文档总数）。
词频TF很好理解，就是文本中每个词出现的频率，但是逆文本频率IDF如何理解呢？我们知道有些词的词频可能很高，但是它的重要性却可能没那么高（比如‘的’，‘地’这些字），IDF就是来帮助我们来反应这个词的重要性的，进而修正仅仅用词频表示的词特征值。
概括来讲， IDF反应了一个词在所有文本中出现的频率，如果一个词在很多的文本中出现，那么它的IDF值应该低。而反过来如果一个词在比较少的文本中出现，那么它的IDF值应该高。一个极端的情况，如果一个词在所有的文本中都出现，那么它的IDF值应该为0。
sklearn中可以使用TfidfVectorizer来实现。

3.4 基于机器学习的文本分类

对比不同文本表示算法的精度，通过本地构建验证集计算F1得分。

3.4.1 Count Vectors + RidgeClassifier

import pandas as pd

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.linear_model import RidgeClassifier
from sklearn.metrics import f1_score

train_df = pd.read_csv('data/train_set.csv', sep='\t', nrows=15000)

#Count Vectors + RidgeClassifier
vectorizer = CountVectorizer(max_features=3000)
train_test = vectorizer.fit_transform(train_df['text'])

clf = RidgeClassifier()
clf.fit(train_test[:10000], train_df['label'].values[:10000])

val_pred = clf.predict(train_test[10000:])
f1_score(train_df['label'].values[10000:], val_pred, average='macro')

结果：0.7404817207081769

3.4.2 TF-IDF + RidgeClassifier

#TF-IDF + RidgeClassifier
import pandas as pd

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import RidgeClassifier
from sklearn.metrics import f1_score

tfidf = TfidfVectorizer(ngram_range=(1, 3) ,max_features=3000)
train_test = tfidf.fit_transform(train_df['text'])

clf = RidgeClassifier()
clf.fit(train_test[:10000], train_df['label'].values[:10000])

val_pred = clf.predict(train_test[10000:])
f1_score(train_df['label'].values[10000:], val_pred, average='macro')

结果：0.8721598830546126
fit_transform学习到一个字典，并返回Document-term的矩阵(即词典中的词在该文档中出现的频次)，行是文档个数，列是特征词的个数。

3.4.3 N-gram +RidgeClassifier

import pandas as pd

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.linear_model import RidgeClassifier
from sklearn.metrics import f1_score

#2-gram + RidgeClassifier
vectorizer = CountVectorizer(ngram_range=(2, 2), max_features=3000)
train_test = vectorizer.fit_transform(train_df['text'])

clf = RidgeClassifier()
clf.fit(train_test[:10000], train_df['label'].values[:10000])

val_pred = clf.predict(train_test[10000:])
f1_score(train_df['label'].values[10000:], val_pred, average='macro')

结果：0.7628933215959407

3.5 小结

介绍了基于机器学习的文本分类方法，对比结果发现TF-IDF的转换方法f1_score最高。

3.6 作业

1.尝试改变TF-IDF的参数，并验证精度

#TF-IDF + RidgeClassifier
tfidf = TfidfVectorizer(ngram_range=(1, 3) ,max_features=3000, sublinear_tf=True)

修改参数sublinear_tf=True，应用线性缩放TF，例如，使用1+log(tf)覆盖tf，f1_score提高为0.8847366264933348。

tfidf = TfidfVectorizer(ngram_range=(1, 3) ,max_features=3000,stop_words=['3750', '900', '648'], sublinear_tf=True)

Task2中我们知道编号’3750’, ‘900’, '648’可能为标点符号，可是尝试直接过滤，效果提高了一点点：0.8877121780871436。

tfidf = TfidfVectorizer(ngram_range=(1, 3) ,max_features=3000,stop_words=['3750', '900', '648'], sublinear_tf=True, max_df=0.6)

我们还可以使用max_df=0.6过滤掉出现次数超过60%的词，结果提高到：0.8899145557347227。
2.尝试使用其他机器学习模型，完成训练和验证。
使用KNN分类器：

#TF-IDF + KNN Classifier
import pandas as pd

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import f1_score

train_df = pd.read_csv('data/train_set.csv', sep='\t', nrows=15000)

tfidf = TfidfVectorizer(ngram_range=(1, 3) ,max_features=3000,stop_words=['3750', '900', '648'], sublinear_tf=True, max_df=0.6)
train_test = tfidf.fit_transform(train_df['text'])

clf = KNeighborsClassifier()
clf.fit(train_test[:10000], train_df['label'].values[:10000])

val_pred = clf.predict(train_test[10000:])
f1_score(train_df['label'].values[10000:], val_pred, average='macro')

结果：0.8626093007762307
参考资料.

你可能感兴趣的:(NLP学习)

最强开源大模型炸场！全网独一份AI大模型学习实践资源...（待会删）大模型应用人工智能大数据 prompt langchain Agent ai大模型 LLM
今年科技圈的热点，除了裁员，就是被各种“AI大模型”新闻刷屏。GPT、Sora还在霸榜…开源大模型又来炸场！Meta发布Llama3系列模型，号称「最强大的开源大模型」，震撼科技圈！毫不夸张地说，AI大模型正在颠覆程序员的价值！很多大厂一边裁员，一边用百万年薪挖掘懂AI大模型的人，打工人的职业危机至少被提前5年。普通程序员想在技术上不掉队，还要增加收入，关键在于——拥抱技术红利，掌握AI大模型项目
【数据结构】C语言实现带头双向循环链表 kazamata 数据结构及算法 c语言数据结构学习链表
在前面的博客中，我们学习了最简单的链表类型——单向、不带哨兵位、不循环，今天我们要来学习的是具有链表中最复杂的结构类型——双向、带哨兵位、循环的链表。我们先来看一下两者的结构示意图。注：头和哨兵位为同一个东西，下面均以哨兵位称呼。从图中我们不难发现，两个链表的结构简直是天差地别，第二种比第一种复杂太多了，那么第二种的实现同样会比第一种的实现难上很多吗？答案是否定的，虽然第二种的结构更加复杂，但是它
Arcpy点点滴滴学习教程梅里雪山GIS Python Arcgis python arcgis
Arcpy点点滴滴学习教程第1章ArcPy简介1.1什么是ArcPy？ArcPy是一个以成功的arcgisscripting模块为基础并继承了arcgisscripting功能进而构建而成的站点包。目的是为以实用高效的方式通过Python执行地理数据分析、数据转换、数据管理和地图自动化创建基础。该包提供了丰富纯正的Python体验，具有代码自动完成功能（输入关键字和点即可获得该关键字所支持的属性和
深度学习专业毕业设计选题清单：算法与应用 HaiLang_IT 毕业设计选题毕业设计人工智能深度学习
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了计算机专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
Python3 OS模块中的文件/目录方法说明十四崔行舟 python python
一.简介前面文章简单学习了Python3中OS模块中的文件/目录的部分函数。本文继续来学习OS模块中文件、目录的操作方法：os.statvfs()方法，os.symlink()方法。二.Python3OS模块中的文件/目录方法1.os.statvfs()方法os.statvfs()方法用于返回包含文件描述符fd的文件的文件系统的信息。这些信息是关于文件系统统计信息的属性，比如块大小、总块数、可用块
python 求差分_用python实现简单的有限元方法（一） weixin_39622710 python 求差分
华中师范大学hahakity有限元算法（FiniteElementMethod，简称FEM）是一种非常流行的求解偏微分方程的数值算法。有限元被广泛应用于结构受力分析、复杂边界的麦克斯韦方程求解以及热传导等问题。这一节介绍有限元方法的基本原理，以及如何用Python从头实现一个有限元算法，数值求解麦克斯韦方程。学习内容筑基：加权残差法（WeightedResidualMethod）心法：有限元与有限
python cv2 matchtemplate_机器学习进阶-图像金字塔与轮廓检测-模板匹配（单目标匹配和多目标匹配）1.cv2.matchTemplate(进行模板匹配) 2.cv2.minMa... weixin_39621044 python cv2 matchtemplate
1.cv2.matchTemplate(src,template,method)#用于进行模板匹配参数说明：src目标图像，template模板，method使用什么指标做模板的匹配度指标2.min_val,max_val,min_loc,max_loc=cv2.minMaxLoc(ret)#找出矩阵中最大值和最小值，即其对应的(x,y)的位置参数说明：min_val，max_val,min_lo
机器学习进阶-图像金字塔与轮廓检测-图像金字塔(拉普拉斯金字塔) weixin_33908217 人工智能 python
拉普拉斯金字塔:使用原始图片-pyrUp(pyrDown(Gi))，获得的结果有一点像边缘轮廓的提取上图的意思：1.进行低通滤波2.进行样本的下采样3.进行样本的上采样4.原始图片-经过上面三步后的图片代码：第一步：读入图片第二步：进行样本的下采样第三步：进行样本的上采样第四步：原始图片-变化后的图片importcv2importnumpyasnpimg=cv2.imread('AM.png')#
为什么要构建知识体系？ linkingfei 其他
转载任何的学习都是在增强人的可控能力,如何构建自己的知识体系？这是一个很大的话题，知乎和分答上不少人都提问过这个问题，可见也是一个相对比较普遍的话题。总结下来大概有六个步骤：目标、获取、提炼、输出、聚合、扩充。1、目标：知识架构是达成目标的一种路径获取知识一定是为了解决某一个问题，或者是满足某方面的好奇心。解决问题就是在树立目标。抛开目标谈构建知识体系是一个伪命题。我们太希望找到一套速成的标准答案
ESP32-C3 学习测试蓝牙篇（二、蓝牙调试APP、开发板手机连接初体验）_esp32蓝牙app 添加应用 2501_90252715 学习智能手机
等了好久终于等到今天，盼了好久终于把蓝牙测试==！ESP32-C3专栏好久没更新了，这次抽点时间把蓝牙的准备工作做完。目录前言1、蓝牙手机调试工具2、ESP-IDF中示例的选择3、ESP32-C3BLE与手机连接初探结语前言距离上一次玩ESP32-C3的板子也有一段时间了，其实都是因为时间安排不过来，最近挤出了一点时间，看了一点蓝牙的资料，想着至少也要做个入门测试，让手机和开发板连接起来！ESP3
MarkDown 语法学习 2501_90252715 学习
###四级标题####五级标题#####六级标题######横线–***---___*字型–斜体:**粗体:****斜粗体******HTML斜体:HTML粗体:HTML粗斜体:引用–>>>>>>...时间过得好快。Timeflies–zmsAndroidDeveloper莫忘初衷。正文内容清单–---1.2.3.***+++清单1.1清单1.2清单1.3清单2.1清单2.2清单2.3abcaaa
java开发工程师—如何让你的简历脱颖而出？ 2401_87252417 java 开发语言
职位描述上的相关技能年限一般只是指商业项目经验，而一般不会包括学习项目经验。所以对于一些介于商业项目和学习项目之间的项目，尽量当成商业项目来写。比如小张在大三时帮计算机系的王老师所在的ABC软件公司干了半年的活，如果小张在简历上写：“在校期间，从x年x月到x年x月完成了xx系统，用到了xx技术”，那么这多半会被当成类似于课程设计的学习经验，但如果再加上如下关键性的描述：“这个系统是属于xx公司的x
【Spring Cloud 10】阿里巴巴分布式服务架构流量控件Sentinel，B站黑马程序员学习笔记 2501_90252715 spring cloud 架构 sentinel
貌似还是他更强一些，不过没关系，加油！所以，今天开启为期一个月的博客疯狂之旅。一、百度百科Sentinel是面向分布式服务架构的高可用流量防护组件，主要以流量为切入点，从限流、流量整形、熔断降级、系统负载保护、热点防护等多个维度来帮助开发者保障微服务的稳定性。Sentinel具有以下特性:丰富的应用场景：Sentinel承接了阿里巴巴近10年的双十一大促流量的核心场景，例如秒杀（即突发流量控制在系
【Legged Gym】Legged Gym训练参数详解与自定义任务实现啵啵啵啵哲人工智能
LeggedGym训练参数详解与自定义任务实现在进行机器人强化学习训练时，LeggedGym提供了一套灵活的参数配置系统，以适应不同的训练需求和环境。本文将详细解析LeggedGym训练时的关键参数，并特别强调如何通过自定义task来实现新任务的训练。同时，也会解释rl_device和sim_device的赋值方法及其区别。1.参数详解1.1.任务与实验配置--task:指定训练任务的类型，如an
什么是“知识蒸馏” 清风AI 深度学习人工智能神经网络 python conda
定义与原理在深度学习领域不断突破的同时，模型的复杂度和计算需求也随之增加。为了解决这一问题，知识蒸馏技术应运而生，成为模型压缩和性能优化的重要手段。本节将详细介绍知识蒸馏的基本概念、工作原理和知识迁移机制。知识蒸馏是一种将大型预训练模型(教师模型)的知识转移到较小模型(学生模型)的技术。这种方法不仅能保留原有模型的性能，还能显著降低模型的复杂度和计算需求，使其更适合在资源受限的环境中部署。知识蒸馏
Ubuntu 安装 docker及基础使用教程（包含显卡驱动设置）——小白专属避坑指南 littlewells ubuntu docker linux
前言：此教程为小白入门教程，包括安装和一些基础的使用指令。如果需要深度使用的话（例如多容器DockerCompose等），还有很多东西没有涉及到，需要找一些专业的教程进一步学习，后续可能更新一下打包镜像的相关内容。教程参考了很多已有的教程并且结合了很多自己踩过的坑和一些需求（这个教程主要是我发布的另一个用Docker安装ROS的帖子的前置教程，用来了解和入门docker），有任何问题欢迎指正。
C# 学习笔记 c#
pictureBox显示不出图片从网上找了一段代码，复制进visualstudio，显示本地的图片，结果始终显示不出来，查了好久，终于发现在Form1的构造函数中多了一个“InitializeComponent();”，删除就好了！消耗了太多时间。
Node.js学习：深入解析Express中间件body-parser的源码碧海蓝天· node.js 学习 express
Node.js学习：深入解析Express中间件body-parser的源码在Node.js开发中，Express是一个非常受欢迎的Web应用框架。它提供了许多功能强大且易于使用的中间件，其中之一是body-parser，它用于解析HTTP请求体中的数据。在本文中，我们将深入探讨body-parser中间件的源码，了解它是如何实现的。首先，让我们来看一下body-parser中间件的基本用法：co
python之多线程 sixkery python基础
注：本文是廖大的教程文章，本人也在学习，因为老是记不住，自己手打一边，代码也是亲自测试。廖大传送门多线程多个任务可以由多进程完成，也可以由一个进程内的多线程完成。一个线程由多个进程组成，一个进程至少有一个线程。由于线程是操作系统直接支持的单元，因此，高级语言都内置多线程的支持，python也不例外，并且，python的线程是真正的PosixThread,不是模拟出来的线程。python的标准库提供
学习日志009--面向对象的编程 Z211613347 python
一、面向对象面向对象编程（Object-OrientedProgramming，简称OOP）是一种编程范式，它使用“对象”来设计应用程序和计算机程序。它利用了抽象、封装、继承和多态这些概念。一、面向对象编程的核心概念封装（Encapsulation）封装是面向对象编程的一个主要特征，它将对象的数据（属性）和操作这些数据的方法（行为）结合在一起，形成一个独立的对象。这样做的好处是可以隐藏内部的复杂性
学习日志011--模块，迭代器与生成器，正则表达式 Z211613347 python
一、python模块在之前学习c语言时，我们学了分文件编辑，那么在python中是否存在类似的编写方式？答案是肯定的。python中同样可以实现分文件编辑。甚至还有更多的好处：‌提高代码的可维护性‌：当代码被分成多个文件时，每个文件可以专注于实现特定的功能或模块。这使得查找和修复错误变得更加容易。可以更方便地对代码进行局部修改，而不需要浏览整个项目的代码。‌增强代码的可读性‌：分文件编程允许开发者
决策树ID3算法小波LFZZB 算法决策树机器学习数据挖掘 sklearn
决策树决策树概念决策树，一种基于规则的机器学习方法，主要用于分类和回归，常用作机器学习中的预测模型。树形结构图，树中每个节点表示某个对象，每个分叉路径代表的某个可能的属性值，每个叶结点对应从根节点到该叶节点所经历的路径所表示的对象的值。它通过递归地划分数据空间并在每个分区内拟合一个简单的预测模型来工作。选择分区是为了在每个细分中最大化目标变量的同质性。决策树特点1.树形结构决策树由根节点、内部节点
鸿蒙OH实战开发：基于webview拉起自定义键盘彭家大少鸿蒙开发移动开发 HarmonyOS harmonyos ArkUI 鸿蒙开发 openharmony 移动开发
往期学习笔录：鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……场景描述在特殊的H5场景下需要应用拉起自定义键盘进行输入。场景一：使用jsBridge拉起自定义弹窗写自定义键盘，再通过jsBridge传参实现输入。场景二：使用web的同层渲染将原生textI
用Python把2024年的豆瓣广播生成词云图 NuageL python 开发语言
突发奇想想对自己的2024进行分析。于是决定把豆瓣广播变成词云，学习一下词云的制作方法分为几步：1.获取数据，爬取2024的豆瓣广播#引入requests和BeautifulSoupimportrequestsfrombs4importBeautifulSoupbase_url="我的豆瓣主页网址/p?="headers={'User-Agent':'Mozilla/5.0(WindowsNT10
Unity接入Minimax语音模型, 将mp3转化成AudioClip NuageL 虚拟恋人 unity 游戏引擎 ai
我不会Unity，但是看到b站一位大佬做的虚拟恋人，于是想做一下伸手党。大佬视频：【chatGPT+unity+Azure+VRoid】AI女友对话，源码分享，零基础手搓二次元妹子，打造专属的AI女友不是梦_哔哩哔哩_bilibili语音合成部分，大佬已经集成了很多百度云语音api，但是因为本人很菜，设备也不太好，所以用本地大模型感觉暂时有点困难（之后想继续学习）不过百度云语音的声音有点难听，所以
AI：180-如何利用Python进行图像处理和计算机视觉任务一键难忘精通AI实战千例专栏合集 python 图像处理计算机视觉
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中~一.探索Python在图像处理和计算机视觉任务中的应用随着人
Python的Json方法 weixin_34293059 json python javascript ViewUI
Json简介：Json，全名JavaScriptObjectNotation，是一种轻量级的数据交换格式。Json最广泛的应用是作为AJAX中web服务器和客户端的通讯的数据格式。现在也常用于http请求中，所以对json的各种学习，是自然而然的事情。dumps方法将字典数据类型转换为json字符串类型例子：importjsonm={'a':123,'b':'hahaha'}json_str=js
前端必知必会-Vue 简介编程岁月 vue.js 前端 javascript
文章目录Vue简介Vue是一个JavaScript框架为什么要学习Vue？OptionsAPI我的第一页文本插值文本插值中的JavaScript总结Vue简介Vue是一个JavaScript框架。可以使用标记将其添加到HTML页面。Vue使用指令扩展HTML属性，并使用表达式将数据绑定到HTML。Vue是一个JavaScript框架Vue是一个用JavaScript编写的前端JavaScript框
004-VTK用户指南--第一部分--第1章-欢迎 darlingfresher VTK系统学习 c++
欢迎来到《VTK用户指南》。VTK是一个开源的、面向对象的、用于计算机图形学、可视化和图像处理的软件系统。尽管VTK庞大且复杂，但只要你了解它的基本面向对象的设计和实现法，你就会发现我们的设计会使它易于使用。这份用户指南的目的是：帮助你学习这种设计和实现方法，并使你熟悉各种各样的、重要的VTK类。如果您阅读过这本指南的过往版本，您会注意到我们现在根据用户指南文档本身的版本号，而不是VTK的版本号来
SpringBoot Mybatis 配置文件形式 ceaningking SpringBoot mybatis spring boot 配置集成
开发环境:IDEA2022.1.4+Mybatis目录1.概述2.单独配置mybatis-config.xml2.1配置内容2.2辅助类2.3调用操作3.application.yml配置mybatis3.1配置内容3.2辅助类3.3调用操作4.结语1.概述在之前BiliBili学习SprintBoot时候，按照视频敲代码，SpringBoot集成MyBatis，是单独写了一个mybatis-co
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他