Python实现文本特征提取的方法详解

1.字典文本特征提取 DictVectorizer()

1.1 one-hot编码

创建一个字典，观察如下数据形式的变化：

import pandas as pd
from sklearn.feature_extraction import DictVectorizer


data = [{'city': '洛阳', 'temperature': 39},
        {'city': '成都', 'temperature': 41},
        {'city': '宁波', 'temperature': 42},
        {'city': '佛山', 'temperature': 38}]

df1 = pd.DataFrame(data)
print(df1)

# one-hot编码 因为temperature是数值型的，所以会保留原始值，只有字符串类型的才会生成虚拟变量
df2 = pd.get_dummies(df1)
print(df2)

输出如下：

1.2 字典数据转sparse矩阵

使用DictVectorizer()创建字典特征提取模型

# 1.创建对象  默认sparse=True 返回的是sparse矩阵；  sparse=False  返回的是ndarray矩阵
transfer = DictVectorizer()
# 2.转化数据并训练
trans_data = transfer.fit_transform(data)
print(transfer.get_feature_names_out()) 
print(trans_data)

使用sparse矩阵没有显示0数据，节约了内存，更为简洁，这一点比ndarray矩阵更好。

2.英文文本特征提取

文本特征提取使用的是CountVectorizer文本特征提取模型，这里准备了一段英文文本（I have a dream）。统计词频并得到sparse矩阵，代码如下所示：

CountVectorizer()没有sparse参数，默认采用sparse矩阵格式。且可以通过stop_words指定停用词。

from sklearn.feature_extraction.text import CountVectorizer


data = ["I have a dream that one day this nation will rise up and live out the true meaning of its creed",
        "We hold these truths to be self-evident, that all men are created equal",
        "I have a dream that one day on the red hills of Georgia, "
        "the sons of former slaves and the sons of former slave owners will be able to sit down together at the table of brotherhood",
        "I have a dream that one day even the state of Mississippi",
        " a state sweltering with the heat of injustice",
        "sweltering with the heat of oppression",
        "will be transformed into an oasis of freedom and justice",
        "I have a dream that my four little children will one day live in a nation where they will not be judged by the color of their skin but by the content of their character",
        "I have a dream today"]


# CountVectorizer文本特征提取模型

# 1.实例化  将"is"标记为停用词
c_transfer = CountVectorizer(stop_words=["is"])

# 2.调用fit_transform
c_trans_data = c_transfer.fit_transform(data)


# 打印特征名称
print(c_transfer.get_feature_names_out())

# 打印sparse矩阵
print(c_trans_data)

输出结果如下图所示：

3.中文文本特征提取

准备一段中文文本（data.txt），以水浒传中风雪山神庙情节为例：

大雪下的正紧，林冲和差拨两个在路上又没买酒吃处。早来到草料场外，看时，一周遭有些黄土墙，两扇大门。推开看里面时，七八间草房做着仓廒，四下里都是马草堆，中间两座草厅。到那厅里，只见那老军在里面向火。差拨说道：“管营差这个林冲来替你回天王堂看守，你可即便交割。”老军拿了钥匙，引着林冲，分付道：“仓廒内自有官司封记，这几堆草一堆堆都有数目。”老军都点见了堆数，又引林冲到草厅上。老军收拾行李，临了说道：“火盆、锅子、碗碟，都借与你。”林冲道：“天王堂内我也有在那里，你要便拿了去。”老军指壁上挂一个大葫芦，说道：“你若买酒吃时，只出草场，投东大路去三二里，便有市井。”老军自和差拨回营里来。
只说林冲就床上放了包裹被卧，就坐下生些焰火起来。屋边有一堆柴炭，拿几块来生在地炉里。仰面看那草屋时，四下里崩坏了，又被朔风吹撼，摇振得动。林冲道：“这屋如何过得一冬？待雪晴了，去城中唤个泥水匠来修理。”向了一回火，觉得身上寒冷，寻思：“却才老军所说五里路外有那市井，何不去沽些酒来吃？”便去包里取些碎银子，把花枪挑了酒葫芦，将火炭盖了，取毡笠子戴上，拿了钥匙，出来把草厅门拽上。出到大门首，把两扇草场门反拽上，锁了。带了钥匙，信步投东。雪地里踏着碎琼乱玉，迤逦背着北风而行。那雪正下得紧。
行不上半里多路，看见一所古庙。林冲顶礼道：“神明庇佑，改日来烧钱纸。”又行了一回，望见一簇人家。林冲住脚看时，见篱笆中挑着一个草帚儿在露天里。林冲径到店里，主人道：“客人那里来？”林冲道：“你认得这个葫芦么？”主人看了道：“这葫芦是草料场老军的。”林冲道：“如何便认的？”店主道：“既是草料场看守大哥，且请少坐。天气寒冷，且酌三杯权当接风。”店家切一盘熟牛肉，烫一壶热酒，请林冲吃。又自买了些牛肉，又吃了数杯。就又买了一葫芦酒，包了那两块牛肉，留下碎银子，把花枪挑了酒葫芦，怀内揣了牛肉，叫声相扰，便出篱笆门，依旧迎着朔风回来。看那雪，到晚越下的紧了。古时有个书生，做了一个词，单题那贫苦的恨雪：
广莫严风刮地，这雪儿下的正好。扯絮挦绵，裁几片大如栲栳。见林间竹屋茅茨，争些儿被他压倒。富室豪家，却言道压瘴犹嫌少。向的是兽炭红炉，穿的是绵衣絮袄。手捻梅花，唱道国家祥瑞，不念贫民些小。高卧有幽人，吟咏多诗草。

对中文提取文本特征，需要安装并使用到jieba库。使用该库将文本处理成为空格连接词语的格式，再使用CountVectorizer文本特征提取模型进行提取即可。

代码示例如下：

import jieba
from sklearn.feature_extraction.text import CountVectorizer


# 将文本转为以空格相连的字符串
def cut_word(sent):
    return " ".join(list(jieba.cut(sent)))


# 将文本以行为单位，去除空格，并置于列表中。格式形如：["第一行","第二行",..."n"]
with open("./论文.txt", "r") as f:
    data = [line.replace("\n", "") for line in f.readlines()]

lis = []
# 将每一行的词汇以空格连接 
for temp in data:
    lis.append(cut_word(temp))

transfer = CountVectorizer()
trans_data = transfer.fit_transform(lis)
print(transfer.get_feature_names())
# 输出sparse数组
print(trans_data)
# 转为ndarray数组（如果需要）
print(trans_data.toarray())

程序执行效果如下：

转换得到的ndarray数组形式（如果需要）如图所示：

4. TF-IDF 文本特征提取 TfidfVectorizer()

TF-IDF文本提取器可以用来评估一字词对于一个文件集或者一个语料库中的其中一份文件的重要程度。

代码展示如下：

from sklearn.feature_extraction.text import TfidfVectorizer
import jieba


def cut_word(sent):
    return " ".join(list(jieba.cut(sent)))


with open("data.txt", "r") as f:
    data = [line.replace("\n", "") for line in f.readlines()]

lis = []
for temp in data:
    # print(cut_word(temp))
    lis.append(cut_word(temp))


transfer = TfidfVectorizer()
print(transfer.get_feature_names())
print(trans_data)

程序执行结果如下：

到此这篇关于Python实现文本特征提取的方法详解的文章就介绍到这了,更多相关Python文本特征提取内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

使用 JavaScript 和 HTML5 实现强大的表单验证 vvilkim JavaScript javascript html5 开发语言
表单验证是Web开发中不可或缺的一部分，它确保用户输入的数据符合预期格式和要求。通过客户端验证，我们可以提高用户体验，减少不必要的服务器请求。然而，客户端验证并不能替代服务器端验证，因为客户端验证可以被绕过。本文将介绍如何使用JavaScript和HTML5实现强大的表单验证。HTML5内置验证HTML5提供了一些内置的表单验证功能，例如required,min,max,pattern等。这些属性
Transformer 工作原理图文详解和实践：在生成式对话系统中的核心技术剖析 AI天才研究院 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
https://www.youtube.com/watch?v=wjZofJX0v4M&t=33sTransformer在生成式对话系统中的核心技术剖析作者：禅与计算机程序设计艺术文章目录Transformer在生成式对话系统中的核心技术剖析1.背景介绍2.核心概念与联系2.1生成式对话系统2.2Transformer模型3.核心算法原理和具体操作步骤3.1Transformer编码器3.2Tra
《职场趣事：“懂哥”的电脑乌龙记》故障抖机灵大师职场经验生活片段电脑生活程序人生
系列文章目录文章目录系列文章目录引子一、懂哥强行认机二、又又又打脸的懂哥总结引子在职场这片满是公式的“神秘丛林”里，“懂哥”宛如一个独特的“神奇变数”，总能凭借那些令人啼笑皆非的“神操作”，为平淡如水的工作日常添上一抹别样的“魔幻色彩”。上次硬盘闹剧刚华丽落幕，最近，一场电脑乌龙事件又在“懂哥”这位“超级导演”的精心策划下，精彩开场，简直像一部永不停歇的荒诞喜剧。一、懂哥强行认机那天清晨，在我正一
POJ 2227 -- The Wedding Juicer（bfs+优先队列） Ac-try 队列/优先队列搜索
题目大意：一个W*H的网格，每个单位格的高度不一样，往这个网格注水，问能储存多少水；思路分析：四周不能注水，和木桶原理一样，要以最低的高度作为能储水的高度，否则水就会溢出；将网格最外层的点开始加入队列，每次去高度最小的点作为“木桶”最低边，看其连接的点，如果高度大于自己加入队列，否则注水至自己的高度加入队列。代码实现：#include#include#includeusingnamespacest
wifi基本原理日行一步通信 wifi
WIFI基本知识整理这里对wifi的802.11协议中比较常见的知识做一个基本的总结和整理，便于后续的学习。因为无线网络中涉及术语很多，并且许多协议都是用英文描述，所以有些地方翻译出来会有歧义，这种情况就直接英文来描述了。主要内容：一、基本概述二、实践基础三、一些原理四、补充五、其它一、基本概述============================1、有线和无线网络目前有线网络中最著名的是以太网
ENSP综合实验题 JioJio～z 网络
1.关于192.168.1.0/24的广播域有14个，所以，192.168.1.00000000/28由2的4次方=16种，分配如下：2.根据以上分配配接口IP，配环回接口IP；3.根据静态路由配置非直连路由，每一个路由器配置其他路由信息，例如R1配置完毕的路由表：4.此时几个路由器间可以Ping通了，根据要求3得知，R1—R4需要配置一个指向5.5.5.0/24的缺省路由，例如Ping通后如下：
C++【STL--- set】疯狂的代M夫 c++c++开发语言
1、什么是set?set是一个不包含重复元素的内部自动有序的容器。set和map是经典的关联容器，与之前的vector,list,string,stack,priority_queue,deque等顺序容器不同；关联容器和顺序容器的区别在于：数据的存储方式不同：顺序容器按照元素插入的顺序依次存放数据，就像在一个数组或者链表中依次摆放数据一样。元素在内存中是连续存储(如vector和string)或
Spring Boot 中 Swagger 配置详解：生成高效的 RESTful API 文档 Jerry._ 爪哇开发 java spring 测试工具
在项目开发中，清晰的API文档对前后端协作至关重要。而Swagger是一个强大的工具，它不仅能生成RESTfulAPI文档，还提供了交互界面，方便开发人员进行接口测试。本篇文章将以一个完整示例为基础，讲解如何在SpringBoot中配置Swagger，并支持JWT认证的API调用。一、Swagger的功能简介Swagger是什么？Swagger是一种RESTfulAPI文档生成工具，常与Sprin
三大范式，让数据库更规范、高效！码熔burning MySQL 数据库数据库 mysql
目录一、为什么要使用范式？二、第一范式(1NF)三、第二范式(2NF)四、第三范式(3NF)五、总结我的其他文章也讲解的比较有趣，如果喜欢博主的讲解方式，可以多多支持一下，感谢！了解MVCC请看：MVCC：多版本并发控制，让数据“时光倒流”的秘密！其他优质专栏：【SpringBoot】【多线程】【Redis】【✨设计模式专栏（已完结）】…等如果喜欢作者的讲解方式，可以点赞收藏加关注，你的支持就是我
Python库 - Mayavi 司南锤 PYTHON库 python 开发语言
Mayavi是一个用于科学数据可视化的Python库，特别适用于三维数据的可视化。基于VTK（VisualizationToolkit）库，提供了简单易用的接口来创建复杂的三维图形。Mayavi可以用于绘制各种类型的三维图形，如点云、曲面、体积数据等，并且支持交互式操作。文章目录安装Mayavi基本概念基本用法1.创建一个简单的三维图形2.绘制点云3.绘制等值面4.交互式操作高级用法1.使用模块和
MySQL集群：高可用架构的利与弊异常驯兽师 mysql 架构数据库
在互联网应用快速发展的今天，数据库的高可用性和扩展性成为许多团队关注的焦点。MySQL集群作为一种常见的解决方案，被广泛用于解决单点故障和性能瓶颈的问题。但它是否适合所有场景？本文将从实际应用的角度，分析MySQL集群的核心特点、优势与不足。1.什么是MySQL集群？MySQL集群（MySQLCluster）并不是指简单的“多个MySQL服务器”，而是一种基于分布式架构的数据库解决方案。它通过将数
java的四种内部类详解异常驯兽师 java 开发语言
Java的四种内部类详解一、静态内部类（StaticInnerClass）定义：使用static修饰的成员内部类，独立于外部类实例存在。访问权限：可直接访问外部类的静态成员（包括private修饰的）。无法直接访问外部类的非静态成员，需通过外部类实例间接访问。特点：可以定义静态成员和方法。创建方式：外部类名.静态内部类名，无需外部类实例。应用场景：适用于与外部类关联紧密但不依赖实例的场景，如Jav
SSH开发模式——Struts2(第一小节) 希望永不加班 JavaEE框架完全解析 JavaWeb Struts2
在制定了学习计划的学习过程中，我感觉学习还是很有效率的。很短的时间内，我便学习完了JavaWeb的连接池、DbUtils框架及其一些工具类的使用。学无止境，学习这些知识还远远不够，所以，在接下来的时间里，我将对JavaWeb中的SSH开发模式进行一个简单的学习，并用博客记录学习进度。开发模式相信大家都有接触或听说，但又觉得这个东西很神秘，的确，这看不见摸不着的东西确实很让人好奇，所以，从今天开始，
第十八篇 SQL优化之逻辑结构：用仓库管理员思维优化数据库随缘而动，随遇而安 SQL之道——从入门到精通数据库 sql
目录摘要：像管理仓库一样理解数据库一、新手必看：从零搞懂逻辑结构（极简步骤）1.1货架管理（Block）：你的第一个优化操作1.2货架区规划（Segment与Extent）：避免仓库碎片化二、进阶技巧：让SQL性能翻倍的骚操作2.1快递单号（ROWID）：直捣黄龙取数据2.2表空间（Tablespace）：冷热数据分开放三、避坑指南：血泪教训总结3.1行迁移：大箱子挤坏小货架3.2热块竞争：秒杀引
doris：ClickHouse 向阳1218 大数据 doris
DorisJDBCCatalog支持通过标准JDBC接口连接ClickHouse数据库。本文档介绍如何配置ClickHouse数据库连接。使用须知要连接到ClickHouse数据库，您需要ClickHouse23.x或更高版本(低于此版本未经充分测试)。ClickHouse数据库的JDBC驱动程序，您可以从Maven仓库下载最新或指定版本的ClickHouseJDBC驱动程序。推荐使用ClickH
C语言函数原型的作用 CLOUD_FL C 函数原型函数声明作用
函数原型（FunctionPrototype）：即函数声明给出了函数名、返回值类型、参数列表（重点是参数类型）等与该函数有关的信息。函数原型的作用：告诉编译器与该函数有关的信息，让编译器知道函数的存在，以及存在的形式，即使函数暂时没有定义，编译器也知道如何使用它。有了函数声明，函数定义就可以出现在任何地方了，甚至是其他文件、静态链接库、动态链接库等。但是如果函数本身带static修饰，那么作用域是
关于自然语言处理（三）深度学习中的文字序列数据的分词操作 MatrixSparse 大模型人工智能自然语言处理深度学习人工智能
深度学习中的文字序列数据二维文字序列在文字数据中，样本与样本之间的联系是语义的联系，语义的联系即是词与词之间、字与字之间的联系，因此在文字序列中每个样本是一个单词或一个字（对英文来说大部分时候是一个单词，偶尔也可以是更小的语言单位，如字母或半词），故而在中文文字数据中，一张二维表往往是一个句子或一段话，而单个样本则表示单词或字。此时，不能够打乱顺序的维度是vocab_size，它代表了一个句子/一
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
基于CNN-BIGRU-Attention模型的功率预测（模型详解及代码复现）清风AI 深度学习算法详解及代码复现深度学习人工智能算法机器学习计算机视觉 cnn 神经网络
整体架构基于CNN-BiGRU-Attention模型的功率预测模型是一种融合了卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(Attention)的深度学习架构。这种混合模型旨在充分利用CNN的局部特征提取能力、BiGRU的长序列处理能力以及Attention机制的关键特征突出能力，从而提高功率预测的准确性和可靠性。模型的整体架构主要包括以下几个关键组件：输入层：设计的输入特
2023年java面试问题大全及答案大全 m0_74824574 面试学习路线阿里巴巴 java 面试开发语言
202年常见的Java面试问题和答案：Java中的基本数据类型有哪些？答：Java中的基本数据类型包括整型(int,short,long,byte)、浮点型(float,double)、字符型(char)和布尔型(boolean)。String和StringBuilder之间的区别是什么？答：String是不可变的，每次对String的操作都会创建一个新的String对象，而StringBuild
RHCE——笔记 tan & 笔记 linux 服务器
Web服务器1，web服务器简介（1）什么是www是全球信息广播的意思。通常说的上网就是使用www来查询用户所需要的信息。www可以结合文字、图形、影像以及声音等多媒体，并通过可以让鼠标单击超链接的方式将信息以Internet传递到世界各处去（2）网址及HTTP简介web服务器提供的这些数据大部分都是文件，那么我们需要在服务器端先将数据文件写好，并且放置在某个特殊的目录下面，这个目录就是我们整个网
mysql创建数据库和表程序员小羊！数据库 mysql oracle
大家好，我是程序员小羊！前言：一、MySQL数据库和表的基础概念在深入讲解如何在MySQL中创建数据库和表之前，先了解一些基础概念。1.1数据库和表的概念数据库（Database）：数据库是数据存储的容器，存储着相关数据集合。每个数据库可以包含多个表，并为这些表提供结构和组织。表（Table）：表是数据库中的基本存储单位。它由行和列组成，每行表示一条记录，每列表示记录的某个属性。1.2关系型数据库
python爬虫系列课程7：ajax wp_tao Python副业接单实战项目 python 爬虫 ajax
python爬虫系列课程7：ajax一、ajax的介绍二、ajax的使用一、ajax的介绍ajax是AsynchronousJavaScriptandXML的简写，ajax是一个前后端配合的技术，它可以让JavaScript发送异步的http请求，与后台通信进行数据的获取，ajax最大的优点是实现局部刷新，ajax可以发送http请求，当获取到后台数据的时候更新页面显示数据实现局部刷新，在这里大家
互联网晚报 | 10月6日星期三 | 微软正式推送Windows 11；网易严选西南首店落地成都；2021年诺贝尔物理学奖揭晓... 「已注销」区块链微软 iot 比特币物联网
今日看点✦2021年诺贝尔物理学奖揭晓，授予3位“复杂物理系统”研究者✦淘宝直播发布“超级种草官计划”，千万奖金、亿级流量奖励招募短视频种草达人✦网易严选西南首店落地成都，为新中产打造高品质生活方式✦电影《长津湖》成影史国庆档票房冠军，超过《我和我的祖国》✦积极推行驾驶证电子化，全国已发放1300多万个电子驾驶证✦微软正式推送Windows11系统，符合条件的Win10用户可免费升级国内要闻1、微
Express Router 全面教程与最佳实践红衣大叔 express express javascript
Express是一个基于Node.js的快速、非意见化的Web应用框架，广泛用于构建API和Web应用。Router是Express中的一个核心组件，它允许你将路由逻辑模块化和组织化，从而提高代码的可维护性和扩展性。本文将详细介绍如何使用Express的Router，并分享一些最佳实践。一、什么是ExpressRouter？ExpressRouter是Express提供的一种中间件，用于组织和管理
二进制安卓清单 binary AndroidManifest - XCTF apk 逆向-2 dilvx android xml
XCTF的apk逆向-2题目wp，这是一道反编译对抗题。题目背景AndroidManifest.xml在开发时是文本xml，在编译时会被aapt编译打包成为binaryxml。具体的格式可以参考稀土掘金MindMac做的类图（2014），下面的博客分别是wp和字段解析。攻防世界XCTF【Mobile】APK逆向-2题解正常下载附件，解压后，拖到JADX-gui中去反编译一下，然-掘金Android
Apple Tree POJ - 3321 里欧布鲁斯算法
对树进行DFS，记时间节点cnt初始等于0，每到一个新的节点（之前没有到过的节点），将cnt+1，作为这个节点的开始时刻，等到遍历完以这个节点为根的子树，回到这个节点时，此时的cnt是这个节点的结束时刻，例如下图：这样就实现了，将节点与节点之间的包含关系，转化到了线段区间上#include#include#include#includeusingnamespacestd;#definelowbit
洛谷P3586 [POI 2015] LOG Logistyka 分析与解答里欧布鲁斯算法 c++
操作1是对序列的修改，重点来看如何实现操作2维护一个长度为n的序列，一开始都是0，支持以下两种操作：Uka将序列中第k个数修改为a。Zcs在这个序列上，每次选出c个正数，并将它们都减去1，询问能否进行s次操作。每次询问独立，即每次询问不会对序列进行修改。“减去1”的操作如何直观得被感受呢，可以把一个数写成很多个1累积而成的形式例如，现在有一组数13243，可以表示成下面这样424523451234
Python中的常用库 cmgdxrz python 开发语言
一、collectionscollections是Python标准库中的一个模块，提供了一些专门的容器数据类型，能够帮助你更高效地处理常见的数据结构操作。1、CounterCounter是一个字典的子类，用于计数可哈希对象。它会统计对象的出现次数，并能快速获取某个元素出现的次数。特点：它的键是可哈希的元素，值是该元素的计数。可以使用常见的字典操作，也支持一些特定的方法，如.most_common(
html中绑定点击事件的三种方法我是陈大大 html 前端 javascript
HTML中为button绑定事件的方式有三种。例如以下标签：submit一、使用jquery进行绑定$('#btn_submit').click(function(){});二、使用原生js绑定（注意：InternetExplorer8及更早IE版本不支持addEventListener()方法，Opera7.0及Opera更早版本也不支持。这类浏览器版本要使用attachEvent()方法来添加
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他