李烟云

2020美赛C题赛后总结之——文本预处理Pyhotn编程代码

1.背景介绍

美赛C题涉及到文本处理之间的工作，笔者学艺不精，广为搜罗了很多代码加以完善改进，封装成一个个的函数，这些函数都很有针对性，主要应用于文本预处理包括，排序、分词、获取语料库、去标点、统计词频、特征提取、词性还原、去停用词等。

2.任务分析

为了更好地了解代码，我们首先来认识一下数据集的格式。
文中涉及三个数据集microwave.tsv,hair_dryer.tsv, pacifier.tsv
表头都是一样的，以pacifier(奶嘴)为例。
我们要用到的有如下几列。

3.Pyhton代码

库引用

#代码所涉及到的库(部分，其余为引用的将在后面引用)
import numpy as np
import pandas as pd
import re
from os import path
import matplotlib.pyplot as plt
import jieba

数据读取

读取数据，由于文件格式不是常见的csv，而且也不必读取全部的列，
因此笔者编写了一个新的函数，用于读取特定文件特定列的数据

def getData(filename,cols):
    train=pd.read_csv(filename, sep='\t',header=0,usecols=cols)
    return train

小写化并排序

如上图所示我们只需要对train的4-7列小写化并排序

def sortLow(train):
    for i in range(3):
        train.iloc[:,i+4]=train.iloc[:,i+4].str.lower()
    	train=train.sort_values(by=["vine",'verified_purchase'],ascending=False)
    	train=train.reindex(list(range(len(train))))#排序后索引会乱掉我们重置索引
    return train

删除过短的评论记录

review_body列中包含用户的评论内容，我们希望删除评论内容小于三个单词的行

#对字符串中单词计数
def count_words(series):
    len_li=[]
    for string in series:
        string=str(string)
        string=string.split(' ')#将文章按照空格划分开 
        len_li.append(len(string))
    return pd.Series(len_li)

#删除小于三个单词的评论
train['counts']=count_words(train.review_body)
train=train[train.counts>3]

获取简单的语料库

我们希望将所有评论汇总到一起，组成一个语料库。

from string import punctuation
punc=punctuation
#去除标点和数字
def text_save(filename, data):#filename为写入CSV文件的路径，data为要写入数据列表.
    file = open(filename,'a')
    for line in data:
        line=str(line)
        line = re.sub(r"[{}]+".format(punc)," ",line)#正则匹配标点
        line = re.sub(r"\d+"," ",line)#正则匹配数字
        file.write(line+" ")
    file.close()
    print("保存文件成功")

#获取词典
def getDicCsv(name):
    review_body=train['review_body']
    review_body=list(review_body)#将评论存入列表
    text_save(name,review_body)

调用getDicCsv函数之后我们就获得了一个txt的语料库

分词

#分词
import jieba 
def dis(path):
    text = open(path, encoding='utf-8').read()
    text_cut=jieba.cut(text)
    return text_cut

上述代码用于将txt文件分成单个词语列表

def rmSym(Series):#去除标点符号存入列表
    lis=[]
    for line in Series:
        line=str(line)
        line=line.lower()
        line = re.sub(r"[{}]+".format(punc)," ",line)
        line = re.sub(r"\d+"," ",line)
        lis.append(line)
    return lis

上述代码用于对一个单独的Series进行分词处理，对于train[‘review_body’]，该函数会输出一个二维列表，每个子列表都对应一条评论的分词结果

词频统计

#词频统计
def getWordFre(wordList,num):
    #输入词语列表和获取top词数量
    word_counts = collections.Counter(wordList) # 对分词做词频统计
    word_counts = word_counts.most_common(num) # 获取前n最高频的词
    return word_counts#返回词频列表

输入词语列表和数量，输出一个词频列表，长度为num，词频从大到小排列。

词形还原

from nltk import word_tokenize, pos_tag
from nltk.corpus import wordnet
from nltk.stem import WordNetLemmatizer
def get_wordnet_pos(tag):
        if tag.startswith('J'):
            return wordnet.ADJ
        elif tag.startswith('V'):
            return wordnet.VERB
        elif tag.startswith('N'):
            return wordnet.NOUN
        elif tag.startswith('R'):
            return wordnet.ADV
        else:
            return None
#词形还原输出列表
def lem(sentence):
    # 获取单词的词性
    tokens = word_tokenize(sentence)  # 分词
    tagged_sent = pos_tag(tokens)     # 获取单词词性
    wnl = WordNetLemmatizer()
    lemmas_sent = []
    for tag in tagged_sent:
        wordnet_pos = get_wordnet_pos(tag[1]) or wordnet.NOUN
        lemmas_sent.append(wnl.lemmatize(tag[0], pos=wordnet_pos)) # 词形还原

    return lemmas_sent

对二维列表进行词形还原并展开成一维列表

def pureList(data_list):
    lem_list=[]
    for i in data_list:
        lem_list = lem_list+lem(i)
    return lem_list#返回词形还原后的一维列表

去停用词

from nltk.corpus import stopwords
stop_words=stopwords.words('english')
noStopList = [word for word in wod_list if(word not in stop_words)]

特征提取

from sklearn.feature_extraction.text import CountVectorizer  
#语料  
corpus = noStopList
#将文本中的词语转换为词频矩阵  
vectorizer = CountVectorizer()  
#计算个词语出现的次数  
X = vectorizer.fit_transform(corpus)  
#获取词袋中所有文本关键词  
word = vectorizer.get_feature_names()  
#查看词频结果  
X.toarray()
word

from sklearn.feature_extraction.text import TfidfTransformer  
#类调用  
transformer = TfidfTransformer()  
print(transformer)
#将词频矩阵X统计成TF-IDF值  
tfidf = transformer.fit_transform(X)  
#查看数据结构 tfidf[i][j]表示i类文本中的tf-idf权重  
tfidf_arr=tfidf.toarray()

import heapq
#获取一个一维数组中最大的n个词
por=list(por)
#此时por为[0,0,2.333,0,...,4.56.0,2,1,3.23...]好长的一个列表
re2 = map(por.index, heapq.nlargest(300, por))
 #求最大的n个索引    nsmallest与nlargest相反，求最小
#注意re2是一个map对象

拆分日期列

#如果review_date数据格式为datetime要转化成字符串形式
train['year']=train['review_date'].apply(lambda x:x.split('/')[2])
train['month']=train['review_date'].apply(lambda x:x.split('/')[0])

然后可以根据dataframe索引筛选特定年月的数据，也可以运用groupby方法进行分类汇总

获取特定年月的词频

def get_month_review_word_fre(year,month,dataframe,fre_num):
    year=str(year);month=str(month)
    test=train[train['year']==year]
    test=test[test.month==month]
    test=test.review_body
    test=rmSym(test)    
    pureSenList=[]
    for sen in test:
        tem=lem(sen,stop_words)
        pureSenList+=tem
    word_fre=getWordFre(pureSenList,fre_num)
    return word_fre

将输出year年month月所有评论的前fre_num个词频

4.声明

上文的函数中存在函数中调用函数的情况，请读者注意。
欢迎广大读者在留言区指正错误，提出意见，如果认为本文对您有帮助可以加个关注点个小赞，不胜感激。
这些代码的原型的原链接已经难以找到，笔者希望原作者能够私信的形式告知笔者，以便笔者在借鉴中声明。

你可能感兴趣的:(2020美赛C题赛后总结之——文本预处理Pyhotn编程代码)

总结Solidity 的数据类型一蓑烟雨，一任平生 web3 Solidity web3.0
数据类型在Solidity中，类型系统非常丰富，主要分为值类型（ValueTypes）和引用类型（ReferenceTypes）。此外，还有一些特殊类型和全局变量。一.值类型布尔型（bool）boolisActive=true;二.整数型（int/uint）int：带符号整数（可以是负数），uint：无符号整数（只能是非负数）指定位宽：int8到int256（步长为8位），默认int等于int25
vue-charts的使用，导入，配置，及常见错误一蓑烟雨，一任平生 vue3 vue.js echarts javascript
vue-charts作用：在使用echarts生成图表时，经常需要做繁琐的数据类型转化、修改复杂的配置项，v-charts的出现正是为了解决这个痛点。基于Vue2.0和echarts封装的v-charts图表组件，只需要统一提供一种对前后端都友好的数据格式设置简单的配置项，便可轻松生成常见的图表。第一步:下载npmiv-chartsecharts-S第二部:导入同时配置import{CanvasR
RocketMQ新消费者加入后的队列一致性保障机制详解慢德分布式设计 rocketmq
RocketMQ新消费者加入后的队列一致性保障机制详解RocketMQ作为一个高性能的分布式消息中间件，其消费者负载均衡机制是保障系统可扩展性和稳定性的关键。当新消费者加入消费组时，如何保证各个消费者之间的队列分配一致性是一个核心问题。下面将深入解析其详细原理和运作机制。消费模式与队列分配基础首先需要明确的是，在RocketMQ中，队列一致性问题主要出现在集群消费模式下。在这种模式中，一条消息只会
配置vim valisweet linux
vim~/.vimrcsetexpandtabsettabstop=2setshiftwidth=2
【HTTP 协议的前世今生】HTTP 1.0、HTTP 1.1 和 HTTP 2.0 春日安然 WEB 前端 http 网络服务器
本篇博客将从HTTP协议的概念出发，分别介绍HTTP协议各个版本的特点，以及对HTTP协议状态码和HTTPS协议进行说明。首先，我们先来了解下HTTP协议的概念。什么是HTTP协议HTTP协议的全称为HyperTextTransferProtocol（超文本传输协议)，是互联网上应用最为广泛的、构建在TCP协议之上的应用层协议。它用于客户端与服务器之间的通信，规定了客户端和服务器之间的通信格式，包
ngx_http_subrange_module 使用指南汤璞亚Heath
ngx_http_subrange_module使用指南ngx_http_subrange_moduleSplitonebigHTTP/Rangerequesttomultiplesubrangerequesets项目地址:https://gitcode.com/gh_mirrors/ng/ngx_http_subrange_module项目介绍ngx_http_subrange_module是一
中频信号解析：瞬时相位信息的原理与应用小驴技术站 FPGA信号处理信号处理 matlab fpga开发
中频信号解析：瞬时相位信息的原理与应用引言在雷达信号处理（图1）、数字通信系统等工程领域，瞬时相位作为信号时频分析的核心参数，承载着调制信息解调、目标特征提取等关键功能。本文将从数学原理、信号处理价值、典型应用三个维度深入剖析瞬时相位的本质。发射机混频器本振信号中频信号ADC采样数字信号处理一、瞬时相位的基本概念瞬时相位是描述信号在某一时刻相位状态的重要参数，反映了信号在时间-频率域中的动态特性。
Nginx源码剖析--ngx_http_optimize_servers函数分析 gswen Nginx nginx 源码函数
前言本章将继续介绍HTTP模块初始化函数：ngx_http_block中的内容。将会涉及到server块的组织，监听端口的管理，以及ip地址和server块之间的组织关系。下面我们将从listen关键字说起，然后根据listen配置项以及它的解析函数了解nginx组织server块和监听端口的过程。最后在介绍ngx_http_optimize_servers函数。所有这些工作都是为了实现Nginx
百度2026届暑期实习生招聘内推开始啦，快来投递你心仪的职位吧 flying jiang 团队建设 java
百度2026届暑期实习生招聘内推开始啦，快来投递你心仪的职位吧（网申链接地址：https://dwz.cn/P2FZhMvx）点击链接自动填入内推码，get内推绿色通道~我的内推码：IZB4S3
Charles抓包神器全方位指南-从设置到会话捕获 2501_91093988 http udp https websocket 网络安全网络协议 tcp/ip
如何设置显示Request和Response大家好，我是watchpoints。别想太多，只管提问，所有问题，都会有答案。watchpoints既是我的GitHub用户名，也是我的微信用户名。如果我对某些内容的解释不够清楚，欢迎大家随时提问。现在，让我们来解答一个常见的问题：如何设置显示Request和Response？这个问题的答案其实就在Charles的设置中。无论是从官网下载的Charles
第十三届蓝桥杯大赛软件赛省赛 C/C++ 大学 B 组C题刷题统计我是小趴菜一枚算法蓝桥杯 c++c语言
问题描述小明决定从下周一开始努力刷题准备蓝桥杯竞赛。他计划周一至周五每天做aa道题目,周六和周日每天做bb道题目。请你帮小明计算,按照计划他将在第几天实现做题数大于等于nn题?输入格式输入一行包含三个整数a,ba,b和nn.输出格式输出一个整数代表天数。样例输入102099样例输出8评测用例规模与约定对于50%50%的评测用例,1≤a,b,n≤1061≤a,b,n≤106.对于100%100%的评
普通人怎么利用AI赚钱？AI 变现的 8 种神操作，最后一个你绝对想不到！ AI设计酷卡人工智能 stable diffusion AI作画 AIGC midjourney
在国内外，几百款AI工具竞争激烈，衍生出各种需求与市场。下面我们就来盘点AI变现的八大生意，看看你能猜到几个？一、AI文本生成：打造公众号矩阵提到AI，ChatGPT无疑是最为知名的工具之一，其核心功能在于生成高质量文本，写出热门文章。许多人利用AI文本生成的能力，成功构建公众号矩阵，创造出大量10w+的文章，甚至有流量主月入过万。今年上半年，一些知名账号每分钟发布数篇文章，依靠AI技术和自动化手
Charles 抓包工具使用指南：设置、功能详解与最佳实践技术博主狂热者 http udp https websocket 网络安全网络协议 tcp/ip
引言前段时间入职了一家公司，项目中的代码注释比较少，而且代码量大，比较难以理解每个接口的数据情况。为了分析接口的行为，我们需要安装项目测试环境包，并通过抓包来查看请求参数和header，借此来理解代码逻辑。我选择了使用Charles配合模拟器进行抓包调试。今天我来总结一下Charles的用法以及结合模拟器的简单使用。Charles与SniffmasterCharles是一款强大的抓包调试工具，相信
ngx_http_add_listen 若云止水 http 网络协议网络
声明在src\http\ngx_http.hngx_int_tngx_http_add_listen(ngx_conf_t*cf,ngx_http_core_srv_conf_t*cscf,ngx_http_listen_opt_t*lsopt);定义在src\http\ngx_http.cngx_int_tngx_http_add_listen(ngx_conf_t*cf,ngx_http_co
Linux信号处理：从“死亡快递“到系统级心跳的奇幻漂流 Loving_enjoy 实用技巧 linux
当Ctrl+C变成"死亡按钮"2017年，某倒霉程序员在深夜误触Ctrl+C，导致价值千万的比特币矿机集群集体"自杀"，这场事故揭示了信号处理的本质——它既是系统的紧急逃生通道，也是定时炸弹的遥控器。本文将带你走进Linux信号的奇幻世界，看这些1到64号的"数字幽灵"如何游走于进程之间。---##一、信号基础：操作系统的摩尔斯电码###1.1信号的诞生：Unix世界的暴力美学-**31个传统信号
IDEA 出现 Cannot access aliyunmaven in offline mode 问题解决方案 z2637305611 intellij-idea java spring boot
一、问题现象在使用IntelliJIDEA构建Maven项目时，可能会遇到如下错误提示：Cannotaccessaliyunmaven(https://maven.aliyun.com/repository/public)inofflinemode这种错误通常意味着Maven正在尝试从远程仓库（如阿里云Maven仓库）下载依赖，但由于某种原因，IDEA处于离线模式，导致无法访问远程仓库3。二、问题
Python实现微博关键词爬虫才华是浅浅的耐心 python 新浪微博爬虫
1.背景介绍随着社交媒体的广泛应用，微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容，本文将介绍如何使用Python编写一个简单的爬虫脚本，从微博中抓取指定关键词的相关数据，并将这些数据保存为Excel文件。本文将以关键词“樊振东”为例，展示从微博抓取该关键词相关数据的全过程。废话不多说，先上结果图。2.项目实现思路该爬虫通过向微博的搜索接口发送HTTP请求，获取与指定
使用 Python 实现批量发送电子邮件才华是浅浅的耐心 python 爬虫开发语言
引言：在日常工作中，我们可能会遇到需要批量发送邮件的场景，例如通知、营销邮件或测试邮件。如果手动发送，不仅效率低下，还容易出错。今天，我将分享一个使用Python实现的自动化邮件发送脚本，通过读取Excel文件中的发件人和收件人信息，轻松完成批量邮件发送任务。功能概述这个脚本的主要功能包括：从Excel文件中读取发件人信息（邮箱和授权码）和收件人信息（邮箱）。根据发件人邮箱的域名，自动匹配SMTP
Trae使用教程，帮助您快速上手这款编程神器。云上的阿七云计算
Trae是一款由字节跳动推出的AI驱动集成开发环境（IDE），旨在通过智能代码补全、多模态交互以及对整个代码库的上下文分析等功能，帮助开发者更高效地编写代码。其强大的AI能力能够理解开发者的需求并提供精准的代码生成和修改建议。目前，Trae提供免费版本，集成了Claude-3.5-Sonnet和GPT-4o等主流大模型。rae使用教程，帮助您快速上手这款编程神器。一、安装Trae访问官网：前往Tr
从头开始学C语言第三十二天——函数神阶平天牛魔王 c语言
函数可以定义为完成特定功能的模块，函数程序代码独立，通常要求要有返回值，也就是return，也可以返回空值0主要函数分为三类：主函数也就是main函数库函数，包括用过的scanf，printf，strlen，strcpy等包含在stdio.h，string.h等库中自定义函数，程序员自己定义的函数模块一般形式：(){语句序列；return[()]；}数据类型是整个函数返回值的类型return语句表
业务流程管理（BPM）：概念、起源与优势牛油果爱编程人工智能
产生背景BusinessProcessManagement（BPM），即业务流程管理，是一套达成企业各种业务环节整合的全面管理模式。BPM涵盖了人员、设备、桌面应用系统、企业级Backoffice应用等内容的优化组合，从而实现跨应用、跨部门、跨合作伙伴与客户的企业运作。BPM通常以Internet方式实现信息传递、数据同步、业务监控和企业业务流程的持续升级优化。显而易见，BPM不但涵盖了传统“工作
python 之GUI设计：Entry组件时间之里 python-tkinter python python
说明：Entry（输入框）组件通常用于获取用户的输入文本。使用条件：Entry组件在GUI界面的设计中主要用于单行文本的键入（实际键入的内容可以比显示的空间更长，此种情况下结束鼠标和位移键能够产看自己输入的隐藏内容），通过几何外观图形属性设计可以改变实际的元素表现如果你希望接收多行文本的输入，可以使用Text组件（后面介绍）。常见用法：-普通输入框作为输入框最重要的属性是输入内容的获取：eg:pa
shell逐行读取文件 & 远程操作服务器二进制杯莫停 #Shell编程服务器运维
代码示例whilereadip;doecho"uninstallingtestprogramsin$line"sshroot@$ip'bash-s'
Mac 下 Go 的安装和卸载浅梦深蓝 macos golang linux
安装下载Go安装包，golangdownload点我跳转下载页面，选择Go版本后，再选择需要的安装包格式，有压缩包和安装包两种，选择自己需要的格式。以压缩包为例。下载完成后，将压缩包解压到$HOME/go文件夹下。在$HOME/.bash_profile配置本地环境变量。exportGOROOT=$HOME/goexportGOPATH=$HOME/Applications/GoexportPAT
我人生中最努力的200个小时（自学高项版）不是小盆友软考软考高项计算机考试软考苏景一软考软考高项信息系统项目管理师计算机考试 pat考试 PMP
在职，每天3个小时，三个月，拿下软考高项，中间多努力不用我多说了吧。下面给大家分享一些我的备考经验，希望能帮助大家提高.效率，一次上岸！-❤❤备考顺序先啃6-19章，接着20-24章，蕞后1-5章6-19章是核心板块，涵盖了大量的关键知识点，从综合知识选择题到案例分析，都是考试的重.点区域，必.须牢牢掌握-❤❤备考建议●选择题每天坚持刷题！建议用软考通、51CTO等app刷题，错题及时总结，做到举
LiteIDE中配置golang编译生成无CMD窗口EXE的步骤 ac.char golang 经验分享 golang 开发语言后端
LiteIDE中配置golang编译生成无CMD窗口EXE的步骤一、环境配置1、设置GOROOT‌2、配置GOPATH‌二、项目编译参数设置1、新建/打开项目‌2、修改编译配置‌3、其他优化选项（可选）‌三、构建与验证1、编译生成EXE‌2、验证无窗口效果‌四、注意事项一、环境配置1、设置GOROOT‌打开LiteIDE→菜单栏选择‌查看→编辑当前环境‌确认GOROOT变量指向Go语言的安装路径（
深入解析 Java 递归：构建层级树形结构的优雅实现！！！小丁学Java 产品资质管理系统 Java数据结构和算法 java 开发语言 Java
深入解析Java递归：构建层级树形结构的优雅实现大家好！今天我们来聊聊Java中一个非常常见的操作：通过递归构建层级树形结构。具体来说，我们将深入分析以下代码片段：//递归构建子树for(InviteCodechild:children){InviteCodeTreeDTOchildNode=buildTree(child,inviteCodeMap);node.getChildren().add
RAMS（区域大气建模系统）与 OpenFOAM 的耦合：构建跨尺度大气流动模拟平台 Hardess-god RAMS 算法人工智能机器学习
随着城市气象、风能开发和空气质量模拟需求的提升，单一尺度的模拟工具已难以满足复杂地形和城市结构下的精细气流场重建需求。RegionalAtmosphericModelingSystem（RAMS）作为区域尺度大气模式，在捕捉天气系统和地形强迫方面表现优异；而OpenFOAM则是功能强大的开源计算流体力学（CFD）平台，能够实现亚米级的湍流建模和局地流场分辨。将两者耦合，实现区域与城市尺度的联动模拟
第三十九个问题-详细讲讲PPO & GRPO原理释迦呼呼 AI一千问人工智能深度学习机器学习语言模型自然语言处理算法
PPO（ProximalPolicyOptimization）原理详解PPO（近端策略优化）是OpenAI于2017年提出的强化学习算法，旨在解决传统策略梯度方法中训练不稳定和样本效率低的问题。其核心思想是通过限制策略更新的幅度，确保新策略不会偏离旧策略太远，从而稳定训练过程。1.策略梯度（PolicyGradient）基础策略梯度方法通过直接优化策略参数θθ来最大化期望回报。目标函数为：J(θ)
用`ode23`和`ode45`函数求解一个常微分方程并展示结果神经网络15044 matlab 算法算法学习
使用Matlab中的ode23，ode45函数求解方程，并展示结果。我将使用ode23和ode45函数求解一个常微分方程并展示结果。这里以一个简单的一阶常微分方程为例：dydt=−2y\frac{dy}{dt}=-2ydtdy=−2y，初始条件为y(0)=1y(0)=1y(0)=1。以下是求解该方程的Matlab代码：%定义微分方程dydt=@(t,y)-2*y;%初始条件y0=1;%时间范围ts
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他