ice110956

[Python]南邮OJ代码备份爬虫

之前看过Python学习的经验，说以工程为导向学习。

自己分析了一下，一般接触Python的都有一定的其他语言基础，对于程序设计的基本逻辑，语法都有一个大概的了解。而Python这种脚本语言，没有过于独特的语法，在一定的其他语言的基础上，更是可以直接上手的。

之前看Python简明教程，半天没有进度。正好遇上Python爬虫项目，直接上手，方便快捷。

网站：http://acm.njupt.edu.cn/welcome.do?method=index，正值系统更新，于是写一个备份代码的爬虫。

使用的Python库

urllib库：

这个库封装了通过URL与网络服务器通信的方法，包括HTTP的request，response等等，目前为止基本够用。

re库：

即regularexpress，正则表达式库。用来在HTML文档中检索信息。

基本框架

首先通过HTTP协议，向目标服务器提交request请求，然后接受response应答。我们再从应答中，得到我们需要的内容：用户cookie和代码。最后新建本地文件，把他们放进去即可。

具体步骤

A.HTTP请求

Python果然是短平快的语言，如下三行搞定：

myUrl ="http://acm.njupt.edu.cn/acmhome/index"#目标页面
req=urllib2.Request(myUrl)#用URL得到request对象
myResponse = urllib2.urlopen(req)#通过urlopen()函数发送request，得到返回的response
myPage = myResponse.read()#在response中读取页面信息

B.登入权限获取

分析页面我们看到，要备份代码需要提交用户名和密码，而且提交的页面不是主页，而是登陆页。根据HTTP的知识，需要用POST方法提交包含表单信息的request。使用chrome开发人员工具，检测到提价的表达包含如下内容。

这在Python中也好实现：

myUrl ="http://acm.njupt.edu.cn/acmhome/login.do"#url地址改为登入页
self.postdata = urllib.urlencode({
           'userName':self.userName,
           'password':self.passWord
})#{}中为Python的字典结构数据，传入username和password
#urlencode()函数把字典结构编码为特定的data类
req=urllib2.Request(
           url = myUrl,
           data = self.postdata
           )
#给Request传入URL以及编码好的data数据
myResponse = urllib2.urlopen(req)
myPage = myResponse.read()

C.处理cookie

之前的还少考虑了一个东西，就是登入后要访问网站的其他页面时，需要用到登入的cookie。Python中没有特殊定义的访问貌似是不保留cookie的。于是我们要从写一个可保留cookie的HTTP通信方式。

首先是Python中的几个概念：

opener：用于通信的对象，之前代码中urllib.urlopen()使用系统默认的opener，等价于default_opener.urlopen()

handler：一个opener包含多个hander，用于处理通信间的各种子问题，包括cookie问题。

于是，上面处理cookie的方法就是，重写一个opener，给予其可处理cookie的handler。

cookie_support =urllib2.HTTPCookieProcessor(cookielib.CookieJar())
#新建cookie_handler
opener =urllib2.build_opener(cookie_support,urllib2.HTTPHandler)
#用cookie_handler建立cookie_opener
urllib2.install_opener(opener)
#设定为默认opener

到此，我们可以实现登入权限获取。

D.定位到代码页面

我们要从首页开始，找到代码页面。本来直接获取URL即可。不过发现代码页面URL如下：

这个页面包含了时间和登入信息的未知编码，应该是通过转义的。这里的解决方法是通过已知页面获取URL而不是手动输入。

分析页面后，可以如下获得代码页面：

首页-->用户信息-->通过代码-->’G++|GCC|JAVA’字段超链接，如下

于是，解析获得的HTML，得到超链接：

myItem = re.findall('<ahref=\"/acmhome/solutionCode\.do\?id\=.*?\"\ ',myPage,re.S)
for item in myItem:
url='http://acm.njupt.edu.cn/acmhome/solutionCode.do?id='+item[37:len(item)-2]

E.扣去文本

如上，可以看出网站是用XML来存储，转义为HTML，于是我们要替换文本中的转义标签，得到正常文本：

class Tool:
    A= re.compile(" \;")
    B= re.compile("\<BR\>")
    C= re.compile("<\;")
    D= re.compile(">\;")
    E= re.compile(""\;")
    F= re.compile("&")
    G= re.compile("Times\ New\ Roman\"\>")
    H= re.compile("\</font\>")
    I= re.compile("'")
    J= re.compile("语言:(.*)?face=\"",re.DOTALL)
   def replace_char(self,x):
       x=self.A.sub(" ",x)
       x=self.B.sub("\r",x)
       x=self.C.sub("<",x)
       x=self.D.sub(">",x)
       x=self.E.sub("\"",x)
       x=self.F.sub("&",x)
       x=self.G.sub("",x)
       x=self.H.sub("",x)
       x=self.I.sub("\'",x)
       x=self.J.sub("",x)
       return x

*注意，Python中字符串有替换函数，str.replace(替换字符，原字符)；不过如果要根据正则表达式来替换，需要用re模块的re.sub()函数才行，replace不能使用正则表达式。

*还有，replace返回替换的字符串，原始字符串没有任何改变

F.存入文件

首先要得到代码的中文题目作为文件名，不过这在自己的代码页看不到，只能到代码主页去找。找到后抓取<title>中的字段作为用户名即可。

tname=re.findall('title\>.*?\</title',p,re.S)
f =open(tname[0][6:len(tname[0])-7]+'_'+sname[8:len(sname)-8]+'.txt','w+')
f.write(self.mytool.replace_char(mytem[0]))
f.close()

最终程序

# -*- coding: cp936 -*-
#copyright by B08020129
 
import urllib2
import urllib
import re
import thread
import time
import cookielib
 
cookie_support =urllib2.HTTPCookieProcessor(cookielib.CookieJar())
opener = urllib2.build_opener(cookie_support,urllib2.HTTPHandler)
urllib2.install_opener(opener)
 
 
class Tool:
    A= re.compile(" \;")
    B= re.compile("\<BR\>")
    C= re.compile("<\;")
    D= re.compile(">\;")
    E = re.compile(""\;")
    F = re.compile("&")
    G =re.compile("Times\ New\ Roman\"\>")
    H= re.compile("\</font\>")
    I= re.compile("'")
    J= re.compile("语言:(.*)?face=\"",re.DOTALL)
   def replace_char(self,x):
       x=self.A.sub(" ",x)
       x=self.B.sub("\r",x)
        x=self.C.sub("<",x)
       x=self.D.sub(">",x)
       x=self.E.sub("\"",x)
       x=self.F.sub("&",x)
       x=self.G.sub("",x)
       x=self.H.sub("",x)
       x=self.I.sub("\'",x)
       x=self.J.sub("",x)
       return x
 
class HTML_Model:
    def __init__(self,u,p):
        self.userName = u
        self.passWord =p
       self.mytool = Tool()
       self.page = 1
       self.postdata = urllib.urlencode({
           'userName':self.userName,
           'password':self.passWord
})
    def GetPage(self):
       myUrl = "http://acm.njupt.edu.cn/acmhome/login.do"
       req=urllib2.Request(
           url = myUrl,
           data = self.postdata
           )
       myResponse = urllib2.urlopen(req)
       myPage = myResponse.read()
       flag = True
       while flag:
           myUrl="http://acm.njupt.edu.cn/acmhome/showstatus.do?problemId=null&contestId=null&userName="+self.userName+"&result=1&language=&page="+str(self.page)
           #print(myUrl)
           myResponse = urllib2.urlopen(myUrl)
           myPage = myResponse.read()
           st="\<a\ href\=.*?G\+\+"
           next = re.search(st,myPage)
           if next:
                flag = True
           else:
                flag = False
           myItem = re.findall('<ahref=\"/acmhome/solutionCode\.do\?id\=.*?\"\ ',myPage,re.S)
           for item in myItem:
                #print(item)
               url='http://acm.njupt.edu.cn/acmhome/solutionCode.do?id='+item[37:len(item)-2]
                #print(url)
                myResponse =urllib2.urlopen(url)
                myPage = myResponse.read()
                mytem = re.findall('语言.*?</font>.*?Times NewRoman\"\>.*?\</font\>',myPage,re.S)
                #print(mytem)
                sName = re.findall('源代码--.*?</strong',myPage,re.S)
                for sname in sName:
                   #print(sname[2:len(sname)-8])
                   name="http://acm.njupt.edu.cn/acmhome/problemdetail.do?&method=showdetail&id="+sname[8:len(sname)-8];
                    #print(name)
                   p=urllib2.urlopen(name).read()
                    #print(p)
                   tname=re.findall('title\>.*?\</title',p,re.S)
                    print(tname[0][6:len(tname[0])-7]+'_'+sname[8:len(sname)-8])
                    f =open(tname[0][6:len(tname[0])-7]+'_'+sname[8:len(sname)-8]+'.txt','w+')
                    f.write(self.mytool.replace_char(mytem[0]))
                    f.close()
                    print('done!')
           self.page = self.page+1
 
print u'plz input the name'
u=raw_input()
print u'plz input password'
p=raw_input()
myModel =HTML_Model(u,p)
myModel.GetPage()

得到文件

以及文件中的正常代码：

下一步用更好地方法试着一键注册及提交所有代码。

你可能感兴趣的:(python,小爬虫)

python allure报告_Pytest+Allure 定制报告 weixin_39876450 python allure报告
前言：最近在研究接口自动化的框架，好的测试报告在整个测试框架起到至关重要的部分。终于被我发现一个超好用的报告框架,不仅报告美观,而且方便CI集成。就是它，就是它：AllureTestReport！！！先上一张报告效果图：python版本及必要库python3.5pytest3.3.3pytest-allure-adaptor1.7.9一、环境配置安装Python依赖库：pip3installpyt
wps合并重复项并求和_Excel中重复项求和的方法大房汪少 wps合并重复项并求和
在Excel统计数据时，经常会碰到重复项反复出现，很干扰视线，想要对重复项进行合并并求和，那要如何操作呢？下面，小编跟大家详细讲解Excel合并重复项数据并求和的操作方法。首先打开一个需要处理的Excel表格，比如对下列表格中相同型号的数量合并求和。先鼠标选中A列中所有的型号：A列的数据复制粘贴到到空白的E列中，然后点击“数据”–“删除重复项”，如图所示：在弹出的窗口选择列E，并点”删除重复项”，
Windows中安装python-embed版本和VSCode免安装版本python开发环境 Effordson Python学习 windows python vscode
python-embed版本下载安装官网下载:下载地址Tips:下载Windowsembeddablepackage安装方法:解压到指定目录即可,无需安装配置环境变量python.exe文件目录配置到Path变量中,cmd中运行python--version查看配置是成功pip安装检查是否安装:python-mensurepip--default-pip下载地址:官方下载安装方法:pythonge
全面解析股票行情接口API：它们的特点、优势及在投资决策中的应用
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
第5章：Python编码规范：遵循PEP8打造高质量代码 DogDog_Shuai python 运维数据库
第5章：Python编码规范：遵循PEP8打造高质量代码作者：Python进阶者阅读时间：约30分钟难度：入门目录1.引言2.PEP8是什么3.代码布局4.命名规范5.编程建议6.注释与文档字符串
flake8-black 使用教程章迅筝Diane
flake8-black使用教程flake8-blackflake8plugintorunblackforcheckingPythoncodingstyle项目地址:https://gitcode.com/gh_mirrors/fl/flake8-black项目介绍flake8-black是一个MIT许可的flake8插件，用于通过命令行代码格式化工具black验证Python代码风格。black
分享我自己的导航网站bituplink导航 (附GitHub开源代码项目OneHtmlNav) bituplink 分享导航 GitHub 开源 bituplink 分享
话不多说,先上资源biuplink导航:http://www.bituplink.com/goodwebOneHtmlNav项目:https://github.com/bituplink/OneHtmlNavOneHtmlNav下载:本地下载或者github直接打包下载小呆导航源项目:https://github.com/xiaodai945/WEBJIKE然后上图再然后说说这个项目的初衷最近新建
同花顺开放接口api有哪些功能？如何申请使用同花顺开放接口api？股票程序化交易接口量化交易股票API接口 Python股票量化交易同花顺开放接口api 功能申请使用股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>同花顺开放接口api的功能概况数据获取功能同花顺开放接口api能够提供丰富的股票市场数据。它可以获取股票的基本信息，像是股票代码、名称、所属行业等。对于投资者来说，这些基本信息是初步了解一只股票的基础。还能获取股票的实时价格数据。这对
python调用minio api接口
需要提前安装minio依赖库pipinstallminio获取bucket列表fromminioimportMinioclient=Minio("10.1.60.40:9000","admin","Ylln@9527",secure=False)buckets=client.list_buckets()forbucketinbuckets:print(bucket.name,bucket.crea
Python 使用同花顺 API 接口的详细步骤及常见问题解答财云量化 python炒股自动化量化交易程序化交易数据库 python 同花顺api接口使用步骤常见问题股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
GitHub Actions配置python flake8和black 小米人儿 Python python flake8 black
要在GitHubActions中使用flake8和black进行代码规范检查和格式化验证，请按照以下步骤操作：1.创建GitHubActions工作流文件在项目根目录创建文件：.github/workflows/lint.yml，内容如下：name:PythonLintingon:push:branches:[main,master]#触发分支pull_request:#PR时触发jobs:lin
Python的线程、进程与协程 Thomas_Cai Python专题 python 进程线程协程
文章目录一、进程和线程的比较1.定义2.内存空间3.创建和销毁4.并发性5.稳定性6.通信7.Python中的实现8.示例代码进程示例线程示例小结二、协程1.协程的关键特性2.协程的工作原理3.协程与生成器的关系4.协程的适用场景5.Python中的协程示例结果6.示例：并发执行多个协程执行一返回一执行二返回二7.协程(asyncio)的应用场景(agent)**7.1.高并发I/O密集型场景**
Python 3.7 安装包及详细安装指南：助你轻松搭建开发环境金琴莺
Python3.7安装包及详细安装指南：助你轻松搭建开发环境python3.7安装包附安装教程.zip项目地址:https://gitcode.com/open-source-toolkit/a278c项目介绍在编程的世界里，Python以其简洁易读的语法和强大的功能，成为了众多开发者的首选语言。然而，对于初学者或需要在Windows系统上搭建Python开发环境的用户来说，安装Python可能是
编程新手小白入门最佳攻略闲暇部落编程 java 新手入门开发语言
编程小白想要成为大神，并为大学新生的学习制定一份最佳入门攻略，可以遵循以下步骤：一、选择编程语言Python：被誉为最适合初学者的编程语言，语法简洁清晰，学习曲线平缓，广泛应用于数据分析、机器学习、Web开发、自动化脚本编写等领域。JavaScript：前端开发的核心语言，实现网页的动态效果，还能通过Node.js实现服务器端的编程，用于开发桌面应用和移动应用。Java：企业级开发中使用最广泛的语
编程新手之环境搭建：node python PyAIGCMaster React python 开发语言
好的，没问题！为你新装的机器打造一套稳定、高效、专业的开发环境是一件非常有成就感的事情。我们将遵循“稳定优先，专业实践”的原则，不追求最新版本，而是选择社区广泛认可的长期支持版（LTS）和最佳实践工具。整个过程将分为几个部分：基础环境：终端、包管理器和Git，这是所有开发的基石。Node.js环境：使用版本管理器nvm，专业地管理Node.js。Python环境：使用版本管理器pyenv+venv
从0到1掌握OpenCV！Python图像处理实战全解析（附代码+案例）小张在编程 Python学习 opencv python 图像处理
引言你有没有想过，手机里的美颜滤镜如何精准识别五官？监控摄像头如何在人流中锁定可疑目标？医学影像软件如何从CT片中快速标注病灶？这些“神奇操作”的背后，往往藏着一个低调的“图像处理神器”——OpenCV。作为Python生态中最受欢迎的计算机视觉库，它用一行行代码将抽象的像素点变成可操作的“数字画布”。今天，我们就从最基础的图像读写开始，手把手带你解锁OpenCV的“十八般武艺”，从图像处理小白变
NLTK库全解析：用Python打开自然语言处理的第一把钥匙
引言你是否好奇过，手机里的智能助手是如何“听懂”你说的话？电商平台的差评分析又是怎样精准提取“物流慢”“质量差”这些关键词？这些看似神奇的自然语言处理（NLP）功能，背后都藏着一个“入门神器”——NLTK（NaturalLanguageToolkit）。作为Python生态中最经典的NLP库，NLTK就像一本“NLP百科全书”，从最基础的文本拆分到复杂的语义理解，它用简单的代码接口，带我们推开自然
【31天蓝桥杯冲刺！】蓝桥杯相关的 Python 细节（1）字典中 get 函数的用法和注意事项王十二er 蓝桥杯蓝桥杯 python 开发语言
文章目录1.描述1.1为什么要使用get()函数？2.语法3.用法3.1访问字典3.2统计列表中元素出现次数例题：力扣454.四数相加2码字不易，希望大家点赞支持一下1.描述Python字典(Dictionary)get()函数返回指定键的值。1.1为什么要使用get()函数？常规访问字典的方法是：dict[key]，但是在key（键）不在字典中时，会触发KeyError异常。get(key)方法
Python——函数版用户管理系统 TWAS@py python pycharm
今天学习了Python的函数模块，就把上次发的字典版用户管理系统用函数的框架升级一下，话不多说，进入正题。1.变量的定义#创建一个列表存放所有用户信息user_list=[]#创建元组提供选择user_input_number=("1","2","3","4","5")user_input_chance=("姓名","年龄","性别","地址")2.菜单函数menu()#创建菜单defmenu()
Python 借助 Matplotlib 绘制分形图形的诀窍 Python编程之道 python matplotlib 信息可视化 ai
Python借助Matplotlib绘制分形图形的诀窍关键词：Python,Matplotlib,分形图形,递归算法,数据可视化,数学艺术,计算机图形学摘要：本文深入探讨了使用Python和Matplotlib库绘制分形图形的核心技术。从分形数学原理入手，详细解析了多种经典分形图形的生成算法，包括曼德勃罗集、朱利亚集、科赫雪花、谢尔宾斯基三角形等。文章提供了完整的Python实现代码，结合Matp
Python Pandas 数据的体育数据处理和分析 Python编程之道 Python人工智能与大数据 Python编程之道 python pandas 开发语言 ai
PythonPandas数据的体育数据处理和分析关键词：PythonPandas,体育数据分析,数据清洗,数据可视化,特征工程,机器学习,体育统计摘要：本文将深入探讨如何使用PythonPandas库进行体育数据的处理和分析。我们将从基础的数据导入和清洗开始，逐步深入到复杂的统计分析、可视化展示以及机器学习建模。文章将涵盖数据处理的全流程，包括数据获取、清洗、转换、分析和可视化，并结合实际体育数据
python-函数模块包 2501_92004703 Python python 开发语言
python-函数模块包前言一、函数1.函数的定义2.函数的参数2.1形参分类（定义）2.2实参分类（调用）3.函数参数传递4.变量作用域5.匿名函数6.高阶函数1.map2.filter3.sorted二、模块1.定义模块2.导入模块3.导入指定函数4.模块的执行机制三、包1.包的结构2.导入包总结练习1.编写函数实现提取身份证号码中的年月日信息2.打印商品信息3.sorted排序前言函数模块包
paddleOCR模型的安装和使用九日卯贝 paddle ocr
paddleOCR仓库：https://github.com/PaddlePaddle/PaddleOCR?tab=readme-ov-file文档：https://paddlepaddle.github.io/PaddleOCR/main/quick_start.html#2-paddleocr环境安装python-mpipinstallpaddlepaddle-gpu==3.0.0b1-iht
文心4.5开源模型部署实践 skywalk8163 人工智能文心人工智能文心大模型开源大模型文心开源
文心4.5开源模型部署实践使用fastdeploy本地部署执行命令：python-mfastdeploy.entrypoints.openai.api_server\ --modelbaidu/ERNIE-4.5-21B-A3B-Paddle\ --port8180\ --metrics-port8181\ --engine-worker-queue-port8182\ --max-model-l
【LeetCode 热题 100】5. 最长回文子串（Python中心扩展法详解）未名编程 LeetCode热题100详解 leetcode python 算法
原题链接：LeetCode5.最长回文子串✨一、题目描述给你一个字符串s，请你找出其中最长的回文子串。回文串是指正着读和反着读都一样的字符串。示例1：输入：s="babad"输出："bab"解释："aba"也是一个有效答案。示例2：输入：s="cbbd"输出："bb"提示：1<=s.length<=1000s仅由数字和英文字母组成
USB服务器在证券公司虚拟化进程中的应用分析复园电子 USB Server 服务器运维开发语言 java 人工智能大数据网络
在证券公司全面拥抱虚拟化、云化的技术浪潮中，一个看似微小却至关重要的环节曾长期阻碍进程：分散在各业务环节的银行前置机U盾、各种系统认证Ukey等物理USB安全设备的管理难题。这些承载着资金划拨、交易认证核心权限的“小钥匙”，在传统模式下存在诸多痛点：1、管理分散，监管困难：U盾/Ukey物理分散在交易员、清算员、运维人员手中，使用记录难以实时监控和追溯，存在操作风险和内部安全隐患。2、虚拟化环境“
全网最详细的华为OD知识，值不值得去看这篇就够了（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od 华为OD机试 2025B卷 java
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
华为OD机试 - 计算某个字符出现次数 - 线性扫描（Python/JS/C/C++ 2025 B卷 100分）哪吒华为od python javascript 2025B卷华为OD机试
一、题目描述写出一个程序，接受一个由字母、数字和空格组成的字符串，和一个字符，然后输出"输入字符串"中该字符的出现次数。（不区分大小写字母）。二、输入描述第一行输入一个由字母、数字和空格组成的字符串，第二行输入一个字符(保证该字符不为空格)。三、输出描述输出输入字符串中含有该字符的个数,(不区分大小写字母)。四、测试用例测试用例1：1、输入HelloWorldo2、输出2测试用例2：1、输入abc
11、Python如何对字符串进行左、右、居中对齐
在Python中，我们经常会遇到需要对字符串进行对齐的情况，比如左对齐、右对齐或者居中对齐。这在处理文本输出、日志格式化等场景中非常有用。方案一：使用str.ljust()、str.rjust()、str.center()方法进行对齐三个方法用法类似，基本格式如下:string.ljust(width[,fillchar])string：表示要进行填充的字符串；width：表示包括S本身长度在内，
Python 自动化日志采集与分析方法
```htmlPython自动化日志采集与分析方法Python自动化日志采集与分析方法在现代软件开发和运维过程中，日志是排查问题、监控系统运行状态的重要工具。然而，随着系统的复杂度增加，手动处理日志变得越来越困难。本文将介绍如何使用Python实现自动化日志采集与分析的方法。一、日志采集的必要性日志记录了系统运行中的各种事件和错误信息，对于开发者和运维人员来说，它们是诊断问题、优化性能的关键数据源
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他