Jerome12138

爬虫学习01_爬虫基础与requests模块

HTTP和HTTPS
爬虫
- 爬虫的流程
- 页面上的数据在哪里
  - 浏览器渲染出来的页面和爬虫请求的页面并不一样
- 常用请求头
- 响应状态码(status code)
- Robots协议（道德层面约束）
requests模块
- response的常用方法：
- requests中解决编解码的方法
- 判断请求否是成功
- 不要刚正面，手机版一般比电脑版的需要的数据更少
使用代理ip
- 正向代理和反向代理的区别
- 随机代理IP池
发送携带cookie请求
- 获取登录后的页面的三种方式
- 使用现有的cookie获取登录后的页面的限制
- 字典推导式，列表推导式
chrome分析url与json
- 寻找网页中post的url地址
- 定位想要的js
request小技巧
安装第三方模块的三种方法
代理神器Fiddler

HTTP和HTTPS

HTTP
超文本传输协议
默认端口号:80

HTTPS # HTTPS比HTTP更安全，但是性能更低
HTTP + SSL(安全套接字层)
默认端口号：443

爬虫

爬虫是模拟浏览器发送请求，获取响应

爬虫的流程

url -->发送请求，获取响应 -->提取数据/提取url -->保存

url形式 -> scheme://host[:port#]/path/…/[?query-string][#anchor]

页面上的数据在哪里

当前url地址对应的响应中
其他的url地址对应的响应中
- 比如ajax请求中
js生成的数据
- 部分数据在响应中
- 全部通过js生成

浏览器渲染出来的页面和爬虫请求的页面并不一样

爬虫只获取当前url地址对应的响应，不会进一步获取js的响应

而当前url地址的elements的内容和url的响应不一样

常用请求头

Host                -> (主机和端口号)
Connection          -> (链接类型)
Upgrade-Insecure-Requests   -> (升级为HTTPS请求)
User-Agent          -> (浏览器名称)***
Accept              -> (传输文件类型)
Referer             -> (页面跳转源)
Accept-Encoding     -> (文件编解码格式)
Cookie              -> (Cookie)***
x-requested-with :XMLHttpRequest  -> (是Ajax 异步请求)

响应状态码(status code)

200：成功
302：重定向，临时转移至新的url
307：重定向，临时转移至新的url
404：not found
500：服务器内部错误

Robots协议（道德层面约束）

网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。

例如：https://www.taobao.com/robots.txt

requests模块

import requests
response = requests.get(url)

中文文档 API

response的常用方法：

response.text           -> 类型：str, 根据HTTP 头部标明的代码自动解码，可能出错
respones.content        -> 类型：bytes, 修改编码response.content.deocde(“utf8”)
response.status_code        -> 状态码
response.request.headers    -> 响应头
response.headers            -> 请求头
response.url            -> 请求的url
response.request.url    -> 响应的url

response = requests.get(url,headers=headers)   # 发送带header的请求
response = requests.get(url,params=kw)         # 发送带?=参数的请求
response = requests.post("http://www.baidu.com/", data = data,headers=headers)  # 发送带POST的请求
    url = "..."
    headers = {'User-Agent':'...',...}
    data = {...}

requests中解决编解码的方法

response.content.decode()     # 默认utf-8，大多数情况下推荐
response.content.decode("gbk")

response.encoding=”gbk”
response.text

# 更推荐使用response.content.deocde()的方式获取响应的html页面

判断请求否是成功

assert response.status_code==200

不要刚正面，手机版一般比电脑版的需要的数据更少

使用代理ip

proxies = { 
    "http": "http://12.34.56.79:9527",          # proxies={协议:协议+ip+端口}
    "https": "https://12.34.56.79:9527", 
    }

requests.get("http://www.baidu.com", proxies = proxies)

正向代理和反向代理的区别

正向代理：客户端知道最终服务器的地址
反向代理：客户端不知道最终服务器的地址

随机代理IP池

准备一堆的ip地址，组成ip池，随机选择一个ip来时用

如何随机选择代理ip，让使用次数较少的ip地址有更大的可能性被用到

- {"ip":ip,"times":0}
- [{},{},{},{},{}],对这个ip的列表进行排序，按照使用次数进行排序
- 选择使用次数较少的10个ip，从中随机选择一个

检查ip的可用性

- 可以使用requests添加超时参数，判断ip地址的质量
- 在线代理ip质量检测的网站

发送携带cookie请求

携带一堆cookie进行请求，把cookie组成cookie池

不需要cookie的时候尽量不去使用cookie

获取登录后的页面的三种方式

requests.session
1. 实例化session（session具有的方法和requests一样）
  session = requests.session()
2. session发送请求post请求，对方服务器设置的cookie会保存在session
  session.post(url,data=data,headers=headers)
3. session请求登录后能够访问的页面，session能够自动的携带登录成功时保存在其中的cookie
  response = session.get(url,headers)
cookie放在headers中
headers = {"Cookie":"cookie字符串"}
cookie转化为字典放在请求方法中
requests.get(url,cookies={"name的值":"values的值"})

使用现有的cookie获取登录后的页面的限制

cookie过期时间很长的网站
在cookie过期之前能够拿到所有的数据，比较麻烦
配合其他程序一起使用，其他程序专门获取cookie，当前程序专门请求页面

字典推导式，列表推导式

cookies="anonymid=j3jxk555-nrn0wh; _r01_=1; _ga=GA1.2.1274811859.1497951251; "
cookies = {i.split("=")[0]:i.split("=")[1] for i in cookies.split("; ")}

[self.url_temp.format(i * 50) for i in range(1000)]

chrome分析url与json

寻找网页中post的url地址

form表单的action属性
抓包，寻找js的url地址
- 勾选perserve log按钮，防止页面跳转找不到url
- 寻找post数据，确定参数
  - 参数不会变，直接用，比如密码不是动态加密的时候
  - 参数会变
    - 参数在当前的响应中
    - 通过js生成

定位想要的js

选择会触发js时间的标签，点击event listener，找到js的位置
通过chrome中的search all file来搜索url中关键字
添加断点的方式来查看js的操作，通过python来进行同样的操作

request小技巧

reqeusts.utils

 requests.get(url,cookies={})
 reqeusts.utils.dict_from_cookiejar      # 把cookie对象转化为字典
 reqeusts.utils.cookiejar_from_dict      # 把cookie字典转化为对象
 requests.utils.quote("...")             # url编码
 requests.utils.unquote("...")           # url解码

忽略SSL证书验证
response = requests.get("https://www.12306.cn/mormhweb/", verify=False)
设置请求超时时间
response = requests.get(url,timeout=10)
配合状态码判断是否请求成功
assert response.status_code == 200

retrying模块

 @retry(stop_max_attempt_number=3)       # 通过装饰器使用
 def fun1():
   ...

安装第三方模块的三种方法

pip install retrying
下载源码解码，进入解压后的目录，执行py文件
***.whl文件安装方法 pip install ***.whl

代理神器Fiddler

抓包工具

Fiddler是一款强大Web调试工具，它能记录所有客户端和服务器的HTTP,HTTPS请求

你可能感兴趣的:(爬虫学习01_爬虫基础与requests模块)

在 Python 异步协程中使用同步队列土谷祠房客 python 协程阻塞
在Python异步协程中使用同步队列使用Pythonasyncio进行异步编程时，可以使用异步队列asyncio.Queue在并发的协程间进行数据交互。不过，asyncio.Queue不是线程安全的，如果需要在不同线程的异步程序之间或者不同线程的异步程序和同步程序间交换数据，就需要使用queue模块中的Queue这个队列，因为它是线程安全的。在asyncio异步协程中使用queue.Queue
使用 LangChain 构建多PDF文档聊天应用 jkgSFS langchain pdf easyui python
随着大型语言模型（LLMs）的普及，如何将它们应用于文档处理成为了热门话题之一。本文将通过一个教程，展示如何使用LangChain构建一个能够处理多个PDF文档并与之对话的应用。技术背景介绍LangChain是一个广受欢迎的库，能够帮助开发者轻松地与LLMs和不同的嵌入技术进行整合。它提供了方便的接口和工具，使得复杂的自然语言处理任务变得简单高效。核心原理解析我们将利用LangChain来读取多个
深度学习笔记——模型部署好评笔记深度学习笔记深度学习笔记人工智能 transformer 模型部署大模型部署大模型
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要概括模型部署的知识点，包括步骤和部署方式。文章目录模型部署模型部署的关键步骤常见的模型部署方式优势与挑战总结边缘端部署方案总结历史文章机器学习深度学习模型部署模型部署是指将训练好的机器学习或深度学习模型集成到生产环境中，使其能够在实际应用中处理实时数据和提供预测服务。模型部署的流程涉及模型的封装、部署环境的选择、部
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点岑童嵘
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点【下载地址】泰坦尼克号生存分类数据集本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件：训练集和测试集。数据集主要用于训练和评估机器学习模型，以预测泰坦尼克号乘客的生存情况项目地址:https://gitcode.com/open-source-toolkit/35561项目介绍泰坦尼克号生存分类数
二分(C++) 数的范围三次方根你干码，哎哟算法 c++排序算法
二分通常指的是二分查找（BinarySearch），它是一种高效的查找算法，用于在有序数组中查找某一特定元素的位置。二分查找的思路是：每次取中间位置的元素与目标值进行比较。如果中间位置的元素正好等于目标值，则查找成功。如果中间位置的元素大于目标值，则在数组的左半部分继续查找。如果中间位置的元素小于目标值，则在数组的右半部分继续查找。重复上述过程，直到找到目标值或查找范围为空。一.数的范围题目给定一
数据结构之循环队列C语言实现（详细） ck8719 数据结构与算法队列数据结构算法 leetcode c#
队列的一些说明队列的定义队列，一种特殊的线性表特点：只允许在一端输入，在另一端输出。输入端称为队尾，输出端称为队头因此，队列，又称为先进先出表（FIFO），类似于生活中的排队，先来的排在前头，后来的排在后头，一个一个办理业务。队列有两种，一种叫做循环队列（顺序队列），另一种叫做链式队列。这一篇讲的是循环队列，链式队列在另外一篇文章中链式队列讲解与C++实现循环数组循环队列使用的是数组，但是这个数组
LLM - 大模型 ScallingLaws 的 CLM 和 MLM 中不同系数(PLM) 教程(2) ManonLegrand 大模型 (LLM)LLM ScalingLaws CLM MLM IsoFLOPs SymboLab
欢迎关注我的CSDN：https://spike.blog.csdn.net/本文地址：https://spike.blog.csdn.net/article/details/145188660免责声明：本文来源于个人知识与公开资料，仅用于学术交流，欢迎讨论，不支持转载。ScalingLaws(缩放法则)是大模型领域中，用于描述模型性能(Loss)与模型规模N、数据量D、计算资源C之间关系的经验规
【Python】Tkinter电器销售有限公司销售数据分析（源码）【独一无二】不争不抢不显不露 python 数据分析开发语言
一、设计要求该项目创建一个数据分析软件，利用Tkinter和Matplotlib构建图形用户界面（GUI），读取和分析美迪电器销售有限公司销售数据。用户可以通过界面选择月份查看数据详情、生成销量图表并计算月总销量和年总销量。二、设计思路2.模块引入首先引入了所需的模块，包括Tkinter（用于GUI创建和管理）、ttk（Tkinter主题化控件）、messagebox（用于弹出消息框）、panda
移除元素OJ详解扶我起来我还能再做一题开发语言数据结构 c语言 leetcode
一、题目介绍给你一个数组nums和一个值val，你需要原地移除所有数值等于val的元素。元素的顺序可能发生改变。然后返回nums中与val不同的元素的数量。假设nums中不等于val的元素数量为k，要通过此题，您需要执行以下操作：更改nums数组，使nums的前k个元素包含不等于val的元素。nums的其余元素和nums的大小并不重要。返回k。用户评测：评测机将使用以下代码测试您的解决方案：int
深入理解C语言函数：定义、调用与设计 Threeiy c语言
在C语言编程的世界里，函数是构建复杂程序的基石。它允许我们将一个大的任务分解为多个小的、功能独立的模块，使得代码更易于理解、维护和复用。今天，我们就来深入探讨一下C语言函数的方方面面。一、函数定义的一般形式函数定义由函数头和函数体两部分组成。//返回值类型类型标识符函数名(形式参数)//函数头head{//函数体--body声明部分语句部分}-函数头：-类型标识符：用于指定函数处理完后要带出的结果
Python在WRF模型自动化运行及前后处理中实践技术应用-包括数据处理、模型运行、结果可视化等步骤。 KY_chenzhao python 自动化开发语言
1.背景与目标WRF（WeatherResearchandForecasting）模型是中尺度气象数值模式的佼佼者，广泛应用于气象预报和气候研究。Python在WRF模型中的应用主要体现在前后处理、自动化运行和数据可视化等方面。本文将以风速预测为例，详细说明Python在WRF模型中的具体应用，包括数据处理、模型运行、结果可视化等步骤。2.数据准备数据来源包括WRF模型的输出数据和实际观测数据。这
基于Python机器学习、深度学习技术提升气象、海洋、水文领域实践应用 KY_chenzhao python 机器学习深度学习气象
1.背景与目标ENSO（ElNiño-SouthernOscillation）是全球气候系统中最显著的年际变率现象之一，对全球气候、农业、渔业等有着深远的影响。准确预测ENSO事件的发生和发展对于减灾防灾具有重要意义。近年来，深度学习技术在气象领域得到了广泛应用，其中长短期记忆网络（LSTM）因其在处理时间序列数据方面的优势，被广泛用于ENSO预测。2.数据准备数据来源包括NOAA（美国国家海洋和
MDX语言的编程范式 BinaryBardC 包罗万象 golang 开发语言后端
MDX语言的编程范式引言MDX（MultidimensionalExpressions）是一种查询语言，主要用于在多维数据集中检索数据。这种语言广泛应用于商业智能（BI）领域，尤其是在与分析服务（如MicrosoftAnalysisServices）相关的上下文中。MDX语言提供了一个强大的语法，使得开发者能够以灵活的方式操作多维数据模型。本文将深入探讨MDX的编程范式，从基本语法、查询结构到高级
AWS SAP-C02教程6--安全_aws sap c02题库(1) 2401_84252743 程序员 aws 安全区块链
有AWS管理密钥，因此安全度高AWSKMS与大多数用于加密数据的其他AWS服务集成例题：Acompanyneedstomoveitswrite-intensiveAmazonRDSforPostgreSQLdatabasefromtheeu-west-1Regiontotheeu-north-1Region.Aspartofthemigration,thecompanyneedstochangef
李开复与零一万物：AI创业的务实之道，以及AI写代码工具的崛起前端
2025年伊始，AI领域便掀起一阵波澜。零一万物，这家备受瞩目的AI公司，其人员变动和业务拆分引发了广泛关注。李开复，这位在AI领域深耕多年的资深人士，对此做出了回应，其核心观点值得我们深思：在AI领域，盲目追求规模并非最佳策略。这不仅关乎零一万物，也为众多AI初创公司提供了宝贵的经验。李开复观点解读：理性决策，而非盲目扩张李开复认为，初创公司“负担不起”超大模型的预训练。这“负担不起”并非仅仅指
AI时代：前端工程师和数学家真的要失业了吗？前端
ExaCEO威廉·布里克近日发布的惊人预测在科技界引发轩然大波：他认为前端工程师将在三年内消失，而数学家则只有700天的时间。这一预测并非危言耸听，它反映了AI代码生成器等AI技术高速发展带来的巨大行业冲击。本文将深入探讨AI技术对前端开发和数学领域的影响，以及由此带来的机遇与挑战。前端开发行业的AI革命布里克的预测并非空穴来风。近年来，众多AI写代码工具如雨后春笋般涌现，例如ScriptEcho
AI 2025：技术飞跃与应用鸿沟——AI代码生成器引领未来？前端
2024年，人工智能技术经历了前所未有的飞跃。大型语言模型（LLM）的能力显著提升，成本大幅下降，多模态应用成为主流。然而，令人担忧的是，技术进步与实际应用普及之间存在着巨大的鸿沟。“智能体”等概念被热炒，但实际应用却远未达到预期。本文将探讨这种技术进步与应用普及之间的矛盾，并分析弥合鸿沟的关键所在。技术的突飞猛进2024年，AI技术在多个方面取得了突破性进展。首先，模型能力得到了显著提升。GPT
BOE（京东方）联手故宫再度打造沉浸式数字展引领数字艺术文化新篇章人工智能
2025年1月6日，由BOE（京东方）联合故宫博物院及腾讯主办的“‘纹’以载道——故宫沉浸式数字体验展”在苏州湾数字艺术馆盛大启幕，1月7日将正式开展。值此故宫博物院建院百年开年之际，BOE（京东方）凭借前沿数字技术，将故宫的瑰丽“国宝”以全新数字化形式串联起来，让故宫文化在苏州湾重焕生机。此次展览是BOE（京东方）与故宫博物院战略合作成果的又一力作，展现了BOE（京东方）在技术赋能文化传承方面的
StarRocks Awards 2024 年度贡献人物开源
在过去一年，StarRocks在Lakehouse与AI等关键领域取得了显著进步，其卓越的产品功能极大地简化和提升了数据分析的效率，使得"OneData，AllAnalytics"的愿景变得更加触手可及。虽然实现这一目标的道路充满挑战且漫长，但我们并不孤单，因为有一群社区伙伴与我们并肩作战。每一位贡献者的代码提交和每一次的布道，都在推动着StarRocks社区向前发展。为了表达对这些贡献者的深深感
Python实用记录(十五)：PyQt/PySide6打包成exe，精简版（nuitka/pyinstaller/auto-py-to-exe） ZZY_dl 实用操作总结 python pyqt 开发语言
文章目录Python打包工具：Nuitka、PyInstaller和Auto-py-to-exe详解方式一：Nuitka安装与使用方式二：PyInstaller安装环境打包方式使用spec文件打包打包后文件说明打包参数说明方式三：Auto-py-to-exe安装环境✅⚠️▶️➡️⭐❄️✅⚠️▶️➡️⭐❄️✅⚠️▶️➡️⭐❄️✅⚠️Python打包工具：Nuitka、PyInstaller和Auto
VMware vSphere Web Services SDK编程指南（五）- 5.4 客户端应用(Web 服务器会话令牌) joexk vSphere Web Services SDK编程指南 vmware vSphere web services sdk
5.4Web服务器会话令牌本章包括以下主题：■5.1vCenter服务器连接■5.2与vCenter服务器建立一个单点登录会话■5.3使用用户名和密码凭证建立一个会话■5.4Web服务器会话令牌■5.5vSphereAPI的多个版本■5.6标识由服务器支持的API版本■5.7Sample应用程序接前篇从第4节开始与其他Web服务一样，vSphereWeb服务通过在HTTP头中使用一个令牌来标识会话
二进制/源码编译安装mysql 8.0 雷学习 Linux mysql 数据库
二进制方式：1.下载或上传安装包至设备：2.创建组与用户：[root@openEuler-1~]#groupaddmysql[root@openEuler-1~]#useradd-r-gmysql-s/bin/falsemysql3.解压安装包：tarxfmysql-8.0.36-linux-glibc2.12-x86_64.tar.xz-C/usr/local4.建立软链接：ln-sv/usr/
游戏开黑陪玩系统: 多客陪玩系统，线下搭子，付费陪聊系统APP小程序H5公众号三端打包
线下搭子通常指的是在现实生活中一起玩游戏的伙伴。而开黑陪玩系统则可以将这种线下合作延伸到线上，让玩家即使不在同一地点也能享受到组队开黑的乐趣。通过陪玩系统，玩家可以发布游戏约单，寻找合适的陪玩伙伴一起进行游戏，满足个性化需求。多客陪玩系统特点1.高清流畅语音通话：确保游戏与休闲时沟通无阻。多客陪玩系统采用先进降噪与回声消除技术，提升对话清晰度；同时支持多人有序交流。2.个性化房间设置：用户可创建私
linux nginx配置不生效,Nginx配置虚拟主机不生效 cici xiang linux nginx配置不生效
今天安装Nginx时，创建虚拟主机配置，发现不生效，始终是读取Nginx的默认配置文件指定的站点目录，于是将配置文件逐行检查了一遍，发现影响虚拟主机的配置是否生效，受到以下两个因素影响：1、Nginx的配置文件中，在http模块必须指定包含虚拟主机配置文件路径，本次实例中虚拟主机配置文件在如下：http{sendfileon;keepalive_timeout65;include/etc/ngin
[如何应对AI API模型弃用：迁移与替代方案策略] wad485486aw 人工智能 python
技术背景介绍在AI技术迅猛发展的背景下，API模型的更新和弃用成为常态。尤其是像Anthropic这样的公司，随着推出更安全、更强大的模型，旧版本的模型往往会被淘汰。这意味着依赖于这些模型的应用程序需要定期更新以保证正常运行。核心原理解析Anthropic模型生命周期包括几个阶段：活跃：模型得到完全支持并推荐使用。遗留：模型不再接收更新，并可能在未来被弃用。已弃用：模型不再对新用户开放，但在退役前
数据库高可用方案-09-数据库的灾难恢复演练老马啸西风 database mysql 数据库 oracle
数据库数据高可用系列数据库高可用方案-01-数据库备份还原方案数据库高可用方案-02-多机房部署数据库高可用方案-03-主备等高可用架构数据库高可用方案-04-删除策略数据库高可用方案-05-备份与恢复数据库高可用方案-06-监控与报警数据库高可用方案-07-一致性校验数据库高可用方案-08-多版本管理数据库高可用方案-09-数据库的灾难恢复演练数据库的灾难恢复演练数据库的灾难恢复演练是确保数据库
数据库高可用方案-05-备份与恢复老马啸西风 database mysql 数据库 oracle
数据库数据高可用系列数据库高可用方案-01-数据库备份还原方案数据库高可用方案-02-多机房部署数据库高可用方案-03-主备等高可用架构数据库高可用方案-04-删除策略数据库高可用方案-05-备份与恢复数据库高可用方案-06-监控与报警数据库高可用方案-07-一致性校验数据库高可用方案-08-多版本管理数据库高可用方案-09-数据库的灾难恢复演练数据库的备份与恢复数据库备份与恢复是数据库管理中至关
数据库高可用方案-07-一致性校验老马啸西风 database mysql 数据库 oracle
数据库数据高可用系列数据库高可用方案-01-数据库备份还原方案数据库高可用方案-02-多机房部署数据库高可用方案-03-主备等高可用架构数据库高可用方案-04-删除策略数据库高可用方案-05-备份与恢复数据库高可用方案-06-监控与报警数据库高可用方案-07-一致性校验数据库高可用方案-08-多版本管理数据库高可用方案-09-数据库的灾难恢复演练数据库的数据一致性校验数据库的数据一致性校验是指确保
数据库高可用方案-03-主备等高可用架构老马啸西风 database mysql 数据库架构
数据库数据高可用系列数据库高可用方案-01-数据库备份还原方案数据库高可用方案-02-多机房部署数据库高可用方案-03-主备等高可用架构数据库高可用方案-04-删除策略数据库高可用方案-05-备份与恢复数据库高可用方案-06-监控与报警数据库高可用方案-07-一致性校验数据库高可用方案-08-多版本管理数据库高可用方案-09-数据库的灾难恢复演练主备高可用架构主备高可用架构（Master-Slav
BUUCTF_Crypto_[WUSTCTF2020]B@se qq_58370970 经验分享
给了一个txt文件：从题目可以看出是与base64相关，不难发现是base64的变种，将base64的顺序改变了，但还有4个字符不知道可以写python脚本得到缺失的4个字符代码如下：importstrings='JASGBWcQPRXEFLbCDIlmnHUVKTYZdMovwipatNOefghq56rs****kxyz012789+/'j='ABCDEFGHIJKLMNOPQRSTUVWXY
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他