Python☞张良

Python网络爬虫之网络爬虫的“盗亦有道”和Requests库网络爬取实战学习笔记手札及代码实战

网络爬虫的“盗亦有道” 和Requests库网络爬取实战

学习笔记手札及单元小结
网络爬虫的“盗亦有道”
- 网络爬虫的限制
- Robots协议
- Robots协议的遵守方式
- - Robots协议的使用
Requests库网络爬取实战
- 实例1：京东商品页面的爬取
- 实例2：亚马逊商品页面的爬取
- 实例3：百度/360搜索关键词提交
- 实例4:网络图片的爬取和存储
- 实例5：IP地址归属地的自动查询

和Requests库网络爬取实战)

学习笔记手札及单元小结

网络爬虫的“盗亦有道”

网络爬虫的限制

1.来源审查：判断User-Agent进行限制
检查来访HTTP协议头的User-Agent域，只响应浏览器或友好爬虫的访问
2.发布公告：Robots协议
告知所有爬虫网站的爬取策略，要求爬虫遵守

Robots协议

1.作用：
网站告知网络爬虫哪些页面可以抓取，哪些不行
2.形式：
在网站根目录下的robots.txt文件

案例：京东的Robots协议

https://www.jd.com/robots.txt
Robots协议基本语法：
#注释，*代表所有，/代表根目录

User-agent: * 
Disallow: /?* 
Disallow: /pop/*.html 
Disallow: /pinpai/*.html?* 
User-agent: EtaoSpider 
Disallow: / 
User-agent: HuihuiSpider 
Disallow: / 
User-agent: GwdangSpider 
Disallow: / 
User-agent: WochachaSpider 
Disallow: /

https://news.sina.com.cn/robots.txt

User-agent: *
Disallow: /wap/
Disallow: /iframe/
Disallow: /temp/

https://www.qq.com/robots.txt

User-agent: *
Disallow:  
Sitemap: http://www.qq.com/sitemap_index.xml

https://news.qq.com/robots.txt

User-agent: *
Disallow:  
Sitemap: http://www.qq.com/sitemap_index.xml
Sitemap: http://news.qq.com/topic_sitemap.xml

https://www.moe.edu.cn/robots.txt
无robots协议
感兴趣的小伙伴可以自己去尝试一下

Robots协议的遵守方式

Robots协议的使用

1.网络爬虫：
自动或人工识别robots.txt，再进行内容爬取
2.约束性：
Robots协议是建议但非约束性，网络爬虫可以不遵守，但存在法律风险。

Requests库网络爬取实战

实例1：京东商品页面的爬取

全代码：

import requests
url = "https://item.jd.com/2967929.html"
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[:1000])
except:
    print("爬取失败")

实例2：亚马逊商品页面的爬取

>>> import requests
>>> r = requests.get("https://www.amazon.cn/gp/product/B01M8L5Z3Y")
>>> r.status_code
200
>>> r.encoding
'UTF-8'
>>> r.encoding = r.apparent_encoding
>>> r.text

>>> r.request.headers
{
     'User-Agent': 'python-requests/2.22.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
>>> kv ={
     'user-agent':'Mozilla/5.0'}
>>> url = "https://www.amazon.cn/gp/product/B01M8L5Z3Y"
>>> r = requests.get(url,headers = {
     'user-agent':'Mozilla/5.0'}) #此处将浏览器端口改为'user-agent':'Mozilla/5.0'
>>> r,status_code
Traceback (most recent call last):
  File "", line 1, in <module>
    r,status_code
NameError: name 'status_code' is not defined #此处代码报错，一定要注意代码的规范书写，快找找错误在哪里
>>> r.status_code
200
>>> r.request.headers
{
     'user-agent': 'Mozilla/5.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
>>> r.text[:1000]
'\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n \n \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n    \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n \n \n\n\n    \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n    \n    \n\n


    
        你可能感兴趣的:(笔记,金融工程考研备忘录,网络,搜索引擎,百度,python,https)
        
            
                
                    Python 实现海康机器人工业相机 MV-CS050-10GC 的实时显示视频流及拍照功能(实时显示视频流同时可以进行拍照)
                        恋上钢琴的虫
数码相机
                        参考链接：https://www.cnblogs.com/HanYork/p/17388506.htmlhttps://www.cnblogs.com/miracle-luna/p/16960556.html#5138211Flask搭建流媒体服务器：使用Flask搭建一个流媒体服务器_multipart/x-mixed-replace;boundary=frame-CSDN博客
                    
                    DeepSeek-辅助NS3学习和功能调试
                        wenxin-
学习php开发语言DeepSeekNS3
                        文章目录一、前言二、DeepSeek回答**1.MAC层替换导致的兼容性问题****可能原因**：**验证方法**：**2.路由表未正确建立****可能原因**：**验证方法**：**3.LR-WPAN物理层限制****可能原因**：**验证方法**：**4.AODV协议配置错误****可能原因**：**验证方法**：**5.网络层与MAC层地址映射问题****可能原因**：**验证方法**：**
                    
                    深入理解C++内存管理机制
                        qzw1210
C++c++学习笔记
                        侯捷C++系列课程学习笔记：深入理解C++内存管理机制在侯捷老师的C++系列课程中，内存管理是一个极其重要且深刻的主题。通过对这部分内容的学习，我对C++的内存管理机制有了更深入的理解，特别是关于new/delete操作符、内存池设计以及智能指针的应用。一、C++内存分配的层次结构侯捷老师在课程中清晰地阐述了C++内存分配的层次结构，这让我对整个内存管理体系有了全局的认识：最底层：操作系统提供的内
                    
                    python:数据类构建器
                        愚戏师
python基础与机器学习pythonwindows开发语言
                        在Python中，数据类（DataClasses）用于快速创建主要目的是存储数据的类，自动生成__init__,__repr__,__eq__等方法。“Python提供了几种构建简单类的方式，这些类只是字段的容器，几乎没有额外功能。这种模式称为“数据类”（dataclass），dataclasses包就支持该模式。”引用自《流畅的python（第二版）》1.基础数据类使用@dataclass装饰器
                    
                    基于群智能算法的三维无线传感网络覆盖优化数学模型-可以使用群智能算法直接调用进行优化，完整MATLAB代码
                        算法小狂人
算法应用matlabphp开发语言
                        1.1三维覆盖模型由于节点随机抛洒，而传感器节点的分布情况会影响网络覆盖率，以RcovR_{\text{cov}}Rcov作为覆盖率评价标准。在三维覆盖区域中，传感器节点的覆盖区域是某一半径确定的球。在三维监测区域中随机抛洒NNN个传感器节点，形成节点集S={s1,s2,s3,⋯ ,sN}S=\{s_1,s_2,s_3,\cdots,s_N\}S={s1,s2,s3,⋯,sN}，第iii个节点的坐
                    
                    开博尔支持超高清8K显示HDMI2.1线材评测体验
                        只你不知
测评文HDMI2.1HDMI2.1高清线8K电视线4K高清线
                        前言（网络整理）：虽然目前没有真正的HDMI2.1的电视机，但是HDMI协会针对HDMI2.1标准做出了临时参数标准和HDMI2.1连接器认证授权，经开博尔技术咨询后得知，开博尔对于HDMI协会当前对HDMI2.1的研产要求均满足，采用定制HDMI2.1认证连接器。HDMI2.0能够实现60FPS的4K图像或30FPS的8K图像。而新的HDMI2.1则可以显示120FPS的4K图像或60FPS的8
                    
                    Elasticsearch大文件检索性能提升20倍实践（干货）_elasticsearch 查询优化
                        2401_84247505
2024年程序员学习elasticsearchjenkins大数据
                        3、问题排查与定位步骤1：限定返回记录条数。不提供直接访问末页的入口。baidu，360，搜狗等搜索引擎都不提供访问末页的请求方式。都是基于如下的请求方式：通过点击上一下、下一页逐页访问。这个从用户的角度也很好理解，搜索引擎返回的前面都是相关度最高的，也是用户最关心的信息。Elasticsearch的默认支持的数据条数是10000条，可以通过post请求修改。最终，本步骤将支持ES最大返回值100
                    
                    【大模型对话 的界面搭建-Open WebUI】
                        y_dd
人工智能深度学习人工智能llama语言模型
                        OpenWebUI前身就是OllamaWebUI，为Ollama提供一个可视化界面，可以完全离线运行，支持Ollama和兼容OpenAI的API。github网址https://github.com/open-webui/open-webui安装第一种docker安装如果ollama安装在同一台服务器上：dockerrun-d-p3000:8080--add-host=host.docker.in
                    
                    还不会构建MindIE镜像？一篇文章搞定
                        Zain Lau
vim编辑器linuxMindIE昇腾
                        MindIE镜像构建工程项目简介用于构建多平台/架构的MindiE镜像的脚本。用户可以根据需要准备好所需的软件包，修改相关配置并构建镜像。前提条件网络连接在整个构建过程中，必须保持稳定的网络连接。此构建工程依赖于在线下载多个资源，包括但不限于Python源码、编译工具以及各种依赖，无法离线构建。Docker推荐版本：Docker20.10.x及以上最低版本要求：Docker19.03.x安装方式：
                    
                    elasticsearch analyzer 学习笔记
                        weixin_40455124
elasticsearch代码分析及扩展elasticsearchanalyzertoken
                        基本定义analyzer执行将输入字符流分解为token的过程使用场景在indexing的时候，也即在建立索引的时候在searching的时候，也即在搜索时，分析需要搜索的词语analysisCharacterfiltering(字符过滤器):使用字符过滤器转换字符Breakingtextintotokens(把文字转化为标记):将文本分成一组一个或多个标记Tokenfiltering：使用标记过
                    
                    Android StrictMode 使用与原理深度解析
                        伟江.Zeng
Android基础androidStrictMode性能优化内存泄漏代码规范耗时检测kotlin
                        AndroidStrictMode是Android系统提供的一种开发者工具，用于检测应用主线程中不合理的耗时操作（如磁盘I/O、网络请求等）和内存泄漏问题。通过配置策略和惩罚机制，它帮助开发者在早期发现潜在性能问题，提升应用流畅性。以下从使用方式和实现原理两方面进行深度解析。一、StrictMode使用详解1.基础配置在Application或Activity的onCreate()中初始化Stri
                    
                    adb shell input text 完美支持中文输入
                        hzm326
pythonandroidwindowslinuxadb
                        adb默认是不支持Unicode编码的，无法通过adbshellinputtext命令输入中文到手机或模拟器解决中文输入还得感谢老外写了一个输入法，源码地址：https://github.com/senzhk/ADBKeyBoard第一步：安装ADBKeyBoard.apk文件打开手机或模拟器，adbinstallADBKeyBoard.apk安装该输入法或者直接安装即可第二步：设置默认输入法默认
                    
                    AtCoder Beginner Contest 275 A-D题解
                        Gowilli
AtCoderc++算法数据结构
                        比赛名称：AtCoderBeginnerContest275A-FindTakahashi找出最大的元素并输出下标使用两个变量一个存储当前找到的最大值一个存储找到的最大值对应的下标，若当前数大于最大值更新最大值和下标AC代码//Problem:A-FindTakahashi//Contest:AtCoder-AtCoderBeginnerContest275//URL:https://atcode
                    
                    Redis7——进阶篇（四）
                        啥也不会的小神龙·
Redis系列redis缓存学习redis经典面试题
                        前言：此篇文章系本人学习过程中记录下来的笔记，里面难免会有不少欠缺的地方，诚心期待大家多多给予指教。基础篇：Redis（一）Redis（二）Redis（三）Redis（四）Redis（五）Redis（六）Redis（七）Redis（八）进阶篇：Redis（九）Redis（十）Redis（十一）接上期内容：上期完成了缓存双写一致性方面的学习。下面学习HyperLogLog/Geo/Bitmap实际案
                    
                    记一次联想ThinkBook 16P G5 IRX ，麦克风无声音问题的解决
                        花花鱼
Windowswindows音频
                        1、微信语音麦克风无声音在电脑上微信电话，麦克风的功能没有，或者说你要录个屏给客户，发现讲不了话，也是比较的麻烦。2、联系客服建议升级声卡驱动，然后更新了以后，一个样没什么区别。各种设置，发现还是不行。3、声音设置当然，图片上的是静音麦克风了，按一下键就可以去掉。4、专家给了工具解决旧版驱动残留文件清除工具.zip链接:https://pan.baidu.com/s/1eVjT_QjYk_vz10
                    
                    使用 certbot 在centos7 搭建ssl证书自动并且续约
                        TwoSs110
sslhttps
                        第一步，确定服务器适合安装的certbot版本sudoyuminstallpython27如果上述方法不起作用，你可以尝试编译安装。首先，你需要安装编译Python所需的依赖包。sudoyuminstallgccmakeopenssl-develsqlite-develreadline-develzlib-develbzip2-devel接下来，下载Python2.7.5的源代码，并进行编译安装。
                    
                    Assembly语言的自然语言处理
                        花韵婷
包罗万象golang开发语言后端
                        Assembly语言在自然语言处理中的应用引言自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能的一个重要分支，致力于实现计算机与人类语言之间的互动。随着计算能力的提升以及大数据的蓬勃发展，NLP在各个领域的应用如火如荼。从语音识别、机器翻译到情感分析等，NLP正在改变我们与信息之间的互动方式。不过，当前主流的NLP研究通常是用高级编程语言（如Python、Ja
                    
                    Groovy语言的漏洞扫描
                        花韵婷
包罗万象golang开发语言后端
                        Groovy语言漏洞扫描：深入分析与实践引言Groovy是一种基于Java虚拟机（JVM）的动态编程语言，它结合了Python、Ruby和Smalltalk等语言的特性，提供了简洁的语法和强大的功能。Groovy广泛应用于脚本编写、自动化测试、构建工具（如Gradle）以及Web开发等领域。然而，随着Groovy的广泛应用，其安全性问题也逐渐显现出来。本文将深入探讨Groovy语言中的常见漏洞类型
                    
                    大模型的webui
                        Zain Lau
人工智能python昇腾Ascend天数
                        exportXXX_LLM_C=~/xcore-llm/build/ReleaseexportCUDA_VISIBLE_DEVICES=2,3exportCUDACXX=/usr/local/cuda-12.3/bin/nvccnohup/usr/bin/python3/home/src/api_server/api_server.py--modelLLama2:7b-chat-hf_A800--
                    
                    PCDN 与边缘计算的结合：未来内容分发的新趋势
                        yczykjyxgs
pcdn智能路由器
                        在数字化浪潮中，内容分发面临着前所未有的挑战与机遇。PCDN（P2P内容分发网络）与边缘计算的结合，正逐渐崭露头角，成为未来内容分发的新趋势。PCDN通过P2P技术，利用用户节点的闲置资源进行内容分发，有效减轻了中心服务器的压力，降低了传输成本。然而，在面对实时性要求极高的业务场景时，PCDN仍存在一定局限。边缘计算的出现，为解决这一问题提供了新思路。边缘计算将计算和存储能力下沉到网络边缘，靠近用
                    
                    PKI及SSL协议分析实验报告
                        只会复制粘贴的
sslhttps服务器
                        PKI及SSL协议分析实验报告一、实验目的通过该实验了解和掌握证书服务的安装，理解证书的发放过程，掌握在WEB服务器上配置SSL，使用HTTPS协议访问网站以验证结果，最后对HTTPS协议进行分析。二、实验环境WindowServer*2本实验中自己指定CA服务器与申请证书的网站。实验过程中建议使用IE浏览器，如果不使用IE，可能会导致后续实验过程中证书不能下载。三、实验内容与实验要求实验内容、原
                    
                    云计算、边缘计算与雾计算
                        白小白呀
笔记大数据
                        云计算（数据上传到云端进行处理）云计算(CloudComputing)是一种基于互联网的计算方式，通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。通俗的讲，云是网络、互联网的一种比喻说法，即互联网与建立互联网所需要的底层基础设施的抽象体。“计算”指的是一台足够强大的计算机提供的计算服务（包括各种功能，资源，存储）。“云计算”可以理解为：通过互联网可以使用足够强大的计算机为用户提
                    
                    Tornado 初识
                        Wu_Candy
Web服务器
                        一、什么是tornadoTornado是使用Python编写的一个强大的、可扩展的Web服务器。它在处理严峻的网络流量时表现得足够强健，但却在创建和编写时有着足够的轻量级，并能够被用在大量的应用和工具中。二、tornado有什么优势Tornado和现在的主流baiduWeb服务器框架（包括大多数Python的框架）有着明显的区别：它是非阻塞式服务器，而且速度相当快，得利于其非阻塞的方式和对epol
                    
                    SSL 和 TLS 认证
                        百里自来卷
ssl网络协议网络
                        SSL（SecureSocketsLayer，安全套接层）认证是一种用于加密网络通信和验证服务器身份的安全技术。它是TLS（TransportLayerSecurity，传输层安全协议）的前身，虽然现在大多数应用使用的是TLS，但仍习惯性地称之为SSL认证。SSL认证SSL认证的核心作用数据加密：防止数据在传输过程中被窃取或篡改，保证机密性。身份验证：验证服务器身份，防止用户连接到伪造的服务器（如
                    
                    SSL的原理和应用
                        m0_74092749
ssl网络协议网络
                        前言：SSL协议便是Internet上应用最为广泛的网络数据安全传输协议。SSL协议隶属于会话层,处于有连接的会话层之上,它一经产生就在Internet领域发挥了它的巨大作用。目前,国外著名的商用浏览器和Web服务器都支持SSL协议,SSL已成为最流行的WWW安全协议。目前已经有若干国外厂商推出了基于SSL的安全产品,但是协议在核心密码算法上都有出口限制,大多采用一些低安全强度的算法,而且协议代码
                    
                    mbedtls编译
                        satadriver
工具和网站学习
                        下载：gitclonehttps://github.com/Mbed-TLS/mbedtls.git设置编译环境：在mbedtls目录下执行：gitsubmoduleupdate--init，切换到tf-psa-crypto目录并再次执行：cdtf-psa-crypto/gitsubmoduleupdate--init编译:切换到mbedtls目录执行命令：makeall
                    
                    PCDN边缘计算小白入门指南
                        神鸟云-Hu
边缘计算人工智能
                        一、PCDN边缘计算简介PCDN是一种基于P2P技术的边缘计算内容分发网络。它通过挖掘和利用边缘网络中的海量碎片化闲置资源，构建出低成本、高品质的内容分发网络服务。通过集成PCDNSDK（软件开发工具包），可以获得与CDN（ContentDeliveryNetwork，内容分发网络）相当或略高的分发质量，同时显著降低分发成本。PCDN适用于视频点播、直播、大文件下载等业务场景，旨在降低客户的分发成
                    
                    【HarmonyOS NEXT 】应用开发：使用@ohos.net.webSocket发送webSocket
                        纳米小川
HarmonyOSharmonyos.netwebsocket
                        @ohos.net.webSocket模块可以建立WebSocket连接，实现与服务器之间的实时双向通信。WebSocket提供了一种低延迟的通信方式，非常适合实时应用，如聊天应用、在线游戏等。下面是使用@ohos.net.webSocket模块建立WebSocket连接的步骤：1、添加权限确保在config.json文件中添加了网络访问权限：{"name":"com.example.myappl
                    
                    python高并发访问mysql_Python访问MySQL
                        阿廖林诺

                        Python访问数据库作为Python开发工程师，选择哪个数据库呢？当然是MySQL。因为MySQL不仅免费，普及率最高，出了错，可以很容易找到解决方法。而且，围绕MySQL有一大堆监控和运维的工具，安装和使用很方便。使用MySQLMySQL是Web世界中使用最广泛的数据库服务器。SQLite的特点是轻量级、可嵌入，但不能承受高并发访问，适合桌面和移动应用。而MySQL是为服务器端设计的数据库，能
                    
                    Python 爬取大量数据如何并发抓取与性能优化
                        chusheng1840
Python教程python性能优化开发语言
                        Python并发抓取与性能优化在进行网络爬虫开发时，爬取大量数据可能非常耗时。尤其是在处理许多网页或API请求时，逐个请求速度会非常慢。为了解决这个问题，我们可以通过并发抓取提高爬取效率。同时，通过性能优化来进一步减少耗时和资源占用，使爬虫更高效。本篇文章将带大家了解Python中常用的并发抓取方法，并介绍如何进行性能优化。1.并发抓取的基本概念并发抓取指的是同时发出多个请求的技术，而不是顺序地等
                    
                                tomcat基础与部署发布
                                    暗黑小菠萝
Tomcat java web
                                    从51cto搬家了，以后会更新在这里方便自己查看。 
做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 
Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。 
一、Tomcat安装 
    安装方式：①运行.exe安装包 
     &n
                                
                                网站架构发展的过程
                                    ayaoxinchao
数据库应用服务器网站架构
                                    1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 
2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 
3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 
4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
                                
                                [信息与安全]数据库的备份问题
                                    comsci
数据库
                                     
 
      如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题 
  
 如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 
 
   是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? 
 
 &n
                                
                                使用maven tomcat plugin插件debug关联源代码
                                    商人shang
mavendebug查看源码tomcat-plugin
                                    *首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 
*配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
                                
                                大访问量高并发
                                    oloz
大访问量高并发
                                    大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简 
 
要列出几点解决方案： 
 
01、优化你的代码和查询语句，合理使用索引 
 
02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 
 
03、采用服务器集群、负载均衡分担大访问量高并发压力 
 
04、数据读写分离 
 
05、合理选用框架，合理架构(推荐分布式架构)。 
 
                                
                                cache 服务器
                                    小猪猪08
cache
                                    Cache   即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。 
　　1.Cache   是怎么样工作的? 
　　Cache   是分配在服务器上
                                
                                mysql存储过程
                                    香水浓
mysql
                                    Description:插入大量测试数据 
 
use xmpl;

drop procedure if exists mockup_test_data_sp;

create procedure mockup_test_data_sp(
	in number_of_records int
)
begin
	declare cnt int;
	declare name varch
                                
                                CSS的class、id、css文件名的常用命名规则
                                    agevs
JavaScriptUI框架Ajaxcss
                                      CSS的class、id、css文件名的常用命名规则 
    (一)常用的CSS命名规则 
　　头：header 
　　内容：content/container 
　　尾：footer 
　　导航：nav 
　　侧栏：sidebar 
　　栏目：column 
　　页面外围控制整体布局宽度：wrapper 
　　左右中：left right 
                                
                                全局数据源
                                    AILIKES
javatomcatmysqljdbcJNDI
                                    实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 
1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
                                
                                MYSQL的随机查询的实现方法
                                    baalwolf
mysql
                                    MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
                                
                                JAVA的getBytes()方法
                                    bijian1013
javaeclipseunixOS
                                        在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！  
    String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： 
    byte[] b_gbk = "
                                
                                AngularJS中操作Cookies
                                    bijian1013
JavaScriptAngularJSCookies
                                            如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。 
        幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
                                
                                [Maven学习笔记五]Maven聚合和继承特性
                                    bit1129
maven
                                    Maven聚合 
  
在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块：   
1. 模型和数据持久化层user-core, 
2. 业务逻辑层user-service以 
3. web展现层user-web， 
user-service依赖于user-core 
user-web依赖于user-core和use
                                
                                【JVM七】JVM知识点总结
                                    bit1129
jvm
                                      1. JVM运行模式 
1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 
1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler 
                                
                                linux下查看nginx、apache、mysql、php的编译参数
                                    ronin47

                                    在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 
1、nginx 
[root@361way ~]# /App/nginx/sbin/nginx -V
nginx: nginx version: nginx/
                                
                                unity中运用Resources.Load的方法？
                                    brotherlamp
unity视频unity资料unity自学unityunity教程
                                    问：unity中运用Resources.Load的方法？ 
答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 
1、unity实时替换的物体即是依据环境条件
                                
                                线段树-入门
                                    bylijinnan
java算法线段树
                                    


/**
 * 线段树入门
 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次
 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i]
 * 
 * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18
 * @author lijinna
                                
                                全选与反选
                                    chicony
全选
                                      
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>全选与反选</title>

                                
                                vim一些简单记录
                                    chenchao051
vim
                                    mac在/usr/share/vim/vimrc linux在/etc/vimrc 
  
1、问：后退键不能删除数据，不能往后退怎么办？ 
      答：在vimrc中加入set backspace=2 
  
2、问：如何控制tab键的缩进？ 
      答：在vimrc中加入set tabstop=4 (任何
                                
                                Sublime Text 快捷键
                                    daizj
快捷键sublime
                                    [size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
                                
                                php 引用(&)详解
                                    dcj3sjt126com
PHP
                                    在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址 变量的引用 PHP 的引用允许你用两个变量来指向同一个内容   复制代码代码如下:   
<?  
$a="ABC";  
$b =&$a;  
echo
                                
                                SVN中trunk,branches,tags用法详解
                                    dcj3sjt126com
SVN
                                    Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
                                
                                对软件设计的思考
                                    e200702084
设计模式数据结构算法ssh活动
                                    软件设计的宏观与微观  
 
   软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
                                
                                同步、异步、阻塞、非阻塞
                                    geeksun
非阻塞
                                    同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。 
  
同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。 
场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。 
  
异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。 
实现：
                                
                                Reverse SSH Tunnel 反向打洞實錄
                                    hongtoushizi
ssh
                                    實際的操作步驟：  
# 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port
ssh -NfR 12345:localhost:22 [email protected]

# 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器
ssh localhost -p 1
                                
                                Hibernate中的缓存
                                    Josh_Persistence
一级缓存Hiberante缓存查询缓存二级缓存
                                    Hibernate中的缓存 
  
一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 
Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
                                
                                对象关系行为模式之延迟加载
                                    home198979
PHP架构延迟加载
                                    形象化设计模式实战     HELLO!架构 
  
一、概念 
Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。 
延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。 
  
  
二、实现延迟加载 
实现Lazy Load主要有四种方法：延迟初始化、虚
                                
                                xml 验证
                                    pengfeicao521
xmlxml解析
                                    有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 
 
public static void testPattern() { 
 
 // 含有非法字符的串 
 String str =       "Jamey&#52828;&#01;&#02;&#209;&#1282
                                
                                div设置半透明效果
                                    spjich
css半透明
                                    为div设置如下样式： 
  
div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;}  
  
  
  
 说明： 
1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
                                
                                你真的了解单例模式么？
                                    w574240966
java单例设计模式jvm
                                        单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。 
  
一，单例模式的5中写法。（回字的四种写法，哈哈。） 
    1，懒汉式 
          （1）线程不安全的懒汉式 
    public cla
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.