weixin_30667649

python抓取网页以及关于破解验证码的探讨

Python爬虫心得

一、前言

学习了爬虫之后，突然对crawler这个词产生了浓厚的兴趣，爬虫，很形象，很生动，在python中，爬虫的使用更加的快捷和方便，在这里将自己的一些心得予以记忆，加深印象！！！！！！

二、python爬虫

要点一：

python版本的选取，这里选取的是3.*，我们知道每一个版本很多的库和函数都做了相应的调整，如果不好好的掌握这一点，我们可能拿到别人的程序也无法使用。比如print函数，在3.*中是print(),具体的改动可以参考网址http://www.jb51.net/article/57956.htm来进行相关的学习。

要点二：

选择一个好的编译器，这点非常重要，这里选择的是pycharm，功能强大，支持调试等各种手段。

要点三：

理解python3.*的一些库函数，比如抓取网页用的urllib.request,用于正则表达式的re等，以及时间库函数time，随机数库函数random。

要点四：python的主函数

1      If  __name__=’__main__’:
2 
3         /*函数体*/

要点五：编码转换。

 1 import re
 2 from urllib.request import urlopen
 3 def catchAllInfoFromNet( myUrl):
 4     html = urlopen(myUrl).read().decode('utf-8','ignore')
 5     #print(html)
 6     #nameList = re.compile(r'(.*?)', re.DOTALL).findall(html)  # 列表形式
 7     #nameList = re.compile(r'href="(.*?)"', re.DOTALL).findall(html)  # 列表形式
 8     #nameList = re.compile(r'"name": "(.*?)"', re.DOTALL).findall(html)  # 列表形式
 9     nameList = re.compile(r'(.*?)', re.DOTALL).findall(html)  # 列表形式
10     for i in range(0, len(nameList)):
11         print("第%d个名字为：  %s"%(i,nameList[i]))

上面是一段源码，我们看到需要将字节转换成字符，这点非常重要。

要点六：对于如何下载网页。

这里有两种方法，一种如上面的代码所示，使用from urllib.request import urlopen来直接使用urlopen来抓取。

第二种是使用urllib.request来获得，代码如下:

 1 import urllib.request
 2 import re
 3 def catchAllInfoFromNet(url):
 4      #模拟浏览器,打开url
 5      headers = ('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML,    like Gecko) Chrome/23.0.1271.64 Safari/537.11')
 6      opener = urllib.request.build_opener()
 7      opener.addheaders = [headers]
 8      data = opener.open(url).read().decode('utf-8','ignore')
 9      nameList = re.compile(r'(.*?)', re.DOTALL).findall(data)  # 列表形式
10      for i in range(0, len(nameList)):
11           print("第%d个名字为：  %s" % (i, nameList[i]))

这种方式我们要伪装成浏览器进行网页抓取。

当然也可以：

1 import urllib.request
2 import re
3 def catchAllInfoFromNet(url):
4     data = urllib.request.urlopen(url).read().decode('UTF-8')
5     nameList = re.compile(r'(.*?)', re.DOTALL).findall(data)
6     for i in range(0, len(nameList)):
7         print("第%d个名字为：  %s" % (i, nameList[i]))

要点六：正则表达式

可以参考http://blog.csdn.net/peace1213/article/details/48950593进行学习。

三、Python实现登录爬虫代码

最近，对python的研究几乎是到了上瘾的地步，一个工具如果好到了一定的程度，就算没有人去宣传它，推广它，这个工具也会成为大家心里最喜爱的工具的，用了python之后才感觉到以前的C/C++,C#和Java实在是不够简练，可能是术业有专攻吧，可是python的哲学色彩真的很浓厚，有很多值得我们去学习和借鉴的地方，正如工具的本质就是继承大量固有的操作，只留一些接口，从而来方便大家的操作和使用，在这一点上，我深有同感，特别是对于网络爬虫来说，python可以说真的封装到了一种瓶颈了，用其他语言需要几百行实现的代码，python只需要我们做几十行的工作，这一点就深深值得我们去思考和借鉴。下面就写一下这几天我是用python爬虫的体会。正如以前所言，爬虫的几个要点都已经说过了，可是正当我高兴的那前人的代码去爬取网页数据的时候，一个问题才出现了，需要登录，现在很多网站都有这个功能，不登录就不能使用爬虫来抓取自己需要的数据了，这不得不说是魔高一尺，道高一丈。这对于网站来说当然是一种进步了，可是对于我们爬虫族来说实在是一个既刺激又烦恼的消息，刺激在于我们就是要和这些网站斗智斗勇，烦恼在于面对与一次次的失败我们是否能平淡视之，不断地积累经验教训，不断地完善自己，这一点至关重要。下面就开始我的心得体会了。

难点一：登录需要的参数都有些什么？

首先一定要有的就是账号和密码了，除此之外或许还有验证码，说到了验证码，我们就有犯难了，可能是网站看到我们很容易的破解了他们的登录阻挡策略，而又想出的新一代安全手段吧。因为验证码多种多样，用代码识别也是可以的，不过要付出很多的代价，而我们自己看的话，也可以，这样对我我们初学者不失为一种好的方法。

难点二:如果只是简单的账号密码性的网站，我们怎么模拟账号和密码？

这一点我们不得不学习一下浏览器是怎么实现这样的功能的，其实很简单，一切都在应用层协议里，比如HTTP，HTTPS协议，在这些协议里封装了一些特殊的字段，用来识别用户的一些信息，比如所用的浏览器，发送的账号密码等等，于是我们就可以根据这些信息来进行伪造从而迷惑服务器了，这点我们再上一次已经讲过，我们的程序也就是这样做的，那在这里，这些账号密码肯定也是放在这些字段中的，我们要做的是将这些数据提交到那些包里面，因此，在这里我们就需要用到cookie了，cookie英文意思是小点心，它确实是我们的“小点心”呀，它的里面存储的东西是非常重要的，如果我们在浏览器上保存了账号，密码等信息，那么就会被存到浏览器对应的cookie里，放在本地主机，比如说firefox浏览器的cookie就在选项——》隐私——》自定义设置——》显示cookie里，如下图所示，不同的浏览器可能有所不同，cookie存储的内容也很简单易懂，就是一个映射，Map(key,value)，一个键值对的映射，比如我们的账户，Account：Account Value，这就是一种映射，因此，我们要搞定用户名和密码，就要知道在实际传输中，当前网站所有的这些信息，一般情况下账号名是不加密的，而密码一定是加密传输的，不过这并不影响我们去识别它，那么问题来了，我们怎么去识别账户名和密码的字段呢?至于真正的账户名和密码，我们可以自己注册一个，这都无关紧要，可是我们怎么知道我们的键（key）呢？！

这些往往在python登录的教程里没讲，而我们确实真正要用到的，因此这里我一定着重讲一下，不然这对初学者来说是极其痛苦的，很难理清思路，很困惑，楼主都被困了整整一个上午才找到解决方案，不过也学到了一些知识，在这里给大家分享：

首先，让我们思考，我们可不可以在浏览器中，用F12来调用网页自带的开发工具来查找呢？！在网上也有这样的例子，比如：在firefox中有一个插件叫做firebug，我们可以安装它之后来捕捉：

下面我们都用人人网为例来进行实验，无它，没有验证码也！！！

首先我们安装firebug，重启浏览器，之后我们在人人网上按F12进入开发者模式，如下图所示：

我们点击cookie可以看到如下的字段，这里放大：

很自然地惊讶这些东西都是什么，是cookie呀，我们还能看到这些是来自那个网页的cookie，不过我们怎么从这些字段中知道那些是我们要找的账号和密码呢？很难，并且我可以告诉大家的是这些都不是，网上的很多文章真的是够混帐的，弄出来浪费我们的时间？！其实可能有其他的用吧，可是却是对于我们的工作帮助不大。比如说下面的一个cookie显示的内容是我的账号，我当时还高兴了很久，觉得总算找到了一个字段了，可是仔细看看，In_uact这个是什么鬼？！我们也不得而知，只能说你是不是在逗我，当然了这些背后肯定有具体的含义，可在这里与我们无关呐。

当然我们辛辛苦苦下载的firebug也不是一无是处嘛，只是我们可以看到一些浏览器的参数，包的header，等信息。在调试器的“网络”中，我们可以看到。这些信息或许对我们以后的学习有用，反正先记着吧。这些就是网上能够看到的内容了，下面我介绍一下，我的方法，当时我也认为没办法了，这些东西一点都不直观明了，并且感觉总有些不对的感觉，幸好我在网上看到了抓包分析的方法，恰好，我也在想可不可以用抓包的方法来检测呢？！沿着这个思路，我又开始了进一步的探索！！！

网络抓包有很多种方法，比如wireshark、fiddler等，这里我用惯了前者，就用用后者吧，后来发现网上对它的评论还不错，尤其是对https协议来说，fiddler确实是一个比较不错的选择，比较小，短小精悍。Fiddle的本意是“小提琴”或者“胡扯，无聊，欺诈，欺骗”，不能理解为什么小提琴会和欺诈扯上关系，我想fiddler肯定是借鉴了欺诈的意义，因为抓包本来就是一种窃取信息的行为，甚至还可以伪造成新的包，因此名字起的还是很形象。下载并安装fiddler，之后如图所示：

然后，我们首先打开fiddler，注意一定要先打开，然后切换浏览器到人人网页面，用自己的账号密码登录网站，此时fiddler就开始抓取我们和服务器进行交互的信息了，如下图所示：

点击登录，就进入下面界面：

此时可以看到fiddler中的信息：

其中result为200的说明是抓取成功的，我们一个个的点击查看，观看右边Inspect上面的webforms来观看，直到点击到第五个url为“/ajaxLogin/。。。”的这一个包的时候，我们发现右边的结果如下图所示：(账号名是email，没加密，密码是加密的，为password)

终于我们找到了这个东西，我们需要的cookie，那大家有可能会说有可能是浏览器迷惑我们，故意写的这些字段呢，其实是把别的伪装成了这样呢，确实有可能，比如淘宝就有两个密码TPL_password和TPL_password_2，经过我的观察，后者才是真正的密码，前者为空，当然具体问题具体分析，我们一个一个试探，总能出结果的，这就是黑客的基本素质了，不气馁，一直积累经验，不断尝试。同理，我们还可以在这个包中读出cookie，看来，我们刚开始认为的字段的名称在cookie里根本就没有呀，这一点到底是为什么，我相信在以后的学习中会渐渐理解的。

找到了重要的两个信息，我们是不是很兴奋，因为，我们可以在python程序中模拟网页登录，并且爬取网页了！！！！！！

先看程序：

 1 import http.cookiejar
 2 import urllib.request
 3 import urllib
 4 #利用cookie模拟网站登录
 5 filenameOfCookie ='renren_cookie.txt'
 6 cookie=http.cookiejar.MozillaCookieJar(filenameOfCookie)
 7 headler=urllib.request.HTTPCookieProcessor(cookie)
 8 opener=urllib.request.build_opener(headler)
 9 data={"email":"18349366304","password":"XXXXXXXXXX"}
10 postdata=urllib.parse.urlencode(data).encode(encoding='UTF8')
11 loginurl='http://www.renren.com/PLogin.do'
12 request=opener.open(loginurl,postdata)
13 print (request)
14 cookie.save(ignore_discard=True, ignore_expires=True)
15 geturl='http://friend.renren.com/managefriends'
16 result=opener.open(geturl).read().decode('utf-8')
17 print (result)
18 filenameOfHtml ='renren.html'
19 fileToWrite=open(filenameOfHtml,'w')
20 fileToWrite.write(result)
21 fileToWrite.close()

看到了吗，我们首先使用了MozillaCookieJar等工具来创建了cookie之后创建了opener来承载我们的处理引擎，之后就是重点了，我们伪造cookie的post数据，也就是data={"email":"18349366304","password":"XXXXXXXXXX"}，因此我们就可以模拟输入账户密码登录了，前面的工作就是为了这一步，经过一些编码处理之后，我们通过request=opener.open(loginurl,postdata)来真正的将这些信息应用到具体的数据包中，模拟浏览器进行登录，最后我们将获得的cookie信息保存起来，写入文本文件中。并且为了测试，我们访问了一个不登录就不能访问的网页，抓取了这个网页的信息打印并写入本地，程序结束。运行结果如图：

不信的话，我们进入人人网的这个链接http://friend.renren.com/managefriends来看一下：可以看到结果完全一样！！！

顺便可以看一下，我们退出了就进不去这个网页了，点击回车显示需要登录:

难点三：如何攻破https格式的网页登录。

这里我用淘宝网进行测试。得到的效果是时好时坏，正在不断地优化，淘宝网也是没有验证码的。不过对于这种失败，我觉得是应该的，要是这么容易就让我蒙混过关了，我都有点不敢用了呢，呐呐~~~这里首先是https协议，我们的fiddler如果不经过配置都不能识别，更不说去解析了，于是我们首先要让fiddler拿到操纵https包的优先权，于是我们需要提升权限，只能用证书的方式了，让fiddler自动生成根证书然后安装到浏览器中，这样我们就可以抓取信息了。过程如下：

在工具中找到该窗口，选中那两个对号，然后点击actions，选择“truest root certificate”选择yes，

之后一直确认，然后点击actions的导出到桌面：我们可以在桌面上看到相应的根证书了。

然后我们将证书导入到浏览器：在火狐中我们选择证书，如图所示：

在查看证书的导入中，将证书导入浏览器，之后就可以抓取https的包了，让我们抓取淘宝网。

好了，我们找到了用户名的post，那么密码为什么是空的呢，我们继续往下查找，总算找到了TPL_passwprd_2这个东西，这就是我们的密码了，这也是一种安全策略吧。

让我们用程序测试一下：

 1 import urllib.request
 2 import urllib
 3 import http.cookiejar
 4 filename = 'taobao_cookie.txt'
 5 cookie = http.cookiejar.MozillaCookieJar(filename)
 6 headler = urllib.request.HTTPCookieProcessor(cookie)
 7 opener = urllib.request.build_opener(headler)
 8 data = {"TPL_username": "朱彦荣0716", "TPL_password_2": "XXXXXXXXXX"}  # 你的用户名密码
 9 postdata = urllib.parse.urlencode(data).encode(encoding='UTF8')
10 loginurl = 'https://login.taobao.com/member/login.jhtml?'
11 request = opener.open(loginurl, postdata)
12 print('登录成功！！！')
13 cookie.save(ignore_discard=True, ignore_expires=True)
14 geturl='https://i.taobao.com/my_taobao.htm?'
15 geturl='http://mm.taobao.com/687471686.htm'
16 result=opener.open(geturl)
17 print (result.read().decode('gbk','ignore'))

结果没成功，这波土我吃的服！

不过这不代表没办法进去了，我们还可以用PlantomJS+Selenium来真正的模拟一个人的登录过程来测试，这里需要慢慢学习，可以说这只是第一步罢了，就算进去了也破坏不了系统的什么东西的。

难点四、如何保存cookie，在以后的登录中读取cookie即可？

代码如下：

 1 import http.cookiejar
 2 
 3 import urllib.request
 4 
 5 import urllib
 6 
 7 #创建MozillaCookieJar实例对象
 8 
 9 cookie = http.cookiejar.MozillaCookieJar()
10 
11 #从文件中读取cookie内容到变量
12 
13 cookie.load('renren_cookie.txt', ignore_discard=True, ignore_expires=True)
14 
15 #创建请求的request
16 
17 req = urllib.request.Request("http://friend.renren.com/managefriends")
18 
19 #利用urllib2的build_opener方法创建一个opener
20 
21 opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
22 
23 response = opener.open(req)
24 
25 print (response.read().decode('utf-8','ignore'))

关于爬虫的心得就先到这里为止！！！！！！

转载于:https://www.cnblogs.com/zyrblog/articles/6862951.html

打卡信奥刷题（638）用C++信奥P8218[普及组/提高] 【深进1.例1】求区间和 Loge编程生活 C++c++算法开发语言青少年编程数据结构
【深进1.例1】求区间和题目描述给定nnn个正整数组成的数列a1,a2,⋯ ,ana_1,a_2,\cdots,a_na1,a2,⋯,an和mmm个区间[li,ri][l_i,r_i][li,ri]，分别求这mmm个区间的区间和。对于所有测试数据，n,m≤105,ai≤104n,m\le10^5,a_i\le10^4n,m≤105,ai≤104输入格式第一行，为一个正整数nnn。第二行，为nnn个
MPP-大规模并行处理 quanzaiwoxin1
1、什么是MPP？MPP(MassivelyParallelProcessing)，即大规模并行处理，在数据库非共享集群中，每个节点都有独立的磁盘存储系统和内存系统，业务数据根据数据库模型和应用特点划分到各个节点上，每台数据节点通过专用网络或者商业通用网络互相连接，彼此协同计算，作为整体提供数据库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。简单来说，MPP
socket网络通信基础杨枝甘露小码网络
目录一、套接字编程基本流程二、TCP流式协议及Socket编程的recv()和send()三、读写无阻塞-完美掌握I/O复用select（）函数详解poll（）函数详解epoll()函数详解一、套接字编程基本流程原文链接：Socket编程权威指南(一)打通网络通信的任督二脉_seqpacket-CSDN博客Socket进行编程通常包括以下几个步骤:创建Socket绑定Socket(绑定地址信息)监
网络技术发展的演变与未来展望大丈夫立于天地间水网络
网络技术作为信息社会的重要基石，在过去几十年中经历了快速的发展和巨大的变革。从最初的ARPANET，到现在广泛使用的互联网，再到未来多国正在积极研发的6G网络，人类社会对网络技术的依赖程度不断加深，网络技术也持续推动着社会经济生活和文化方式的转变。第一代网络技术：构造基础互联网的起源可以追溯到1960年代的美国，美国国防部DAC(AdvanceResearchProjcetsAgency)为了军事
OSPF - 路由过滤的几种方法大丈夫立于天地间 hcie笔记智能路由器网络信息与通信学习网络协议算法
1.路由引入时过滤可以通过引入路由时使用路由策略来过滤掉不想要的路由在ASBR上配置，能够直接不产生对应的5类LSAimport[外部自治系统]route-policy[路由策略名]//引入时考虑路由策略例如我现在要过滤掉从ISIS区域引入的3.3.4.4[ABSR的OSPF进程下]importisis1route-policyI2O//引入时考虑路由策略I2Oroute-policyI2Oper
国自然青年项目｜基于多模态影像组学的乳腺癌分子分型预测研究｜基金申请·25-01-20 罗小罗同学基金申请医学人工智能人工智能国自然
小罗碎碎念今天和大家分享一份国自然青年项目，项目执行期为2021-2023年，直接费用为24万。项目聚焦乳腺癌分子分型预测，综合运用多模态组学数据、影像组学技术和深度学习技术。研究内容包括跨模态医学图像分割、多模态特征提取与融合、模型设计与系统研发。通过提出一系列创新算法，如基于类别中心原型对齐器的图像分割算法、基于自注意力机制与生成对抗网络的聚类算法等，实现了对乳腺癌分子分型的高精度预测，并开发
后端学习1.4： Mybatis-plus配置多租户 Congee_porridge 后端开发学习 mybatis java spring boot 后端
功能要求Mybatis-plus配置多租户。从header中的token获取租户信息；所有userController的数据库操作*不要*配置多租户，所有工作计划相关的数据库操作*需要*配置多租户，达成数据隔离。开发工具：IDEA技术：Springboot+MabtisPlus+Postman1、什么是多租户？多租户技术（多重租赁技术，简称saas），是一种软件架构技术；可以实现同一套程序下用户数
linux服务器中的rinted端口转发yum源代理设置 Waylen_Wu 网络服务器 linux centos 运维
内网服务器统一通过可访问公网的服务器代理端口转发使用yum源文章目录前言一、国内yum源一、公网服务器rinted代理安装二、公网服务器rinted使用说明1.rinted编辑配置2.启动程序3.需要注意三、内网服务器yum源设置1.先备份源yum源2.植入网易163yum源四、修改内网服务的hosts五、内网服务器验证yum源是否正常1.ping通mirrors.163.com2.yum源正常使
Java的DatagramPacket在C#中体现 hh_fine c#java
C#创建UDP客户端和服务端在C#中，DatagramPacket是Java中用于UDP通信的一个类，而C#并没有直接对应的DatagramPacket类。不过，C#提供了类似的机制来处理基于UDP的数据报（datagram）通信，主要通过System.Net.Sockets命名空间中的UdpClient和Socket类来实现使用UDP客户端发送UdpClient是相对于Socket更高级的类，适
CMD批处理命令入门（7）——if 条件语句跑不了的你 Windows驱动 windows ddos microsoft
CMD批处理命令入门（7）——if条件语句本章主要内容判断两个字符串是否相等判断两个数值是否相等判断判断驱动器，文件或文件夹是否存在，判断变量是否已经定义，判断上个命令的反回值，本章主要内容5种if语句的基本语法：判断两个字符串是否相等，if"字符串1"=="字符串2"command语句;判断两个数值是否相等，if数值1equ数值2command语句；判断判断驱动器，文件或文件夹是否存在，ifex
CMD批处理命令入门（1）——echo,rem,cd,dir 跑不了的你 Windows驱动 ddos windows microsoft
CMD批处理命令入门（1）——echo,rem,cd,dir本章内容包含显示信息：echo输出提示信息关闭该命令的回显打开回显或关闭回显功能输出空行，即相当于输入一个回车答复命令中的提问建立新文件或增加文件内容rem目录切换：cd同一个分区的切换不同分区的切换CD的另一个用途：显示当前的完整路径，一般用通过%cd%加以引用。列文件名：dir列出`c:\windows`下的目录及文件列出`c:\`下
后端开发面试题6（附答案）来年定当除暴安良面试面试跳槽后端 golang
前言在下首语言是golang，所以会用他作为示例。原文参见@arialdomartini的:Back-EndDeveloperInterviewQuestions分布式系统相关问题1.怎么测试一个分布式系统？测试分布式系统是一项复杂且具有挑战性的任务，因为它涉及到多个组件在不同的网络环境和硬件设施上的协同工作。以下是一些测试分布式系统的关键步骤和方法：单元测试：对分布式系统中的每个独立模块进行单元
【MyBatis-Plus】实现多租户功能会飞的猪ϵ( 'Θ' )϶ spring cloud微服务 mybatis 数据库 java
一、引言多租户是一种软件架构技术，在多用户的环境下，共有同一套系统，并且要注意数据之间的隔离性。举个实际例子：小编曾经开发过一套H5程序，这套程序应用在不同医院的APP上，当医院患者下载医院APP，并且进入相对应的H5页面，APP则会把用户相关数据传输到小编这里。在传输的时候需要带上医院标识（租户ID），以便小编将数据进行隔离。当不同的租户使用同一套程序，这里就需要考虑一个数据隔离的情况。数据隔离
文献综述相关ChatGPT提示词分享 AIWritePaper官方账号 Prompt ChatGPT AIWritePaper chatgpt 人工智能数据分析 AIGC 信息可视化数据挖掘 prompt
文献综述ChatGPT可以帮助提高文献综述的有效性和全面性。ChatGPT可以高效搜索和审查与宝子们课题研究相关的文献资料来源。一些给力的插件工具还可以帮助您总结复杂的研究论文并提取信息以更快更好地消化信息。合理的运用ChatGPT和GPTs可以提高文献综述的清晰度和质量，使其更加全面和有洞察力。文献综述提示词*131.在[人工智能相关]领域中，主要发现有哪些？2.在[人工智能相关]领域中，引用次
【python | pip list】pip list导入与导出苹榆枫 #深度学习框架 pip python linux
1.导出#查看当前安装的包piplist#导出当前安装的包记录pipfreeze>./requirements.txt2.导入#用anaconda创建一个虚拟环境condacreate-npy37python=3.7#激活当前py37环境MAC/Linux:sourceactivatepy37WIndows:activatepy37#导入安装之前的包列表pipinstall-r./requirem
【AI | python】functools.partial 的作用苹榆枫 #深度学习框架人工智能 python
在代码中，partial是Pythonfunctools模块中的一个方法，用于固定函数的某些参数并返回一个新的函数。这个新的函数可以像原函数一样调用，但固定的参数不需要再次提供。代码中：self.compute_cis=partial(compute_axial_cis,dim=self.internal_dim//self.num_heads,theta=rope_theta)这里partial
下完安装好python后，想查看python的安装位置的几种方法 omofun5541 python 开发语言
查看python的路径基于windows系统，按下win+r（也就是命令提示符），输入cmd，进入查看当前的python的版本的话输入python-V1，查看当前下载的python类型和路径则可以输入py-0(加*的是你使用python的默认版本)2，还可以使用命令wherepython查看路径（这样就不会显示你python默认使用的是哪个）小技巧：如果想清除命令行的话可以输入命令cls然后ent
omfun官方版网页版下载-omofun官方版2024安卓IOS下载 omofun5541 omofun动漫 omofun 动漫 ios 动画安卓 windows
omofun关于“ROOT苹果手机”的说法实际上是一个误解，omofun动漫因为“ROOT”这个术语通常指的是获取Android设备的超级用户权限，omofun漫画而苹果手机（iPhone）使用的是iOS操作系统，获取超级用户权限的过程被称为“越狱”（Jailbreak）。omfun官方版app最新版本版下载：http://om.aunbaidu.com/下面是一篇关于如何越狱苹果手机的文章，介绍
深入浅出 SQLSugar：快速掌握高效 .NET ORM 框架 m0_74823595 .net
SQLSugar是一个高效、易用的.NETORM框架，支持多种数据库（如SQLServer、MySQL、PostgreSQL等）。它提供了丰富的功能，包括CRUD操作、事务管理、动态表名、多表联查等，开发者可以通过简单的链式操作实现复杂的数据库逻辑。本文将以完整的示例，详细介绍SQLSugar的安装、配置和功能使用，适用于.NETFramework和.NETCore项目。一、SQLSugar简介1
足球俱乐部管理系统（11293） codercode2022 spring boot spring cloud 后端 hibernate 架构 laravel actionscript
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发
Bootstrap UI 编辑器：简化前端开发的利器 lsx202406 开发语言
BootstrapUI编辑器：简化前端开发的利器引言在当今的网页设计和开发领域，Bootstrap已经成为了一个非常流行的前端框架。它以其响应式设计、简洁的代码和丰富的组件库而受到广大开发者的喜爱。然而，对于一些非技术背景的设计师或者初学者来说，直接使用Bootstrap可能会有一定的难度。这时，BootstrapUI编辑器就成为了他们的救星。本文将详细介绍BootstrapUI编辑器的概念、特点
Python3 环境搭建指南 lly202406 开发语言
Python3环境搭建指南1.引言Python是一种广泛使用的高级编程语言，以其简洁明了的语法和强大的功能而闻名。Python3是Python的最新版本，它在Python2的基础上进行了大量更新和改进。本指南将详细介绍如何在您的计算机上搭建Python3环境，以便您可以开始编写和运行Python程序。2.系统要求在开始安装Python3之前，请确保您的计算机满足以下最低系统要求：操作系统：Wind
【python自动化运维】python第三方运维模块应用 leo__programmer python自动化运维运维 python 自动化
一、pymysql模块——数据库编程1、介绍第三方模块作用:连接MySQL数据库1.1、操作流程创建数据库连接基于连接创建游标cursor数据库读写操作关闭游标关闭数据库连接2、pymysql模块的使用2.1、准备工作准备MySQL数据库安装pymysql模块pipinstallpymysql安装配置MySQL数据库[root@localhost~]#yuminstall-ymariadb-ser
一文学习python中编码和解码科雷learning python编程 python 开发语言
学习目录1什么是编码和解码2编解码基本原理3python的默认编码4什么是10进制/2进制/8进制/16进制？5python的字符串编解码5.1使用str.encode()编码，str.decode()解码5.2解码的乱码问题5.316进制字符串转为普通字符串6python字符串和unicode类型编码转换什么是编码和解码大家都知道计算机是二进制的世界，计算机系统只能识别数字0和1组成的一串串的数
张丽霞：对地址转换（NAT）的回顾与反思 junecauzhang 软件综合 internet 互联网网络防火墙工作 transactions
张丽霞：对地址转换（NAT）的回顾与反思PostedonFebruary24,2009byDuanHaixin作者简介：张立霞，美国UCLA计算机系教授，互联网体系结构委员会（IAB）委员，IETFIRTFRoutingResearch工作组副主席（co-chair）,ACM会员（Fellow）,曾担任ACMSIGCOMM副主席(1999-2003),IEEECommunicationSociet
使用 PyTorch 从头开始构建您自己的 Llama 3 架构子然在打码 pytorch llama 人工智能
https://www.aisolink.com/build-your-own-llama-3-architecture-from-scratch-using-pytorch全文摘要本文提供了一个详细的指南，介绍如何使用PyTorch从头开始构建Llama3模型的完整架构，并对自定义数据集进行训练和推理。文章涵盖了构建输入块、解码器块和输出块的步骤，并提供了相应的代码示例。最终目标是构建一个功能齐
ZYNQ + Linux jerwey linux zynq
ZYNQLinux操作系统移植说明文档http://xilinx.eetrend.com/content/2019/100018437.html1，组成ZYNQ上面移植Linux操作系统包括四个部分，uboot,devicetree,kernel,ramdisk.其中uboot类似于bios，负责对设备进行简单的初始化，devicetree以树的形式对zynq相连的硬件设备进行描述，kernel是
已知域名如何知道网站的ip hunter206206 网络 tcp/ip 网络协议网络
已知域名获取网站IP的方法如下：1.使用ping命令Windows:打开命令提示符，输入pingexample.com，查看返回的IP地址。macOS/Linux:打开终端，输入pingexample.com，查看返回的IP地址。2.使用nslookup命令Windows/macOS/Linux:在命令提示符或终端中输入nslookupexample.com，查看返回的IP地址。3.使用dig命令
paimon中的Branch qzWsong paimon 大数据数据库
Branchhttps://paimon.apache.org/docs/0.9/maintenance/manage-branches/paimon借鉴了git的管理机制，在我们开发代码的时候，为了不影响主分支的功能，我们一般会新建一个分支进行迭代，待新分支完善后，合并回主分支，在新的分支做任何数据操作都不会影响主分支。在paimon中，我们也可以对表创建分支，相当于在当前数据状态下复制出来了一
C语言编程数据结构编程练习-顺序栈的操作墨楠。 #C 语言数据结构研习汇 C c语言数据结构开发语言
#define_CRT_SECURE_NO_WARNINGS#include#include#include#include#include#defineMAX_SIZE20//通过数组的方式创建顺序栈出栈，入栈等操作typedefintelementType;typedefstructstack{elementTypedata[MAX_SIZE];inttop;//栈顶intbottom;//栈
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include