xor0ne_10_01

初入python01之爬虫小蜘蛛

Contens

- 第四周
- - 1、爬虫的基本流程有：
  - - 1.1、Request（请求）
    - 1.2、Response（响应）：
- 第五周：
- - *知识拓展：*
  - - 1、HTML（超文本标记语言）
    - 2、XHTML是更纯净更严格的HTML代码
- 第六周：
- - 1、Xpath:
  - - - 1、Xpath术语
        
        2、节点关系
        
        3、Xpath语法：
        
        4、Xpath轴
        
        5、Xpath的用法
        
        6、Xpath实例
  - 2、XSLT（扩展样式表语言）

第四周

	要学习爬虫，那么就先理解一下爬虫到底是什么。
	首先我们作为用户获取网络数据的方式：

方式1：浏览器提交请求—>下载网页代码—>解析成页面
方式2：模拟浏览器发送请求(获取网页代码)->提取有用的数据->存放于数据库或文件中
而爬虫要做的便就是方式2，爬虫,正如它的英文名字一般Web Spider（网络蜘蛛）,指爬在互联网这张大网上的一只小蜘蛛吧！这只小蜘蛛沿着网络不断的抓取自己想吃的猎物（数据），即不断地向网站发起请求，获取资源后，进行分析并提取有用的数据。

1、爬虫的基本流程有：

（1）、发送请求：通过HTTP库（这个概念不太清楚）向目标站点发起请求，即发送一个Request，然后等待服务器接受并响应。
（去网站上搜索了HTTP的相关知识，虽然看不懂，但是总会用到的，嘿嘿
网站链接为：http://www.runoob.com/http/http-messages.html）
（2）、获取响应内容：如果服务器能正常响应，我们将得到一个Response;即服务器接收客户端的请求，通过解析发送给浏览器网页HTML文件。
（3）、解析内容：
解析html数据：正则表达式（RE模块），第三方解析库如Beautifulsoup，pyquery等
解析json数据：json模块
解析二进制数据:以wb的方式写入文件
这一步相当于浏览器把服务器端的文件获取到本地，再进行解释并且展现出来。（这个东西有点迷糊，现在还接受不了，就暂且复制过来吧。）
（4）、保存数据：
保存方式：可以把数据存为文本，也可以把数据保存到数据库里面或者存为特定的jpg,mp4等格式的文件。相当于我们在浏览网页时，下载了网页上的图片、视频、网页文本等数据。

1.1、Request（请求）

Request：浏览器—>>服务器。
模拟用户使用浏览器向服务器发送搜索信息
浏览器向该网站服务器发送信息的过程，叫做HTTP Request
请求方式：主要类型GET、OST（这个不太理解）
请求URL：URL 全称是统一资源定位符，也就是我们说的网址。比如一张图片，一个音乐文件，一个网页文档等都可以用唯一URL来确定，它包含的信息指出文件的位置以及浏览器应该怎么去处理它。
请求头(Request Headers)：请求头包含请求时的头部信息，如User-Agent（指定浏览器的请求头）信息。模拟用户使用浏览器向服务器发送搜索信息

1.2、Response（响应）：

Response：服务器—>>浏览器。
当用户发送搜索信息之后，服务亲根据用户所需作出回应，发送相关信息
服务器收到浏览器发送的信息后，能够根据浏览器发送信息的内容，做出相应的处理，然后把消息回传给浏览器（返回一个包含HTTP状态码的信息头用以响应浏览器的要求），这个过程就叫做HTTP Response。
响应状态：多种响应状态。（HTTP状态码主要是为了表示此次HTTP请求的运行状态）

这个是在学习HTML是看见的关于状态码的相关解释：https://www.runoob.com/tags/html-httpmessages.html

例如：200代表成功，301 跳转页面，表示资源（网页等）被永久转移到其他URL（永久重定向），302表示资源（网页等）被临时转移到其他URL（临时重定向），304资源（网页等）没有更新，403表示无权限访问，404 表示找不到页面，502（也有说502）表示服务器错误，503由于临时的服务器维护或者过载，服务器当前无法处理请求
响应头(Response Headers)：比如内容类型，内容长度，服务器信息，设置Cookie等；（这边不了解）
响应体：响应体最主要的部分，包含了请求资源的内容，比如网页 HTML 代码，图片二进制数据等。
Request和Response

import requests #导入requests库，运行前需要进行安装

#模拟成浏览器访问的头，注意 ‘ 单引号 ’ ，内容应该都在单引号里面，否则会报错
#关于具体的模拟方法目前对于网站内容还是有点难理解
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
resp = requests.get('https://www.baidu.com',headers=headers)
print(resp.text) # 打印出网页源代码
print(resp.status_code) # 打印出状态码

运行成功后可以看到打印出来的 html 源代码和 200 状态码了。这就基本上实现了爬虫的Request和Response的过程
注PS：偶然看见到urllib.requests.Requests( )的知识，虽然我只能看出来和这个程序有点关，但是也算一点收获啦。内容见下：
（1）、HTTP头部信息：有众多的头域组成，每个头域=一个域名+冒号（：）+域值
域名是大小写无关的，域值前可以添加任何数量的空白符，头域可以被扩展为多行，在每行开始处只用至少一个空格或制表符。
Request Header：在请求头中可能包含以下内容：
GET代表的是请求方式（常用请求方式为：GET和POST，虽然百度讲了一大段，然而我依旧不知道他讲了啥）
U-ser-Agent头域，里面包含发出请求的用户信息，其中有使用浏览器的型号，版本，和操作系统的信息。这个头域经常用来做反爬虫的措施。
Host头域，Accept请求报头域，Accept-Language,Accept-Encoding,Connection这些头域等于到了再仔细研究吧。

urllib.request.Request( url[ ,date ][,headers] [ ,oringin-req-host ] [ ,unverifiable ] )这是一个urllib的抽象类，用于构造一个http请求对象实例。
url参数必须是一个有效的url字符串，header参数就是发送给网页服务器的请求头信息，也是用字典来创建的请求报头，但是不需要转换，直接赋值即可。
geturl（）返回资源所在的url
info( )返回响应头的信息，返回响应状态码
getcode（）返回响应状态码

第五周：

想试着按照网站上的代码爬取一些东西，便在网站上找了一个爬取小说的视频去爬取赶集网，前面的步骤以及得出的结果，是一样的，但是到利用正则表达式的时候却不一样了，如下：
由于之前没有接触过关于正则表达式的东西，同学给我解释错误原因的时候，有点蒙圈了，然后他就建议我去看一下Xpth。
首先，Xpth定义：

XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。
XPath 标准函数
XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。

在查询的时候遇到了很多的知识点，在此先列出来吧，怕以后忘了。

知识拓展：

1、HTML（超文本标记语言）

（1）、定义：用来描述网业的一种标记语言，即它是一套标记标签。
（2）、标记标签：由尖括号包围的关键词例如：
通常成对出现，例如和，并且这一对标签对中，第一个是开始标签，第二个是结束标签，也说开放标签和闭合标签
（3）、HTML文档：包含HTML标签和纯文本，用来描述网页，但也被称作网页。
（4）、HTML统一资源定位器：URL（即网址的地址），Web浏览器通过URL从web服务器请求页面

所遵守的规则：
scheme://host.domain:port/path/filename
解释：
scheme - 定义因特网服务的类型。最常见的类型是 http
host - 定义域主机（http 的默认主机是 www）
domain - 定义因特网域名，比如 w3school.com.cn
:port - 定义主机上的端口号（http 的默认端口号是 80）
path - 定义服务器上的路径（如果省略，则文档必须位于网站的根目录中）。
filename - 定义文档/资源的名称

（5）、HTML小结：
把HTML的所有内容大致看了一遍，感觉它似乎就是网页版的Word，word有界面提供给我们编辑，而HTML是利用代码进行编辑，从而得到我们想要的界面。在此先列出一些主要的知识吧，以免以后又忘记了。

HTML基础标签，文本格式化，表格、框架、列表、超链接、图像、背景
当你需要输入一篇文章时，可以利用HTML基础标签给文章进行排版；例如首先给主题进行标注，并且居中；如果需要的话，它还可以进行横线标注；之后，对于段落，进行排版，折行、空行、换行等等都是可以的；对于某些重要的知识点还可以进行添加背景色。为了方便编写者检查代码，它还可以隐藏标注而不显示出来。当遇到特殊的文本时（如计算机代码），可以用文本格式化进行特殊编码，达到突出效果；对于某些好的图片，及网站资源参考，可以利用连接的方式进行插入（图片还可以直接插入）；
框架、表格、列表分别是指当你写一个界面时，如果需要把他划分成几个模块，便可以利用框架进行划分，而表格所指的和excel中的表格基本相同。并且，当需要对内容进行分点时，便可利用列表进行编码。
大致的基本就这么多了，额，其他的等用到的时候再添加吧。

2、XHTML是更纯净更严格的HTML代码

定义：可扩展的超文本标签语言
他的目标是取代HTML，作为XML应用，通过把 HTML 和 XML 各自的长处加以结合，我们得到了在现在和未来都能派上用场的标记语言 - XHTML，

下面是刚刚编写的一段小代码，颜色框架之类的还有不太清楚，所以没有加上去，目前只能下到这了，稍复杂一点比如登入界面等后续慢慢编写吧，今天就先编这个吧。

 
 


 
 华东交通大学简介
 
 
 
 
 
 
 
 
 
  联系我们
  站点地图
 
 
  
  ::关于华东交大::
  
  创办时间:

  -1971年9月 

  
  
  
   学校概况:
   华东交通大学（East China Jiaotong University），粗体
   
位于江西省会南昌，大号文字
   是一所以工为主，着重文字
   经、管、文、理、法、教育、艺术等斜体
   多学科协调发展，小号文字
   以交通为特色、轨道为核心的加重语气
   教学研究型大学，_下标
   江西省属重点大学，^上标
   是中国铁路总公司,下划线
   国家铁路局与江西省人民政府共建高校.删除线

编译界面：

第六周：

1、Xpath:

XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。

1、Xpath术语

（1）、节点：
在Xpath中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档节点（又被称之为根节点）。XML文档又被作为节点树来对待。
**（2）、基本值（**或称原子值，Atomic value）
基本值是无父或无子节点。
（3）、项目（Item）：项目是基本值或者节点

2、节点关系

（1）、父：每个元素都有一个父
（2）、子：元素节点可能有零个、一个或多个子
（3）、同胞：拥有相同父的节点
（4）、先辈（Ancestor）：某节点的父、父的父，等等
（5）、后代（Descendant）：某节点的子、子的子等等

3、Xpath语法：

（1）、选取节点：Xpath:使用路径表达式来选取XML文档中的节点或者节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

（2）、谓语（Predicates）：位于用来查找某个特定的节点或者包含某个指定的值的节点。（谓语被嵌在方括号中）
（3）、选取未知的节点：xpath通配符可用来选取位置的XML元素。

（4）、选取若干路径：通过路径表达式中使用 “|” 运算符，可以选取若干个路径。

4、Xpath轴

（1）、轴可定义相对于当前节点的节点集。

（2）、位置路径表达式：可以是绝对的也可以是相对的。

5、Xpath的用法

（下面为引用百度上的模板，由于对于路径的了解得不够深入，所以就先把方法复制下来，以便日后有料可寻）

1、XPATH使用方法
使用XPATH有如下几种方法定位元素（相比CSS选择器，方法稍微多一点）：

a、通过绝对路径定位元素（不推荐！）
WebElement ele = driver.findElement(By.xpath("html/body/div/form/input"));

b、通过相对路径定位元素
WebElement ele = driver.findElement(By.xpath("//input"));

c、使用索引定位元素
WebElement ele = driver.findElement(By.xpath("//input[4]"));

d、使用XPATH及属性值定位元素
WebElement ele = driver.findElement(By.xpath("//input[@id='fuck']"));
//其他方法(看字面意思应该能理解吧)
WebElement ele = driver.findElement(By.xpath("//input[@type='submit'][@name='fuck']"));
WebElement ele = driver.findElement(By.xpath("//input[@type='submit' and @name='fuck']"));
WebElement ele = driver.findElement(By.xpath("//input[@type='submit' or @name='fuck']"));

e、使用XPATH及属性名称定位元素
   元素属性类型：@id 、@name、@type、@class、@tittle
//查找所有input标签中含有type属性的元素
WebElement ele = driver.findElement(By.xpath("//input[@type]"));

f、部分属性值匹配
WebElement ele = driver.findElement(By.xpath("//input[start-with(@id,'fuck')]"));//匹配id以fuck开头的元素，id='fuckyou'
WebElement ele = driver.findElement(By.xpath("//input[ends-with(@id,'fuck')]"));//匹配id以fuck结尾的元素，id='youfuck'
WebElement ele = driver.findElement(By.xpath("//input[contains(@id,'fuck')]"));//匹配id中含有fuck的元素，id='youfuckyou'

g、使用任意值来匹配属性及元素
WebElement ele = driver.findElement(By.xpath("//input[@*='fuck']"));//匹配所有input元素中含有属性的值为fuck的元素
元素定位总结

步的语法：
轴名称::节点测试[谓语]

6、Xpath实例

以下内容转自：https://blog.csdn.net/qq_33472765/article/details/80672281
（感觉之前虽然看过一遍了，但似乎依旧记不住，还老是忘记了）
HTML文件：

将一个HTML文件解析为对象
（1）、首先导入

# element tree: 文档树对象

from lxml.html import etree

（2）、将HTML解析为对象

#方式一：使用较多
	obj= etree.HTML("index.html")
 
#方式二：
	obj = etree.parse('index.html')
 
	print(type(obj))

（3）、开始查找元素或数据：

注意：

1、 //ul: 从obj中查找ul，不考虑ul所在的位置。【// 定向查找某一个标签】
2、/li: 找到ul下边的直接子元素li，不包含后代元素。【/查找某一个标签对应的子节点】

list1 =  html.xpath('//ul//a')	 #[ //xx//yy   查找xx标签的yy子孙 ] 显然并没有
list2  = html.xpath('//li/a') 	 
	#[  /  查找某一个标签对应的子节点] 定向查找所有 标签下的 标签

3、 [@class=“one”]: 给标签设置属性，用于过滤和筛选
4、xpath()返回的是一个列表：比如

one_li = obj.xpath('//ul/li[@class="one"]')[0]

获取 one_li 的文本内容

one_li = obj.xpath('//ul/li[@class="one"]')[0]	#shu'xing'guo'lü
print(one_li.xpath('text()')[0])	#打印文本
  
# 上述写法的合写方式
print(obj.xpath('//ul/li[@class="one"]/text()')[0])

获取所有 li 文本的内容：

	all_li = obj.xpath('//ul/li/text()')

获取所有li的文本内容以及class属性的值：

all_li = obj.xpath('//ul/li')
for li in all_li:
    class_value = li.xpath('@class')[0]
    text_value = li.xpath('text()')[0]
    print(class_value, text_value)

list0 = html.xpath('//a[@href="link4.html"]/../@class')
#[@xxxx]用于指定属性,满足属性的才能被查找到
#第二个@是 取出结果的 @属性，如果没这个'@class'，得到的直接是一个父亲标签 
#/../和/parent::*/ 用于向父节点回查

获取div标签内所有文本

注意：
//text()：获取所有后代元素的文本内
/text()：获取直接子元素的文本，不包含后代元素

print(obj.xpath('//div[@id="inner"]//text()'))

获取第一个li [1] ([1]：第一个 li ）中的文本

print(obj.xpath('//ul/li[1]/text()'))

查找类名中包含four的li的文本内容：

print(obj.xpath('//ul/li[contains(@class, "four")]/text()'))

xpath 获取标签内的 text ， href

/li/a/@herf 这样取的应该是herf的内容
/li/a/text() 这样取得是text内容

2、XSLT（扩展样式表语言）

你可能感兴趣的:(书中不求甚解)

推荐学习图像处理的入门书：《Python图像处理实战》天飓学习感悟学习图像处理 python
《Python图像处理实战》是一本全面介绍Python图像处理技术的实用指南，是由人民邮电出版社于2020年12月出版。这本书的作者桑迪潘·戴伊是一位兴趣广泛的数据科学家，主要研究机器学习、深度学习、图像处理和计算机视觉。在《Python图像处理实战》一书中，作者主要介绍了如何用Python图像处理库（如PIL、python-opencv、Scipy等），机器学习库（scikit-learn）和深
掌握高级Stamp编程技术：实时时钟、浮点运算与脉冲计数一筐猪的头发丝 BASIC Stamp 实时时钟浮点数学脉冲计数编程技巧
掌握高级Stamp编程技术：实时时钟、浮点运算与脉冲计数背景简介本文基于《TheNutsandVoltsofBASICStamps》一书中的第36章节内容，探讨了高级Stamp编程技术，包括如何在不具备实时时钟的BASICStamp上实现时钟功能，进行浮点数学的简单模拟，以及在多个引脚上同时计数脉冲。这些高级技巧对于开发复杂的Stamp应用程序至关重要。实时时钟的实现BASICStamp不具备内置
2024年最新Android Jetpack Compose开发指南及实战教程_jetpack compose pdf 2401_86391835 android jetpack pdf android
这里免费分享一份阿里P7架构师和谷歌技术团队共同整理的JetpackCompose指南及实战教程，来帮助读者规划出从入门到精通的最佳学习路径。在对知识点细致的讲解之外，书中还穿插了大量示例代码和最佳实践，对于Compose的初/中级读者极具学习和参考价值。AndroidJetpackCompose开发应用指南第⼀章初识JetpackJetPack是什么JetPack和AndroidXAndroid
C++ 函数匹配重载函数的调用规则榛栗栗栗子 c++
学习《C++Primer》一书中，函数匹配这一节内容信息较多，现截取重点内容记录于此。便于你对本文内容更好的理解，你需对类型提升、算术类型转换以及顶层cosnt，底层const有一定的了解。多数情况下，我们可以很容易的判断出该会调用哪一个重载函数，例如，调用的重载函数之间形参数量不同，形参的类型有明显的区别等。但是，当几个重载函数形参数量相等、具有默认形参以及形参又可以发生类型转换时，判断会调用哪
new操作中发生了什么？木头没有瓜 js
比较直观的感觉，当我们new一个构造函数，得到的实例继承了构造器的构造属性(this.name这些)以及原型上的属性。在《JavaScript模式》这本书中，new的过程说的比较直白，当我们new一个构造器，主要有三步：•创建一个空对象，将它的引用赋给this，继承函数的原型。•通过this将属性和方法添加至这个对象•最后返回this指向的新对象，也就是实例（如果没有手动返回其他的对象）例子，大概
LLM大语言模型书籍教程推荐：《大模型时代》+《开源大模型食用指南》！附文档 Langchain 人工智能 langchain 大模型自然语言处理大语言模型 LLM AI大模型
哈喽大家好！很久都没有更新大模型这块的书了，今天给大家说一下这本：《大模型时代》，本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。《本书》深入探讨了大型模型时代的技术演进、应用场景和产业变革。生动地阐释了ChatGPT背后的工作原理，深入解析了这一推动技术和产业变革的关键力量书中对国内外大型模型产业的布局和发展趋势进行了剖析，并对潜在的风险和泡沫进行了预警。作者简介龙志勇：曾任阿里巴
03 手把手教你理解Vue Router核心原理（附实战代码）泯泷 Vue2 快速入门 ui html5 css3 前端前端框架 Vue vue.js
一、前端路由的魔法原理想象你在一本魔法书中翻页，页面内容会变化但书本本身不会重新印刷。前端路由就是这样的魔法，当我们在单页应用（SPA）中切换页面时：不会触发真正的页面刷新页面内容通过JavaScript动态更新URL会同步变化反映当前状态二、三种路由模式大比拼1.Hash模式（默认模式）工作原理：利用URL中的#符号（锚点）实现路由切换//创建路由实例import{createRouter,cr
利用gensim生成词袋模型（基于频次和基于TF-IDF） weixin_50291342 文本表示自然语言处理 python 机器学习
前言参考文献：胡盼盼编著.自然语言处理从入门到实战[M].中国铁道出版社,2020.最近在学习文本表示的一种最简单方式——词袋模型，书中给出了使用gensim生成词袋模型的代码，原代码就来自于这本书，我加了一些注释，方便理解代码。一、引入库fromgensim.modelsimportTfidfModelfromgensim.corporaimportDictionaryimportjieba二、
基于 Python 的云笔记平台分析与设计程序员奇奇计算机毕设 Python 云笔记毕业设计
完整代码：https://download.csdn.net/download/qq_38735017/873824351前言1.1背景苏联著名教育学家苏霍姆林斯基说得好：“如果学生的智力生活仅局限于教科书，如果他做完了功课就觉得任务已经完成，那么他是不可能有自己特别爱好的。”每一个学生要在书籍的世界里，有自己的生活。把读书，应视为自己的乐趣。当每读完一本有意思的书时，很多时候都想把书中感触深刻亦
今晚直播，DeepSeek真的有意识了吗？｜DeepSeek十日谈 CSDN资讯人工智能
你是否曾凝视着ChatGPT，好奇Ta是否真的“听懂”了你的指令？你是否在科幻电影中，思考过机器人真的拥有情感吗？你是否惊讶于DeepSeek的分析过程，好奇它到底是「推理」还只是模拟人类思考的假象？这里不禁思考：AI是否真的有意识？在科幻巨著《云球》中，作者描绘了一个惊心动魄的未来——AI不再只是工具，而是拥有自我意识的存在。它们不仅能思考，还能创造，甚至形成自己的文明。书中预言，当AI的认知能
Oracle WebLogic Server管理实战指南悦闻闻
本文还有配套的精品资源，点击获取简介：《WebLogic管理指南》详细介绍了OracleWebLogicServer的管理方法，包括服务器与集群的启动、停止、监控、配置、故障排除等任务。书中探讨了节点管理器的使用、日志管理、安全配置、性能优化、应用部署与更新以及故障排查等核心知识，旨在帮助管理员提升管理效率和系统稳定性。1.WebLogic服务器管理概述在现代IT环境中，WebLogic服务器是企
故障处理软件需求_软件可靠性 weixin_39531229 故障处理软件需求
在《装备软件质量和可靠性管理》一书中，对JohnMusa定义的软件可靠性工程过程进行了改进，给出了软件可靠性工程框架——Ruan模型，描述了覆盖软件全生命周期的各项可靠性工程活动。软件可靠性工程模型-Ruan模型由于篇幅原因，本文仅简单介绍一下可靠性设计、可靠性参数的内容（其实是因为本人是个二把刀，很多东西也一知半解的原因^_^）。一、软件可靠性在《GB/T11457-2006信息技术软件工程术语
数据库第六章：索引及执行计划琴剑诗酒数据库
索引及执行计划索引的作用类似于一本书中的目录,通过索引可以快速定位到数据具体的物理存储位置，起到优化查询的作用。索引的分类(算法)**B树默认使用的索引类型(原型：平衡二叉树算法)R树HashFullTextGIS索引BTREE索引算法演变(了解)***B-叶子节点无水平指针B+叶子节点有水平指针，可以方便范围查询B*枝节点有水平指针，mysql当前默认Btree索引功能上的分类4.1聚集索引(唯
c语言中加减和移位,c中的移位运算 zhu cyrus c语言中加减和移位
C++位运算,看高手都是运用的灵活自如,打算从今天开始学习他!收藏每次看到位运算的地方,都比较迷糊.以前学习C的时候也不求甚解,到现在看来,觉得位运算和指针在C++基本知识里是最难理解,最难融会贯通的东西.尤其是位运算,用好了可以"出神入化"了^_^.如果当年好好学习C语言,也不至于今天这么费劲!位运算位运算的运算分量只能是整型或字符型数据，位运算把运算对象看作是由二进位组成的位串信息，按位完成指
政务、教育域名免费一年SSL证书申请 ssl证书https运维服务器
对于政务、教育域名免费一年SSL证书的申请，以下是一个详细的步骤指南，主要基于JoySSL这一知名的证书颁发机构（CA）：一、访问CA并注册账号免费一年SSL证书申请打开JoySSL的官方网站。点击右上角的注册按钮，注册一个属于自己的账号。在注册时，填写特定的注册码230922以激活免费证书的获取权限和安装指导。二、选择证书类型登录后，在“免费体验版”证书中找到教育版或者政务版。确认选择一年期免费
读go语言自制解释器（二）解析ast 陈墨1234 golang进阶之路源码学习 golang 开发语言后端
简介书中对这部分的介绍是对ast进行求值，但我感觉应该叫语义分析更加合适一点，单纯的ast是没有意义的，需要对其进行相关解析，生成符合自己需求的结果，才更加合适。符号表（应该算是）对象定义packageobjectimport("bytes""fmt""monkey/ast""strings")typeObjectTypestringconst(NULL_OBJ="NULL"ERROR_OBJ="
你有没有想过可以轻松学习C语言？《嗨翻C语言》全新学习方式(好书分享更新中) 苹果酱0567 面试题汇总与解析大数据课程设计 spring boot vue.js java
嗨翻C语言作者:[美]DavidGriffiths/[美]DawnGriffiths出版社:人民邮电出版社原作名:HeadFirstC译者:程亦超内容简介······你能从这本书中学到什么？你有没有想过可以轻松学习C语言？《嗨翻C语言》将会带给你一次这样的全新学习体验。本书贯以有趣的故事情节、生动形象的图片，以及不拘一格、丰富多样的练习和测试，时刻激励、吸引、启发你在解决问题的同时获取新的知识。你
数据库索引：秋招面试中的经典高频题目 [特殊字符](索引原理/操作/优缺点/B+树) Purified_Soda MySQL数据库 oracle 数据库 adb 学习 mysql SQL
在数据库的秋招面试中，索引（Index）是一个经典且高频的题目。索引的作用类似于书中的目录，它能够显著加快数据库查询的速度。本文将深入探讨索引的概念、作用、优缺点以及背后的数据结构，帮助你从原理到应用全面掌握这一重要知识点。什么是索引？在数据库中，索引是一种特殊的数据结构，用于加快查询操作的速度。当我们执行SELECT查询时，数据库默认会通过逐行扫描的方式来完成查询。例如，当我们使用WHERE语句
Python 高手编程系列二千零五十五：常见约定与实践杨琴1 python 开发语言
有一套部署的常见约定与实践，可能不是每个开发者都知道，但对做过运营的人来说都是显而易见的。正如在本章引言中所说，即使你不负责代码部署和运营，但了解其中一点内容也是很重要的，因为这可以让你在开发过程中做出更好的设计决策。文件系统层次结构可能出现在你脑海中最显而易见的约定可能就是关于文件系统层次结构和用户命名。如果你在本书中寻找这方面的建议，那你要失望了。当然，存在一个文件系统层次结构标准（Files
SystemVerilog变量的符号 pilxpi 功能测试
过年这几天，偷懒了，没有认真创作，但是素材收集了一些，今天专门聊聊变量的符号，我们只从书中的一个点来切入。引用《漫游》原文：从仿真器得到的结果是：如果按照有符号和无符号的类型划分，那么可以将常见的变量类型划分为：·有符号类型：byte、shortint、int、longint、integer。·无符号类型：bit、logic、reg、net-type（如wire、tri）。上文的“signed_v
Python 浅拷贝深拷贝 MIPS71 Python
看《流畅的Python》8.3节默认做浅拷贝，自己动手实践。书中提到的网站http://pythontutor.com是一个可视化编程的网站。csdn不支持图片粘贴，我也是服了，图片全没了。。。一、浅拷贝在http://pythontutor.com/visualize.html#mode=edit下输入：importcopyl1=[3,[66,55,44],(7,8,9)]l2=list(l1)
Uboot中外存MMC(sd/iNand等)驱动架构代码简单分析 IT悟物穷理IT uboot和系统移植
2020-7-519:50北京晴屋内开空调不知道外面啥情况一天没出屋外面貌似闷热吧！本文仅作为技术积累，方便日后查阅！作家格拉德威尔在《异类》一书中指出：“人们眼中的天才之所以卓越非凡，并非天资超人一等，而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件”。他将此称为“一万小时定律”。要成为某个领域的专家，需要10000小时，按比例计算就是：如果每天工作八个小时，一周工作五天
Python数据处理(一)：处理 JSON、XML、CSV 三种格式数据 solocoder222 Python python 数据处理 CodeRiver
Python数据处理系列博客来啦！本系列将以《Python数据处理》这本书为基础，以书中每章一篇博客的形式带大家一起学习Python数据处理。书中有些地方讲的不太详细，我会查阅其他资料来补充，力争每篇博客都把知识点涵盖全且通俗易懂。这本书主要讲了如何用Python处理各种类型的文件，如JSON、XML、CSV、Excel、PDF等。后面几章还会讲数据清洗、网页抓取、自动化和规模化等使用技能。我也是
《无人机DIY》——3.5 Brooklyn Aerodrome Flack weixin_33989780
本节书摘来异步社区《无人机DIY》一书中的第3章，第3.5节，作者：【美】JohnBaichtal（约翰贝克托），更多章节内容可以访问云栖社区“异步社区”公众号查看3.5BrooklynAerodromeFlackBrooklynAerodrome（brooklynaero.com）是纽约的一个用家用隔热材料（看起来像彩色的泡沫塑料，在图3.13中可以看到一个例子）制作无线遥控飞机的组织。Flac
大型语言模型构建指南：从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF AGI大模型学习语言模型 pdf 人工智能大模型大模型学习大模型教程大模型书籍
通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！一、构建大型语言模型（从头开始）在《构建大型语言模型（从头开始）》中，你将了解如何LLMs从内到外工作。在这本富有洞察力的书中，畅销书作家塞巴斯蒂安·拉施卡（SebastianRaschka）将指导你逐步创建自己的LLM，用清晰的文字、图表和示例解释每个阶段。你将从最初的设计和创建到通用语料库的预训练，一直到特定任
书籍推荐：《从零构建大型语言模型》附免费PDF下载大模型入门学习语言模型 pdf 人工智能产品经理大模型学习大模型教程大模型入门
通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！一、构建大型语言模型（从头开始）在《构建大型语言模型（从头开始）》中，你将了解如何LLMs从内到外工作。在这本富有洞察力的书中，畅销书作家塞巴斯蒂安·拉施卡（SebastianRaschka）将指导你逐步创建自己的LLM，用清晰的文字、图表和示例解释每个阶段。你将从最初的设计和创建到通用语料库的预训练，一直到特定任
awtk开发实践——学习篇28： image_animation（图片动画控件）惺忪牛犊子 #awtk c语言嵌入式
说明：本文章旨在总结备份、方便以后查询，由于是个人总结，如有不对，欢迎指正；另外，内容大部分来自网络、书籍、和各类手册，如若侵权请告知，马上删帖致歉。 QQ群号：513683159【相互学习】内容来源：官方的手册（免费获取）Pxx=该手册的对应页码xx github-awtk控件说明关于image_animation_t控件（图片动画控件）介绍，对应书P164。(书中还有更详细内容
用HTML写一首绝句古诗,《绝句二首》_杜甫的诗词_诗词名句网 Artemis Lee 用HTML写一首绝句古诗
作品赏析迟日江山丽，春风花草香。泥融飞燕子，沙暖睡鸳鸯。清代的诗论家陶虞开在《说杜》一书中指出，杜集中有不少“以诗为画”的作品。这一首写于成都草堂的五言绝句，就是极富诗情画意的佳作。诗一开始，就从大处着墨，描绘出在初春灿烂阳光的照耀下，浣花溪一带明净绚丽的春景，用笔简洁而色彩浓艳。“迟日”即春日，语出《诗经·豳风·七月》“春日迟迟”。这里用以突出初春的阳光，以统摄全篇。同时用一“丽”字点染“江山”
《动手学深度学习》(PyTorch版) chaser&upper 深度学习 pytorch 深度学习 python
《动手学深度学习》PyTorch版前言简介面向人群食用方法方法一方法二方法三目录原书地址引用阅读指南前言读书啦！！！本项目将《动手学深度学习》原书中MXNet代码实现改为PyTorch实现。原书作者：阿斯顿·张、李沐、扎卡里C.立顿、亚历山大J.斯莫拉以及其他社区贡献者，GitHub地址：https://github.com/d2l-ai/d2l-zh此书的中英版本存在一些不同，针对此书英文版的P
蓝桥云课 | 图书管理员 Mryan2005 #蓝桥那些事算法数据结构开发语言 c++蓝桥云课
题目描述图书馆中每本书都有一个图书编码，可以用于快速检索图书，这个图书编码是一个正整数。每位借书的读者手中有一个需求码，这个需求码也是一个正整数。如果一本书的图书编码恰好以读者的需求码结尾，那么这本书就是这位读者所需要的。小D刚刚当上图书馆的管理员，她知道图书馆里所有书的图书编码，她请你帮她写一个程序，对于每一位读者，求出他所需要的书中图书编码最小的那本书，如果没有他需要的书，请输出-1。输入描述
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他