pypypypy

从Python安装到语法基础，这才是初学者都能懂的爬虫教程

Python和PyCharm的安装：学会Python和PyCharm的安装方法

变量和字符串：学会使用变量和字符串的基本用法

函数与控制语句：学会Python循环、判断语句、循环语句和函数的使用

Python数据结构：理解和使用列表、字典、元组和集合

Python文件操作：学习使用Python建立文件并写入数据

Python面向对象：了解Python中类的定义和使用方法

01 Python与PyCharm安装

“工欲善其事，必先利其器”，本节介绍Python环境的安装和Python的集成开发环境（IDE）PyCharm的安装。

Python安装（Windows、Mac和Linux）

当前主流的Python版本为2.x和3.x。由于Python 2第三方库更多（很多库没有向Python 3转移），企业普遍使用Python 2。如果作为学习和研究的话，建议使用Python 3，因为它是未来的发展方向。所以本教程选择Python 3的环境。

1.1 Windows中安装Python 3

在Windows系统中安装Python 3，请参照下面的步骤进行。

打开浏览器，访问Python官网（https://www.python.org/）。

光标移动至Downloads链接，单击Windows链接。

根据自己的Windows版本（32位或64位），下载相应的Python 3.5版本，如为Windows 32位系统，应下载Windows x86 executable installer，如果为Windows 64位系统，应下载Windows x86-64 executable installer。

单击运行文件，勾选Add Python 3.5 to PATH，然后单击Install Now按钮即可完成安装。

在计算机中打开命令提示符（cmd）窗口，输入python，如图1.1所示，说明Python环境安装成功。

▲图1.1 运行Python环境
当界面出现提示符>>>时，就表明进入了Python交互式环境，输入代码后按Enter键即可运行Python代码，通过输入exit()并按Enter键，就可以退出Python交互式环境。

注意：如果出现错误，可能是因为安装时未勾选Add Python3.5 to PATH选项，此时卸载Python后重新安装时勾选Add Python3.5 to PATH选项即可。

1.2 Mac中安装Python3

Mac系统中自带了Python 2.7，需到Python官网上下载并安装Python 3.5。Mac系统中的安装比Windows更为简单，一直单击“下一步”按钮即可完成。安装完后，打开终端并输入python3，即可进入Mac的Python 3的交互式环境。

1.3 Linux中安装Python 3

大部分Linux系统内置了Python 2和Python 3，通过在终端输入python –version，可以查看当前Python 3的版本。如果需要安装某个特定版本的Python，可以在终端中输入：

sudo apt-get install python3.5

PyCharm安装

安装好Python环境后，还需要安装一个集成开发环境（IDE），IDE集成了代码编写功能、分析功能、编译功能和调试功能。在这里向读者推荐一个最智能、好用的Python IDE，叫做PyCharm。进入PyCharm的官网，下载社区版即可：

http://www.jetbrains.com/pycharm/

由于PyCharm上手极为简单，因此就不详细讲解PyCharm的使用方法了。以下讲解如何使用PyCharm关联Python解释器，让PyCharm可以运行Python代码。

打开PyCharm，在菜单栏中选择File ∣ Defalut Settings命令。

在弹出的对话框中选择Project Interpreter，然后在右边选择Python环境，这里选择Python 3.5，单击OK按钮，即可关联Python解释器，如图1.2所示。

▲图1.2 关联Python解释器

02 变量和字符串

本节主要介绍Python变量的概念、字符串的基本使用方法、字符串的切片和索引，以及字符串的几种常用方法。

变量

Python中的变量很好理解，例如：

a = 1

这种操作称为赋值，意思为将数值1赋给了变量a。

注意：Python中语句结束不需要以分号结束，变量不需要提前定义。

现在有变量a和变量b，可以通过下面代码进行变量a、b值的对换。

a = 4

b = 5

t = a #把a值赋给t变量

a = b #把b值赋给a变量

b = t #把t值赋给b变量

print(a,b)

result 5 4

这种方法类似于将两个杯子中的饮料对换，只需要多加一个杯子，即可完成饮料的对换工作。

字符串的“加法”和“乘法”

由于Python爬虫的对象大部分为文本，所以字符串的用法尤为重要。在Python中，字符串由双引号或单引号和引号中的字符组成。首先，通过下面代码看看字符串的“加法”：

a = 'I'

b = ' love'

c = ' Python'

print(a + b + c) #字符串相加

result I love Python

在爬虫代码中，会经常构造URL，例如，在爬取一个网页链接时，只有一部分/u/9104ebf5e177，这部分链接是无法访问的，还需要http://www.jianshu.com，这时可以通过字符串的“加法”进行合并。

注意：此网站为笔者的简书首页。

Python的字符串不仅可以相加，也可以乘以一个数字：

a = 'word'

print(a*3) #字符串乘法

result wordwordword

字符串乘以一个数字，意思就是将字符串复制这个数字的份数。

字符串的切片和索引

字符串的切片和索引就是通过string[x]，获取字符串的一部分信息：

a = 'I love python'

print(a[0]) #取字符串第一个元素

result I

print(a[0:5]) #取字符串第一个到第五个元素

result I lov

print(a[-1]) #取字符串最后一个元素

result n

通过图1.3就能清楚地理解字符串的切片和索引。

▲图1.3 字符串切片和索引

注意：a[0:5]中的第5个是不会选择的。

在爬虫实战中，经常会通过字符串的切片和索引，提取需要的部分，剔除一些不需要的部分。

字符串方法

Python作为面向对象的语言，每个对象都有相应的方法，字符串也一样，拥有多种方法，在这里介绍爬虫技术中常用的几种方法。

4.1 split()方法

a = 'www.baidu.com'

print(a.split('.'))

result ['www', 'baidu', 'com']

字符串的split()方法就是通过给定的分隔符（在这里为‘.’），将一个字符串分割为一个列表（后面将详细讲解列表）。

注意：如果没有提供任何分隔符，程序会把所有的空格作为分隔符（空格、制表、换行等）。

4.2 repalce()方法

a = 'There is apples'

b = a.replace('is','are')

print(b)

result There are apples

这种方法类似文本中的“查找和替换”功能。

4.3 strip()方法

a = ' python is cool '

print(a.strip())

result python is cool

strip()方法返回去除两侧（不包括内部）空格的字符串，也可以指定需要去除的字符，将它们列为参数中即可。

a = 'python is good'

print(a.strip('*!'))

result python is good

这个方法只能去除两侧的字符，在爬虫得到的文本中，文本两侧常会有多余的空格，只需使用字符串的strip()方法即可去除多余的空格部分。

4.4 format()方法

最后，再讲解下好用的字符串格式化符，首先看以下代码：

a = '{} is my love'.format('Python')

print(a)

result Python is my love

字符串格式化符就像是做选择题，留了空给做题者选择。在爬虫过程中，有些网页链接的部分参数是可变的，这时使用字符串格式化符可以减少代码的使用量。

例如，Pexels素材网（https://www.pexels.com/），当搜索图片时，网页链接也会发生变化，如在搜索栏中输入book，网页跳转为https://www.pexels.com/search/book/，可以设计如下代码，笔者只需输入搜索内容，便可返回网页链接。

content = input('请输入搜索内容：')

url_path = 'https://www.pexels.com/search/{}/'.format(content)

print(url_path)

运行程序并输入book，便可返回网页链接，单击网页链接便可访问网页了，如图1.4所示。

▲图1.4 字符串格式化符演示

03 函数与控制语句

本节主要介绍Python()函数的定义与使用方法，介绍Python的判断和循环两种爬虫技术中常用的控制语句。

函数

“脏活累活交给函数来做”，首先，看看Python中定义函数的方法。

def 函数名（参数1，参数2...）：

return '结果'

制作一个输入直角边就能计算出直角三角形的面积函数：

def function(a,b）：

return '1/2ab'

也可以这样写

def function(a,b）：

print( 1/2ab)

注意：读者不需要太纠结二者的区别，用return是返回一个值，而第二个是调用函数执行打印功能。

通过输入function(2,3)，便可以调用函数，计算直角边为2和3的直角三角形的面积。现在来做一个综合练习：读者都知道网上公布的电话号码，如156**9354，中间的数值用其他符号代替了，而用户输入手机号时却是完整地输入，下面就通过Python()函数来实现这种转换功能。

def change_number(number):

hiding_number = number.replace(number[3:7],''4)

print(hiding_number)

change_number('15648929354')

result 156**9354

注意：这里的手机号码是随意输入的，不是真实的号码。

代码说明如下：

定义了一个名为change_number的函数。

对输入的参数进行切片，把参数的[3:7]部分替换为‘*’号，并打印出来。

调用函数。

判断语句

在爬虫实战中也会经常使用判断语句，Python的判断语句格式如下：

if condition:

else:

注意：冒号和缩进不要忘记了

再看一下多重条件的格式

if condition:

elif condition:

else:

在平时使用密码时，输入的密码正确即可登录，密码错误时就需要再次输入密码。

def count_login():

password = input('password:')

if password == '12345':

print('输入成功！')

else:

print('错误，再输入')

count_login()

程序说明如下：

运行程序，输入密码后按Enter键。

如果输入的字符串为12345，则打印“输入成功！”，程序结束。

如果输入的字符串不是12345，则打印“错误，再输入”，继续运行程序，直到输入正确为止。

读者也可以将程序设计得更为有趣，例如，“3次输入失败后，退出程序”等。

循环语句

Python的循环语句包括for循环和while循环，代码如下：

for循环

for item in iterable:

item表示元素，iterable是集合

for i in range(1,11):

print(i)

其结果为依次输出1到10，切记11是不输出的，range为Python内置函数

while循环

while condition:

例如，设计一个小程序，计算1～100的和：

i = 0

sum = 0

while i < 100:

i = i + 1

sum = sum + i

print(sum)

result 5050

04 Python数据结构

数据结构是存放数据的容器，本节主要讲解Python的4种基本数据结构，即列表、字典、元组和集合。

列表

在爬虫实战中，使用最多的就是列表数据结构，不论是构造出的多个URL，还是爬取到的数据，大多数都为列表数据结构。下面首先介绍列表最显著的特征：

列表中的每一个元素都是可变的。

列表的元素都是有序的，也就是说每个元素都有对应的位置（类似字符串的切片和索引）。

列表可以容纳所有的对象。

列表中的每个元素都是可变的，这意味着可以对列表进行增、删、改操作，这些操作在爬虫中很少使用，因此这里不再给读者添加知识负担。

列表的每个元素都有对应的位置，这种用法与字符串的切片和索引很相似。

list = ['peter', 'lilei', 'wangwu', 'xiaoming']

print(list[0])

print(list[2:])

result

peter

['wangwu', 'xiaoming']

如果为切片，返回的也是列表的数据结构。

列表可以容纳所有的对象：

list = [

1.1,

'string',

print(1),

True,

[1, 2],

(1, 2),

{'key', 'value'}

]

列表中会经常用到多重循环，因此读者有必要去了解和使用多重循环。现在，摆在读者面前有两个列表，分别是姓名和年龄的列表：

names = ['xiaoming','wangwu','peter']

ages = [23,15,58]

这时可以通过多重循环让name和age同时打印在屏幕上：

names = ['xiaoming','wangwu','peter']

ages = [23,15,58]

for name, age in zip(names, ages):

print(name,age)

result

xiaoming 23

wangwu 15

peter 58

注意：多重循环前后变量要一致。

在爬虫中，经常请求多个网页，通常情况下会把网页存到列表中，然后循环依次取出并访问爬取数据。这些网页都有一定的规律，如果是手动将这些网页URL存入到列表中，不仅花费太多时间，也会造成代码冗余。这时可通过列表推导式，构造出这样的列表，例如某个网站每页的URL是这样的（一共13页）：

http://bj.xiaozhu.com/search-duanzufang-p1-0/http://bj.xiaozhu.com/search-duanzufang-p2-0/http://bj.xiaozhu.com/search-duanzufang-p3-0/http://bj.xiaozhu.com/search-duanzufang-p4-0/……

通过以下代码即可构造出13页URL的列表数据：

urls = ['http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(number) for number in range(1,14)]

for url in urls:

print(url)

通过一行代码即可构造出来，通过for循环打印出每个URL，如图1.5所示。

▲图1.5 列表推导式构造URL列表

注意：本网站为小猪短租网。

字典

Python的字典数据结构与现实中的字典类似，以键值对（'key'-'value'）的形式表现出来。本文中只讲解字典的创造，字典的操作在后面会详细介绍。字典的格式如下：

user_info = {

'name':'xiaoming',

'age':'23',

'sex':'man'

}

注意：插入MongoDB数据库需用字典结构。

元组和集合

在爬虫中，元组和集合很少用到，因此这里只做简单介绍。元组类似于列表，但是元组的元素不能修改只能查看，元组的格式如下：

tuple = (1,2,3)

集合的概念类似数学中的集合。每个集合中的元素是无序的，不可以有重复的对象，因此可以通过集合把重复的数据去除。

list = ['xiaoming','zhangyun','xiaoming']

set = set(list)

print(set)

result {'zhangyun', 'xiaoming'}

注意：集合是用大括号构建的。

05 Python文件操作

在爬虫初期的工作中，常常会把数据存储到文件中。本节主要讲解Python如何打开文件和读写数据。

打开文件

Python中通过open()函数打开文件，语法如下：

open(name[, mode[, buffering]])

open()函数使用文件名作为唯一的强制参数，然后返回一个文件对象。模式（mode）和缓冲（buffering）是可选参数。在Python的文件操作中，mode参数的输入是有必要的，而buffering使用较少。

如果在本机上有名为file.txt的文件（读者可以在本机中新建一个文本文件），其存储路径为C:UsersAdministratorDesktop，那么可以通过下面代码打开文件：

f = open('C:/Users/Administrator/Desktop/file.txt')

注意：此代码为Windows系统下的路径写法。

如果文件不存在，则会出现如图1.6所示的错误。

▲图1.6 文件不存在报错信息

如果open()函数只是加入文件的路径这一个参数，则只能打开文件并读取文件的相关内容。如果要向文件中写入内容，则必须加入模式这个参数了。下面首先来看看open()函数中模式参数的常用值，如表1.1所示。

▲表1.1 open()函数中模式参数的常用值

读写文件

上一节中有了名为f的类文件对象，那么就可以通过f.write()方法和f.read()方法写入和读取数据了。

f = open('C:/Users/Administrator/Desktop/file.txt','w+')

f.write('hello world')

这时，在本机上打开file.txt文件，可以看到如图1.7所示的结果。

▲图1.7 Python写文件

注意：如果没有建立文件，运行上面代码也可以成功。

如果再次运行程序，txt文件中的内容不会继续添加，可以修改模式参数为'r+'，便可一直写入文件。

Python读取文件通过read()方法，下面尝试把f的类文件对象写入的数据读取出来，使用如下代码即可完成操作：

f = open('C:/Users/Administrator/Desktop/file.txt','r')

content = f.read()

print(content)

result hello world

关闭文件

当完成读写工作后，应该牢记使用close()方法关闭文件。这样可以保证Python进行缓冲的清理（出于效率考虑而把数据临时存储在内存中）和文件的安全性。通过下面代码即可关闭文件。

f = open('C:/Users/Administrator/Desktop/file.txt','r')

content = f.read()

print(content)

f.close()

06 Python面向对象

Python作为一个面向对象的语言，很容易创建一个类和对象。本节主要讲解类的定义及其相关使用方法。

定义类

类是用来描述具有相同属性和方法的对象集合。人可以通过不同的肤色划分为不同的种族，食物也有不同的种类，商品也是形形色色。但划分为同一类的物体，肯定具有相似的特征和行为方式。

对于同一款自行车而言，它们的组成结构都是一样的，如车架、车轮和脚踏板等。通过Python可以定义这个自行车的类：

class Bike:

compose = ['frame','wheel','pedal']

通过使用class定义一个自行车的类，类中的变量compose称为类的变量，专业术语为类的属性。这样，顾客购买的自行车组成结构就是一样的了。

my_bike = Bike()

you_bike = Bike()

print(my_bike.compose)

print(you_bike.compose) #类的属性都是一样的

结果如图1.8所示。

▲图1.8 类属性引用

在左边写上变量名，右边写上类的名称，这个过程称之为类的实例化，而my_bike就是类的实例。通过“.”加上类的属性，就是类属性的引用。类的属性会被类的实例共享，所以结果都是一样的。

实例属性

对于同一款自行车来说，有些顾客买回去后会改造下，如加一个车筐可以放东西等。

class Bike:

compose = ['frame','wheel','pedal']

my_bike = Bike()

my_bike.other = 'basket'

print(my_bike.other) #实例属性

结果如图1.9所示。

▲图1.9 实例属性

说明：通过给类的实例属性进行赋值，也就是实例属性。compose属性属于所有的该款自行车，而other属性只属于my_bike这个类的实例。

实例方法

读者是否还记得字符串的format()方法。方法就是函数，方法是对实例进行使用的，所以又叫实例方法。对于自行车而言，它的方法就是骑行。

class Bike:

compose = ['frame','wheel','pedal']

def use(self):

print('you are riding')

my_bike = Bike()

my_bike.use()

结果如图1.10所示。

▲图1.10 实例方法

注意：这里的self参数就是实例本身。

和函数一样，实例方法也是可以有参数的。

class Bike:

compose = ['frame','wheel','pedal']

def use(self,time):

print('you ride {}m'.format(time*100))

my_bike = Bike()

my_bike.use(10)

结果如图1.11所示。

▲图1.11 实例方法多参数

Python的类中有一些“魔法方法”，_init_()方法就是其中之一。在我们创造实例的时候，不需要引用该方法也会被自动执行。

class Bike:

compose = ['frame','wheel','pedal']

def __init__(self):

self.other = 'basket'

def use(self,time):

print('you ride {}m'.format(time*100))

my_bike = Bike()

print(my_bike.other)

结果如图1.12所示。

▲图1.12 魔术方法

类的继承

共享单车的出现，方便了人们的出行。共享单车和原来的自行车组成结构类似，但多了付费的功能。

class Bike:

compose = ['frame','wheel','pedal']

def __init__(self):

self.other = 'basket' #定义实例的属性

def use(self,time):

print('you ride {}m'.format(time*100))

class Share_bike(Bike):

def cost(self,hour):

print('you spent {}'.format(hour*2))

bike = Share_bike()

print(bike.other)

bike.cost(2)

结果如图1.13所示。

▲图1.13 类的继承

在新的类Share_bike后面的括号中加入Bike，表示Share_bike继承了Bike父类。父类中的变量和方法可以完全被子类继承，在特殊情况下，也可以对其覆盖

如果还有问题未能得到解决，搜索887934385交流群，进入后下载资料工具安装包等。最后，感谢观看！

你可能感兴趣的:(从Python安装到语法基础，这才是初学者都能懂的爬虫教程)

RocketMQ学习-Springboot整合RocketMQ wechatt_fee1024 面试 maven spring boot java
SpringBoot整合RocketMQ需要注意的是SpringBoot的starter集成包时，要注意版本。因为SpringBoot集成的RocketMQ的starter依赖由Spring社区提供，迭代比较快，版本之间的差异还是比较大的。可能版本不同，就导致使用的时候出现错误。maven依赖,直接把我的maven工程的配置放到这里了。普通消息maven工程创建我直接创建了一个空的maven工程，
【商城实战(55)】商城数据库备份：策略与实操指南奔跑吧邓邓子商城实战商城实战数据库备份 MySQL 策略与实操
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
Python自动登陆、登出南京理工大学NJUST校园网程序 JimesMz python 开发语言
本文程序针对南京理工大学NJUST和NJUST-FREE校园网开发，其他学校无法使用。文章目录开发目的使用说明参考资料开发目的今天突然想要用代码实现一下自动登陆校园网，上网搜寻了一下。知乎有一些教程，CSDN也有一些完整的代码，但是我跟随教程或者直接运行现有代码都没有能够成功登陆，且NJUST校园网付费，我想要一个“登出”功能，借助Kimi自己写了一下。本人技术不精，以实现功能为主。使用说明请确保
Python调用fofa API接口并写入csv文件中 YOHO !GIRL 网络测绘 python 网络安全
前言一.功能目的二.功能调研三.编写代码1.引入库2.读取数据3.写入csv文件中总结前言上一篇我们讲述了目前较为主流的几款网络探测系统，简单介绍了页面的使用方法。链接如下，点击跳转：网络空间测绘引擎集合：Zoomeye、fofa、360、shodan、censys、鹰图然而当我们需要针对单个引擎进行二次开发时，页面就不能满足我们的需求了，这就需要参考API文档进行简单的数据处理，接下来，给大家介
没想到枚举Enum类还能实现接口！教你玩转Java枚举Enum 林发和 Java 干货分享 java
枚举是什么？枚举是一种特殊的数据类型，预先定义一组常量（对象），并且必须为其赋值。Java枚举类型的基本想法非常简单：这些类通过共有的静态final域为每个枚举常量导出一个实例。枚举类型没有可以访问的构造器，所以它是真的final类。客户端不能创建枚举类型的实例，也不能对它进行扩展，因此不存实例，而只存在声明过程的枚举常量。也就是枚举类型是实例受控的。它们是单例（Singleton）的范型化，本质
微信视频号禁止下载？3招隐藏技巧秒存！安卓/iOS双端亲测有效，最后1招官方都默许微丽宝值得分享视频下载视频号里面的短视频怎样下载
一、视频号不提供下载按钮的原因版权保护为保护创作者原创内容，避免未经授权的传播和侵权行为[1][2]。平台生态维护鼓励用户在微信生态内互动（点赞、评论、分享），减少内容外流[1]。用户体验优化避免用户因下载导致存储空间不足或下载速度问题[1]。二、安卓用户下载方法1分钟提取缓存文件完整播放目标视频（确保缓存生成）。进入手机【文件管理】→【内部存储】→【Android】→【data】→【com.te
Android 中蓝牙Profile与UUID jaylkh android bluetooth
在Android中，常用的几种BluetoothProfile分别为：SPP(SerialPortProfile)、A2DP(AdvancedAudioDistributionProfile)、AVRCP(Audio/VideoRemoteControlProfile)、HID(HumanInterfaceDeviceProfile)、HFP(Hands-FreeProfile)。其中Media相
【架构实战营】模块四 3.存储架构模式 - 分片架构和分区架构 qxlxi #架构实战训练营架构系统架构微服务
教学目标掌握分片架构的设计和本质掌握分区架构的设计和本质目录分片架构分区架构分片架构分片架构的本质分片架构设计核心分片架构设计核心-分片规则分片架构设计核心-路由规则
如何在苹果内购开发中获取App Store Connect API密钥-共享密钥理解内购安全-优雅草卓伊凡卓伊凡 APP上架服务器运维
如何在苹果内购开发中获取AppStoreConnectAPI密钥-共享密钥理解内购安全-优雅草卓伊凡在苹果内购开发中，你可能会涉及到获取不同类型的“密钥”，以满足安全验证和开发的需求。以下介绍常见的获取方式：1.AppStoreConnectAPI密钥（用于服务器端验证内购）用途：如果你计划在服务器端验证用户的内购交易，以确保交易的真实性和防止欺诈，就需要使用AppStoreConnectAPI密
无法访问 GitHub？教你如何轻松解决 CarlowZJ github
在开发过程中，GitHub是开发者不可或缺的代码托管平台。然而，由于网络环境或地区限制，国内用户有时会遇到无法访问GitHub的问题。本文将详细介绍几种常见原因及解决方法，帮助你快速恢复对GitHub的访问。一、常见原因及解决方案1.DNS解析问题DNS解析问题是最常见的原因之一，可能导致GitHub的域名无法正确解析为IP地址。解决方法：更换公共DNS：将本地DNS服务器更换为公共DNS，例如G
解决 Ollama 无法通过本地 IP 访问 11434 端口的问题 CarlowZJ tcp/ip 网络协议网络
根据你的描述，你在尝试将Ollama的localhost地址替换为本地IP地址（如192.168.*.*）时，遇到了网络错误，提示无法连接到服务。但在浏览器中访问http://:11434时，Ollama显示正在运行。以下是可能的原因和解决方案：一、问题分析Ollama默认绑定到127.0.0.1默认情况下，Ollama服务绑定到127.0.0.1（即localhost），这意味着它只能接受来自本
SenseVoice 部署记录安静六角开源软件
最近试用了SenseVoice（阿里团队开源的语音转文字）效果可以，可以本地部署，有webui界面，测试了万字以上的转换效果可以。首先部署好conda环境和cuda，这个可以查看他人的文章。步骤1.创建虚拟环境：condacreate-nmainenvpython=3.102.然后安装依赖condaactivatemainenvpipinstall-rC:\Users\xx\Documents\P
回答我！！！如何用“快递分拣”讲明白OSI五层模型？茫忙然计算机网络网络
刚开始学习计算机网络时，会比较难理解计算机网络的五层协议，毕竟确实挺抽象的，接下来我用寄快递的过程来类比计算机网络的五层协议（物理层、数据链路层、网络层、传输层、应用层），帮助大家理解每一层的功能和作用。1.物理层（PhysicalLayer）——交通工具和道路快递中的比喻：卡车、飞机、轮船等运输工具，以及高速公路、铁路、航线等物理路径。功能：负责将包裹（数据）从一个地点物理传输到另一个地点，不关
178.HarmonyOS NEXT系列教程之列表交换组件错误处理机制 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表交换组件错误处理机制效果演示1.错误处理架构1.1错误类型定义//错误类型枚举enumErrorType{DATA_ERROR,//数据错误OPERATION_ERROR,//操作错误NETWORK_ERROR,//网络错
数据结构之顺序表和栈 Dust-Chasing 数据结构算法 c语言
一、顺序表1.1顺序表的概念及结构顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构，一般情况下采用数组存储。在数组上完成数据的增删查改。1.2静态顺序表静态顺序表，即使用定长的数组来存储元素，用下面一张图就可以清楚看懂1.3动态顺序表动态顺序表：使用动态开辟的数组存储。与静态顺序表不同，动态顺序表使用的数组大小可以动态变化，从而实现更灵活的储存数据。二、动态顺序表的实现静态顺序表只适
通过动态内存管理实现在VS2022中实现变长数组 Dust-Chasing 开发语言 c语言数据结构算法
目录一、malloc函数和free函数二、calloc函数三、realloc函数不知道大家在使用vs2022编译器时有没有遇见过这样一个问题，当我们用一个变量来作为数组的大小时，编译器会报错，要求我们使用常量，这样一来就会使我们的内存空间被大量浪费，使我们非常的头疼，但是如果当我们学到动态内存管理时，我们就有了解决这个问题的办法。一、malloc函数和free函数C语言提供了一个动态内存开辟的函数
数据结构之链表（单链表） Dust-Chasing 数据结构链表 c语言
目录一、链表的概念二、链表的分类三、单链表的实现1.创建新的节点2.打印链表3.链表的头插和尾插尾插：要注意第一次插入时链表为空的情况。头插：4.单链表的头删和尾删尾删：注意链表中只有一个元素的情况。且要保存尾节点的前一个节点。头删：5.单链表的查找一、链表的概念链表是一种物理存储结构上非连续、非顺序的存储结构，数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表实际上就像一列火车一样，每一个
深入理解指针（1） Dust-Chasing c语言开发语言
指针，一般是代指针变量，指针是C语言中至关重要的一部分。由于内容较多，且较难，所以我们掰开了揉碎了慢慢讲，今天我们开始先讲解字符指针，指针数组，数组指针。一、字符指针指针与数据类型相同，有多种分类inta=0;int*pd=&a;//取a的地址，并将其存入指针变量pd中doubleb=5.20;double*pb=&b;//取b的地址floatc=13.14;float*pc=&c;//取c的地址
使用kubeadm部署高可用IPV4/IPV6集群---V1.32
使用kubeadm部署高可用IPV4/IPV6集群https://github.com/cby-chen/Kubernetes开源不易，帮忙点个star，谢谢了k8s基础系统环境配置配置IP#注意！#若虚拟机是进行克隆的那么网卡的UUID和MachineID会重复#需要重新生成新的UUIDUUID和MachineID#UUID和MachineID重复无法DHCP获取到IPV6地址sshroot@1
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
聊聊langchain4j的HTTP Client langchain4j
序本文主要研究一下langchain4j的HTTPClientlangchain4j-http-clientlangchain4j提供了langchain4j-http-client模块，它实现了一个HttpClientSPI（服务提供者接口），其他模块通过该接口调用LLM提供商的RESTAPI。这意味着底层HTTP客户端可以被自定义，通过实现HttpClientSPI，还可以集成任何其他HTTP
stability ai推出的 AI模型2D图像转3D视频微丽宝 AI工具人工智能 3d 音视频
StableVirtualCamera是StabilityAl推出的A|模型，能将2D图像转换为具有真实深度和透视感的3D视频。用户可以通过指定相机轨迹和多种动态路径(如螺旋、推拉变焦、平移等)来生成视频。模型支持从1到32张输入图像生成不同宽高比(如1:1、9:16、16:9)的视频，最长可达1000帧。无需复杂的重建或优化，可生成高质量的3D视频，同时保持3D一致性和时间平滑性。StableV
【Spark】查询优化中分区（Partitioning）和分桶（Bucketing）是什么关系？什么时候应当分区，什么时候应当分桶？ petrel2015 spark 大数据分布式数据库
在学习Spark的过程中，分区和分桶乍一看很像，都能为了计算加速，但是仔细一想，一查还是有些差异的，甚至说差异很大。那么具体有什么差异点，有什么相同点。我做出了如下的整理，供大家参考，欢迎指正。相同点分区（Partitioning）和分桶（Bucketing）在很多方面具有相似性，它们都是用于优化大数据查询性能的技术数据划分的目的：优化查询性能分区和分桶的核心目标是通过将数据分割成更小的逻辑单元来
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
不神话大模型，不做技术乌托邦，用"传统IT+AI积木"实现企业智能转型人工智能
一、开篇：AI革命的务实辩证法在技术狂热与落地鸿沟并存的AI时代，灵燕智能体开发平台提出"三轮驱动法则"：•不颠覆的智慧：MySQL、知识图谱库、MQ等传统中间件构成数字地基•不空想的创新：大模型仅承担"认知苦力"，在人类设计的思考链中定向发力•不取巧的工程：通过D2R映射、低代码工具、元数据治理实现可落地的智能装配二、核心价值：智能开发的工业流水线技术要素原子化拆解将复杂需求分解为可执行的"技术
递归实例：登台阶问题:假如有n个台阶，一次只能上1个台阶或2个台阶，请问走到第n个台阶有几种走法？@C语言热心市民小汪 C语言代码练习 c语言算法开发语言
假如有n个台阶，一次只能上1个台阶或2个台阶，请问走到第n个台阶有几种走法？为便于读者理解题意，这里举例说明如下：假如有3个台阶，那么总计就有3种走法：第一种为每次上1个台阶，上3次；第二种为先上2个台阶，再上1个台阶；第三种为先上1个台阶，再上2个台阶。输入为n，输出为走到第n个台阶有几种走法Input3Output如果输入是3，走到第3个台阶的走法总计有3种，1,1,1和1,2和2,1，输出为
某人想将手中的一张面值100元的人民币换成10元、5元、2元和1元面值的票子。要求换正好40张，且每种票子至少一张。问：有几种换法？（C语言）热心市民小汪代码练习 C语言 c语言学习 java
一、首先分析题目有两点1、总和是100元。2、一共分为四十张且每种至少有一张。二、思路分析。10元的为s张，5元的为w张，2元的为e张，1元的为y张。n为有几种换算法首先，每个至少有一张a>=1,b>=1,c>=1,d>=1。#includeintmain(){inttotal;for(ints=1;s<=10;s++){for(intw=1;w<=20;w++){for(inte=1;e<=40
读取一个字符串，字符串可能含有空格，将字符串逆转,原字符串与逆转字符串进行比较@C语言热心市民小汪代码练习 C语言算法学习 c语言开发语言
读取一个字符串，字符串可能含有空格，将字符串逆转原来的字符串与逆转后字符串比较相同，输出0，原字符串小于逆转后字符串输出-1，大于逆转后字符串输出1。例如输入hello，逆转后的字符串为olleh，因为hello小于olleh，所以输出-1SampleInput1helloSampleOutput1-1#include#includeintmain(){charstr[20];charreStr[
Linux脚本实践1 一点多余. linux 运维服务器脚本
前言日常在Liunx中用到多个版本的java修改很麻烦，一个脚本搞定。1.准备两个jdk(如下图所示)2.准备脚本文件viswitch_jdk.sh#!/bin/bash#提示用户输入JDK路径read-p"请输入JDK的绝对路径（例如/usr/local/jdk/jdk-11.0.21）："jdk_path#检查输入的路径是否存在if[!-d"$jdk_path"];thenecho"错误：路径
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc