小陌白

零基础学Python学习笔记

Python学习笔记

代码下载地址

链接：https://pan.baidu.com/s/1yGnpfq4ZHeKpt4V0J_PTSg
提取码：hmzs

1. Python 基础语法

1.1 基本数据类型

整数(int)：8
浮点数(float)：8.8
字符串(str)：“8” “Python”
布尔值(bool)：True False

print(type(int('8'))) # 将字符串8转化为整型
print(type(str(123))) # 将整型123转为字符串类型
print(type(bool(123))) # 将整型123转为布尔类型
print(bool(0)) # 将整型0转为布尔类型 非0为True，0为False

1.2 变量的定义和常用操作

a = 123 a为变量名称，=为变量赋值，123为变量得到的值

# 网络带宽计算
print(100/8)

bandwidth = 100
ratio = 8
print(bandwidth/ratio)

Python编码风格指南

2. 序列

2.1 序列的概念

特点：成员都是有序排列，并且可以通过下标偏移量访问到它的一个或几个成员
字符串、列表、元组三种类型都属于序列
字符串：“abcd”
列表：[0, “abcd”]
元组：(“abc”, “def”)
思考：元组和列表的区别？

答：相同点：都是序列，可以通过索引访问，可以存储任何数据类型

不同点：写法不同，列表是可变的，元组是不可变的
无关知识点：在Python单引号跟双引号字符串没有区别，只是当你的字符串内容中有单引号出现时可以用双引号将整个字符串圈起来

chinese_zodiac = '鼠牛虎兔龙蛇马羊猴鸡狗猪'

print(chinese_zodiac[0:4]) # 下标从0开始
print(chinese_zodiac[-1]) # 取最后一个元素

2.2 字符串的定义和使用

# 记录生肖，根据年份来判断生肖
chinese_zodiac = '猴鸡狗猪鼠牛虎兔龙蛇马羊'

year = 2022
print(year%12)
print(chinese_zodiac[year%12])

2.3 序列的基本操作

对象[not] in 序列
序列+序列
序列*整数
序列[0:整数]

chinese_zodiac = '猴鸡狗猪鼠牛虎兔龙蛇马羊'

print('狗' in chinese_zodiac)
print('狗' not in chinese_zodiac)
print(chinese_zodiac + 'abcd')
print(chinese_zodiac * 3)

2.4 元组的定义和常用操作

比较操作

a = (4)
b = (5)
print(a > b) # 元组当中只有一个数时是按这一个元素的大小去比较
print(a < b)
c = (1,50)
d = (1,200)
print(c > d) # 当元组中有两个元素的时候是将这两个元素结合之后进行比较，此处是150 > 1200
print(c < d)

案例演示

# 输入一个日期判断其是哪个星座
zodiac_name = (u'魔羯座', u'水瓶座', u'双鱼座', u'白羊座', u'金牛座', u'双子座', u'巨蟹座',
           u'狮子座', u'处女座', u'天秤座', u'天蝎座', u'射手座') # 在这u是指unicode编码，防止乱码
zodiac_days = ((1, 20), (2, 19), (3, 21), (4, 21), (5, 21), (6, 22), (7, 23),
               (8, 23), (9, 23), (10, 23), (11, 23), (12, 23))
(month, day) = (2, 15)

zodiac_day = filter(lambda x: x <= (month, day), zodiac_days)
# print(zodiac_day)
zodiac_len = len(list(zodiac_day))
print(zodiac_name[zodiac_len])

2.5 列表的定义和常用操作

常用操作：

append(x)：向列表中插入一个元素x
remove(x)：从列表中删除元素x

a_list = ['abc', 'xyz']
a_list.append('X')
print(a_list)
a_list.remove('xyz')
print(a_list)

3. 条件与循环

3.1 条件语句

if语句：
- 关键字
- 判断条件表达式
- 判断为真时的代码块
```
格式：
if 表达式:
	代码块
```
- 可以和else、elif(else-if)语句组合成更复杂的判断
```
if 表达式:
	代码块
elif 表达式:
	代码块
else:
	代码块
```

3.2 循环

for语句：

for 迭代变量 in 可迭代对象:
	代码块
    
# 例子    
chinese_zodiac = '猴鸡狗猪鼠牛虎兔龙蛇马羊'

for cz in chinese_zodiac:
    print(cz)

for i in range(3): # 输出0-2
    print(i)

for i in range(1, 3): # 输出1-2
    print(i)

for year in range(2000, 2023):
    print('%s 年的生肖是 %s' %(year, chinese_zodiac[year % 12]))

while语句：
```
while 条件表达式:
    代码块
```

for循环+if判断:

# 输入一个日期判断其是哪个星座
zodiac_name = (u'魔羯座', u'水瓶座', u'双鱼座', u'白羊座', u'金牛座', u'双子座', u'巨蟹座',
           u'狮子座', u'处女座', u'天秤座', u'天蝎座', u'射手座') # 在这u是指unicode编码，防止乱码
zodiac_days = ((1, 20), (2, 19), (3, 21), (4, 21), (5, 21), (6, 22), (7, 23),
               (8, 23), (9, 23), (10, 23), (11, 23), (12, 23))

# 用户输入月份和日期
int_month = int(input('请输入月份：'))
int_day = int(input('请输入日期：'))

for zd_num in range(len(zodiac_days)):
    if zodiac_days[zd_num] >= (int_month, int_day):
        print(zodiac_name[zd_num])
        break
    elif int_month == 12 and int_day > 23:
        print(zodiac_name[0])
        break

while循环+if判断：

# 输入一个日期判断其是哪个星座
zodiac_name = (u'魔羯座', u'水瓶座', u'双鱼座', u'白羊座', u'金牛座', u'双子座', u'巨蟹座',
           u'狮子座', u'处女座', u'天秤座', u'天蝎座', u'射手座') # 在这u是指unicode编码，防止乱码
zodiac_days = ((1, 20), (2, 19), (3, 21), (4, 21), (5, 21), (6, 22), (7, 23),
               (8, 23), (9, 23), (10, 23), (11, 23), (12, 23))

# 用户输入月份和日期
int_month = int(input('请输入月份：'))
int_day = int(input('请输入日期：'))
n = 0
while zodiac_days[n] < (int_month, int_day):
    if int_month == 12 and int_day > 23:
        break
    n += 1
print(zodiac_name[n])

4. 映射与字典

字典：

特性：包含哈希值和指向的对象
格式：{"哈希值":"对象"}

简单使用：

dict1 = {}
print(type(dict1))
dict2 = {'x':1, 'y':2}
dict2['z'] = 3

print(dict2)

列表推导式与字典推导式：

# 1. 列表一般写法
even_list = []
for i in range(1, 11):  # 记录1-10中所有偶数的平方
    if (i % 2) == 0:
        even_list.append(i * i)
print(even_list)
# 1. 列表的列表推导式写法
even_list2 = [i * i for i in range(1, 11) if (i % 2) == 0]
print(even_list2)

zodiac_name = (u'魔羯座', u'水瓶座', u'双鱼座', u'白羊座', u'金牛座', u'双子座', u'巨蟹座',
               u'狮子座', u'处女座', u'天秤座', u'天蝎座', u'射手座')
# 2. 字典的一般写法
z_dict = {}
for i in zodiac_name:
    z_dict[i] = 0
print(z_dict)

# 2. 字典的字典推导式写法
z_dict2 = {k: 0 for k in zodiac_name}
print(z_dict2)

5. 文件和输入输出

5.1 文件的内建函数

定义：python自带的函数，不需要额外去安装
基本的函数：
1. open()：打开文件
2. read()：输入
3. readline()：输入一行
4. seek()：文件内移动
5. write()：输出
6. close()：关闭文件
注意：
- 在打开文件之后一定要对文件进行关闭，否则电脑突然关机的话你写入的信息就会丢失。

5.2 文件的常用操作

读取一行：readline()
读取多行：readlines()得到一个列表，列表中每一个元素都是一行的内容
读取整个内容：read()直接得到整个文章的内容，用字符串的形式去存储
读取固定数字符：read(x)x代表读取的字符数量
移动文件读取指针：
- 单个参数时：seek(x)代表移动到文章第几个字符处，从0开始
- 两个参数时：seek(a, b) 第一个参数代表偏移位置第二个参数0表示从文件开头偏移1表示从当前位置偏移2表示从文件结尾

例子：

# # 将小说的主要人物记录在文件中
# # file1 = open('name.txt') # 默认以只读的方式打开文件
# file1 = open('name.txt', 'w')  # 以写入的方式打开文件
# file1.write('诸葛亮')
# file1.close()
#
# file2 = open('name.txt')
# print(file2.read())
# file2.close()
#
# file3 = open('name.txt', 'a')  # 如果是以写入的方式打开文件在新写内容时会覆盖，这里用增加的方式进行写入
# file3.write('刘备')

# file4 = open('name.txt')
# print(file4.readline()) # 读一行
#
# file5 = open('name.txt')
# # print(file5.readlines()) # 读取多行
# for line in file5.readlines():
#     print(line)
file6 = open('name.txt')
print('当前文件指针的位置 %s' % (file6.tell()))  # 文件指针在哪个位置
# print(file6.read())  # 读取所有文件
print('当前读取到了一个字符，字符的内容是 %s' % file6.read(1))  # 默认是读取所有文件，此处表读取一个字符
print('当前文件指针的位置 %s' % (file6.tell()))
file6.seek(2, 0)  # 第一个参数代表偏移位置   第二个参数 0表示从文件开头偏移 1表示从当前位置偏移 2从文件结尾
print('我们进行了seek操作')
print('文件指针回到了位置 %s' % (file6.tell()))
print('当前读取到了一个字符,字符的内容是 %s' % file6.read(1))  # 默认是读取所有文件，此处表读取一个字符
print('当前文件指针的位置 %s' % (file6.tell()))
file6.close()

6. 错误和异常

异常：

产生：出现错误时采用正常控制流以外的动作
异常处理的一般流程：
1. 检测到错误，引发异常
2. 对异常进行捕获操作

异常处理代码格式：

try:
    <监控异常>
except Exception[,reason]:
    <异常处理代码>
finally:
    <无论异常是否发生都执行>  # 常用于文件关闭

简单试验：

# try:
#     year = int(input('input year：'))
# except ValueError:
#     print('年份要输入数字!')

# except (ValueError, AttributeError, KeyError) 捕获多个异常时使用元组将其整合成一个对象

# try:
#     print(1 / 0)
# except Exception as e:  # Exception代表所有错误信息
#     print('0不能做除数 %s' % e)

# 自己定义错误信息
try:
    raise NameError('helloError')
except NameError:
    print('my Custom error')

7. 函数

定义：对程序逻辑进行结构化的一种编程方法

定义格式：

def 函数名称():
	代码
	return 需要返回的内容

函数的调用：函数名称()

函数传参时使用指定关键字：

print('abc', end='\n') # end是指定关键字参数，好处是不用按顺序输入参数
    
def func(a, b, c):
    print('a = %s' %a)
    print('b = %s' %b)
    print('c = %s' %c)
func(1, 2, 3)
func(1, c = 2, b = 3) # 指定关键字，不用按顺序输入参数

7.1 函数的可变长参数

# 取得参数的个数
def howlong(first, *other):
    print(1 + len(other))
howlong(1, 2, 3)

7.2 函数的变量作用域

var1 = 123
def func():
    var1 = 456 # 它的影响范围只是在这个函数内，如果要让它的影响范围变大的话，要加上关键字global，即global var1 
    print(var1) # 输出456
func()
print(var1) # 输出的还是123

7.3 函数的迭代器与生成器

iter()：用来生成迭代器
next()：返回迭代器的下一个项目

list1 = [1, 2, 3]
it = iter(list1)
print(next(it))
print(next(it))
print(next(it))
print(next(it))

list2 = ['a', 'b', 'c']
for i in iter(list2):
    print(i)

生成器：使用了yield的函数称为生成器，生成器是迭代器的一种。调用一个生成器函数，返回一个迭代器对象。

# 自己手写一个浮点数range
def frange(start, stop, step): # 使用了yield的函数我们称为生成器，也是迭代器的一种
    x = start
    while x < stop:
        yield x
        x += step
for i in frange(10, 20, 0.5):
    print(i)

7.4 Lambda表达式

使用：在我们仅仅使用函数进行简单计算的时候使用。省去了写return和定义函数名称的过程。

def add(x, y):
    return x + y
lambda x,y: x + y

7.5 Python内建函数

filter(func, iterable)：将符合指定函数的项给选出来

a = [1, 2, 3, 4, 5, 6, 7]
list(filter(lambda x:x>2, a)) # 将符合指定函数的项给取出来

map()：对每个元素依次进行操作变变换

a = [1, 2, 3]
b = [4, 5, 6]
list(map(lambda x:x+1, a)) # 对a列表中的每一项进行加一
list(map(lambda x,y:x+y, a, b))# a列表中的每一项加上b列表中的每一项

reduce()：序列的所有项和初始值依次按照函数做运算注意：reduce虽然是内建函数，但是得用from functools import reduce导入
```
reduce(lambda x,y: x+y, [2,3,4], 1) # (( 1 + 2 ) + 3 ) + 4
# 初始值可以省略，当省略时，默认为0
```

zip()：可以使两个元组纵向合并。可以实现字典的key、value对调

a = (1, 2, 3)
b = (4, 5, 6)
tuple(zip(a, b))
for i in zip(a, b): # zip是一个可迭代的函数,其有一个iter方法
    print(i)
dicta = {'a':'aaa', 'b':'bbb'}
dictb = dict(zip(dicta.values(), dicta.keys()))
dictb

补充：
- 可迭代的函数都会有一个iter的方法

7.6 闭包

定义：嵌套的函数，且当外部函数的参数被内部函数给引用的情况下我们称其为闭包。

小示例：

# 使用闭包实现计数器
def counter(FIRST=0):
    cnt = [FIRST]
    def add_one():
        cnt[0] += 1
        return cnt[0]
    return add_one
num1 = counter(5)
num2 = counter(10)
print(num1())
print(num1())
print(num2())
print(num2())

运行结果：

6

7

11

12

发现：

互不影响，这也是闭包的好处。

# 使用闭包实现线段
def a_line(a, b):
    def arg_y(x):
        return a * x + b
    return arg_y
line1 = a_line(3, 5)
line2 = a_line(10, 5)
print(line1(5))
print(line2(5))
'''
闭包优雅写法
def a_line(a, b):
    return lambda x:a*x+b
'''

好处：比传统的实现方式传参少，定义函数时只需要传a、b两个参数，使用线段求y时只用传x一个参数。

7.7 装饰器

定义与闭包类似，只不过它传递的参数是一个函数，使用方法经过不断演化后得到了简化。

示例：

粗略计算一下程序的运行时间

import time
# 未用装饰器前
def I_sleep():
    time.sleep(3)
start_time = time.time()
I_sleep()
stop_time = time.time()
print("程序运行了%s" %(stop_time-start_time))

# 用装饰器后
def timer(func):
    def wrapper():
        start_time = time.time()
        func()
        stop_time = time.time()
        print("程序运行了%s" %(stop_time-start_time))
    return wrapper
@timer # 语法糖，修饰I_sleep2
def I_sleep2():
    time.sleep(3)
I_sleep2() # 实际上是(timer(I_sleep2))()这么运行的

带参数的装饰器：

# 带参数的装饰器
def out(func):
    def inner(a,b):
        print('start')
        func(a,b)
        print('stop')
    return inner
@out
def add(a,b):
    print(a + b)  
add(7,3) # 实际上可以理解为运行的时候是这样的(out(add))(7,3),所以实际上是inner(7,3)

针对不同函数装饰器做适应：

# 带参数的装饰器
def new(argv):
    def out(func):
        def inner(a,b):
            print('start %s %s' %(argv, func.__name__)) # __name__取传入函数的名字
            func(a,b)
            print('stop')
        return inner
    return out
@new('add_module')
def add(a,b):
    print(a + b) 
@new('sub_module')
def sub(a,b):
    print(a - b)
add(3, 5)
sub(5, 3)

好处：
1. 调用函数时不用在上面下面去编写重复的代码，可以将这些代码放在装饰器里面。
2. 装饰器更易于复用

7.8 自定义上下文管理器

先来看看一般打开文件的方法

fd = open('name.txt')
try:
    for line in fd:
        print(line)
finally:
    fd.close()

上面这种方法是不优雅的

下面我们使用with上下文管理器的方法去精简

with open('name.txt') as f:
    for line in f:
        print(line)

通过这种方法省去了我们写finally，因为在出现异常的时候，它会自动帮我们做关闭的操作。

8. 模块

在代码量变得相当大之后，将需要重复使用的有组织的代码段放在一起组成一个文件，这个文件就是模块。可以附加到现有的程序中。

导入：附加的过程

导入的一般写法：

import 模块名称 as 别名
from 模块名称 import 方法名

9. 面向对象编程

9.1 类与实例

# 传统表示玩家信息的方法
user1 = {'name':'tom','hp':100}
user2 = {'name':'jerry','hp':80}

def print_role(rolename):
    print('name is %s,hp is %s' %(rolename['name'], rolename['hp']))
print_role(user1)
print_role(user2)
# 使用类的方法
class Player():
    def __init__(self, name, hp):
        self.name = name
        self.hp = hp
    def print_role(self): # 定义了一个方法
        print('name is %s,hp is %s' %(self.name, self.hp))
user1 = Player('Tom', 100) # 类的实例化
user2 = Player('Jerry', 80)
user1.print_role()
user2.print_role()

9.2 增加类的属性和方法

# 使用类的方法
class Player():
    def __init__(self, name, hp, occu):
        self.__name = name # 变量被称作属性
        self.hp = hp
        self.occu = occu
    def print_role(self): # 定义了一个方法(函数被称作方法)
        print('name is %s,hp is %s,occupation is %s' %(self.__name, self.hp, self.occu))
    def updateName(self, newname):
        self.__name = newname
user1 = Player('Tom', 100, 'war') # 类的实例化
user2 = Player('Jerry', 80, 'master')
user1.print_role()
user2.print_role()

user1.updateName('wilson')
user1.print_role()

其中name默认是公有成员，也可以通过实例.name的方式去访问和更改。

如果想使得name不能使用.name 的方式去访问和更改，可以在其类中使用__name。

9.3 类的继承

class Monster():
    # 定义怪物类
    pass # 告知系统我们定义了一个Monster，但是现在我们还不想去实现它
class Animals(Monster): # 继承自Monster类
    # 普通怪物
    pass
class Boss(Monster):
    # Boss类怪物
    pass
# version 2
class Monster():
    # 定义怪物类
    def __init__(self, hp = 100):
        self.hp = hp
    def run(self):
        print('移动到某个位置')
    def whoami(self):
        print('我是怪物父类')
class Animals(Monster): # 继承自Monster类
    # 普通怪物
    def __init__(self, hp = 10):
        super().__init__(hp)
        
class Boss(Monster):
    # Boss类怪物
    def __init__(self, hp=800):
        super().__init__(hp)
    def whoami(self): # 有重名的方法，使用时会覆盖父类的方法
        print('我是Boss')
a1 = Monster(200)
a1.run()
print(a1.hp)

a2 = Animals(100)
a2.run()
print(a2.hp)

a3 = Boss(1000)
a3.whoami()

print('a1的类型 %s' %type(a1))
print('a2的类型 %s' %type(a2))
print('a3的类型 %s' %type(a3))

print(isinstance(a2, Monster)) # 判断对象是否是一个已知类型

9.4 自定义with语句

class Testwith():
    def __enter__(self):
        print('run')
    def __exit__(self, exc_type, exc_val, exc_tb):
        print('exit')
with Testwith():
    print('test is running')

运行结果：

run

test is running

exit

class Testwith():
    def __enter__(self):
        print('run')
    def __exit__(self, exc_type, exc_val, exc_tb):
        if exc_tb is None: # 没有异常它的值就是None
            print('正常结束')
        else:
            print('has error %s' %exc_tb)
with Testwith():
    print('test is running')
    raise NameError('testNameError') # 手动抛出异常

10. 多线程编程

定义：同时处理多个请求的方法

线程的简单使用：

import threading
import time
from threading import current_thread
def myThread(arg1, arg2):
    # print(current_thread().getName(),'start')
    time.sleep(1)
    print('%s %s' %(arg1, arg2))
    # print(current_thread().getName(),'stop')
for i in range(1, 6, 1):
    t1 = threading.Thread(target=myThread,args=(i, i + 1))
    t1.start()

让主线程等待其他线程结束之后再结束

import threading
from threading import current_thread
class Mythread(threading.Thread):
    def run(self):
        print(current_thread().getName(), 'start')
        print('run')
        print(current_thread().getName(), 'stop')
t1 = Mythread()
t1.start() # 线程使用start启动的时候实际上是调用了run方法
t1.join() # 等待t1线程结束才会向下执行

print(current_thread().getName(), 'end')

生产者和消费者：

from threading import Thread,current_thread
import time
import random
from queue import Queue

queue = Queue(5) # 定义队列的长度
class ProducerThread(Thread):
    def run(self):
        name = current_thread().getName() # 获取线程的名字
        nums = range(100)
        global queue
        while True:
            num = random.choice(nums)
            queue.put(num)
            print('生产者 %s 生产了数据 %s' %(name, num))
            t = random.randint(1, 3)
            time.sleep(t)
            print('生产者 %s 睡眠了 %s 秒' %(name, t))
class ConsumerThread(Thread):
    def run(self):
        name = current_thread().getName()
        global queue
        while True:
            num = queue.get()
            queue.task_done() # 封装好了关于线程等待和线程同步的代码
            print('消费者 %s 消耗了数据 %s' %(name, num))
            t = random.randint(1, 5)
            time.sleep(t)
            print('消费者 %s 睡眠了 %s 秒' %(name, t))
p1 = ProducerThread(name = 'p1')
p1.start()
p2 = ProducerThread(name = 'p2')
p2.start()
p3 = ProducerThread(name = 'p3')
p3.start()
c1 = ConsumerThread(name = 'c1')
c1.start()
c2 = ConsumerThread(name = 'c2')
c2.start()

11. 标准库

定义：安装python后自带的库
目前比较广泛的模块：
1. 文字处理的re
2. 日期类型的time、datetime
3. 数字和数学类型的math、random
4. 文件和目录访问的pathlib、os.path
5. 数据压缩和归档的tarfile
6. 通用操作系统的os、logging、argparse
7. 多线程的threading、queue
8. Internet数据处理的base64、json、urllib
9. 结构化标记处理工具的html、xml
10. 开发工具的unitest
11. 调试工具的timeit
12. 软件包发布的venv
13. 运行服务的__main__

11.1 正则表达式库re的使用

导入import re

单个字符的匹配：

import re
p = re.compile('a')
print(p.match('a'))
print(p.match('b'))

运行结果：

<re.Match object; span=(0, 1), match='a'> # 匹配到的位置
None # 匹配失败

正则表达式元字符：
- .匹配任意一个字符除换行符
- \d匹配任意一个数字
- 更多

匹配日期：

p = re.compile(r'(\d+)-(\d+)-(\d+)') # r是告知python字符串中的特殊符号不要进行转义
print(p.match('2022-05-05').group()) # 获取匹配到的内容
print(p.match('2022-05-07').group(1)) # 获取年
print(p.match('2022-05-07').groups()) # 获取年月日，用元组去存
year,month,day = ('2022', '05', '07')

正则表达式match与search的区别
- match要求原字符和输入字符完全匹配。即当第一个字符与原字符不匹配时便返回匹配失败。
- search不会，它会沿输入字符继续向后进行匹配。
- match经常是用于完全匹配之后进行分组。
正则表达式库替换函数sub
- sub(str1, str2, str3)：
  - str1：匹配的规则
  - str2：匹配到的字符串要替换成的内容
  - str3：将要替换的字符串
- 使用：
```
# 删去电话号码结尾不合法部分
phone = '123-456-789 # 这是一个电话号码'
p = re.sub(r'#.*$', '', phone)
print(p)
# 删去-
p2 = re.sub(r'\D','',p)
print(p2)
```
  运行结果：
  
  123-456-789
  
  123456789
补充：
- search只能匹配一次，想要匹配多次要用findall

11.2 日期与时间函数库

时间库：
- 引入import time
- 函数：
  - time()：从1970年1月1日到现在经历了多少秒
  - localtime([sec])：格式化时间戳为本地的时间
  - strftime(str)：返回str格式的当前时间
- 使用：
```
import time
print(time.time()) # 查19700101到现在过了多少秒
print(time.localtime())
print(time.strftime('%Y%m%d'))
```

以当前时间为准，计算指定偏移后的时间

import datetime
print(datetime.datetime.now())
newtime = datetime.timedelta(minutes = 10) # 计算十分钟偏移量
print(datetime.datetime.now() + newtime) # 显示十分钟后的时间

one_day = datetime.datetime(2008,5,27)
new_date = datetime.timedelta(days = 10)
print(one_day + new_date)

11.2 数学相关库

math

random

randint()：返回指定区间的随机数
choice(obj)：从对象中任选一值

import random
print(random.randint(1, 5))
print(random.choice([1, 2, 'a', 'b']))

11.3 文件与目录操作库

os.path

引入：import os或者from os import path

使用：

from os import path
print(path.abspath('..')) # 根据相对路径.获得绝对路径v
print(path.exists('./01 hello_world.py')) # 判断文件是否存在
print(path.isfile('./01 hello_world.py')) # 判断是否是文件
print(path.isdir('./01 hello_world.py')) # 判断是否是目录
print(path.isdir('.'))
print(path.join('/tmp/','01 hello_world.py')) # 路径拼接

pathlib

引入：from pathlib import Path

使用：

from pathlib import Path
p = Path('.')
print(p.resolve()) # 根据相对路径获得绝对路径，跟我们的path.abspath()一样
print(p.is_dir()) # 判断当前位置是否是目录
q = Path('./a/b/c')
Path.mkdir(q, parents=True) # parents=True是当父级目录不存在时会创建父级目录

特点：两者大多数功能类似，但pathlib好的是可以创建目录。

12. 机器学习库

12.1 Numpy库

用途：主要用于高性能科学计算和数据分析，是常用的高级数据分析库的基础包。

简单使用：

import numpy as np
arr1 = np.array([2, 3, 4])
print(arr1)
print(arr1.dtype)

arr2 = np.array([2.1, 3.1, 4.1])
print(arr2)
print(arr2.dtype)
print(arr1 + arr2)

# Numpy数组和标量的计算
print(arr2 * 10)
data = [[1,2,3], [4,5,6]]
arr3 = np.array(data) # 将列表转为二维矩阵
print(arr3)
print(arr3.dtype)
print(type(arr3))

print(np.zeros(10)) # 定义了一个一维的长度为10的数组，这个数组的所有值都是0
print(np.zeros((3, 5))) # 定义一个3x5的矩阵，这个矩阵的所有值为0
print(np.ones((4, 6))) # 定义一个4x6的矩阵，初始值都为1
print(np.empty((2,3,2))) # 定义了一个三维矩阵，初始值为随机值

# Numpy数组的索引和切片
arr4 = np.arange(10)
print(arr4[5])
print(arr4[5:8])
arr4[5:8] = 0
print(arr4)
arr_slice = arr4[5:8]
arr_slice[:] = 1 # 由于python这里是引用，故而这么做会影响到arr4的内容
print(arr4)
arr_slice = arr4[5:8].copy()
arr_slice[:] = 0 # 这样子做操作不会影响arr4，因为它是arr4的一个副本
print(arr4)
print(arr_slice)
arr5 = np.array(['a', 'b', 'c', 'd'])
print(arr5[1]) # 下标从0开始计算

12.2 Pandas库

好处(相比于Numpy)：
- 自动帮你将数据对齐显示
- 可以灵活的处理缺失的数据、
- 还可以实现像类似sql语句一样的连接操作
特点：
- 会帮我们自动添加索引
- 键值可以不唯一

简单使用：

import pandas as pd
obj = pd.Series([4, 5, 6, -7])
print(obj)

print(obj.index) # 打印索引
print(obj.values) # 打印值

obj2 = pd.Series([4, 5, 6, 3], index = {'a', 'b', 'd', 'c'})
print(obj2)
obj2['c'] = 6
print(obj2)
print('c' in obj2) # 判断是否存在键'c'
print('f' in obj2)

# 将字典转化到我们的series中
sdata = {'beijing' : 35000, 'shanghai' : 70000, 'guangzhou' : 16000, 'shenzhen' : 5000}
obj3 = pd.Series(sdata)
print(obj3)
obj3.index = ['bj', 'sh', 'gz', 'sz'] # 修改索引为它们的缩写
print(obj3)

# 将字典转化到我们的dataframe中
data = {'city' : ['shanghai', 'guangzhou', 'beijing', 'shenzhen'],
        'year' : [2016, 2017, 2018, 2019],
        'pop' : [1.5, 1.8, 1.3, 2.0]}
frame = pd.DataFrame(data)
print(frame)

frame2 = pd.DataFrame(data, columns = ['year', 'city', 'pop']) # 调换列的顺序
print(frame2)

# 将二维表格转换为一维的数据
print(frame2['city'])
print(frame2.year)

# 为pandas增加一个新的列
frame2['cap'] = frame2.city == 'beijing'
print(frame2)
# 求转置
pop = { 'beijing' : {2008:1.5, 2009:2.0},
        'shanghai' : {2008:2.0, 2009:3.6}
       }
frame3 = pd.DataFrame(pop)
print(frame3)
# 行和列的转换
print(frame3.T)

obj4 = pd.Series([4.5, 7.2, -5.3, 3.6], index = ['b', 'd', 'c', 'a'])
obj5 = obj4.reindex(['a', 'b', 'c', 'd', 'e']) # 按索引顺序排序，不存在的索引将出现空值
print(obj5)

obj6 = obj4.reindex(['a', 'b', 'c', 'd', 'e'], fill_value = 0) # 给空值填充0
print(obj6)

obj7 = pd.Series(['blue', 'yellow', 'pink'], index = [0, 2, 4])
print(obj7.reindex(range(6)))
print(obj7.reindex(range(6), method = 'ffill')) # 空值填充为其前一个数值

from numpy import nan as NA
# 删除缺失值的一行数据
data = pd.Series([1, NA, 2])
print(data.dropna())

# 在DataFrame删除缺失值的情况
# 1. 某一列的某一行有缺失
data = pd.DataFrame([[1.,  6.5, 3], [1., NA, NA], [NA, NA, NA]])
data[4] = NA
print(data)
print(data.dropna()) # 发现只要出现了na的一行就会被全部删掉
print(data.dropna(how = 'all')) # 只删掉全部出现na的一行
# 2. 某一列的某一列有缺失
print(data.dropna(axis = 1, how = 'all')) # 删掉全部出现na的一列
data.fillna(0) # 这种方法是对data副本进行填充0，并返回，并不会直接修改data
data.fillna(0, inplace = True) # 使用了inplace参数则代表是对data进行填充修改
print(data)
# 层次化索引
import numpy as np
data3 = pd.Series(np.random.randn(10),
               index = [['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd', 'd'],
                        [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]])
# 层次化索引的用途
print(data3)
print(data3.unstack()) # 将一维数据转化为二维数据
print(data3.unstack().stack()) # 再转换回来

12.3 Matplotlib库

用途：绘图

简单使用：

import matplotlib.pyplot as plt

# 绘制简单的曲线
plt.plot([1, 3, 5], [4, 8, 10])
plt.show()

import numpy as np
x =  np.linspace(-np.pi, np.pi, 100) # x轴的定义域为-3.14·3.14，中间间隔100个元素
print(x)
plt.plot(x, np.sin(x))
# 显示所画的图
plt.show()

x = np.linspace(-np.pi * 2, np.pi * 2, 100)
plt.figure(1, dpi = 50) # 创建图表，dpi代表精度，精度越高，画的图就越大就越清晰
for i in range(1, 5): # 画四条线
    plt.plot(x, np.sin(x / i))
plt.show()

plt.figure(1, dpi = 50) # 创建图表1，dpi代表图片精细度，dpi越大文件越大，杂志要300以上
data = [1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 4]
plt.hist(data) # 只要传入数据，直方图就会统计数据出现的次数
plt.show()

x = np.arange(1, 10)
y = x
fig = plt.figure()
plt.scatter(x, y, c = 'r', marker = 'o') # c = 'r' 表示散点的颜色为红色，marker表示指定三点多边形为圆形
plt.show()

import pandas as pd
iris = pd.read_csv('./iris_training.csv')
print(iris.head())
# 绘制散点图
iris.plot(kind = 'scatter', x = '120', y = '4')

# 没啥用，只是让pandas的plot方法显示
plt.show()

# 使用seaborn来绘制图
import seaborn as sns
import warnings 
warnings.filterwarnings('ignore')
iris = pd.read_csv('./iris_training.csv')
# 设置样式
sns.set(style = 'white', color_codes = True)
# 设置绘制格式为散点图
# sns.jointplot(x = '120', y = '4', data = iris, size = 5)
# distplot绘制曲线
# sns.distplot(iris['120'])
sns.FacetGrid(iris, hue = 'virginica', size = 5).map(plt.scatter, '120', '4').add_legend() # 按virginica属性分类，给点分配不同颜色
sns.FacetGrid(iris, hue = 'virginica', size = 5).map(plt.scatter, 'setosa', 'versicolor').add_legend()

13. 爬虫

13.1 网页数据采集与urllib库

网络库：
- urllib库：http协议常用库
- requests库：http协议常用库
- BeautifulSoup库：xml格式处理库
urlib跟requests库都是用于收集数据的库，BeautifulSoup是用于数据处理的库

urlib库：

使用：from urllib import request

例子：

from urllib import request

url = 'http://www.baidu.com'
response = request.urlopen(url, timeout = 1)
print(response.read().decode('utf-8')) # read直接读是按照单个字节解释出来的，而中文往往要占多个字节，所以要用decode做编码解析

专门用于测试get和post请求的网页：http://www.httpbin.org/

发送get请求：

注意：使用urlopen的时候一般都要指定timeout，不然一旦请求超时程序会卡死

from urllib import request
response = request.urlopen('http://httpbin.org/get', timeout=1) 
print(response.read())

# 超时异常捕获处理
import urllib
import socket
try:
    response3 = request.urlopen('http://httpbin.org/get', timeout=0.1)
except urllib.error.URLError as e:
    if isinstance(e.reason, socket.timeout):
        print('TIME OUT')

发送post请求：

from urllib import parse # 处理post数据
from urllib import request
data = bytes(parse.urlencode({'word':'hello'}), encoding='utf8')
# print(data)
response2 = request.urlopen('http://httpbin.org/post', data=data)
print(response2.read().decode('utf-8'))

HTTP头部信息的模拟：

from urllib import parse # 处理post数据
from urllib import request
headers = {
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
    "Accept-Encoding": "gzip, deflate",
    "Accept-Language": "zh-CN,zh;q=0.9",
    "Host": "httpbin.org",
    "Upgrade-Insecure-Requests": "1",
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36",
    "X-Amzn-Trace-Id": "Root=1-627a1828-401ed66a579dbc0173b7ee85"
}
dict = {
    'name' : 'value'
}
data = bytes(parse.urlencode(dict), encoding = 'utf8')
req = request.Request(url = 'http://httpbin.org/post', data = data, headers = headers, method = 'POST')
response = request.urlopen(req)
print(response.read().decode('utf-8'))

13.2 requests库的基本使用

使用：import requests

get请求：

import requests
url = 'http://httpbin.org/get'
data = {'key': 'value'}
response = requests.get(url, data)
print(response.text)

post请求：

import requests
url = 'http://httpbin.org/post'
data = {'key' : 'value'}
response = requests.post(url, data)
print(response.text) # 返回类型转为为json格式 response.json()

爬虫小栗子：

import requests
import re

content = requests.get('http://www.mnw.cn/news/china/')
content.encoding = 'utf8'
# print(content.text)
pattern = re.compile(r', re.S)
results = re.findall(pattern, content.text)
# print(results)

for result in results:
    print(re.sub('\s', '', result)) # 去除空白符

re.S的作用：

不使用re.S时，则只在每一行内进行匹配，如果存在一行没有，就换下一行重新开始，使用re.S参数以后，正则表达式会将这个字符串看做整体，在整体中进行匹配。

13.3 BeautifulSoup库的基本使用

作用：处理请求得到的html文本，一般情况下比使用正则更容易处理得到想要内容

简单使用：

html_doc = """
网页标题
这是一个段落
这是第二个段落
百度一下

"""
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'lxml')
print(soup.prettify()) # 格式化显示

# 找到title标签
print(soup.title)
# 找到title标签里面的内容
print(soup.title.string)

# 找到第一个p标签
print(soup.p)

# 找到第一个p标签里面的内容
print(soup.p.string)
# 找到第一个p标签里面class的名字
print(soup.p['class'])
# 找到所有p标签
print(soup.find_all('p'))
# 找到id为first的标签
print(soup.find(id='first'))
# 找到所有a标签的链接
for link in soup.find_all('a'):
    print(link.get('href'))

爬取百度新闻：

from bs4 import BeautifulSoup  # 编码解码库
import requests # 请求访问库

# 用 dict 定义http头，伪装浏览器访问，避免被拒之门外
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36 LBBROWSER"
}

#目标网址为 百度新闻
url = "http://news.baidu.com"


# 创建函数，传入 URL 获取新闻标题 和对应链接

def craw2(url):
    response = requests.get(url, headers=headers) # 获取 指定 URL 内容， 头部用 headers ,把这个动作 赋予给 response
    soup = BeautifulSoup(response.text, "lxml") # 用 BeautifulSoup 把 response 正文内容，用lxml 格式 整理，并赋值给Soup
    # print(soup)   #尝试打印， 能否获取内容

    # 把 soup 里面 ，class= mod-tab-pane active 的  标签，全部找出来，并 逐一赋值 给 title_href
    for title_href in soup.find_all("div", class_="mod-tab-pane active"):
        for title in title_href.find_all("a"):  # 然后把 title_href里的  标签 全部找出来，并逐一赋值给 title
            title_url=title.get("href") #在title 中，找出href 的值，并赋予给 title——url
            print(title.text,title_url)     #输出 标题和对应链接
craw2(url)

爬取图片网站的图片：

import os # 引入目录操作相关库
import shutil 
# 用 dict 定义http头，伪装浏览器访问，避免被拒之门外
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36",
}
url = "http://www.netbian.com/"
def download_jpg(image_url, image_localpath):
    response = requests.get(image_url, stream = True)
    if response.status_code == 200: # 图片存在
        with open(image_localpath, 'wb') as f: # 打开本地路径
            response.raw.deconde_content = True
            shutil.copyfileobj(response.raw, f)

# 获取图片
def craw3(url):
    response = requests.get(url, headers=headers) 
    soup = BeautifulSoup(response.text, 'lxml')
    # print(soup.prettify())
    for div in soup.find_all('div', class_="list"):
        for img in div.find_all('img'):
            imgurl = img.get('src')
            dir = os.path.abspath('./爬取的图片/')
            filename = os.path.basename(imgurl) # 自动帮我们把https://th.wallhaven.cc/small/k7/k7v9yq.jpg前面的目录路径给去掉剩余k7v9yq.jpg
            imgpath = os.path.join(dir, filename)
            print('开始下载 %s' % imgurl)
            download_jpg(imgurl, imgpath)

craw3(url)

14. 设计合理的代码结构

如果使用的功能不需要调用库的话，尽量不要去调用库
在编写大型程序时，优先把逻辑编写出来，具体实现封装到函数当中
程序带有的功能建议单独写到一个模块中

知识点

序列包含列表、元组、字符串，sort() 函数是列表的方法。
元组和列表的删除都可以使用del()关键字
语法错误跟finally中遇到文件打开失败都会引发异常
不可变类型可以作为字典的key
python中类的父类可以有多个
queue库是线程安全的

你可能感兴趣的:(机器学习,python,学习,开发语言)

基于pytorch的神经病网络搭建学习停走的风 pytorch学习学习 pytorch 人工智能
1.pycharm中code方法的使用1.1父类重写技巧操作：在需要重写的方法上右键，选择code-->Generate>OverrideMethods。作用：自动生成重写父类或接口的方法2.简单神经网络importtorchfromtorchimportnnclassyu(nn.Module):def__init__(self,*args,**kwargs)->None:super().__in
论文摘要生成器：用TextRank算法实现文献关键信息提取 Atlas Shepherd python 算法自然语言处理 python 信息可视化
我们基于python代码，使用PyQt5创建图形用户界面（GUI），同时支持中英文两种语言的文本论文文献关键信息提取。PyQt5：用于创建GUI应用程序。jieba：中文分词库，用于中文文本的处理。re：正则表达式模块，用于文本清理和句子分割。numpy：提供数值计算能力，如数组操作、矩阵运算等，主要用于TextRank算法的实现。importsysimportreimportjiebaimpor
SvelteKit 最新中文文档教程（1）—— 入门指南
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
C++学习笔记（十三）——指针奕天者 C++基础学习 c++学习笔记
一、指针的作用指针（Pointer）是C++中的一种特殊变量，它存储的是另一个变量的内存地址，而不是具体的值。指针有以下作用：直接操作内存地址，提高效率。动态内存分配，如new和delete。数组与字符串的操作，如遍历数组。函数参数传递，提高性能，避免数据拷贝。实现数据结构，如链表、树等。二、指针的声明、取地址和解引用(1)指针的声明作用：定义指针变量。语法：数据类型*指针变量名;示例：inta=
湖南大学DeepSeek研究：我们该如何看待DeepSeek（附 PDF 下载）伟贤AI之路 AI技术人工智能
很多大学最近对DeepSeek相关研究比较多，大家可以通过阅读大学研究文档，学习AI知识及判断未来AI方面发展趋势。下面是其它大学的PDF下载厦门大学DeepSeek手册：从社会大众到高校及企业的全面应用实践研究（附PDF下载）清华北大推出的DeepSeek教程（附PDF下载链接）一、Whatisit：DeepSeek是什么从ChatGPT到DeepSeek-R1，TA到底厉害在哪里？DeepSe
将Labelme标注的数据做成COCO格式的数据集（实例分割的数据集）一直开心深度学习计算机视觉
这里说明一下：Labelme标注数据时候是用的多边形框，关于标注，可以看前面的博客文章下面制作的COCO数据集是用于实例分割的数据集。COCO格式数据集的制作1、labelme标注的数据转coco数据集AnacondaPrompt里F:\rockdata下的目录运行指令：这里需要注意是在activatelabelme后，pythonlabelme2coco.pyNoObejectNoObeject
KMeans实战——聚类和轮廓系数评估啤酒数据集巷955 机器学习人工智能
原理：在数据分析和机器学习中，聚类是一种常用的无监督学习方法，用于将数据集中的样本划分为若干个簇，使得同一簇内的样本相似度较高，而不同簇之间的样本相似度较低。KMeans算法是其中最常用的聚类算法之一。本文将介绍如何使用KMeans算法对啤酒数据集进行聚类，并使用轮廓系数（SilhouetteScore）来评估聚类结果的质量。1.数据准备首先，我们需要导入必要的库并加载数据集。本文使用的数据集是一
大数据学习（61）-Impala与Hive计算引擎 viperrrrrrr 学习 impala hive yarn hadoop
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、impala与yarn资源管理YARN是ApacheHadoop生态系统中的一个资源管理器，它采用了master/slave的架构，使得多个处理框架能够在同一集群上共享资源。Impala作为Hadoop生态系统中的一个组件，可以与YARN集成，以便更好地管理
大数据学习（62）- Hadoop-yarn viperrrrrrr 大数据 yarn
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、YARN概述1.YARN简介Hadoop-YARN是ApacheHadoop生态系统中的一个集群资源管理器。它作为Hadoop的第二代资源管理框架，负责管理和分配集群中的计算资源。YARN的设计目标是提供一个通用的资源管理框架，使得Hadoop集群可以同时运
大数据学习（60）-HDFS文件结构 viperrrrrrr 学习 hdfs hadoop
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、体系结构HDFS是一个标准的主从(Master/Slave)体系结构的分布式系统；HDFS集群包含一个或多个NameNode(NameNodeHA会有多个NameNode)和多个DataNode(根据节点情况规划),用户可以通过HDFS客户端同NameNod
K8S Calico网络插件 u012804784 android 网络 flask python 计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统目录0.前言1.Calico概述1.1.Calico组件1.2.Calico网络实现1.3.了解Calico对CIDR子网
机器狗监控系统软件工程师面试题道亦无名机器人面试机器狗
大部分企业会使用的面试题一、基础知识编程语言方面请简述C++中多态的实现方式，在机器狗监控系统中，哪里可能会用到多态来提高代码的扩展性？例如不同型号机器狗的运动控制模块。Python作为脚本语言在系统开发中有诸多应用，说说Python的GIL（全局解释锁）对多线程性能的影响，以及在实时数据采集与处理场景下如何规避。数据结构与算法若要实现机器狗的路径规划，你会选择哪种数据结构来存储地图信息，比如栅格
Linux图形界面中客户端、服务器、窗口管理器之间的关系谁不小心的 linux系统使用界面 linux 桌面环境 x
作者：刘老师，华清远见嵌入式学院金牌讲师，ARMATC授权培训讲师。很多LINUX初学者在学习linux图形方面的知识时会遇到一些概念，如：X、X11、Xfree86、WM、KDE、GNOME、QT、QT/E、Qtopia、DirectFB、Framebuffer、显卡加速驱动等等。理解它们之间是什么关系，对我们学习来说是非常重要的。写这篇文章的目的，就是想让大家明晰这些概念及它们之间的关系。（部
FPGA 学习笔记：Vivado 2020.2 MicroBlaze MIG 测试 DDR3 篇二 zhangsz_sh FPGA开发技术 fpga开发学习
前言因为FPGADDR3测试的工程搭建步骤比较的多，所以分成几篇来写，这样利于把复杂的事情拆分，利于理解与实际的操作上一篇搭建了初步的HelloWorld工程，还没写什么代码或者改什么配置，所以FPGA开发，并不是上来就写VerilogHDL，而是要把更多的时间用在：目标是什么？DDR3测试，正常DDR3能否当RAM一样使用清楚要做什么，这里通过搭建嵌入式软核处理器的方式，快速验证实现与验证：搭建
python-uiautomator2 安装教程水w Android python 开发语言测试工具自动化 UI自动化测试工具推荐 UI自动化测试 uiautomator2
目录一、简介二、支持平台及语言三、工作原理四、安装一、简介uiautomator2是一个python库，用于Android的UI自动化测试，其底层基于Googleuiautomator，Google提供的uiautomator库可以获取屏幕上任意一个APP的任意一个控件属性，并对其进行任意操作。GitHub地址：GitHub-openatx/uiautomator2:AndroidUiautoma
在 Ubuntu20.04中能编译 Android2.3 吗？亚马逊的蝴蝶 android ubuntu gcc/gdb编译调试
这是一篇充满血和泪的文章，讲的是我编译Android2.3的踩坑经历。最近开始学习Android开发，看的是罗升阳大神写的《Android系统源代码情景分析（第三版）》。很多人应该都知道这本书，书中的实例非常适合初学者，但美中不足之处是这本书写得比较早，差不多是十年前，因此现在按书中例子进行实操，不可避免地会遇到很多坑。既然学习Android，当然要在Ubuntu中搭环境，因为这是主流使用的系统，
ROS学习笔记 xiyuping24 学习笔记机器人图论
下载使用鱼香ROS，一键下载十分好评~学习地址官网网站：ros.wiki调试打开终端，输入roscore，发现最后输出startcoreservice，说明安装成功尝试小海龟，打开另一个终端，输入rosrunturtlesimturtlesim_node，出现小海龟的窗口，说明成功其他小海龟玩法：小海龟画圆关于文件结构最高层是home中自己建的workspace，在里面应该有三大部分：buildd
C语言指针 812503533 c语言开发语言
指针是C语言的核心概念之一，C语言是面向过程的语言，允许直接操作内存。指针使得程序能够非常灵活地控制内存、访问和修改数据。这种能力对于低级编程至关重要，尤其在操作系统开发、嵌入式编程、性能优化等领域中，直接操作内存可以带来极大的优势。是C语言与其他许多高级编程语言（例如Python、Java、JavaScript等）之间的一个重要区别之一1.指针的基本概念指针本质上是一个变量，它保存了另一个变量的
易语言开机启动雾削木 IT 易语言
学习了易语言半年了，我有一次想制作像360一样开机启动的软件。结果我发现有俩条指令可以设置开机启动.一条是设置自动运行（）一开始我也没明白是啥意思。看了说明后发现就是开机启动的.编码不行就不复制给大家看了.设置自动运行中有3个参数；参数一程序名称（这个可以通过取执行文件名获取）参数二程序文件名（这个意思就是你程序的路径和名称可以通过取运行目录和取执行文件名获取）参数三位置整数型为0或1（0为到注册
Python连接Sql server数据库 Python老炮儿数据库 python
defparse_subjectname(sid):"""根据传入的sid，连接到SQLServer数据库，并获取对应的subjectname。参数:sid:int-要查询的subject的sid返回:subject_name:str或None-查询到的subjectname，如果没有找到则返回None"""#固定的数据库连接信息server='***'database='***'username
linux 学习笔记 IT 古月方源 linux 学习笔记
#Linux学习笔记##1Linux入门###1.1概述Linux内核最初只是芬兰人在赫尔辛基大学上学时处于个人爱好而编写的。Linux是一套免费使用和自由传播的类Unix操作系统，是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。Linux能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想，是一
Ansible剧本编写指南：从简单任务到复杂自动化的实现勤劳兔码农 ansible 自动化运维
Ansible剧本编写指南：从简单任务到复杂自动化的实现Ansible是一个流行的开源自动化工具，被广泛用于配置管理、应用部署、任务自动化以及IT基础设施的编排。它的核心是简单且易于学习的YAML格式，使用户能够编写可重用、可维护的剧本（Playbooks）来实现各种自动化任务。本指南将深入探讨Ansible剧本编写，从简单任务开始，逐步过渡到复杂的自动化实现。目录Ansible概述什么是Ansi
顺序结构双语言征服：C++与Python秒杀洛谷三大经典入门题三流搬砖艺术家算法算法 c++数据结构
目录顺序结构核心思想题目一：P1001A+BProblem题目描述解题思路代码实现题目二：P1425小鱼的游泳时间题目描述解题思路代码实现题目三：P1421小玉买文具题目描述解题思路代码实现顺序结构四步心法常见问题与避坑指南实战扩展（LeetCode真题）顺序结构核心思想输入→处理→输出本文精选洛谷顺序结构题单中三大经典问题，通过C++与Python双语言对比实现，彻底掌握基础编程技巧！题目一：P
如何增强机器学习基础，提升大模型面试通过概率 weixin_40941102 机器学习面试人工智能
我的好朋友没有通过面试所以我给我的好朋友准备了这一篇学习路线随着大模型（如Transformer、GPT-4、LLaMA等）在自然语言处理（NLP）、计算机视觉（CV）和多模态任务中的广泛应用，AI行业的招聘竞争愈发激烈。面试官不仅要求候选人熟练使用深度学习框架（如PyTorch、TensorFlow），还希望他们具备扎实的机器学习理论基础、算法实现能力和实际问题解决经验。本文将从机器学习基础入手
使用python进行单因素方差分析（ANOVA）和事后多重比较(LSD) thinkwindows 数据分析 python 算法 excel
#idea来源#在使用spss帮朋友做单因素分析时，发现个别数据需要调整到符合显著性的要求，在spss中修改数据，再在spss中操作步骤太麻烦，于是有了这个想法。程序思路1、将数据放到excel里，确定两列数据，Group（分组数据）和B（对应数据列）2、程序读取excel数据3、整理数据格式，将数据分组，将数据从宽格式转换为长格式，以便于进行ANOVA分析。4、执行单因素方差分析（ANOVA），
linux-Openmanus本地部署-AI-Agent初探世转神风- manus manus
文章目录简介官网指导widows安装linux安装安装依赖项报错配置快速入门别急效果展示简介上来先不说其它的，先给你们稳定军心……要尝试的兄弟，放心尝试，占用空间并不大，部署下来，不超过10G。官网指导网址官网指导，比较全面。我只挑重点。widows安装在B站上，有人用过，我就不细讲了。condacreate-nopen_manuspython=3.12condaactivateopen_manu
从原理和公式出发：python实现One_Way_ANOVA ＾哪来的＆永远～ python 算法概率论
文章目录目的：python实现onewayANOVA单因素方差分析1.代码流程2.python代码实现0主要的函数1加载数据2查看数据统计结果3数据处理及可视化4方差分析4.1模型拟合4.2单因素方差分析5PostHoct-test组间比较分析6根据定义自行分解计算对比调用函数的结果7获取F分布对应的P值3.方差分析公式及原理参考目的：python实现onewayANOVA单因素方差分析方差分析(
2025年北京市海淀区信息奥赛真题解析（小学组）热爱编程的通信人 c++白名单信息学奥赛
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
python anova_使用Python进行双向ANOVA的三种方法 cumei1658 python 机器学习深度学习人工智能数据分析
pythonanovaInanearlierpostIshowedfourdifferenttechniquesthatenablestwo-wayanalysisofvariance(ANOVA)usingPython.Inthispostwearegoingtolearnhowtodotwo-wayANOVAforindependentmeasuresusingPython.在较早的文章中，我
熊猫烧香之手动查杀梦断九歌命令工具隐藏软件删除
对熊猫烧香进行手动查杀学习笔记：手动查杀：只不通过代码的方式对病毒进行查杀，通过鼠标指指点点+DOS命令实现杀毒粗浅，往往不能查杀干净并不代表什么软件都不用，专业分析软件手动查杀病毒木马固定的流程：1.排查可疑进程。因为病毒往往会创建出来一个或多个进程，因此我们需要分辨出哪些进程是由病毒所创建，然后删除可疑进程。2.检查启动项。病毒为了实现自启动，会采用一些方法将自己添加到启动项中，从而实现自启动
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：deathwknight@163.com）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方