nsq_ai

Python与量化投资（1+2）

Python与量化投资

从基础到实战

本博客是记录以及监督自己学习这本书中的内容，为了防止看过就忘记的弊端，简单地对本书进行一些必要的记录，也方便了日后的复习。

第一章准备工作

1.1 Python的安装与设置

考虑Python的版本，建议使用Python 3，可以自行查找相关教程
Python的集成环境：建议使用Anaconda。PyCharm、Spyder等也可以，看自己的使用习惯或者参考资料是用的是啥。

1.2 常见的Python库

NumPy
NumPy是Python的一种开源的数值计算扩展，可用来存储和处理大型矩阵，比Python自身的列表结构要高效得多。NumPy底层使用BLAS作为向量，各种运算的速度也得打大幅提升。它主要包括：
- 强大的N维数组对象Array
- 比较成熟的（广播）函数库
- 用于整合C、C++和Fortran代码的工具包
- 实用的线性函数、傅里叶变换和随机数生成函数，使NumPy和系数矩阵运算包的配合使用更加方便。
  另外，NumPy中的数据类型在Pandas、Scikit-Learn、StartsModel等库中被作为基本数据类型使用。
Pandas
Pands的主要应用环境如下：

数据的导入和导出
数据清理
数据挖掘与探索
为分析数据处理与准备
结合Scikit-Learn、StatsModel进行分析

Pandas的底层基于NumPy搭建，因此Pandas拥有了NumPy的全部优点。

Matplotlib
Matplotlib是Python最著名的绘图库，提供了一整套和MATLAB相似的命令API，十分适合进行交互式制图。
Seaborn
Seaborn 其实是在Matplotlib 的基础上进行了更高级的API封装，从而使作图更容易。
应该把Seaborn 视为Matplotlib 的补充，而不是替代物。
SciPy
SciPy 包含致力于解决科学计算中常见的各个工具箱。它的不同子模块相当于不同的应用，例如差值、积分、优化、图像处理、特殊函数等。
Scikit-Learn
Scikit-Learn 是基于Python 的机器学习模块，基于BSD开源许可。
基本功能主要为：分类、回归、聚类、数据降维、模型选择和数据预处理。
对具体的机器学习问题的解决，通常可以分为三步：数据准备与预处理、模型选择与训练、模型验证与参数调优。Scikit-Learn封装了这些步骤，使建模的过程更方便、简单和快捷。
StatsModel
StatsModel 是Python 的统计建模和计量经济学工具包，包括一些描述统计、统计模型估计和推断，例如线性回归模型、广义线性回归模型、方差分析模型、时间序列模型、非参检验、优化、绘图功能等。
Quartz
Quartz 是优化的在线回测模块库，提供了跨资产多账户交易的量化策略框架，可以对策略进行专业的历史回测，得到详细的策略表现评估结果。它包括：多因子选股策略、事件驱动策略、CTA策略等。
特点如下：
- 支持标准级的策略编写规范。删减了大量冗余的策略API，让我们只需记忆少量的函数名，即可快速实现策略想法
- 扩充了策略交易的资产范围，从原来的只支持股票、基金这两种资产类型，扩充到支持股票、场内外基金、指数、期货这4种资产的全资产平台。
- 体现了策略信号生成和交易执行相分离的思想，可以灵活的进行各种资产的数据分析和交易撮合。
- 支持更多的策略特性，例如多因子裸多策略、市场中性策略、FOF策略和CTA期现策略等。
- 会得到更充分的研究和支持，新的示例会逐步扩充在优矿知识库中，辅助我们更好的进行量化研究。
- 在性能方面进行了诸多优化，让我们可以用更快的运行速度进行策略研究。
CAL
CAL依托优矿量化实验室在线平台，基于C++ 开发高性能引擎，以 Python 作为接口语言向用户提供功能，他的宗旨是为广大投资者提供丰富、灵活的金融分析模块，降低投资者的分析平台搭建成本，帮助用户在金融大浪中顺利前行。

第二章 Python 基础介绍

2.1 Python 学习准备

Anaconda的安装
Jupyter Notebook 界面的简单介绍和使用
Jupyter Notebook 的存储位置

2.2 Python 语法基础

变量与常量
变量：即可被赋值也可被更改。
常量：一旦被绑定，不能修改。
数与字符串
数的类型有五种：

整数型（int）: 0、-1、1、2021等
长整型（long）: 878817、-9909901等
浮点型（float）：2.7788、3.277、8.88等
布尔型（bool）：True和False
复数型（complex）：4 +2j、-9+3j等

字符串：引号引起来的字符集。‘hello’、‘my python ’、‘2+3’等。可以是单引号、双引号和三引号。

#单引号
c1='Hello,Python'
print (c1)
c2='It is a "dog"!'
print (c2)

结果：Hello,Python
It is a "dog"!

转为大写字母

c1.upper()

结果显示：'HELLO,PYTHON'

c1[0]  #获取第一个字母

结果显示：'H'

#双引号
c1="Hello,Python"
print (c1)
c2="It is a dog!"
print (c2)
#三引号
c3="""这
是
Python量化投资"""
print (c3)

结果显示：
Hello,Python
It is a dog!
这
是
Python量化投资

转义符

#转义符
print ('It\'s a dog!')
print ("hello boy\nhello boy")

结果显示：
It's a dog!
hello boy
hello boy

#自然字符串
print ("hello boy\nhello boy")
print (r"hello boy\nhello boy")

结果显示：
hello boy
hello boy
hello boy\nhello boy

字符串的重复

#字符串的重复
print ("我爱Python\n"*10)
结果显示：
我爱Python
我爱Python
我爱Python
我爱Python
我爱Python
我爱Python
我爱Python
我爱Python
我爱Python
我爱Python

切片运算

#子字符串
#索引运算符从0开始索引
#切片运算符[a:b]是指从第a下标开始到第b-1下标。同样第一位的下标为0，“包前不包后”
c1=u"wangxiaochuan"
c2=c1[0]
c3=c1[7]
c4=c1[:2]
c5=c1[2:]
c6=c1[4:7]
c7=c1[-1] 
c8=c1[-3:]
cuts=[2,4,6]
c9=c1+c2
print (c2)
print (c3, c4, c5, c6,c7,c8,c9)

结果显示：
w
o wa ngxiaochuan xia n uan wangxiaochuanw

数据类
在Python中没有数组的概念，与数组最接近的概念就是列表和元组。

列表：是用来存储一连串元素的容器，用[ ] 来表示。

#列表
students=["小明","小华","小李","小娟","小云",3]
print (students[len(students)-1])
print (students[-1])
print (students[2])

结果显示：
3
3
小李

列表可以存放不同类型的数据，支持改写。

#列表元素支持修改
students=["小明","小华","小李","小娟","小云",3]
print (students[3])
students[3]="小月"
print (students[3])
students[5]="小楠"
print (students[5])
students[5]=19978
print (students[5])

结果显示：
小娟
小月
小楠
19978

元组
元组中的元素的值不可以修改，只可以读取；元组的符号是（）。

#元组
students=("小明","小军","小强","小武","小龙")
print (students[1])

结果显示：
小军

元组比列表更加安全，因为不能修改，可以安全的保存一个引用，而不用担心里面的内容被其他程序修改，从而导致逻辑错误。
3. 集合
集合主要有两个功能：一个功能是进行集合操作，另一个功能是消除重复的元素。集合的格式是set（元素）：

a=[1,2,3,4]
set(a)

结果显示：
{1, 2, 3, 4}

a=set("abcnmaaaaggsng")
print (a)
b=set("cdfm")
#交集
x=a&b 
print (x)
print (a)
#并集
y=a|b
print (y)
#差集
z=b-a
print (z)
#去除重复元素
new=set(a)
print (new)

结果显示：
{'a', 'n', 'm', 'c', 's', 'g', 'b'}
{'c', 'm'}
{'a', 'n', 'm', 'c', 's', 'g', 'b'}
{'d', 'a', 'n', 'f', 'm', 'c', 's', 'g', 'b'}
{'f', 'd'}
{'a', 'n', 'm', 'c', 's', 'g', 'b'}

字典，也叫关联数组，可以理解为列表的升级版，用大括号{ } 括起来。

#字典
k={"姓名":"王小川","籍贯":"山东"}
print (k["籍贯"])
#添加字典里面的项目
k["爱好"]="游泳"
print (k["姓名"])
print (k["爱好"])

结果显示：
山东
王小川
游泳

Python 字典包含了很多的内置函数，比如比较两个字典元素。

标识符
规范：
标识符的第一个字符必须是字母或下画线，不能出现数字或其他字符；
标识符除第一个字符外，其他部分可以是字母、下画线或数字；
标识符是大小写敏感的。

常用关键字

#常用关键字
#查看一下关键字有哪些
import keyword
print (keyword.kwlist)

结果显示：
['False', 'None', 'True', 'and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']

对象
封装、继承、多重继承和多态

a='abc'
print (a.upper())
print  (a.title())

结果显示：
ABC
Abc

行与缩进
逻辑行主要是指一段代码在逻辑上的行数，物理行指的是我们实际看到的行数。
行

#逻辑行与物理行
#以下是3个物理行
print ("abc")
print ("789")
print ("777")
#以下是1个物理行，3个逻辑行
print ("abc");print ("789");print ("777")
#以下是1个逻辑行，3个物理行
print ('''我是帅哥
王老师很帅
这是Python教程！''')

结果显示：
abc
789
777
abc
789
777
我是帅哥
王老师很帅
这是Python教程！

缩进

#如何缩进
#一般情况下，行首应该不留空白
import sys
#缩进的方法有两种，可以按空格，也可以按tab键
#if语句的缩进方法
a=7
if a>0:
     print ("hello")
#while语句的缩进方法
a=0
while a<7:
    print (a)  # 思考下a为什么不包含7
    a+=1
a=100

结果显示：
hello
0
1
2
3
4
5
6

注释
一般通过# 进行注释，从# 开始一直到一行（物理行）结束的部分都是注释。

2.3 Python 运算符与表达式

算数运算符
+ 、- 、 * 、 / 等
% 求余数，// 求商的整数部分等

#"+":两个对象相加
#两个数字相加
a=7+8
print (a)

#两个字符串相加
b="GOOD"+" JOB!"
print (b)

#"-":取一个数字的相反数或者实现两个数字相减
a=-7
print (a)
b=-(-8)
print (b)
c=19-1
print (c)


#"*":两个数相乘或者字符串重复
a=4*7
print (a)
b="hello"*3
print (b)
b="hello\n"*3
print (b)

#"/":两个数字相除
a=7/2
print (a)
b=7.0/2
c=7/2.0
print (b)
print (c)

from __future__ import division  
a=7/2
print (a)

#"**":求幂运算
a=2**3   #相当于2的3次幂，就是2*2*2
print (a)

#"//":除法运算，然后返回其商的整数部分，舍掉余数
a=10//3
print (a)
#"%":除法运算，然后返回其商的余数部分，舍掉商
a=10%3
print (a)
b=10%1  #没有余数的时候返回什么？
print (b)

比较运算符
用于比较两个值，不同类型的比较方式不一样，数字类型会根据数字的大小和正负进行比较，而字符串会根据字符串序列值进行比较。

#"<"：小于符号，返回一个bool值
a=3<7
print (a)
b=3<3
print (b)
type(a)

#">":大于符号，返回一个bool值
a=3>7
print (a)
b=3>1
print (b)

#"!=":不等于符号，同样返回一个bool值
a=2!=3
print (a)
b=2!=2
print (b)

#"<=":小于等于符号，比较运算，小于或等于，返回一个bool值
a=3<=3
print (a)
b=4<=3
print (b)
#">="
a=1>=3
print (a)
b=4>=3
print (b)

#"==":比较两个对象是否相等
a=12==13
print (a)
b="hello"=="hello"
print (b)

逻辑运算符
and 、 or 、not

#not:逻辑非
a=True
b=not a
print (b)
c=False
print (not c)

#and:逻辑与
'''
True and True等于True
True and False等于False
False and True等于False
'''
print (True and True)

#or:逻辑或
'''
True or True等于True
True or False等于True
False or False等于False
'''
print (True or False)

Python 中的优先级

2.4 Python 中的控制流

我们通常根据不同的需要来选择控制语句，以控制某些代码段的执行方式，这些不同功能的控制语句就叫做控制流。

控制流的功能，就是控制代码的执行方式

两种方式实现同一功能

i=1
print (i)
i=i+1
print (i)

i=1
print (i)
i=i+1
print (i)

结果显示：
1
2
1
2

for k in range(0,2):
    i=1
    print (i)
    i=i+1
    print (i)

结果显示：
1
2
1
2

weather="rainy"
if weather=="sunny":
    print ("basketball")
else:
    print ("badminton")

结果显示：
badminton

Python 的三种控制流

顺序结构

a=1
print (a)
a=a-1
print (a)
a=a+2
print (a)

结果显示：
1
0
2

分支结构

a=0
if a==1:
    print ("She")
else:
    print ("He")

结果显示：
He

循环结构
for 结构

for i in range(5):
    print ("hello world")
    print (i)

结果显示：
hello world
0
hello world
1
hello world
2
hello world
3
hello world
4

while 结构

i=5
while i:
    print ("hello world")
    print (i)
    i=i-1

结果显示：
hello world
5
hello world
4
hello world
3
hello world
2
hello world
1

认识分支结构 if

在一种情况下的if用法

#在一种情况下的if用法
a=8
if a==8:                         #这里的等号注意是==，而非=
    print ("hello world")

结果显示：
hello world

在两种选择情况下的if用法

#在两种选择情况下的if用法
a=9
if a==9:
    print ("hello world")
else:
    print ("Null")

结果显示：
hello world

在三种选择情况下的if用法

#在三种选择情况下的if用法
a=10
if a==10:
    print ("hello world")
elif a>8:
    print ("hello")
elif a>6:
    print ("world")
else:
    print ("Null")
    
结果显示：
hello world

使用要点如下：
各分支尽量不重复，并且尽量包含全部可能性；
在if 语句里还可以再写if 语句，形成if 语句的嵌套；
elif 和 else 语句永远只是可选的；
在Python中没有 switch 语句。

认识循环结构 for in

for i in [1,2,3,4,5]:
    print (i)

结果显示:
1
2
3
4
5

for i in range(1,10,3):
    print ("hello")
    print (i)

结果显示：
hello
1
hello
4
hello
7

char=u"你好世界"       #U代表这是Unicode编码
tem=("元组：你好","元组：世界")
list=["列表：你好","列表：世界"]
dict={"first":"字典：你好","second":"字典：世界"}
for i in char:
    print (i)
for i in tem:
    print (i)
for i in list:
    print (i)
for i in dict:
    print (i)

结果显示：
你
好
世
界
元组：你好
元组：世界
列表：你好
列表：世界
first
second

使用要点：
适当运用range 、 xrange函数；
在for 中还可以再写for ，形成循环嵌套；
合理地运用lambda 代替 for 循环，可以提高运行速度。

认识循环结构 while

a=True
while a:
    print ("hello world")

无限循环 hello world

b=False
while b:
        print ("hello world")
else:
        print ("Null")

a=1
while a<5:
        if a<=3:
            print (a)
        else:
            print ("hello")
        a=a+1

结果显示：
1
2
3
hello

break 语句和 continue 语句
break 跳出循环

for i in range(5,9):
    print (i)
    print ("hello world")
    if i>6:
        break
结果显示：
5
hello world
6
hello world
7
hello world




a=5
while a<=8:
    a=a+1
    for i in range(1,3):
        print (a,i)
        if i==2:
            break
            
结果显示：
6 1
6 2
7 1
7 2
8 1
8 2
9 1
9 2

continue 语句停止循环中的这一次执行，直接跳到下一次执行。

n = 0
while n < 10:
    n = n + 1
    if n % 2 == 0:      # 如果n是偶数，则执行continue语句
        continue# continue语句会直接继续下一轮循环，后续的print()语句不会执行
    print (n)

结果显示：
1
3
5
7
9

for n in range(1,10):
    if n%2==0:
        continue
    print (n)

结果显示：
1
3
5
7
9


a=1
while a<7:
    a=a+1
    if a==4:
        continue 
    for i in range(7,10):
        if i==9:
            continue
        print (i)

结果显示：
7
8
7
8
7
8
7
8
7
8

continue 语句指的是结束执行本次循环中的剩余的语句，然后继续执行下一轮的循环；
break 语句指的是直接结束这个循环，包括结束执行该循环的剩余的所有次循环。


for i in range(10,19):
    if i==15:
        continue
    print (i)

结果显示：
10
11
12
13
14
16
17
18

for i in range(10,19):
    if i==15:
        break
    print (i)

结果显示：
10
11
12
13
14

2.5 Python 函数

认识函数
函数是用来封装特定功能的。
两种类型的函数：一种是系统自带的不用我们编写器功能的函数；另一种是我们自定义的需要我们编写其功能的函数。

Python中的函数功能

a="ace"
print (len(a))
3

a="student,my xxxx"
b=a.split('t')
print (b)
['s', 'uden', ',my xxxx']

a.upper()
'STUDENT,MY XXXX'

在Python中定义函数

def function1():
    a=9
    a+=8
    print (a)
    
function1()
17

形参与实参

a="abcdm"
print (len(a))
5

形参

def function(a,b):
    if a>b:
        print (a)
    else:
        print (b)

function(4,5)
5

实参

def function1(a,b):
    if a>b:
        return 'a+b'
    else:
        return 'a-b'
a=function1(1,3)
print (a)
a-b

参数的传递

def function(a=1,b=0):
    if a>b:
        return a
    else:
        return b
max=function(7,8)
print (max)
8

function()
1


a=9
b=10
c=1
def function(add=0,b=0,c=0):
    print (add)
    print (b)
    print (c)
function(a,c,b)
9
1
10

function(add=a,b=b,c=c)
9
10
1

function(b=7,add=8)
8
7
0

function(c=2,b=3,add=5)
5
3
2

全局变量与局部变量

作用域：一个变量在一定的范围内起作用。

i=10      #这里定义一个全局变量i
print (i)
10

def func():
    i=8 #给局部变量i赋值
func()
print (i)
10

局部变量

i=2  #给全局变量i赋值
def func2(a):
    i=7  #给局部变量i赋值
    print (i)
func2(1)
print (i)
7
2

func2(i)
7

print (i)
2

全局变量

def func3():
    global i
    i=7
a=func3()
print (a)
print (i)
None
7

对函数的调用与返回值
对函数的调用

i=7
def func3 ():
    i=1
func3 ()                 #调用函数
print (i)
7

函数的返回值

def test():
    i=7
    return i
print (test())
7

def test2(i,j):
    k=i*j
    return (i,j,k)
a=test2(4,5)
print (a)
4 5 20

文档字符串

def d(i,j):
    '''这个函数实现一个乘法运算。
    函数会返回一个乘法运算的结果。'''
    k=i*j
    return k
help(d)

Help on function d in module __main__:

d(i, j)
    这个函数实现一个乘法运算。
    函数会返回一个乘法运算的结果。

通过对文档字符串的说明，我们就可以明白这个函数的功能及所返回结果的属性。

2.6 Python 模块

认识 Python 模块
模块：是可以实现一项或多项功能的模块。函数是一段程序，模块是一项程序块，函数和模块都用来实现功能，但是模块的作用范围比函数广，模块中可以包含很多函数。
通过import 导入整个模块

import pandas
import pandas as pd

通过from import 导入整个模块

from pandas import Series

sys 模块
我们把在标准库中与系统功能有关的这些模块叫做sys 模块。

import sys

print (sys.argv[0])

sys.getdefaultencoding()
'utf-8'

from import 详解

from pandas import DataFrame
df1 = DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)})
df1.head(2)


  data1	key
0	0	b
1	1	b

from pandas import *
df1 = DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)})
df1.head(2)

  data1	key
0	0	b
1	1	b

认识__name__属性
主模块：如果一个模块是被直接使用的，没有被其他模块调用。
如果一个模块的__name__ 属性的值是__main__ ，那么这个模块是主模块。

print (__name__)
__main__

if __name__=="__main__":
     print ("It's main")
else:
     print ("It's not main")

It's main

自定义模块：需要我们自己定义和编写
定义一点代码，保存，调用
dir（）函数
通过dir（）函数来查看指定模块的功能列表。

import pandas
dir(pandas)

还能查看任意指定对象的功能列表。

a = [1]
dir(a)

2.7 Python异常处理与文件操作

Python 异常处理
出现异常，首先检查语法规则或者是否打错字符；然后网上搜索各路大神的解决方案。
异常的发生
系统自定义的异常
自定义异常

class SoSError(Exception):                 #按照命名规范，以Error结尾，并且自定义异常需要继承Exception类
    def __init__(self):
        Exception.__init__(self)
try:
    i=8
    if i>7:
        raise SoSError()
except SoSError:
    print ("SoSError:我错了")

SoSError:我错了

try finally 的使用
无论是否发生异常，都将执行最后的代码

#假如要实现不管中间是否发生异常，都要输出hello world
try:
    print (w)
finally:
    print ("不管上面是否异常，我必须输出hello world！")

不管上面是否异常，我必须输出hello world！

文件操作

创建某个文件

#创建某个文件
import os
os.mkdir(r"d:/newdir")

文件的基本操作：增、删、查、改。

你可能感兴趣的:(python书籍笔记,python,数据分析,大数据,人工智能)

新手如何使用 Milvus 巴依老爷coder 数据库 milvus 向量数据库数据库
一文带你入门Milvus：详细指南新手如何使用Milvus：详细指南一、Milvus简介主要特点应用领域二、安装Milvus安装DockerCompose基于DockerCompose安装Milvus服务端安装attu-可视化界面工具三、快速入门安装PythonSDK连接数据库方式1方式2（方式1的封装）数据库操作核心概念集合操作数据操作插入数据精准查询数据-get条件查询数据-query查询数据
nginx-部署Python网站项目 skyQAQLinux python linux nginx 服务器
一、部署Python网站项目实验要求配置Nginx使其可以将动态访问转交给uWSGI安装Python工具及依赖1)拷贝软件到proxy主机[root@server1~]#scp-r/linux-soft/s2/wk/python/192.168.99.5:/root2)安装python依赖软件[root@proxy~]#yum-yinstallgccmakepython3python3-devel
Python 3.6.8 64位独立安装程序霍娴果Myrtle
Python3.6.864位独立安装程序【下载地址】Python3.6.864位独立安装程序Python3.6.864位独立安装程序欢迎使用Python3.6.64位版安装包！本资源专门针对需要在64位操作系统上进行Python环境搭建的用户项目地址:https://gitcode.com/open-source-toolkit/98d19欢迎使用Python3.6.64位版安装包！本资源专门针对
Python 3.6.8 安装包下载何盼思Kit
Python3.6.8安装包下载【下载地址】Python3.6.8安装包下载Python3.6.8安装包下载本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构项目地址:https://gitcode.com/open-source-toolkit/d9647本仓库提供适用于Windows操作系统的Python3.6.8安装包，支持x86和x64架构。Pyt
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
大数据技术实战---项目中遇到的问题及项目经验一个“不专业”的阿凡大数据
问题导读：1、项目中遇到过哪些问题？2、Kafka消息数据积压，Kafka消费能力不足怎么处理？3、Sqoop数据导出一致性问题？4、整体项目框架如何设计？项目中遇到过哪些问题7.1Hadoop宕机（1）如果MR造成系统宕机。此时要控制Yarn同时运行的任务数，和每个任务申请的最大内存。调整参数：yarn.scheduler.maximum-allocation-mb（单个任务可申请的最多物理内存
Python匿名函数Lambda，不止是省略函数名这么简单橙色小博 python的学习之旅 python 开发语言
目录1.前言2.Lambda函数的基本用法3.关于Lambda函数的应用3.1与map函数结合3.2lambda与if-else语句3.3多参数lambda3.4嵌套lambda3.5字典与lambda（也是我本人最喜欢的用法）3.6lambda其他用法4.总结：Lambda的编程哲学1.前言在Python的广阔天地里，Lambda函数宛如一颗璀璨的明珠，以其简洁优雅的姿态，为代码增添了一份独特的
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four 热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
python 捕获异常 weixin_30730151 python 数据库
异常：由于代码的逻辑或者语法错误导致的程序中断。在学习Python的过程当中，大家一定要区分清楚异常和布尔值False布尔值的False只是一个值，通常代表的是一个条件的不成立，常用于逻辑判断比如：1num=22print(num>3)3ifnum>3:4print("num>3")异常指的是由于代码的逻辑或者语法错误导致的程序中断比如：1num=222+"2"了解了上面的逻辑之后，我们来看看大家
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
python爬虫Redis数据库 Æther_9 Python爬虫零基础入门数据库 python 爬虫
Redis数据库Redis简介Redis是完全开源免费的，遵守BSD协议，是一个高性能的key-value数据库。Redis与其他key-value缓存产品有以下三个特点：Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。Redis不仅仅支持简单的key-value类型的数据，同时还提供list，set，zset，hash等数据结构的存储。redis：半持
python sympy的安装与使用范哥来了 python 开发语言
为了安装和使用sympy，您可以按照以下步骤进行操作：安装SymPy首先，您需要确保已经安装了Python。接着，可以通过pip来安装sympy。打开命令行工具（如终端或命令提示符），然后输入以下命令来安装sympy：pipinstallsympy如果您使用的是特定的Python环境，请确保激活该环境后再执行上述安装命令。使用SymPy安装完成后，您就可以在Python项目中导入并使用sympy了
facefusion AI换脸软件的本地部署过程记录 kfrealme 人工智能
tags:AI驾驭facefusion我的环境Win10+N卡安装步骤安装Python3.10方案手动安装Python官网下载安装包安装PythonReleasesforWindows|Python.org我的蓝奏云分享https://www.lanzoub.com/i9La81s1o5gb密码:h17b命令行安装1以管理员身份打开「命令提示符」2删除Microsoft官方源wingetsourc
Python中手动实现进制转换棉猴 Python 进制转换十进制二进制十六进制八进制
在《Python中进制转换》中提到可以使用bin()、oct()、int()和hex()等函数编程实现数字间的进制转换。除了编程实现进制转换外，还可以通过手动实现。1手动实现二进制数转换为十进制可以通过“填空法”手动将二进制数转换为十进制数，例如将二进制数“0b1101”转换为十进制数的方法如图1所示。“填空法”可以归纳为四个步骤：首先“画空格”，接下来“写次方”，然后“填数字”，最后“列算式”。
Python中的进制转换棉猴 #Python数据类型 Python 进制转化二进制八进制十六进制 bin oct
常用的进制有二进制、八进制、十进制和十六进制。1四种进制简介最常用的十进制基本原理是“逢十进一”，因此十进制包括的数字是“0-9”;同理，二进制的基本原理是“逢二进一”，包含的数字是“0-1”;八进制是“逢八进一”，包含的数字是“0-7”；十六进制是“逢十六进一”，包含的数字是“0-15”，其中用“A、B、C、D、E、F”分别表示“10-15”这五个数。2四种进制数的表示对于一个数字“11”,可能
小菜鸟的Python笔记001：将Word文档中数据汇总到Excel表格蜉蝣2805 小菜鸟的Python笔记 python 数据分析
将Word文档中数据汇总到Excel表格前言一、应用场景二、程序思路及准备工作思路如下：准备工作：三、程序代码1、主程序2、获取Word文档列表3、提取文档内数据4、导入到Excel表格四、遇到的问题1、错误AttributeError:word.Application.Quit2、word文档中复选框的识别总结前言我并非一个专业的程序员，只是一个普通的编程爱好者、一只小菜鸟。得益于网络上各路大神
31天Python入门——第9天:再学函数安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录再学函数1.变量在函数中的作用域2.函数的参数传递.补充学习:不定长参数*args和**kwargs3.值传递和引用传递补充学习:把函数作为参数传递4.匿名函数5.python中内置的常用函数zip()map()filter()all()any()6.函数练习再学函数1.变量在函数中的作用域变量的作用域是指变量的作用范围.局部变量:在函数体或局部范围内声明的变量称为局部
Scrapy 入门教程 zru_9602 爬虫 scrapy
Scrapy入门教程Scrapy是一个用于爬取网站数据的Python框架，功能强大且易于扩展。本文将介绍Scrapy的基本概念、安装方法、使用示例，并展示如何编写一个基本的爬虫。1.什么是Scrapy？Scrapy是一个开源的、用于爬取网站数据的框架，主要特点包括：高效、异步的爬取机制强大的XPath和CSS选择器解析能力内置中间件，支持代理、去重等功能易于扩展，适用于各种爬虫需求2.安装Scra
python批量替换word内容_python win32com 库批量替换word文件内容 weixin_39657300
前言win32com模块主要为Python提供调用windows底层组件对word、Excel、PPT等进行操作的功能，只能在Windows环境下使用，并且需要安装office相关软件才行(WPS也行)。实例代码下方代码实现批量替换当前路径下word文档的指定文本内容。importwin32com.clientimportosimporttimedefupdate_replace(file):wo
python strip() 编号1993 python python
参考：http://www.jb51.net/article/37287.htm###############################s.strip(del)：在字符串s的开头结尾处，删除del中存在的字符s.lstrip(del)：在字符串s的开头处，删除del中存在的字符s.rstrip(del)：在字符串s的结尾处，删除del中存在的字符s='asdf'#前后均有空格s.strip(
Python调用WPS进行文档转换PDF及PDF转图片 IT孔乙己 python 开发语言后端
这里是利用WPS进行转换，要先安装WPS。安装依赖pipinstallpypiwin32代码#!/usr/bin/python#-*-coding:UTF-8-*-importosimportwin32com.clientdefConvertByWps(sourceFile,targetFile):ifnotos.path.exists(sourceFile):print(sourceFile+"
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
Python strip() 方法详解：用途、应用场景及示例解析（中英双语）阿正的梦工坊 Python python 开发语言
Pythonstrip()方法详解：用途、应用场景及示例解析在Python处理字符串时，经常会遇到字符串前后存在多余的空格或特殊字符的问题。strip()方法就是Python提供的一个强大工具，专门用于去除字符串两端的指定字符。本文将详细介绍strip()的用法、适用场景，并通过多个示例解析其应用。1.strip()方法简介strip()方法用于去除字符串两端的指定字符（默认为空格和换行符）。它的
使用Python连接SqlServer 带带琪宝工作日记 python sqlserver 开发语言
目录cursor()execute('sqlstr')fetchall()、fetchone()cursor.description属性close()转化为dataframe进行分析使用的是pymssql库，这个库的详细用法参照博客（博客里也有官方文档，英语好的可以直接看）：pythonpymssql—pymssql模块使用指南_夏日白云的博客-CSDN博客我目前的需求只是使用Python连接数据
Python连接SQL SEVER数据库全流程 m0_74823131 数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Java后端开发技术详解小二爱编程· java 开发语言
Java作为一门成熟的编程语言，已广泛应用于后端开发领域。其强大的生态系统和广泛的支持库使得Java成为许多企业和开发者的首选后端开发语言。随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。1.Java基础：理解面向对象的编程Java是一种面向对象的编程语言，面向对象
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&