weixin_39861823

python迷宫小游戏代码_TensorFlow应用实战-17-Qlearning实现迷宫小游戏

什么是Q-learning

Q是Quality的首字母，表示"质量/优劣"，表示给它打一个分。

在某些状态下做某个动作，会给他一个Q的价值。

learning就是学习的意思。基于质量，评判做出选择。

Q learning 是基于价值(Value-Based) 的学习

Q learning 是离线(off-play) 学习基于过去的记忆学习。

炸弹奖励是-1 宝石奖励为1。

Q learning 是基于价值的: State-Actio

对于state-action对做出一个打分。

总共有12个状态，s1到s12.对于每一个状态会有四个动作。对于每个状态下的每个动作会有一个Q的值。

游戏中不断去跳转Q表中的值，学到最佳策略。

算法:

中文的算法解释。之后我们会基于这个中文算法描述来写我们的代码。

流程图：

基于表格的Q learning 局限性

对于状态(State) 非常多的(例如围棋) 无能无力

神经网络最会记住N多的参数，解决了Q Learing 的表格的局限。

结合深度学习(深度神经网络) 和 Q learning 推出了 DQL/DQN

深度Q learning 或者深度的Q 网络

深度Q learning (DQL/DQN)

使用深度神经网络实现Q-learning的方法。克服了表格的局限。

Q-learning 实现机器人走迷宫

红色代表两个炸弹。蓝色宝藏。结束之后打印出Q表

实现步骤

游戏环境机器人大脑游戏主程序实现游戏的环境

迷宫的地图是这样的，左下角有个起点。-1 是炸弹 +1 是宝藏。

用Tkinter 来模拟gym的环境构建。我们用到的方法名和用法都和gym是类似的。

完成的迷宫地图如下

编写我们的env.py

1# -*- coding: UTF-8 -*-

2"""

3Q Learning 例子的 Maze（迷宫）环境

4黄色圆形 : 机器人

5红色方形 : 炸弹 [reward = -1]

6绿色方形 : 宝藏 [reward = +1]

7其他方格 : 平地 [reward = 0]

8"""

9import sys

10import time

11import numpy as np

12# Python2 和 Python3 中 Tkinter 的名称不一样

13if sys.version_info.major == 2:

14import Tkinter as tk

15else:

16import tkinter as tk

python2与python3下的Tkinter的不同引入处理。

1WIDTH = 4 # 迷宫的宽度

2HEIGHT = 3 # 迷宫的高度

3UNIT = 40 # 每个方块的大小（像素值）

构建一个class继承TK

1# 迷宫类

2class Maze(tk.Tk, object):

3def __init__(self):

4super(Maze, self).__init__()

5self.action_space = ['u', 'd', 'l', 'r'] # 上，下，左，右四个 action（动作）

6self.n_actions = len(self.action_space) # action 的数目

7self.title('Q Learning')

8self.geometry('{0}x{1}'.format(WIDTH * UNIT, HEIGHT * UNIT)) # Tkinter 的几何形状

9self.build_maze()

定义一个init的构造方法。调用父类的初始化方法。

定义它的动作空间: action_space 上下左右四个。 up down action的数目。 title: 生成的游戏窗口的title geometry 几何形状。第一维是一宽度乘以每个单元的像素值，第二维是高乘以每个单元像素值。

调用 build Maze方法

1创建迷宫

2def build_maze(self):

3# 创建画布 Canvas.白色背景，宽高。

4self.canvas = tk.Canvas(self, bg='white',

5 width=WIDTH * UNIT,

6 height=HEIGHT * UNIT)

8# 绘制横纵方格线。创建线条。

9for c in range(0, WIDTH * UNIT, UNIT):

10 x0, y0, x1, y1 = c, 0, c, HEIGHT * UNIT

11 self.canvas.create_line(x0, y0, x1, y1)

12for r in range(0, HEIGHT * UNIT, UNIT):

13 x0, y0, x1, y1 = 0, r, WIDTH * UNIT, r

14 self.canvas.create_line(x0, y0, x1, y1)

16# 零点（左上角）往右是x增长的方向。往左是y增长的方向。

17# 因为每个方格是40像素，20,20是中心位置。

18origin = np.array([20, 20])

20# 创建我们的探索者机器人（robot）

21robot_center = origin + np.array([0, UNIT * 2])

22# 创建椭圆，指定起始位置。填充颜色

23self.robot = self.canvas.create_oval(

24 robot_center[0] - 15, robot_center[1] - 15,

25 robot_center[0] + 15, robot_center[1] + 15,

26 fill='yellow')

28# 炸弹 1

29bomb1_center = origin + UNIT

30self.bomb1 = self.canvas.create_rectangle(

31 bomb1_center[0] - 15, bomb1_center[1] - 15,

32 bomb1_center[0] + 15, bomb1_center[1] + 15,

33 fill='red')

35# 炸弹 2

36bomb2_center = origin + np.array([UNIT * 3, UNIT])

37self.bomb2 = self.canvas.create_rectangle(

38 bomb2_center[0] - 15, bomb2_center[1] - 15,

39 bomb2_center[0] + 15, bomb2_center[1] + 15,

40 fill='red')

42# 宝藏

43treasure_center = origin + np.array([UNIT * 3, 0])

44self.treasure = self.canvas.create_rectangle(

45 treasure_center[0] - 15, treasure_center[1] - 15,

46 treasure_center[0] + 15, treasure_center[1] + 15,

47 fill='green')

49# 设置好上面配置的场景

50self.canvas.pack()

reset方法表示游戏重新开始，机器人回到左下角

1# 重置（游戏重新开始，将机器人放到左下角）

2def reset(self):

3self.update()

4time.sleep(0.5)

5self.canvas.delete(self.robot) # 删去机器人

6origin = np.array([20, 20])

7robot_center = origin + np.array([0, UNIT * 2])

8# 重新创建机器人

9self.robot = self.canvas.create_oval(

10 robot_center[0] - 15, robot_center[1] - 15,

11 robot_center[0] + 15, robot_center[1] + 15,

12 fill='yellow')

13# 返回观测（observation）

14return self.canvas.coords(self.robot)

使用update方法更新一下游戏环境。使用coords返回一个观测值。

走一步(机器人实施一个action)

1# 走一步（机器人实施 action）

2def step(self, action):

3# s表示一个state状态值

4s = self.canvas.coords(self.robot)

5# 基准动作

6base_action = np.array([0, 0])

7if action == 0: # 上

8 if s[1] > UNIT:

9 base_action[1] -= UNIT

10elif action == 1: # 下

11 if s[1] < (HEIGHT - 1) * UNIT:

12 base_action[1] += UNIT

13elif action == 2: # 右

14 if s[0] < (WIDTH - 1) * UNIT:

15 base_action[0] += UNIT

16elif action == 3: # 左

17 if s[0] > UNIT:

18 base_action[0] -= UNIT

20# 移动机器人，移动到baseation横向纵向坐标值

21self.canvas.move(self.robot, base_action[0], base_action[1])

23# 取得下一个 state

24s_ = self.canvas.coords(self.robot)

26# 奖励机制。

27if s_ == self.canvas.coords(self.treasure):

28 reward = 1 # 找到宝藏，奖励为 1

29 done = True

30 s_ = 'terminal' # 终止

31 print("找到宝藏，好棒!")

32elif s_ == self.canvas.coords(self.bomb1):

33 reward = -1 # 踩到炸弹1，奖励为 -1

34 done = True

35 s_ = 'terminal' # 终止

36 print("炸弹 1 爆炸...")

37elif s_ == self.canvas.coords(self.bomb2):

38 reward = -1 # 踩到炸弹2，奖励为 -1

39 done = True

40 s_ = 'terminal' # 终止

41 print("炸弹 2 爆炸...")

42else:

43 reward = 0 # 其他格子，没有奖励

44 done = False

46return s_, reward, done

47# 调用 Tkinter 的 update 方法

48def render(self):

49time.sleep(0.1)

50self.update()

调用Tkinter的update方法。0.1秒去走一步。

实现Q learning（机器人的大脑）

Q learning的 Q表

每一行是一个状态，s1 到 s4

每一列是在这个状态下可以采取的行动。

Q learning的算法

我们例子的Q表: 有12个格子,4个动作

对应的Q值。

中文的Q learning算法伪代码

首先会随机的初始化Q表中的值。对于每一个回合做一个循环。

循环中首先:

初始化初始位置的状态。

新的Q表中的Q(s,a)更新规则如上。

著名的贝尔曼方程

e-Greedy 贪婪算法: 持续探索(Exploration)

贪婪度 e: e-Greedy 算法可以预防更好的选择一直没有被探索到。

1-e 的概率选择Q表中state位置值最大的action

e的概率随机选取Q表中state位置的action

https://www.zhihu.com/question/26408259?sort=created

http://mnemstudio.org/path-finding-q-learning-tutorial.htm

代码编写

1# -*- coding: UTF-8 -*-

2"""

3Q Learning 算法。做决策的部分，相当于机器人的大脑

4"""

5import numpy as np

6import pandas as pd

7class QLearning:

8def __init__(self, actions, learning_rate=0.01, discount_factor=0.9, e_greedy=0.1):

9self.actions = actions # action 列表

10self.lr = learning_rate # 学习速率

11self.gamma = discount_factor # 折扣因子

12self.epsilon = e_greedy # 贪婪度

13# 列是action，上下左右四种。

14self.q_table = pd.DataFrame(columns=self.actions, dtype=np.float32) # Q 表

15# 检测 q_table 中有没有这个 state

16# 如果还没有当前 state, 那我们就插入一组全 0 数据, 作为这个 state 的所有 action 的初始值

17def check_state_exist(self, state):

18# state对应每一行，如果不在Q表中。

19if state not in self.q_table.index:

20 # 插入一组全 0 数据，上下左右，四个动作，创建四个零

21 self.q_table = self.q_table.append(

22 pd.Series(

23 [0] * len(self.actions),

24 index=self.q_table.columns,

25 name=state,

26 )

27 )

29# 根据 state 来选择 action

30def choose_action(self, state):

31self.check_state_exist(state) # 检测此 state 是否在 q_table 中存在

32# 选行为，用 Epsilon Greedy 贪婪方法

33if np.random.uniform() < self.epsilon:

34 # 随机选择 action

35 action = np.random.choice(self.actions)

36else: # 选择 Q 值最高的 action

37 state_action = self.q_table.loc[state, :]

38 # 同一个 state, 可能会有多个相同的 Q action 值, 所以我们乱序一下

39 state_action = state_action.reindex(np.random.permutation(state_action.index))

40 # 每一行中取到Q值最大的那个

41 action = state_action.idxmax()

42return action

44# 学习。更新 Q 表中的值

45def learn(self, s, a, r, s_):

46# s_是下一个状态

47self.check_state_exist(s_) # 检测 q_table 中是否存在 s_

49q_predict = self.q_table.loc[s, a] # 根据 Q 表得到的估计（predict）值

51# q_target 是现实值

52if s_ != 'terminal': # 下个 state 不是终止符

53 q_target = r + self.gamma * self.q_table.loc[s_, :].max()

54else:

55 q_target = r # 下个 state 是终止符

57# 更新 Q 表中 state-action 的值

58self.q_table.loc[s, a] += self.lr * (q_target - q_predict)

编写游戏主程序、

1 play.py

2 # -*- coding: UTF-8 -*-

3 """

4 游戏的主程序，调用机器人的 Q learning 决策大脑和 Maze 环境

5 """

6 from env import Maze

7 from q_learning import QLearning

8 def update():

9 for episode in range(100):

10# 初始化 state（状态）

11state = env.reset()

13step_count = 0 # 记录走过的步数

15while True:

16 # 更新可视化环境

17 env.render()

19 # RL 大脑根据 state 挑选 action

20 action = RL.choose_action(str(state))

22 # 探索者在环境中实施这个 action, 并得到环境返回的下一个 state, reward 和 done (是否是踩到炸弹或者找到宝藏)

23 state_, reward, done = env.step(action)

25 step_count += 1 # 增加步数

27 # 机器人大脑从这个过渡（transition） (state, action, reward, state_) 中学习

28 RL.learn(str(state), action, reward, str(state_))

30 # 机器人移动到下一个 state

31 state = state_

33 # 如果踩到炸弹或者找到宝藏, 这回合就结束了

34 if done:

35 print("回合 {} 结束. 总步数 : {}\n".format(episode+1, step_count))

36 break

37 # 结束游戏并关闭窗口

38 print('游戏结束')

39 env.destroy()

40 if __name__ == "__main__":

41 # 创建环境 env 和 RL

42 env = Maze()

43 RL = QLearning(actions=list(range(env.n_actions)))

44 # 开始可视化环境

45 env.after(100, update)

46 env.mainloop()

47 print('\nQ 表:')

48 print(RL.q_table)

DeepQlearning实现：迷宫游戏

我们通过之前的Qlearning 知道了算法和代码

Qlearning 局限: 不能表示很多的状态和Q值。下围棋这个例子

可以表示很多参数

最终效果:

实现步骤:

机器人大脑

游戏环境

游戏主程序。

DeepQlearing 有Q-learning的优势

Q-learning 是 off-Policy (离线学习可以学习过往经验或记忆)

Q-learning 可以单步更新，比回合更新更有效率

经验回放(去学习过往的经验或记忆)

单步更新，更新网络参数

记忆库存储过往记忆。

估计神经网络现实实际神经网络

1# -*- coding: UTF-8 -*-

2"""

3Deep Q Learning 算法。做决策的部分，相当于机器人的大脑

4"""

5import numpy as np

6import tensorflow as tf

7# 伪随机数。为了复现结果

8np.random.seed(1)

9tf.set_random_seed(1)

10class DeepQLearning:

11def __init__(

12 self,

13 n_actions,

14 n_features,

15 learning_rate=0.01,

16 discount_factor=0.9,

17 e_greedy=0.1,

18 replace_target_iter=300,

19 memory_size=500,

20 batch_size=32,

21 output_graph=False, # 是否存储 TensorBoard 日志

22 ):

23self.n_actions = n_actions # action 的数目

24self.n_features = n_features # state/observation 里的特征数目

25self.lr = learning_rate # 学习速率

26self.gamma = discount_factor # 折扣因子

27self.epsilon = e_greedy # 贪婪度 Epsilon Greedy

28self.replace_target_iter = replace_target_iter # 每多少个迭代替换一下 target 网络的参数

29self.memory_size = memory_size # 记忆上限

30self.batch_size = batch_size # 随机选取记忆片段的大小

32# 学习次数 (用于判断是否更换 Q_target_net 参数)

33self.learning_steps = 0

35# 初始化全 0 记忆 [s, a, r, s_]

36self.memory = np.zeros((self.memory_size, n_features * 2 + 2))

38# 构建神经网络

39self.construct_network()

41# 提取 Q_target_net 和 Q_eval_net 的参数

42t_params = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='Q_target_net')

43e_params = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='Q_eval_net')

45# 用 Q_eval_net 参数来替换 Q_target_net 参数

46with tf.variable_scope('target_replacement'):

47 self.target_replace_op = [tf.assign(t, e) for t, e in zip(t_params, e_params)]

49self.sess = tf.Session()

51if output_graph:

52 # 输出 TensorBoard 日志文件

53 tf.summary.FileWriter("logs", self.sess.graph)

55# 初始化全局变量

56self.sess.run(tf.global_variables_initializer())

57'''

58构建两个神经网络（Q_eval_net 和 Q_target_net）。

59固定住一个神经网络 (Q_target_net) 的参数（所谓 Fixed Q target）。

60Q_target_net 相当于 Q_eval_net 的一个历史版本, 拥有 Q_eval_net 之前的一组参数。

61这组参数被固定一段时间, 然后再被 Q_eval_net 的新参数所替换。

62Q_eval_net 的参数是不断在被提升的

63'''

64def construct_network(self):

65# 输入数据 [s, a, r, s_]

66with tf.variable_scope('input'):

67 self.s = tf.placeholder(tf.float32, [None, self.n_features], name='s') # State

68 self.a = tf.placeholder(tf.int32, [None, ], name='a') # Action

69 self.r = tf.placeholder(tf.float32, [None, ], name='r') # Reward

70 self.s_ = tf.placeholder(tf.float32, [None, self.n_features], name='s_') # 下一个 State

72# 权重和偏差

73w_initializer, b_initializer = tf.random_normal_initializer(0., 0.3), tf.constant_initializer(0.1)

75# 创建 Q_eval 神经网络, 适时更新参数

76with tf.variable_scope('Q_eval_net'):

77 e1 = tf.layers.dense(self.s, 20, tf.nn.relu, kernel_initializer=w_initializer,

78 bias_initializer=b_initializer, name='e1')

79 self.q_eval = tf.layers.dense(e1, self.n_actions, kernel_initializer=w_initializer,

80 bias_initializer=b_initializer, name='e2')

82# 创建 Q_target 神经网络, 提供 target Q

83with tf.variable_scope('Q_target_net'):

84 t1 = tf.layers.dense(self.s_, 20, tf.nn.relu, kernel_initializer=w_initializer,

85 bias_initializer=b_initializer, name='t1')

86 self.q_next = tf.layers.dense(t1, self.n_actions, kernel_initializer=w_initializer,

87 bias_initializer=b_initializer, name='t2')

89# 在 Q_target_net 中，计算下一个状态 s_j_next 的真实 Q 值

90with tf.variable_scope('Q_target'):

91 q_target = self.r + self.gamma * tf.reduce_max(self.q_next, axis=1)

92 # tf.stop_gradient 使 q_target 不参与梯度计算的操作

93 self.q_target = tf.stop_gradient(q_target)

95# 在 Q_eval_net 中，计算状态 s_j 的估计 Q 值

96with tf.variable_scope('Q_eval'):

97 a_indices = tf.stack([tf.range(tf.shape(self.a)[0], dtype=tf.int32), self.a], axis=1)

98 # tf.gather_nd 用 indices 定义的形状来对 params 进行切片

99 self.q_eval_by_a = tf.gather_nd(params=self.q_eval, indices=a_indices)

100

101# 计算真实值和估计值的误差（loss）

102with tf.variable_scope('loss'):

103 self.loss = tf.reduce_mean(tf.squared_difference(self.q_target, self.q_eval_by_a, name='error'))

104

105# 梯度下降法优化参数

106with tf.variable_scope('train'):

107 self.train_op = tf.train.RMSPropOptimizer(self.lr).minimize(self.loss)

108

109# 在记忆中存储和更新 transition（转换）样本 [s, a, r, s_]

110def store_transition(self, s, a, r, s_):

111if not hasattr(self, 'memory_count'):

112 self.memory_count = 0

113transition = np.hstack((s, [a, r], s_))

114# 记忆总大小是固定的。如果超出总大小, 旧记忆就被新记忆替换

115index = self.memory_count % self.memory_size

116self.memory[index, :] = transition

117self.memory_count += 1

118

119# 根据 state 来选 action

120def choose_action(self, state):

121# 统一 state 的形状

122state = state[np.newaxis, :]

123

124if np.random.uniform() < self.epsilon:

125 # 随机选择

126 action = np.random.randint(0, self.n_actions)

127else:

128 # 让 Q_eval_net 神经网络生成所有 action 的值, 并选择值最大的 action

129 actions_value = self.sess.run(self.q_eval, feed_dict={self.s: state})

130 action = np.argmax(actions_value)

131

132 return action

133

134 # 学习

135 def learn(self):

136# 是否替换 Q_target_net 参数

137if self.learning_steps % self.replace_target_iter == 0:

138 self.sess.run(self.target_replace_op)

139 print('\n替换现实网络的参数...\n')

140

141# 从记忆中随机抽取 batch_size 长度的记忆片段

142if self.memory_count > self.memory_size:

143 sample_index = np.random.choice(self.memory_size, size=self.batch_size)

144else:

145 sample_index = np.random.choice(self.memory_count, size=self.batch_size)

146batch_memory = self.memory[sample_index, :]

147

148# 训练 Q_eval_net

149_, _ = self.sess.run(

150 [self.train_op, self.loss],

151 feed_dict={

152 self.s: batch_memory[:, :self.n_features],

153 self.a: batch_memory[:, self.n_features],

154 self.r: batch_memory[:, self.n_features + 1],

155 self.s_: batch_memory[:, -self.n_features:],

156 })

157

158self.learning_steps += 1

Policy Gradient 实现 Gym游戏

实现步骤: 机器人大脑 & 游戏主程序

什么是Policy Gradient

Policy-Based 方法: 与Value-Based(如Q-learning DQN)不同

策略上做一个梯度下降

Policy Gradient 跳过 Value 阶段，根据概率来输出具体的Action

输出的Action可以是一个连续的值，Value-Based输出是不连续的。

原文链接：https://www.jianshu.com/p/e37f5d98c886

你可能感兴趣的:(python迷宫小游戏代码)

【论文复现】——基于SIFT特征点结合ICP的点云配准方法点云侠点云配准专题开发语言计算机视觉算法 3d c++
目录一、论文概述二、代码实现三、结果展示1、初始位置2、配准结果四、实验心得一、论文概述在点云配准过程中，针对迭代最近点(ICP)算法对点云初始位置依赖性强且迭代速度慢的问题，提出一种基于尺度不变特征变换(SIFT)特征点结合ICP的点云配准方法。首先利用SIFT算法提取待配准点云和目标点云的特征点;接着计算出特征点的快速点特征直方图(FPFH)特征;然后依据该特征使用采样一致性初始配准(SA
.net 4.0 webServices 的使用，从前端到后端，代码超全。静静香甜 .net 前端后端 c#
1、创建webServices：创建之后会生成两个文件，分别是：SecurityWebService.asmx，SecurityWebService.asmx.csSecurityWebService.asmx代码：SecurityWebService.asmx.cs代码：usingNewtonsoft.Json;usingNewtonsoft.Json.Linq;usingSystem;usin
【分治法】最接近点对问题 C++（附代码分析及实例） haaaaaaarry 算法设计与分析算法
问题描述给定平面上n个点，找其中的一对点，使得在n个点组成的所有点对中，该点对间的距离最小问题分析先考虑一下一维情况下，取中间某个点m，将所有点划分为两个集合，递归的找出左右集合的最接近点对，最后再和最靠近点m的左右两点间的距离作比较，最小的就是整个点对中最接近的现在将一维的情况扩展到二维，二维比一维复杂的地方在于每个点都有两个坐标，我们用一条直线l将平面上的所有点同样分成两个集合，再递归的去两个
鸿蒙5开发：Ark-TS UI 动效设计指南：让你的应用界面 “活” 起来 harmonyos-next
在鸿蒙5应用开发中，Ark-TSUI不仅能让你快速构建漂亮的界面，还提供了丰富的动效功能，让界面交互更加流畅和有趣。今天咱们聊聊Ark-TSUI的动效设计，看看如何用几行代码实现按钮点击动画、页面过渡效果等，让你的应用“眼前一亮”。一、Ark-TSUI动效的核心玩法：简单又强大Ark-TSUI的动效设计基于Animator类和内置的过渡效果，无需复杂的第三方库，就能实现多种动画效果。比如：按钮点击
Python 中的 Iterable、Iterator 与生成器 CavenWang python python 开发语言
Python中的Iterable、Iterator与生成器Iterable（可迭代对象）Iterator（迭代器）生成器（Generator）Iterable、Iterator与生成器的关系实际应用生成器的高级用法（send()）总结在Python中，Iterable、Iterator和生成器是三个密切相关的概念，它们都与迭代操作有关，但各自扮演不同的角色。本文将深入探讨它们的定义、区别以及实际应
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
Python Lambda 函数详解 2201_75491841 python 开发语言 lambda函数
一、引言在Python编程中，我们经常会遇到一些简单的函数，这些函数可能只在某个特定的地方使用一次，而且逻辑非常简单。如果为了这些简单的功能定义一个常规的函数，不仅会增加代码的冗余，还会使代码结构变得不够简洁。这时，lambda函数就派上用场了。lambda函数也被称为匿名函数，它为我们提供了一种简洁的方式来定义小型的、一次性使用的函数。在本文中，我们将深入探讨Python中的lambda函数，包
小白学AI量化：DeepSeek+Python构建强大的金融数据挖掘与多维分析机器人老余捞鱼 AI顾投高级策略 AI探讨与学习人工智能 python 金融 deepseek
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：在机构主导的量化交易时代，普通投资者如何用一杯奶茶的钱（15元/天）打造专业级智能量化产品？本文将为您揭秘一个革命性的解决方案——基于国产大模型DeepSeek和Python构建的智能数据挖掘分析机器人。它不仅适用于通用网页数据抓取，更能深度应用于金融领域，精准捕捉市场信号。本文“干货”很多，请务必耐心读完。一、颠覆认知的性价比革命1.
python processpoolexecutor_Python多进程解决方案multiprocessing ProcessPoolExecutor weixin_39599046 python
大多数编程语言都会有多线程和多进程的概念，至于线程和进程的概念，大家可以百度一下。作为一门胶水语言，Python毫不意外，也可以利用多线程和多进程处理并发问题，但是多线程由于GIL的存在，起作用范围大打折扣，仅限于在IO等场景可以发挥点作用。所以，今天要跟大家分享的是Python多进程方案，更好地利用系统多核，从而提升性能。基础方案一：利用Process新建一个子进程，在子进程执行任务。我们写一个
python processpoolexecutor_Python线程和进程池并行编程三千香蕉三千 python
Python3.2版本之后发布了concurrent.futures模块，用以支持和管理并发编程，内容涵盖了进程和线程池(ThreadandProcessPooling)、非确定性执行流(NondeterministicExecutionFlows)以及进程和线程同步。本文通过将带有可选参数的任务提交(Submit)给执行器(Executor)来实例化futures对象。执行器是线程或者进程执行池
python 底层原理processpoolexecutor_Python 并发编程：PoolExecutor 篇风投小虾 python
个人笔记，如有疏漏，还请指正。使用多线程(threading)和多进程(multiprocessing)完成常规的并发需求，在启动的时候start、join等步骤不能省，复杂的需要还要用1-2个队列。随着需求越来越复杂，如果没有良好的设计和抽象这部分的功能层次，代码量越多调试的难度就越大。对于需要并发执行、但是对实时性要求不高的任务，我们可以使用concurrent.futures包中的PoolE
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
代码随想录day7-链表俩数相加凌凡天链表数据结构 java 算法 leetcode
给你两个非空的链表，表示两个非负的整数。它们每位数字都是按照逆序的方式存储的，并且每个节点只能存储一位数字。请你将两个数相加，并以相同形式返回一个表示和的链表。你可以假设除了数字0之外，这两个数都不会以0开头。示例1：输入：l1=[2,4,3],l2=[5,6,4]输出：[7,0,8]解释：342+465=807.示例2：输入：l1=[0],l2=[0]输出：[0]示例3：输入：l1=[9,9,9
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
conda篇----在已有conda环境的基础上升级python包心惠天意 conda python jvm
conda篇----在已有conda环境的基础上升级python包原先的python版本第一步：condaupdate--all(py11)[xxx@aivrs01xxx]$condaupdate--allCollectingpackagemetadata(current_repodata.json):doneSolvingenvironment:done==>WARNING:Anewervers
systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比笔记250322 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等笔记 bash
systemctlrestart和systemctlreload和systemctldaemon-reload对比以下是systemctlrestart、systemctlreload和systemctldaemon-reload的对比总结：命令作用对象行为适用场景对服务的影响systemctlrestart服务名具体服务强制停止服务，再重新启动。配置或代码有重大变更，或服务出现异常需完全重启。服
conda：一个当下最流行的Python虚拟环境工具 Wang_AI
点击上方“AI派”，选择“设为星标”最新分享，第一时间送达！作者：LeonWang，现为中科院特别研究助理(博士后)，在AI、数据科学和科学计算等方面相关的工程实践上积累了丰富的经验。编辑：王老湿前面的文章中，为大家介绍过Python下的虚拟环境和包管理。在实际中，更为流行的是用Conda来管理Python环境。今天这篇文章就为大家介绍这方面的相关内容。Conda环境Conda简介Conda是目前
【Html+CSS】3D旋转相册小木荣 web前端 css html 3d
3D旋转木马相册&3D盒子相册因为代码大部分相同，就放一起了注释一下就是另一个相册3D旋转木马相册body{background-color:#000;/*视距，使子元素获得视距效果*/perspective:900px;}section{margin:20vhauto;position:relative;width:200px;height:200px;/*开启3D空间*/transform-s
轻松上手：Matplotlib的基本用法全知道大数据方向陪跑私教 python
《轻松上手：Matplotlib的基本用法全知道》嗨，小伙伴们！之前咱们了解了好多厉害的Python包，今天咱们来好好讲讲Matplotlib这个在数据可视化方面超棒的包。**Matplotlib到底该怎么用呢？**这就像是探索一个新的游乐场，每个功能都是一样好玩的项目。一、安装Matplotlib在开始使用Matplotlib之前，得先把它安装好。如果你已经安装了Python的包管理工具pip，
Python 高手编程系列一千七百零八：在事件循环中使用 executors 杨琴1 python 开发语言
Executor.submit()方法返回的Future类实例在概念上非常接近异步编程中使用的协程。这就是为什么我们可以使用执行器在协同多任务和多进程或多线程之间进行混合。此解决方法的核心是事件循环类的BaseEventLoop.run_in_executor(executor,func,*args)方法。它会在进程池或线程池中调度执行由executor参数表示的func函数。这个方法最重要的是它
conda将python低版本环境升级到高版本 dkgee conda python 开发语言
conda将python低版本环境3.7.16升级到高版本3.81.激活你的Conda环境2.升级Python版本3.验证升级4.处理依赖问题5.测试环境注意事项可以将Conda环境中的Python版本从3.7.16升级到3.8。以下是具体步骤：1.激活你的Conda环境首先，你需要激活你想要升级Python版本的环境。假设你的环境名为myenv，你可以使用以下命令激活它：condaactivat
python 爬取某乎某选全部内容路笑笑
在发布了python爬取知乎盐选文章内容后，没想到居然这么快就要更新新的内容了。在下午思考第一篇python爬取知乎盐选文章内容的时候，其实就把自动爬取目录内的其他内容的方法想出来了，但是本来没想这么快更新的，哈哈。不过思来想去还是发出来吧，毕竟要不哪天就忘了。fromDecryptLoginimportloginfrombs4importBeautifulSoupimportreimportba
（含import）两行代码，将ppt的每一页幻灯片保存为图片。（如果你没装office，只装了WPS也可以，只不过更麻烦一些）几道之旅人工智能智能体及数字员工 powerpoint wps
文章目录第一步:安装包第二步：写代码，运行第三步：如果你是Office，现在已经搞定了。但我是WPS，会报错：第四步：直接去包里改代码第五步：保存对包中代码的修改，重新运行咱最开头的代码第六步：成功了第一步:安装包pipinstallpython-office第二步：写代码，运行#安装库：pipinstallpython-officeimportoffice#单页转图片office.ppt.ppt
Python知识分享第十四天闵少搞AI python 开发语言
“”"1.面向对象相关概述概述面向对象是一种编程思想强调的是以对象为基础完成的各种操作它是基于面向过程的扩展Python中是同时支持面向对象和面向过程这两种编程思想的思想特点更符合人们的思考习惯把复杂的问题简单化把人们(程序员)从执行者变成了指挥者2.面向对象三大特征介绍封装继承多态封装概述封装就是隐藏对象的属性和实现细节仅对外提供公共的访问方式举例:插板电脑手机好处提高代码的安全性弊端代码量增加
pythontype函数使用_Python astype(np.float)函数使用方法解析 weixin_39870238 pythontype函数使用
Pythonastype(np.float)函数使用方法解析我的数据库如图结构我取了其中的nameagenr，做成array，只要所取数据存在str型，那么取出的数据，全部转化为str型，也就是array阵列的元素全是str，不管数据库定义的是不是int型。那么问题来了，取出的数据代入公式进行计算的时候，就会类型不符，这是就用到astype(np.float)代码如下importpymysqlim
深入理解 <；和 >；：HTML 实体转义的核心指南！！！小丁学Java 积累小知识 Java Web html 前端
️深入理解<和>：HTML实体转义的核心指南️在编程和文档编写中，符号无处不在，但它们也是引发语法错误、安全漏洞和渲染混乱的头号元凶！本文将聚焦<（小于号）和>（大于号）这两个HTML实体，解析它们的核心作用、使用场景及避坑技巧，助你写出更安全、更健壮的代码！一、❓为什么需要转义？1.符号冲突问题•HTML/XML标签冲突：是标签的起始和结束符（如）。若直接在文本中使用，解
Vue 中的日期格式化实践：从原生 Date 到可视化展示！！！小丁学Java 产品资质管理系统 vue.js 前端 javascript ts
Vue中的日期格式化实践：从原生Date到可视化展示在数据可视化场景中，日期时间的格式化显示是一个高频需求。本文将以一个邀请码关系树组件为例，深入解析Vue中日期格式化的核心方法、性能优化和最佳实践，并配合Mermaid流程图直观展示处理流程！一、️核心方法：原生Date对象处理代码实现privateformatDate(dateString:string|null):string{if(!dat
conda install 和 pip install 的区别不知江月待何人.. 深度学习
condainstall和pipinstall是两个常用的包安装命令，但它们在很多方面存在差异。1.所属管理系统不同1.1condainstallcondainstall是Anaconda和Miniconda发行版自带的包管理工具conda的安装命令。conda是一个跨平台的开源包管理系统和环境管理系统，它不仅可以管理Python包，还能管理其他语言（如R、C++等）的包。conda更侧重于数据科
蓝桥杯备赛计划 laitywgx 蓝桥杯职场和发展
1-2小时的蓝桥杯PythonB组冲刺日程表（持续1个月，聚焦高频考点）：第一周：核心算法突破Day1（周一）学习重点：动态规划（01背包问题）学习资源：AcWing《蓝桥杯辅导课》第8讲（背包问题模板）代码模板速记：#一维01背包模板n,V=map(int,input().split())dp=[0]*(V+1)for_inrange(n):w,v=map(int,input().split()
SassScript：Sass中的编程特性详解 jiajia651304 sass 前端 css
Sass（SyntacticallyAwesomeStylesheets）是一种强大的CSS预处理器，它允许开发者使用类似于编程语言的语法来编写CSS，然后通过编译生成标准的CSS代码。SassScript是Sass中的编程特性集合，它包含了变量、嵌套规则、混合、函数以及控制指令等，极大地提高了CSS的开发效率和可维护性。1.变量SassScript中的变量允许开发者在样式表中存储和重复使用值。变
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那