小羊和小何

AI考试复习

文章目录

复杂度
- 无信息搜索
- 有信息搜索
- 对抗搜索
- CSP 相关
- - General CSP
  - independent subproblem
  - Cutset Conditioning
CSP内容
- Variable Ordering
- - MRV (minimum remaining values)
  - Degree Heuristic
- Value Ordering
- - Least Constraining Value
- Forward Checking
- 弧相容
拍卖
- 拍卖的组成部分
- 拍卖协议的三个维度
- 拍卖系统的影响因素
- 有效设计的拍卖的特征（期望的特征）
- 拍卖类型
- - English auction（英式拍卖）
  - - 介绍
    - 协议
    - 优势策略（dominant strategy）：
    - 特点
  - Dutch auction（荷兰式拍卖）
  - - 介绍
    - 协议
    - 优势策略（dominant strategy）：
    - 特点（与英式拍卖一样）
  - First-price & sealed-bid auction
  - - 介绍
    - 特点
    - 优势策略
  - Second-price sealed-bid auction （Vickrey auction）
  - - 介绍
    - 优势策略
    - 特点
机器学习 & 强化学习
- Book learning
- Search Control Learning
- - $\alpha-beta$ 完美序列
  - 如何 cut off
- 机器学习
- - $\eta$ 的作用
  - 梯度下降在做 game playing 任务时的两个问题
  - TD-leave( $\lambda$ )
- Learning Environment
- - Learn from data
  - Learn from opponents
  - Learn from self
  - 监督学习和 TD-lambda 的对比

复杂度

无信息搜索

宽度优先搜索：

Bidirectional Search

一致代价搜索

深度优先搜索

迭代加深的深度优先搜索

有信息搜索

贪婪优先搜索

A*搜索

对抗搜索

Minmax

Alpha-Beta Pruning + 完美排序

CSP 相关

如果不使用 CSP 而使用深度优先树做着色的相关问题

General CSP

independent subproblem

一共 n 个节点，切分成多个子区域，每个子区域有 c 个节点，在 c 个节点中的求解复杂度是 $d^c$

树结构的CSP

Cutset Conditioning

$d^c$ 是因为在割集中的节点一共有 $c$ 个，每个都有 $d$ 种可能的取值，割集之外的节点数为 $n - c$ 个，这些节点组成了一棵树，这棵树的 CSP 求解复杂度是 $nd^2$ ，所以总体的复杂度如上图所示

CSP内容

Variable Ordering

MRV (minimum remaining values)

选择合法值最少的 variable 进行扩展；可以尽早的暴露问题，因为当 variable 中的 domain 被删除至空集合，那么就会进行回溯

Degree Heuristic

选择具有最多约束的变量，例如下图中先选蓝色的中部（有 5 个约束节点）
这是一种 tie breaking，通常结合 MRV 一起使用（当有两个 variable 中的剩余值数量相同）

Value Ordering

Least Constraining Value

已经选定了一个 variable 进行配色，那么选择这个 variable 中限制最少的颜色进行分配；这样的目的和 MRV 一样也是尽早暴露问题

Forward Checking

弧相容

如果由 A -> B 检查相容性，那么 A 是 tail，B 是 head，如果存在不相容现象，那么从 A 中（tail）中删除对应的值。
例如，NSW -> SA，首先是检查红色，在 SA 中至少存在一个颜色与 NSW 中的红色相容，那么红色不触犯 constrain 因此不动
再检查 NSW 中的蓝色，发现 SA 中没有任何颜色可以与 NSW 中的蓝色相容，因此删除 NSW 中的蓝色

拍卖

拍卖的组成部分

language： a language to describe the allowable strategies an agent can follow
protocol for communicating： 出价人向拍卖人传递信息的方式（open-cry / sealed-bid)
outcome rule： 决定最终的胜利者的原则（first price / second price）

拍卖协议的三个维度

拍卖系统的影响因素

private value 就是每个人对于当前商品的预估价值
common value 市场公认的物品价值

有效设计的拍卖的特征（期望的特征）

efficient：商品最终的去向是最重视他们的人
discourage collusion：阻止勾结。拍卖机制应该阻止两个或两个以上的竞标者之间操纵价格的非法或不公平协议
dominant strategy：优势策略。投标人存在一种优势策略，如果一种策略比其他任何策略都能给投标人带来更好的回报，那么该策略就是优势策略
truth-revealing：揭示物品的真正价值

拍卖类型

English auction（英式拍卖）

介绍

方案和结果规则:拍卖师从要求最低(保留)价格开始，拍卖师邀请投标人出价，必须高于当前收到的最高价格(可能需要一个最低出价增量)，当没有收到进一步的出价时，拍卖结束，如果最终出价超过保留价，货物就被售出，获胜者支付的价格是他们的最终(最高)出价

协议

最后的赢家需要支付最高价 first price
公开竞价 open-cry
价格逐渐升高 ascending

优势策略（dominant strategy）：

不断抬高竞价，直到竞拍的价格超过自己的心里预期

特点

Efficient：总是最喜欢（最看重当前商品的人）获得当前商品
赢家诅咒（suffer from winner’s curse)：每个竞拍人都不愿意马上按照心中的估价出价，而是一点点往上加。而且过程中可能因为哄抬价格而导致拍到商品的价格超过了预估价，因此导致获胜者的收益为负数（收益为竞价者的心里预期与商品的最终价值之差，假设我预估这个商品 100 元，那么80元拍到，我就获益 20）
susceptible to collusion 这种公开加价的方式可能会导致哄抬价格；也有可能导致竞拍者提前约定好压低价格

Dutch auction（荷兰式拍卖）

介绍

协议和结果规则:拍卖师从要求一个极高的初始价格开始拍卖师不断地逐步降低商品的价格，当有人以当前的出价出价时拍卖结束，赢家支付的价格是他们出价时的价格

协议

*一次性竞价（one-shot）这个有争议
公开竞价（open-cry）
价格逐渐降低（descending）

优势策略（dominant strategy）：

直到竞拍的价格达到自己的心里预期

特点（与英式拍卖一样）

Efficient：能卖给对商品估值最高的人
collusion：买方可能串通来共同压低价格
赢家诅咒

First-price & sealed-bid auction

介绍

协议和结果规则:

每个投标人做出一次出价
出价发送给拍卖师，使投标人不能看到对方的出价
获胜者是出价最高的投标人（efficient）
获胜者支付的价格是最高的出价

特点

not efficient：对商品估值最高的人未必能获得商品
communication 方式更加简单（比 English 和 Dutch更简单）
克服了串通问题 collusion

优势策略

没有优势策略，因为每个人的出价都是低于自己心中的估价，但是比自己内心的价格低多少这取决于其他竞标者的表现。

Second-price sealed-bid auction （Vickrey auction）

介绍

协议和结果规则:本质上与第一价格密封竞价拍卖相同，但赢家支付的价格是第二高竞价的价格

优势策略

因为即使竞标者表现出自己内心的预估价值，那么也只需要按照第二高的价格来支付，因此很容易暴露出竞标者的期盼价值。
出价符合自己的真实价值不会有任何损失，因为如果出价远高于第二高的出价，你仍然只需支付第二高的价格
这有助于克服赢家的诅咒

特点

Efficient
能够克服赢家诅咒
truth-revealing： 能够揭露商品的真实价值，因为 dominant strategy 可以让人们轻松地叫出心中的预期价值。
克服串通（collusion）
其计算简单，使其流行使用在多代理人工智能系统和在线拍卖

机器学习 & 强化学习

Book learning

没有真正的从对局中学习，而是通过 memory 将对应的解决方案进行存储。

Search Control Learning

$\alpha-beta$ 完美序列

通过调整 alpha-beta 树的节点序列保证能够 cut 掉最多的子节点

如何 cut off

limit depth： 限制搜索树的最大深度
截断搜索 / 静态搜索(quiescence): 将稳定的节点删掉，只扩展不稳定的节点
action pruning：将开始时表现不好的节点舍弃掉

机器学习

$\eta$ 的作用

学习率，能够控制梯度下降算法在更新参数时候的步长，如果学习率过大，会导致算法很难收敛，当学习率过小又会导致算法的参数更新花费的时间很长

梯度下降在做 game playing 任务时的两个问题

延迟强化：一个行为的反馈可能要等到多个时间步之后，可能会降低整个学习过程的速率
权重分配：很难知道不同的行为对最终的结果将会产生什么影响

TD-leave( $\lambda$ )

$d_i$ 表示两个连续状态 $s_i, s_{i+1}$ 之间的 reward 差值；我们的目标是尽可能减少两个连续状态 reward 的差值。
在结合 minimax tree 的时候，直到搜索到最底层的叶子节点才会有 reward {-1,0,+1} 分别代表输，平局，胜
在从当前节点搜索到叶子节点的过程中一共会有 n 个 state，在每个 state 都要通过 evaluation function 来计算得到当前节点的值
而evaluation function 如果表现不好，就会出现不稳定的情况；为了解决这个问题，TDLambda 通过 将所有相邻 states 之间的 reward 差值进行求和并把其最小化当作求解目标，为了得到一个好的、稳定的 evaluation function
当然值得注意的是， $eval(s_i,w)$ 得到的值的范围是在 $\{-\infin,+\infin\}$ 之间，但是最后的 reward 的取值范围却是 ${-1,0\}$ 因此将中间步骤的 evalution 求出的值都进行 normalization 操作，这个过程通过 tanh 函数来完成。从而这些states evaluation 的结果也都是 ${-1,0\}$ ，因此我们将这些值也称为 reward，但是这些其实是 pseudo-reward，并不是真正的 reward 的意思

接下来通过下面的公式来更新参数：
- 最后的一项的作用是将所有相邻的节点的 $d_i$ 进行求算，
- 例如 $d_1,d_2$ ， $d_2,d_3$ 一直到 $d_n,d_{n-1}$ ，把这些求和，就得到了一个反应整个决策过程中的不稳定的程度的值。最小化这个值作为当前的求解目标，通过更新参数就可以得到更优的 evaluation function。 $\sum_{m=i}^{N-1}\lambda^{m-i}d_m$

最开始的时候一般设置 $\lambda$ 接近 1 附近，然后随着模型训练的越来越好，将 $\lambda$ 的值逐步减小
这是因为当 $\lambda$ 开始的时候我们希望从全局的层面实现一种一致性，这种一致性可以保证我们整体的、step 与 step 之间的决策差异不会很大
但是随着模型表现的变好，我们可能要更灵活地追求一种局部的一致性，因此将 $\lambda$ 减小，使得当前的 state 更新受到更小范围的 reward 的影响
$\lambda$ 的意义：
- 当 $\lambda=0$ 时，权重的更新根据的是当前状态到下一状态的 reward
- 当 $\lambda=1$ 时，权重更新根据的是当前状态到最终状态的 reward
学长笔记：

Learning Environment

Learn from data

通过标签提供的监督信息，结合梯度下降的优化策略，来训练模型。模型的精度取决于参数的调整以及数据的好坏

Learn from opponents

与菜鸟训练：越练越差，没有参考价值
与大师训练：越练越强，通过不断失败累积经验

Learn from self

越练越强：类⽐进化论，因为不同的学习机制，评估函数的不同，对局情况的不同，都会导致agent 的差异因为学习⽽越来越⼤，⼀开始多创建⼀些不同的agent，淘汰掉相对较弱的。再不断地训练优质的agent。

监督学习和 TD-lambda 的对比

监督学习的学习过程依赖于人工标注的标签，而 TD-lambda 不需要给定训练标签
监督学习的决策过程是针对单个步骤的（one-step）而 TD-lambda 是针对 multi-step prediction 的
监督学习和 TD lambda 都是通过梯度下降的方式来逐步优化参数
监督学习的主要思想是通过拟合已标注的数据来训练模型，通常有两类主要的任务：
- 分类任务
- 回归任务
而 TD 算法属于强化学习算法，基于环境的反馈而行动，通过不断与环境的交互、试错，最终完成特定目的或者使得整体行动收益最大化。强化学习不需要训练数据的label，但是需要每一步行动环境基于的反馈，是奖励还是惩罚，反馈可以量化，基于反馈不断调整自己的行为。

SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language UnknownBody LLM Daily Multimodal 语言模型人工智能自然语言处理
摘要深度学习的最新进展给地震监测带来了革命性变化，但开发一个能在多个复杂任务中表现出色的基础模型仍然充满挑战，尤其是在处理信号退化或数据稀缺的情况时。本文提出SeisMoLLM，这是首个利用跨模态迁移进行地震监测的基础模型，它无需在地震数据集上进行直接预训练，就能充分发挥大规模预训练大语言模型的强大能力。通过精心设计的波形标记化处理和对预训练GPT-2模型的微调，SeisMoLLM在DiTing和
50 种不同编程语言的“Hello World”，你知多少？逗逗逗逗666 编程 hello world 编程语言
当我们学习一门编程语言时，都是从“Hello,World!”开始。所有程序员在其职业生涯中，都至少接触过一个经典的“Hello,World!”程序。通常程序员会使用多种编程语言，多的甚至实现了十几种。还有一种称为TTHW（Timeto“Hello,World!”）的方法，来衡量程序员创建一个新的“Hello,World!”程序的时间。你可以用多少种不同的语言编写一个“Hello,World!”程序
git subtree 高频使用方法 NickDeCodes git git github
subtree高频使用方法官网添加新的子项目查看子项目的差异使用子项目克隆存储库引入超级项目更新改变分支引入子项目更新对子项目进行更改将更改推送到子项目存储库高效配置添加新的子项目subtreegitsubtreeadd--prefix=example-submodulehttps://github.com/githubtraining/example-submodulemaster--squas
C++ time(0)函数宁玉AC c学习
time(0)函数返回当前格林尼治标准时间与格林尼治标准时间1970年0分0秒的时间间隔。头文件#include//问题：得到当前时间。#include#includeusingnamespacestd;intmain(){inttotalSeconds=time(0);intcurrentSeconds=totalSeconds%60;inttotalMinutes=totalSeconds/6
AbMole| 纳米药物递送系统IL@H-PP在乳腺癌和脑转移光热疗法 AbMole AbMole 生物化学生物试剂科研生物实验
近年来，光热疗法（PTT）作为一种非侵入性的癌症治疗手段，因其独特的优势而受到广泛关注。来自四川大学华西药学院药物靶向与药物递送系统重点实验室的范童,胡海丽,徐燕燕等多名研究人员发表了题为《HollowcoppersulfidenanoparticlescarryingISRIBforthesensitizedphotothermaltherapyofbreastcancerandbrainmet
【C语言】八进制、十六进制 Octopus2077 c语言开发语言算法 visual studio
前言在我们日常生活中使用的数往往是十进制的，而当我们学习C语言后我们会接触到许多不同的进制并且时常需要去思考与使用这些不同的进制（尤其是2的幂相关的进制，因为这种计数系统比十进制更接近于计算机的二进制系统），所以学习和掌握这些不同进制是非常重要的。本文将对八进制和十六进制（8和16都为2的幂）进行一些讲解。通常情况C语言都假定整型常量是十进制的数，但在表达与计算机相关的值时，八进制和十六进制却十分
C# &Unity 唐老狮 No.8 模拟面试题咩咩-哈基米版 C#&&Unity 面试题与算法合集 c#unity 开发语言
本文章不作任何商业用途仅作学习与交流安利唐老狮与其他老师合作的网站,内有大量免费资源和优质付费资源,我入门就是看唐老师的课程打好坚实的基础非常非常重要:全部-游习堂-唐老狮创立的游戏开发在线学习平台-PoweredByEduSoho如果你发现了文章内特殊的字体格式,那是AI补充的知识,我发现原网站下面有答案,我将会把答案以不同样式穿插在回答之中目录C#1.如果我们想为Unity中的Transfor
学习笔记12——并发编程之线程之间协作方式码代码的小仙女高级开发必备技能 java jvm 开发语言
线程之间协作有哪些方式当多个线程可以一起工作去解决某个问题时，如果某些部分必须在其他部分之前完成，那么就需要对线程进行协调。共享变量和轮询方式实现：定义一个共享变量（如volatile修饰的布尔标志）。线程通过检查共享变量的状态来决定是否继续执行。publicclassTest{ privatestaticvolatilebooleanflag=false; publicstaticvoi
QT显示网页控件QAxWidget、QWebEngineView及区别 AI+程序员在路上 QT&C++实战系列 qt 开发语言
一.QT种显示网页控件QAxWidget1.介绍QAxWidget属于QtAxContainer模块，ActiveX是微软提出的一种组件对象模型（COM）技术，允许不同的软件组件在Windows操作系统上进行交互和集成。QAxWidget为开发者提供了在Qt应用程序中使用ActiveX控件的能力，通过它可以将各种ActiveX控件嵌入到应用程序界面中。2.使用引入必要的模块在.pro文件中添加QT
Llama3.1是AI界的Linux？先部署起来再说！ AI大模型探索者人工智能 linux 运维语言模型 ai LLama llama
前言就在昨天，Meta发布了Llama3.1，这次带来的中杯、大杯和超大杯3个版本。从纸面数据来看，Llama3.1超大杯已经能跟GPT-4Omni、Claude3.5Sonnet分庭抗礼了。而中杯和大杯更是将同量级的对手摁在地上摩擦。要知道，Llama的对手可是闭源模型啊工友们！小扎同志说，开源AI会成为行业的标准，就像Linux一样！不管怎么说，既然你开源了，那我就在本地部署起来吧。本文使用O
使用LangChain访问个人数据第一章-简介明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序正文在大数据时代，数据价值逐渐凸显，打造定制化、个性化服务，个人数据尤为重要。要开发一个具备较强服务能力、能够充分展现个性化智能的应用程序，大模型与个人数据的对齐是一个重要步骤。作为针对大模型开发应运而生的框
使用LangChain访问个人数据第八章-总结明志刘明大模型学习手册 langchain 人工智能
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序本部分前几个章节请查看使用LangChain访问个人数据第一章-简介使用LangChain访问个人数据第二章-文档加载使用LangChain访问个人数据第三章-文档分割使用LangChain访问个人数据第四章
基于 LangChain 开发应用程序第一章-简介明志刘明大模型学习手册 langchain 人工智能
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分章节目录如下：基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出基于LangChain开发应用程序第三章-储存基于LangChain开发应用程序第四章-模型链基于LangChain开发应用程序第五章-基于文档的问答基于LangCh
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
docker运行容器命令 redis 指定端口 big maom~~ docker redis eureka 容器运维
我整理的一些关于【Docker】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://edu.51cto.com/surl=QsXoR2使用Docker运行Redis容器并指定端口的详细指南本文旨在帮助初学者理解如何使用Docker来运行Redis容器，并指定端口。Docker是一个开源平台，允许开发者将应用和其依赖打包成一个标准的单元——容器。通过使用Docker，开发者可以确保
ollama教程——使用Ollama与LangChain实现Function Calling(函数调用)的详细教程（二）【附完整源码】 walkskyer ollama入门教程 langchain ollama LLM
ollama入门系列教程简介与目录相关文章:Ollama教程——入门：开启本地大型语言模型开发之旅Ollama教程——模型：如何将模型高效导入到Ollama框架Ollama教程——兼容OpenAIAPI：高效利用兼容OpenAI的API进行AI项目开发Ollama教程——使用LangChain：Ollama与LangChain的强强联合Ollama教程——生成内容API：利用Ollama的原生AP
向 state 字典中的 “messages“ 键添加一条新的用户消息，提示模型返回实际的输出。背太阳的牧羊人 langgraph langgraph tools Agent
完整代码：fromdatetimeimportdatetimefromlangchain_core.runnablesimportRunnable,RunnableConfigfromlangchain_core.promptsimportChatPromptTemplateprimary_assistant_prompt=ChatPromptTemplate.from_messages([("s
《Natural Actor-Critic》译读笔记 songyuc 笔记
《NaturalActor-Critic》摘要本文提出了一种新型的强化学习架构，即自然演员-评论家（NaturalActor-Critic）。Theactor的更新通过使用Amari的自然梯度方法进行策略梯度的随机估计来实现，而评论家则通过线性回归同时获得自然策略梯度和价值函数的附加参数。本文展示了使用自然策略梯度的actor改进特别有吸引力，因为这些梯度与所选策略表示的坐标框架无关，并且比常规策
如何通过深度学习优化操作系统中的故障诊断与恢复机制金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 深度学习人工智能
如何通过深度学习优化操作系统中的故障诊断与恢复机制（副标题：智能监控、自适应诊断与自动恢复——操作系统故障自愈的新方向）摘要随着现代操作系统在多核、高并发和分布式环境中的广泛应用，系统故障及其恢复问题日益成为影响系统稳定性和业务连续性的关键挑战。传统的故障诊断方法依赖于预设规则和人工干预，难以应对复杂多变的故障场景。本文提出了一种基于深度学习的故障诊断与恢复机制，通过对大量历史日志、监控数据和故障
LWC-KD：图结构感知的推荐系统增量学习对比知识蒸馏宇直不会放弃 GKD-Middle layer 人工智能 python chatgpt gpu算力深度学习机器学习神经网络
LWC-KD：图结构感知的推荐系统增量学习对比知识蒸馏《GraphStructureAwareContrastiveKnowledgeDistillationforIncrementalLearninginRecommenderSystems》2021作者是YueningWang、YingxueZhang和MarkCoates论文地址：https://dl.acm.org/doi/10.1145/
vue3新增修改页面，字段来源于其他表大波V5 vue.js elementui javascript
确定取消constunitOptions=ref([]);constlistAdspunitAllLocal=async()=>{if(!unitOptions.value.length){constresUnit=awaitlistAdspunitAll();unitOptions.value=resUnit.data;}}//单位生成ID-Name映射字典constidToNameUnitMa
java ik分词器大波V5 java 开发语言
org.apache.lucenelucene-core7.4.0org.apache.lucenelucene-analyzers-common7.4.0com.github.mageseik-analyzer8.5.0publicstaticvoidmain(String[]args)throwsException{Stringtext="今天是个好日子";//创建一个StringReader
PDF处理控件Aspose.PDF，如何实现企业级PDF处理 CodeCraft Studio 文档管理控件 pdf python java
PDF处理为何成为开发者的“隐形雷区”？“手动调整200页PDF目录耗时3天，扫描件文字识别错误导致数据混乱，跨平台渲染格式崩坏引发客户投诉……”作为开发者，你是否也在为PDF处理的复杂细节消耗大量精力？Aspose.PDF凭借AI增强解析、全栈API控制与企业级自动化能力，正在重新定义PDF处理效率的天花板。Aspose.pdf最新下载一、Aspose.PDF六大技术亮点1.高精度PDF解析与生
程序员必看！DeepSeek隐藏用法大揭秘：从代码优化到多模态开发，这些技巧让你少熬三夜班后端
最近在程序员圈子里，有个同事老张的故事特别火。他原本每周要花20小时写接口文档，自从用上DeepSeek的代码补全功能，现在喝着咖啡看AI自动生成Swagger注释——这让我想起刚入行时，为了调通一个正则表达式熬夜到凌晨三点的自己。今天咱们不聊那些官方说明书，就说点真正能让键盘冒火星的实战技巧。藏在代码补全里的"作弊码"很多人以为DeepSeek就是个加强版搜索引擎，其实它对代码的理解远超想象。比
HarmonyNext实战案例：基于ArkTS的高性能分布式机器学习应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能分布式机器学习应用开发引言在HarmonyNext生态系统中，分布式机器学习是其核心特性之一。通过分布式机器学习，开发者可以充分利用多设备的计算资源，实现复杂模型的训练与推理。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的分布式机器学习应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的分
Garfish 源码解析 —— 一个微应用是如何被挂载的 moonrailgun 前端工程化 javascript 前端前端框架
背景Garfish是字节跳动webinfra团队推出的一款微前端框架包含构建微前端系统时所需要的基本能力，任意前端框架均可使用。接入简单，可轻松将多个前端应用组合成内聚的单个产品因为当前对Garfish的解读极少，而微前端又是现代前端领域相当重要的一环，因此写下本文，同时也是对学习源码的一个总结本文基于garfish#0d4cc0c82269bce8422b0e9105b7fe88c2efe42a
HarmonyNext实战案例：基于ArkTS的实时多人协作白板应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的实时多人协作白板应用开发引言在HarmonyNext生态系统中，实时多人协作是其核心特性之一。通过实时多人协作，开发者可以构建高效、互动的应用场景，例如实时白板、协同编辑等。本文将深入探讨如何使用ArkTS12+语法开发一个实时多人协作白板应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的实时通信特性，结
HarmonyNext实战案例：基于ArkTS的高性能图像处理应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能图像处理应用开发引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，为开发者提供了强大的工具来构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的图像处理应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的特性，结合ArkTS的强大功能，实现复杂的图
本地部署AI大模型之并行计算：什么是可重入互斥锁/递归锁杰瑞学AI Devops Computer knowledge 开发语言 python 软件工程性能优化
目录1.普通互斥锁的局限性2.可重入互斥锁的工作原理3.使用场景4.代码示例5.实现关键6.注意事项可重入互斥锁（ReentrantMutex，或称为递归锁）是一种特殊类型的互斥锁，允许同一线程多次获取同一把锁而不会导致死锁。以下是其核心要点：1.普通互斥锁的局限性普通互斥锁（Mutex）在同一个线程中只能被获取一次。若线程尝试重复获取已持有的锁，会导致自死锁（线程无限等待自己释放锁）。2.可重入
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

AI考试复习

文章目录

复杂度

无信息搜索

有信息搜索

对抗搜索

CSP 相关

General CSP

independent subproblem

Cutset Conditioning

CSP内容

Variable Ordering

MRV (minimum remaining values)

Degree Heuristic

Value Ordering

Least Constraining Value

Forward Checking

弧相容

拍卖

拍卖的组成部分

拍卖协议的三个维度

拍卖系统的影响因素

有效设计的拍卖的特征（期望的特征）

拍卖类型

English auction（英式拍卖）

介绍

协议

优势策略（dominant strategy）：

特点

Dutch auction（荷兰式拍卖）

介绍

协议

优势策略（dominant strategy）：

特点（与英式拍卖一样）

First-price & sealed-bid auction

介绍

特点

优势策略

Second-price sealed-bid auction （Vickrey auction）

介绍

优势策略

特点

机器学习 & 强化学习

Book learning

Search Control Learning

α − b e t a \alpha-beta α−beta 完美序列

如何 cut off

机器学习

η \eta η 的作用

梯度下降在做 game playing 任务时的两个问题

TD-leave( λ \lambda λ)

Learning Environment

Learn from data

Learn from opponents

Learn from self

监督学习和 TD-lambda 的对比

你可能感兴趣的:(人工智能基础,学习,AI)

$\alpha-beta$ 完美序列

$\eta$ 的作用

TD-leave( $\lambda$ )