kebijuelun

WebArena: A Realistic Web Environment for Building Autonomous Agents

Paper name

Paper Reading Note

Paper URL: http://webarena.dev/static/paper.pdf

Project URL: http://webarena.dev/

Code URL: https://github.com/web-arena-x/webarena

TL;DR

2023 年 CMU 出的文章，提出一个真实和可复现的 Web 测试环境 WebArena，旨在促进能够执行任务的自主代理（Autonomous agents）的开发

Introduction

背景

自主代理（Autonomous agents）具备通过人类自然语言指令执行日常任务的能力，有可能显著增强人类的能力，比如效率的提升。然而，要充分发挥这些自主代理的能力，至关重要的是在一个真实且可复现的环境中理解它们的行为。这将衡量代理在真实的人们关心的任务上的能力，并使它们能够在公正和一致的方式下进行评估
当前的自主代理仿真环境往往过度简化现实世界的情况，这就导致现有仿真环境中的功能只是真实世界中的一小部分，任务的复杂度很低

本文方案

本文提出 WebArena，一个真实和可复现的网络环境，旨在促进能够执行任务的自主代理的开发，整体框架如下图所示
- 环境包括四个完全操作、自托管的 Web 应用程序，每个应用程序代表互联网上流行的独特领域：
  - 在线购物
  - 讨论论坛
  - 协作开发
  - 商业内容管理
- 结合了几个使用程序工具，比如地图、计算器和缓存器
- 补充了大量文档和知识库，比如英文 wiki 等通用知识和集成工具开发手册等专业知识
- 环境通过带有 gym API 的 docker 进行托管，保证可用性和可重复性
同步提出了一个测试数据集，包含 812 个基于网络的测试任务
- 每个任务都是 high-level 自然语言表达的，模拟人类通常使用的方式，上图就展示了两个测试样例
- 关注评测的功能正确性，比如对于下面的测例，会直接评估 gitlab repo 中代理生成的内容是否符合预期（下图任务是规划一个路线，以最小的行驶距离从 CMU 开始访问所有匹兹堡的艺术博物馆，并将路径的顺序记录到一个 gitlab repo 中）
  
  可以看到 Agent 为了完成这个任务需要首先通过搜索维基百科来找到位于匹兹堡的所有艺术博物馆，然后需要利用地图工具确认每个博物馆的位置，基于收集到的信息来优化行程。最后 Agent 还需要在一个合适的 gitlab repo 的 readme 中更新设计的行程。

Methods

WebArena 环境实现

网站选择

为了决定使用哪些类别的网站，我们首先对大约200个作者实际的浏览器历史记录进行了分析。每位作者都深入研究了他们的浏览历史，总结了特定部分浏览会话的目标。基于此，我们将访问的网站分类为抽象类别。然后，我们确定了四个最重要的类别，并根据此分析实现了每个类别的一个实例：
- （1）支持在线购物活动的电子商务平台（例如Amazon、eBay）
- （2）用于意见交流的社交论坛平台（例如Reddit、StackExchange）
- （3）用于软件开发的协作开发平台（例如GitLab）
- （4）用于管理数字内容的内容管理系统（CMS）（例如在线商店管理）
除了这些平台，我们还选择了三种在基于Web的任务中经常使用的实用工具：
- （1）用于导航和搜索有关兴趣点（POIs）的信息的地图，例如机构或位置
- （2）计算器
- （3）便签本用于做笔记
鉴于信息查找和知识获取在基于Web的任务中的关键作用，我们还将各种知识资源纳入了我们的环境。这些资源从一般信息存储库，例如英文维基百科，到更专门的知识库，例如网站用户手册，都有涵盖。

观察空间

设计了观察空间，以粗略模拟Web浏览器体验：一个Web页面的URL，打开的标签以及焦点标签的Web页面内容
- WebArena是第一个考虑多标签Web任务的Web环境，以促进工具使用，直接在标签之间进行比较和引用以及其他功能。与在单个标签中管理所有内容相比，多标签功能更真实地复制了人类的Web浏览习惯
提供了灵活的配置选项来以多种模式呈现页面内容：（如下图所示）：
- （1）原始Web页面HTML，由文档对象模型（DOM）树组成
- （2）屏幕截图，作为当前Web页面的RGB数组表示
- （3）Web页面的可访问性树（可访问性树是DOM树的子集，其中包含有关显示Web页面内容的相关和有用元素。每个元素都表示为其角色（例如，链接），其文本内容和其属性（例如，是否可聚焦）。可访问性树在保留Web页面的结构化信息的同时比DOM表示更紧凑。）
提供一个选项，将所有模式下的内容限制为视窗内的内容。这确保观察结果可以输入到具有有限上下文长度的基于文本的模型或具有图像大小或分辨率要求的基于图像的模型中

动作空间

设计了一个复合动作空间，模拟了Web页面上可用的键盘和鼠标操作
- 第一类包括基本操作，例如点击、悬停、键入和按键组合
- 第二类包括标签页管理动作，如打开、关闭和在标签页之间切换
- 第三类包括URL导航动作，例如访问特定的URL或在浏览历史中前进和后退

用户角色模拟

同一网站的用户由于不同的角色、权限和交互历史通常会有不同的体验。例如，在电子商务内容管理系统中，店主可能拥有在所有内容上的完全读写权限，而员工可能只被授予对产品的写权限，但没有访问客户数据的权限。我们旨在通过在每个平台上生成独特的用户配置文件来模拟这种情况
在购物网站上，我们创建了一个客户配置文件，该配置文件在两年内完成了35多个订单。在GitLab上，我们选择了一个维护多个热门开源项目并有许多合并请求和问题的用户配置文件。该用户还私下管理了几个个人项目。在Reddit上，我们选择了一个积极参与讨论并发布了许多帖子和评论的用户配置文件。最后，在我们的电子商务内容管理系统上，我们设置了一个店主的用户配置文件，该店主对系统的所有内容具有完全的读写访问权限。（这 Agent 的起始权限和地位挺高啊…）
所有用户都会自动使用预缓存的Cookie登录到他们的帐户。据我们所知，这是第一个公开可用的代理程序评估环境，实现了这样的特性。现有的文献通常假设用户角色是普遍相同的。

基于 Web 的测试任务构建

测试基准包含 812 个测试样例，用于将高层自然语言指令与WebArena中的交互关联起来。每个示例都附带有一个指标，用于评估任务执行的功能正确性。

通过高层自然语言控制代理

WebArena环境表示为E，具有状态空间S，动作空间A（§2.3）和观察空间O（§2.2）。转移函数T：S × A是确定性的，并由环境中每个网站的底层实现定义。通过自然语言意图描述的任务可以被构建为部分可观察的马尔可夫决策过程（POMDP）：在每个时间步t，代理发出一个动作at，给定部分观察ot。因此，该动作导致一个新的状态st+1及其对应的观察ot+1。我们提出了一个奖励函数r(a, s)来衡量任务执行的成功程度，其中a代表动作序列，s表示所有中间状态。该奖励函数评估状态转换是否符合意图的预期。例如，对于一个下订单的意图，它会验证是否已经下了订单。此外，它还评估代理动作的准确性，例如检查预测答案的正确性。

模仿人类的意图收集

要求标注员根据以下标准制定意图：
- (1) 意图应该是抽象和高层次的，意味着任务不能仅通过一两个动作就能完成。例如，与其说“点击科学子论坛”，我们鼓励标注员提出更复杂的任务，比如“在科学子论坛上发布一个问候信息”，这涉及到多个动作
- (2) 意图应该是有创意的。常见的任务，比如创建账户，很容易想到。我们鼓励标注员添加约束条件（例如，“创建一个Reddit账户，与我的GitLab账户完全相同”），使意图更具独特性
- (3) 意图应该以模板形式表述，将可替换的元素作为变量。标注员还负责为每个变量开发几个实例。例如，意图“创建一个Reddit账户，与我的GitLab账户完全相同”可以转换为“创建一个{{site1}}账户，与我的{{site2}}账户完全相同”，并具有实例化项，如“{site1: Reddit, site2: GitLab}”和“{site1: GitLab, site2: OneStopShopping}”。值得注意的是，从同一个模板派生出的任务可能具有不同的执行轨迹。相似性主要存在于高层语义而不是特定的实现。
意图分布如下图所示，主要包含三个类别：
- （1）信息查找任务：这些任务期望获得文本回答。值得注意的是，WebArena中的信息查找任务通常需要在多个页面之间导航或关注用户中心内容。这使得它们与开放领域的问答任务有所不同，后者侧重于使用简单的检索步骤查询一般知识。例如，为了回答“我上次购买洗发水是什么时候”，代理程序必须遍历用户的购买历史，检查每个订单的详细信息，以识别最近一次购买洗发水的时间
- （2）网站导航任务：这个类别由需要使用各种交互元素（如搜索功能和链接）浏览网页的任务组成。其目标通常是定位特定信息或导航到网站的特定部分
- （3）内容和配置操作任务：这个类别包含需要在Web环境中创建、修改或配置内容或设置的任务。这包括调整设置、管理账户、进行在线交易、生成新的Web内容以及修改现有内容。示例范围从更新社交媒体状态或README文件到进行在线购买和配置隐私设置

评估标注

评估信息查找任务
- 如下表所示，为每个意图提供了一个注释的答案，分为 exact_match、must_include 和 fuzzy_match（使用语言模型 gpt-3.5-turbo-0613 来评估）来进行匹配，fuzzy_match函数可以灵活地将时间“2h58min”与“2小时58分钟”、“2:58”等不同形式相匹配
评评估网站导航和内容与配置任务
- 检查执行轨迹中的中间状态s，以确定结果是否与预期结果一致。比如下表中第 5 个任务，先检查评估通过检查帖子的URL来验证帖子是否被正确发布在“nyc”子论坛中，并通过检查帖子内容来验证是否包含所请求的内容

Baseline Web Agents

设计了两种基准LLM-prompt web代理，其中输入观察和预测动作都是文本形式：
- (1) 直接代理 (Direct Agent)：代理接受观察作为输入，并直接预测下一个动作
- (2) 推理代理 (Reasoning Agent)：代理首先以文本形式执行一系列推理步骤，然后发出下一个动作
prompt 设计
- 首先详细阐述了基于Web的任务的定义
- 然后提供了一个完整的可用动作列表及其解释
- 包含了一些有关避免常见失败的注意事项，在我们对简单示例进行初始实验时观察到这些失败。例如，我们发现代理程序往往会生成一系列动作，而不是逐个动作执行，因此提供了"您应该一次只执行一个动作"的提示
- 在提示中提供了两个观察 → 动作对的演示
详细配置
- 尝试了gpt-3.5-turbo-0613和gpt-4-0613，温度为1.0，top-p参数为0.9
- 状态转换的最大次数设置为30
- 如果在相同的观察上重复执行相同的动作超过三次，或者代理程序连续生成三个无效动作，我们将停止执行（这些情况通常表示执行失败的可能性很高）

Experiments

主要结论

使用基于 GPT4 的 reasoning agent 最多也只能达到 10.63% 的端到端成功率。有趣的是这里基于 GPT3.5 的实验来看，增加推理步骤的 reasoning agent 精度比 direct agent 高不了太多。这些结果突显了在跨越长时间范围内执行任务的固有挑战和复杂性，尤其是在WebArena这样的现实环境中

从相同模板执行任务的一致性

可视化了至少有一个成功完成的模板的任务成功率。在这41个模板中，GPT-4代理程序只在一个模板上实现了100%的任务成功率，而GPT-3.5代理程序在任何模板上都没有完成所有任务。在几种情况下，代理程序只能完成其他任务变体中的一个。性能差异出现的原因有两个。首先，即使在同一个模板内，任务的复杂性也可能不同。例如，代理程序可以正确执行"Fork metaseq"，但在"Fork all repos from Facebook"上却失败了。后者需要更多的重复操作，因此增加了其复杂性。其次，由于我们在实验中使用了较高的温度，预测可能存在较大的变化。然而，这些结果表明目前代理程序在处理复杂任务时的不稳定性。

错误分析

错误case1：在大约54.9%的可行任务中（428个任务）中，观察到GPT-4代理程序错误地将其标记为不可能完成。例如，如下图左侧所示，为了实现"Fork all repos from Facebook"的目标，代理程序首先正确执行了对Facebook的搜索。然而，由于默认的搜索结果列出了可能的以Facebook命名的项目，而代理程序需要进一步点击用户栏来找到Facebook帐户，代理程序决定停止，因为它认为"似乎没有任何与Facebook匹配的可用项目。因此，不可能从GitLab中复制任何Facebook存储库。"
错误 case2：在观察解释中的失败有趣的是，虽然GPT-4代理有能力对观察结果进行总结，但偶尔会忽略更加细致的信息，比如之前输入的内容。就像下图右侧的例子中所示，[5172] StaticText 表明搜索词 “DMV area” 已经被输入过了。然而，代理忽视了这个细节，并持续地输入命令类型 [2430] [DMV area] 直到达到最大步数限制

Thoughts

在现阶段基于 Web 来做 Agent 的测试环境感觉很合理，Web 环境中的操作可执行性强，同时可复现性也不错
当前 Agent 的精度并不高，即便基于 GPT4 也只有 10.59% 的端到端完成率，可研究的方向还很多

5年前端面试题整理汇总100题 W蘭前端 javascript 开发语言前端面试
1.一些开放性题目1.自我介绍：除了基本个人信息以外，面试官更想听的是你与众不同的地方和你的优势。2.项目介绍3.如何看待前端开发？4.平时是如何学习前端开发的？5.未来三到五年的规划是怎样的？2、position的值，relative和absolute分别是相对于谁进行定位的？absolute:生成绝对定位的元素:相对于最近一级的定位不是static的父元素来进行定位。fixed（老IE不支持）
使用HBuilderX高效开发微信小程序全流程指南斯~内克 vue知识点开发记录微信小程序 notepad++小程序
一、为什么选择HBuilderX开发微信小程序？1.1跨平台开发利器HBuilderX作为DCloud推出的前端开发工具，凭借其强大的uniapp框架支持，已成为多端开发的首选工具。通过一套代码即可编译生成微信小程序、H5、Android/iOS等多端应用，极大提升开发效率。1.2深度集成的小程序开发支持内置微信小程序语法提示和代码块实时预览与真机调试功能自动处理路径别名和文件引用支持条件编译实现
前端 CDN 深度解析：从加速优化到工程化实践斯~内克前端前端
一、前端CDN的核心价值与挑战1.1现代前端资源的分发困境资源体积爆炸：主流框架生产包平均大小突破2MB全球化访问需求：跨国访问延迟差异可达500ms以上版本管理复杂度：多环境部署导致的缓存污染问题安全防护压力：XSS、资源劫持等攻击频发1.2前端CDN的技术指标指标传统方案CDN优化后提升幅度首屏加载时间3.8s1.2s68%资源下载速度12MB/s85MB/s608%缓存命中率65%98%51
前端开发简历优化指南，DeepSeek助您前端简历秒变高分！大模型大数据攻城狮前端面试前端面经前端简历 vue原理社招校招前端框架
目录一、简历格式与排版（一）简洁至上（二）字体与字号的选择（三）文字间距与对齐（四）使用分段与列表二、内容优化（一）个人信息（二）教育背景（三）工作经历（四）专业技能（五）项目经验（六）自我评价（七）技术亮点深度挖掘（八）典型项目模版（九）实习经历技术化改造三、其他注意事项（一）避免错别字与语法错误（二）定制化简历（三）更新频率（四）技术细节缺失（五）技术关联性断裂（六）模糊表达修正（七）技术堆砌
【产品经理修炼之道】- 关于产品科技方法论 xiaoli8748_软件开发产品经理产品经理
对科技、技术等方面的钻研所得，有时可以反哺至日常的产品设计中，比如本篇文章里，作者便总结了他在产品科技领域的一些思考，包括了产品创新、商业模式等各个方面，一起来看看吧。以下汇总自我在产品科技领域的思考笔记共计27篇（约3万余字），欢迎留言、交流及探讨！许多思考的灵感来自于保罗的《黑客与画家》、陆奇等科技界大佬、硅谷部分投资者等。enjoy！一、学会从前端技术中，挖掘新的商业模式通过技术前端的能力（
【前端】【nuxt】几种在 Nuxt 客户端使用console的方式患得患失949 Nuxt 面试考题专栏（前后端）前端 Nuxt console.log 客户端
方法1：在Vue生命周期钩子中使用只在客户端执行的钩子（如mounted）中打印：exportdefault{mounted(){console.log('仅在客户端显示',this.$route.path)}}方法2：通过环境判断使用process.client判断当前环境：if(process.client){console.log('客户端环境变量:',process.env.NODE_EN
Easyliev在线视频分享平台项目总结——SpringBoot、Mybatis、Redis、ElasticSearch、FFmpeg 周小闯项目总结 spring boot mybatis redis
EasyLive项目总结登陆注册获取图片验证码captchat插件base编码（图片，用于前端展示）checkCodeKey验证码标识（用于匹配redis缓存，校验验证码）redis缓存保存验证码缓存用于登录注册校验（checkCodeKey为标识）注册校验验证码根据前端传递的checkCodeKey，在Redis缓存中查找验证码并进行比较注册昵称是否被使用邮箱是否被使用清除Redis中的验证码缓
适合前端入门的Go语言开发框架fiber weixin_45969116 前端 go 前端开发语言 go语言
适合web前端开发者入门的go框架(fiber)FIBER：高效、极速、极简的WEB框架Fiber是一个借鉴Express的Web框架，建立在Go语言写的最快的FasthttpHTTP引擎的基础上。皆在简化零内存分配和提高性能，以便快速开发。不想阅读下面的内容直接进入主题fiber官网fiber的特点强大的路由静态文件服务性能出众内存占用低与ExpressAPI高度相似中间件和Next支持快速的服
前端 - uniapp - - 滚动容器scroll-view实现横向滚动 cv高级工程师YKY uniapp 前端 uni-app
微信开放平台scrol-view的官方文档说明https://developers.weixin.qq.com/miniprogram/dev/component/scroll-view.htmlscrollview相当于给div加上了overflow-x:auto;属性想要实现横线滚动官方文档有说明需要配置scroll-x和enable-flex为true并其需要给高度和flex-directi
前端webpack 高薪企业必备面试真题16道 ---带答案(9)（20220415) 一染星辰企业真实面试题前端 webpack
目录1、什么是webpack（必会）2、webpack的优点是什么？（必会）3、webpack的构建流程是什么?从读取配置到输出文件这个过程尽量说全（必会）4、webpack与grunt、gulp的不同？（必会）1、三者之间的区别2、构建思路的区别3、从知识背景区别5、有哪些常见的Loader？他们是解决什么问题的？（必会）6、Loader和Plugin的不同？（必会）1、不同的作用2、不同的用法
前端基础：同页面不同区块跳转的三种方式自己瞎琢磨前端综合
各种语言官网的教程部分经常是这样的页面一边是目录，一般是具体的内容，点击目录就能跳转到某个区块（当然这个页面还涉及到请求等等，和我这边要讲的不完全一样，我这边只是拿这个结构做个例子）。这就涉及到了一个页面之中不同区块件的跳转，这里有三种方式可以实现这样的跳转。下面是代码Document.box{width:200px;height:60px;background-color:red;}.sp{he
基于Golang的微服务——Consul winyh5 golang 微服务 consul
自我简介：4年导游，10年程序员，最近6年一直深耕低代码领域，分享低代码和AI领域见解。这系列文章很基础，主要给想尝试后端技术栈的前端看的，后端大佬别看了，很可能浪费你的时间。虽然我更擅长写前端相关的知识点总结文章，但是也阻止不了我对后端技术的向往啊,后端相关的文章质量不会高，主要目的是为了记录自己的学习历程，也是希望把自己的短板和缺点暴露出来，跟小伙伴们一起成长。初衷学习Go很大一个原因是因为想
【脑洞小剧场】零帧起手创业小公司之 UI设计稿初稿 Foyo Designer 技术职场小剧产品经理改行学it 经验分享程序人生前端 ui
点击此处查看脑洞小剧场合集https://blog.csdn.net/foyodesigner/category_12896948.html阳光透过办公室的窗户，洒在吴艾（UI工程师）的桌上，映照出他那张略显疲惫但又充满期待的脸。今天，他终于完成了那份被无数次催促、无数次修改的UI设计稿初稿。他深吸一口气，像是要把这份成果深深烙印在心里，然后满怀信心地点开了与产品经理程立新和前端程序员段码的群聊窗
基于springboot的旅游出行指南超级无敌暴龙战士塔塔开 Java课设与毕设资源 spring boot 旅游后端
文章目录项目介绍主要功能截图：部分代码展示设计总结项目获取方式作者主页：超级无敌暴龙战士塔塔开简介：Java领域优质创作者、简历模板、学习资料、面试题库【关注我，都给你】文末获取源码联系项目介绍基于springboot的旅游出行指南,java项目。eclipse和idea都能打开运行。推荐环境配置：eclipse/ideajdk1.8mavenmysql前端技术：vue，Ajax，Json后端技术
前端开发定时器的一些规范使用爱分享的程序员前端前端
以下是前端定时器规范使用的详细指南，涵盖常见场景、最佳实践及代码示例：一、定时器类型与选择类型特点适用场景setTimeout单次执行，可嵌套调用实现循环延迟任务、简单轮询setInterval固定间隔重复执行定期数据同步、简单动画requestAnimationFrame与浏览器刷新率同步，更高性能动画、高频可视化更新queueMicrotask将任务加入微任务队列需要优先执行的高优先级任务二、
基于微信小程序的文章管理系统的设计与开发(源码+lw+部署文档+讲解等) #Takagi S# 微信小程序 notepad++小程序
文章目录前言项目背景介绍技术栈后端框架SSM前端框架Vue数据库MySQL（MyStructuredQueryLanguage）微信小程序具体实现截图详细视频演示系统测试系统测试目的系统功能测试系统测试结论代码参考数据库参考源码获取前言博主介绍：✌新人博主,工作经验两年+、专注于Java、小程序技术领域和毕业项目实战✌文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写
SvelteKit 最新中文文档教程（1）—— 入门指南
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
Doris集群启停脚步江畔独步数据仓库
ApacheDoris是一个基于MPP（大规模并行处理）架构的高性能、实时的分析型数据库。在Doris中，FE（Frontend）、BE（Backend）和Broker组件有特定的启动和关闭顺序，下面详细介绍一下。一、启动顺序通常按照FE->BE->Broker的顺序启动，以下是对该顺序的详细解释：启动FEFE是Doris的前端节点，负责元数据管理、查询规划、权限管理等功能，是整个系统的核心控制节
Vue组件化开发：如何将一个大型应用拆分成多个小组件码说数字化码说VUE vue.js 前端 javascript
在现代前端开发中，组件化开发已经成为一种主流的开发模式。Vue.js作为一款流行的前端框架，提供了强大的组件化支持，使得开发者能够将复杂的应用拆分成多个可复用、易维护的小组件。本文将详细介绍如何利用Vue的组件化开发思想，将一个大型应用拆分成多个小组件进行开发。1.什么是组件化开发？组件化开发是一种将用户界面拆分为独立、可复用的组件的开发方式。每个组件负责特定的功能或视图部分，组件之间通过prop
100.Vue3 + OpenLayers：使用 marker-feature 添加 Marker 吉檀迦俐 OpenLayers vue.js 前端 javascript 深度学习 openlayers
在前端GIS（地理信息系统）开发中，OpenLayers是一个强大的开源地图库，可以帮助开发者快速构建Web地图应用。本文将详细介绍如何在Vue3项目中，使用OpenLayers并结合marker-feature插件来添加Marker。1.项目初始化如果你的Vue3项目还没有创建，可以使用Vite进行快速搭建：npmcreatevite@latestvue-openlayers-demo--tem
在Vue中如何高效管理组件状态？几何心凉前端小常识 vue.js 前端 javascript
在Vue中如何高效管理组件状态？文章目录在Vue中如何高效管理组件状态？1.引言2.局部状态管理2.1组件内部的data2.2计算属性与Watcher3.父子组件状态传递3.1通过Props与$emit3.2双向绑定（v-model）4.全局状态管理4.1使用Vuex4.2使用Pinia5.组合式API中的响应式状态管理6.最佳实践7.总结1.引言在现代前端开发中，随着应用复杂度的不断提升，组件状
web前端面试之——原型与原型链 tsuyoii 前端面试 javascript 面试 javascript 前端
原型与原型链（一）原型理解与记忆核心：F.prototype===f.__proto__===原型对象（原型）f.constructor===F.prototype.constructor===F===f.__proto__.constructor解释：每个函数F（也是对象，js中一切皆对象）在初始化时都拥有一个prototype属性，该属性指向原型对象（即原型）F=newFunction();F
前端面试：原型和原型链啃火龙果的兔子原型模式
什么是原型对象每一个JavaScript对象(null除外)在创建的时候就会与之关联另一个对象，这个对象就是我们所说的原型对象，每一个对象都会从原型"继承"属性。函数的原型和对象的原型每个函数都有一个prototype属性，该属性指向函数的原型每个对象都有一个__proto__属性，该属性指向对象的原型什么是原型链当读取实例的属性时，如果找不到，就会查找与对象关联的原型中的属性，如果还查不到，就去
面试之《前端常见的设计模式》只会写Bug的程序员面试笔记面试前端设计模式 react
前端开发中运用多种设计模式可以提高代码的可维护性、可扩展性和可复用性。以下是一些常见的前端设计模式：创建型模式1.单例模式定义：确保一个类只有一个实例，并提供一个全局访问点。应用场景：在前端中，像全局状态管理对象、数据库连接对象等通常使用单例模式。例如，在React项目中使用Redux管理全局状态，Redux的store就是一个单例，整个应用只有一个store实例。示例代码（JavaScript）
低成本·无任何依赖·实现大文件pdf预览功能-带下载进度
经常做pdf预览的小伙伴都知道，如pdfjs,pdfjs-dist,react-pdf等等，各种库，但是其实就是为了预览一下pdf内容。而且pdfjs-dist还会依赖node-pre-gyp,做前端的都知道，这个gpy是有多恶心。好了，为了不用任何库，就可以预览pdf，你可以如下操作：1.新窗口打开或将pdf地址放在iframe的src里预览写法如下：这么做有一个问题，如果pdf的地址请求头是a
RuoYi-Cloud-Plus 发布 1.8.0 新增 sms4j 短信融合「已注销」 java
更新日志重大更新[重大更新]新增sms4j短信融合框架整合(支持数十种短信厂商接入、发送限制、负载均衡等功能)[不兼容更新]移除原短信功能(建议使用新sms4j功能)[重要迁移]迁移vue3前端到主仓库统一维护依赖升级updatespringboot2.7.11=>2.7.13updatespring-cloud2021.0.7=>2021.0.8updatesatoken1.34.0=>1.35
在Vue 3中，如何创建一个异步组件？ JJCTO袁龙 Vue vue.js 前端 javascript
在Vue3中，如何创建一个异步组件？在现代前端开发中，组件的重用性和异步加载是提升用户体验和优化性能的关键因素。在Vue3中，创建异步组件变得更为便利。本文将探讨如何在Vue3中使用setup语法糖来创建异步组件，并通过示例代码来深入理解这一特性。什么是异步组件？异步组件是一种在需要时才被加载的组件，而不是在应用启动时一次性加载所有组件。这种做法有助于减小初始加载的包大小，从而提升加载速度和响应性
《Python全栈开发》第1课：认识全栈开发与Web工作原理程序员没睡醒 Python全栈 python 前端开发语言
课程目标理解全栈开发的核心概念了解网站运行的底层原理建立全栈知识体系框架完成第一个网页实践一、什么是全栈开发？（用餐厅比喻）1.1餐厅后厨vs餐厅前厅顾客服务员点单厨师做菜传菜员送餐1.2对应到Web开发：餐厅角色Web开发对应关键技术服务员前端开发HTML/CSS/JavaScript厨师后端开发Python/Java/PHP传菜员数据库MySQL/MongoDB店长全栈工程师掌握所有环节二、网
Vue.js 基础入门：从零开始构建你的第一个 Vue 应用 vvilkim vue vue.js 前端 javascript
Vue.js是一个轻量级、易上手的渐进式JavaScript框架，广泛用于构建现代化的用户界面。无论你是前端新手还是有一定经验的开发者，Vue.js都能帮助你快速构建高效、可维护的Web应用。本文将带你从零开始学习Vue.js的基础知识，并完成一个简单的Vue应用。1.什么是Vue.js？Vue.js是一个用于构建用户界面的渐进式框架。它的核心库专注于视图层，易于与其他库或现有项目集成。Vue的主
利用 WPF 和阿里云实现图片多区域文字识别并保存至 Excel 如沐春风菜鸡收割机基于图片水印文字的智能图片分类利用水印文字实现图片精准分类图片水印文字在图片分类中的应用按照水印文字特征对图片进行分类解析图片水印文字助力图片分类 excel 阿里云
一、项目背景本项目旨在通过自定义指定图片的多个识别区域，利用强大的文字识别技术将这些区域内的文字提取出来，并保存到Excel表格中，方便后续的数据处理和分析。我们选择使用WPF（WindowsPresentationFoundation）作为前端开发框架，以提供友好的用户界面，方便用户自定义识别区域。同时，借助阿里云的文字识别服务，利用其先进的OCR（OpticalCharacterRecogni
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

WebArena: A Realistic Web Environment for Building Autonomous Agents

TL;DR

Introduction

背景

本文方案

Methods

WebArena 环境实现

网站选择

观察空间

动作空间

用户角色模拟

基于 Web 的测试任务构建

通过高层自然语言控制代理

模仿人类的意图收集

评估标注

Baseline Web Agents

Experiments

主要结论

从相同模板执行任务的一致性

错误分析

Thoughts

你可能感兴趣的:(paper_reading,前端)