大模型入门学习

Browser-Use + LightRAG Agent：利用LLM抓取99%网站的高效方案

在这个故事中，我将提供一个快速教程，展示如何使用浏览器使用、LightRAG和本地LLM创建一个强大的聊天机器人，以开发一个能够抓取您选择的任何网站的AI代理。此外，您可以询问有关您的数据的问题，这将为您提供该问题的回答。

免责声明：本文仅用于教育目的。我们不鼓励任何人抓取网站，特别是那些可能有反对此类行为的条款和条件的网络属性。

现有的RAG系统存在显著的局限性，包括依赖扁平数据表示和缺乏上下文意识，导致答案碎片化以及无法捕捉复杂的相互依赖关系。

为了解决这些挑战，我们提出LightRAG和浏览器使用

浏览器使用是一个开源的网络自动化库，支持与任何语言模型（LLM）进行交互。

通过一个简单的接口，用户可以使LLM与网站交互并执行数据抓取和信息查询等任务。

LightRAG将图结构集成到文本索引和检索过程中。这个创新框架采用两级检索系统，以增强从低级和高级知识发现中全面信息检索的能力。

那么，让我给您快速演示一个实时聊天机器人，向您展示我的意思。

我想抓取一个网站，所以我问了代理两个问题。我的第一个问题是：“去亚马逊找出最便宜的16GB VRAM和RTX 3080或RTX 4090 GPU的笔记本电脑。”

结果令人惊讶！浏览器使用大型语言模型提取数据，自动定位交互元素。如果您仔细观察，您会看到代理在找不到元素或LLM出错时会自我纠正。它还使用视觉模型进行截图并提取信息。

对于我的第二个问题，我问代理：“去google.com寻找关于监督LLM的文章，然后提取关于监督微调的所有内容。”如果您想了解更多关于微调的信息，我在我上一个视频中进行了详细解释和研究。

一旦数据加载完成，我们实现LightRAG，以便LLM能够同时处理多个元素——实体、关系和描述。它测试了LLM的理解，分拆任务可以减少压力，但可能会增加令牌使用。

模型的源代码提前指定了实体类型，这可能不适用于新领域，类似于在传统知识图谱中定义模式的挑战。

在更高的层面上，关键词指导相关信息的回忆，但回忆质量取决于这些关键词。最终，这个过程提高了最终答案的质量。

什么是 LightRAG？

LightRAG 是一个快速高效的信息检索和生成系统，旨在解决传统 RAG 系统的问题。一个典型的 RAG 系统旨在将 LLM 与外部知识链接，以生成更准确的用户问题答案。

然而，传统系统受限于扁平的数据表示，缺乏上下文。LightRAG 将图结构纳入数据索引和搜索，以克服这些限制，并提供高效且具有上下文的信息。

LightRag 的工作原理

LightRAG 首先应用基于图的数据结构，在信息检索过程中对外部数据库中的实体及其关系进行预处理。

该过程包括多个步骤：

• 实体和关系的提取
• 检索键值对的生成
• 信息的去重

通过这些步骤，LightRAG 不仅提取具有特定语义的实体，还加深了对抽象概念的理解，使系统在面对复杂问题时能够进行更准确的信息检索和生成。

例如

基于图的文本索引

LightRAG 从文档中提取实体（人、地点、概念等）及其之间的关系，并利用这些信息构建知识图谱。

例如，从句子“Andrew Yan 在 Google Brain 团队研究人工智能”中，我们提取以下信息：

• 实体：Andrew Yan（人），Google Brain 团队（组织），人工智能（概念）
• 关系：Andrew Yan — 研究 — 人工智能，Andrew Yan — 隶属 — Google Brain 团队

以这种方式创建的知识图谱可以有效地表示复杂的信息关系。图 1 的左侧对应于这个过程。

双阶段搜索范式

LightRAG 搜索分为两个阶段，低级和高级，如图 1 中间部分所示。

• 低级搜索：寻找具体的实体或关系，例如特定的名称或概念，如“Andrew Yan”或“The Google Brain team”。
• 高级搜索：寻找更抽象的主题或对象，例如广泛的主题，如“谷歌 AI 研究的前沿”。

这种双层次的方法允许平衡的信息检索，既捕捉具体事实，又展现更大的全局。

LightRAG 与 GraphRAG

LightRAG 在效率、检索和处理复杂查询方面优于 GraphRAG。它使用双层检索系统，将令牌使用量减少到 100 以下，仅需一次 API 调用，而 GraphRAG 则需要 610,000 个令牌和多次调用。

LightRAG 提供了更多样化的响应，有效捕捉特定和广泛的主题，并在复杂查询中表现出色，而 GraphRAG 的适应性较差，成本更高。LightRAG 更加高效、灵活，适合动态数据环境。

什么是 Browser-Use？

Browser-use 是一个开源的网页自动化库，允许大型语言模型（LLMs）执行诸如检查航班、搜索信息、总结热门帖子等任务。

它自动检测可点击元素，处理 Cookie 提示和弹出窗口，并允许在多个标签页之间切换。它还可以填写表单、提取网页信息、截取屏幕截图和读取图像内容。

该工具通过分析当前页面内容做出智能决策，以确定下一步行动——是点击、输入文本还是翻页。此外，它具有记忆功能，能够回忆之前访问的页面和收集的信息。它支持与 LangChain 兼容的模型，包括 GPT-4、Claude 3.5 和 LLama。

开始编码

在我们深入应用程序之前，我们将创建一个理想的环境以便代码能够正常工作。为此，我们需要安装所需的 Python 库。首先，我们将开始安装支持模型的库。为此，我们将执行 pip install requirements。由于演示使用了 OpenAI 大模型，因此您必须首先设置 OpenAI API 密钥。

pip install -r requirements.txt

安装完成后，我们导入 browser_use、langchain_openai 和 lightrag。

from browser_use import Agent, Controller   from dotenv import load_dotenv   from langchain_openai import ChatOpenAI   import os   from lightrag.lightrag import LightRAG, QueryParam   from lightrag.llm import gpt_4o_mini_complete

然后，我们使用 Controller 来管理和保持多个代理之间的浏览器状态。它允许代理共享浏览会话，保持 Cookie、会话和标签页的一致性。

## 在代理之间保持浏览器状态   controller = Controller()

我们将初始化代理，以通过在 Google 中搜索 “LoRA LLM” 来查找和提取信息。然后，我们使用 chatOpenai 模型来处理和分析与 controller 连接的内容，以保持浏览器状态。

## 初始化浏览器代理   agent = Agent(       task="Go to google.com and find the article about Lora llm and extract everything about Lora",       llm=ChatOpenAI(model="gpt-4o", timeout=25, stop=None),       controller=controller)

此外，我们可以初始化另一个代理，但这不是必需的，具体取决于您希望在代码中包含多少代理。它们可以执行不同的任务，但您需要将每个代理管理到不同的任务中。

agent = Agent(       task="Go to google.com and find the article Supervised llm and extract everything about Supervised Fine-Tuning",       llm=ChatOpenAI(model="gpt-4o", timeout=25, stop=None),       controller=controller)

然后，我们定义一个异步函数以实现任务的并发执行，我们将代理的最大步骤限制设置为 20，但可以根据需要设置任何数字。在每一步中，代理执行一个动作，表示代理计划下一步要做的事情，结果包含该步骤的输出，包括任务是否完成和任何提取的数据。如果任务完成，提取的内容将保存到名为 text.txt 的文件中，过程终止。

async defmain():       max_steps = 20       # 逐步运行代理       for i inrange(max_steps):           print(f'\n 步骤 {i+1}')           action, result = await agent1.step()              print('动作:', action)           print('结果:', result)              if result.done:               print('\n✅ 任务成功完成！')               print('提取的内容:', result.extracted_content)                            # 将提取的内容保存到文本文件               withopen('text.txt', 'w') as file:                   file.write(result.extracted_content)               print("提取的内容已保存到 text.txt")                            break      asyncio.run(main())

现在我们定义工作目录并检查当前工作目录中是否存在名为 dickens 的目录。如果不存在，程序将创建它。这确保了该目录可用于存储文件或其他资源。

WORKING_DIR = "./dickens"   if not os.path.exists(WORKING_DIR):       os.mkdir(WORKING_DIR)

主要步骤是使用必要的参数配置 LightRAG 实例。我们使用工作目录（./dickens）和轻量级 GPT-4o 模型（gpt_4o_mini_complete）作为默认语言模型进行初始化。此设置对于增强检索任务是高效的，如果需要，可以灵活使用更强大的模型（gpt_4o_complete）。

rag = LightRAG(       working_dir=WORKING_DIR,       llm_model_func=gpt_4o_mini_complete  # 使用 gpt_4o_mini_complete LLM 模型       # llm_model_func=gpt_4o_complete  # 可选，使用更强的模型   )

我们从指定路径读取 text.txt 的内容，并使用 rag.insert() 将其插入 RAG 系统。

with open("C:/Users/mrtar/Desktop/lightrag/text.txt") as f:       rag.insert(f.read())

我们对查询 “What is Supervised Fine-Tuning” 在 RAG 系统中执行 简单搜索。在简单搜索模式下，系统查找直接包含查询中关键字的文档或条目，而不考虑这些术语周围的任何关系或上下文。对于不需要复杂推理的简单查询，它非常有用。它将仅基于关键字匹配返回结果。

## 执行简单搜索   print(rag.query("what is Supervised Fine-Tuning", param=QueryParam(mode="naive")))

此外，我们对查询 “What is Supervised Fine-Tuning?” 执行 局部搜索。在局部搜索模式下，系统检索与查询及其直接邻居（直接相关的实体）相关的信息。它将提供额外的上下文，专注于与 “Supervised Fine-Tuning” 直接相关的紧密关系。

搜索比简单搜索更详细，当您需要更多关于直接连接或关系的上下文时非常有价值。

## 执行局部搜索   print(rag.query("what is Supervised Fine-Tuning", param=QueryParam(mode="local")))

现在，我们对查询 “What is Supervised Fine-Tuning” 使用 全局搜索。在全局搜索模式下，系统考虑整个知识图谱，查看更广泛范围内的直接和间接关系。它检查与 “Supervised Fine-Tuning” 相关的所有可能连接，而不仅仅是直接的。它提供了全面的概述，适合需要广泛上下文或全局关系视角的查询。

## 执行全局搜索   print(rag.query("what is Supervised Fine-Tuning", param=QueryParam(mode="global")))

最后，我们对查询 "What is Supervised Fine-Tuning” 执行 混合搜索。混合搜索模式结合了局部搜索和全局搜索的优点。它根据直接关系（如局部搜索）检索信息，但也考虑间接或全局关系（如全局搜索）。它提供了平衡和全面的上下文，适合大多数场景，特别是在理解整体和特定上下文时至关重要。

## 执行混合搜索   print(rag.query("what is Supervised Fine-Tuning", param=QueryParam(mode="hybrid")))\

结论：

不仅仅是技术进步，LightRAG 和 Browser-Use 潜在地可以从根本上改变我们与信息的互动方式。它们提供更准确和全面的搜索能力、对复杂问题的精确回答，以及始终反映最新知识的响应。

如果这些目标得以实现，它们可能会彻底改变教育、研究和商业等领域。LightRAG 和 Browser-Use 代表了开创性的技术，将开启下一代信息搜索和生成。我非常期待看到它们在未来的发展！

AI大模型学习福利

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

大模型&AI产品经理如何学习

求大家的点赞和收藏，我花2万买的大模型学习资料免费共享给你们，来看看有哪些东西。

1.学习路线图

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源，但基本上都残缺不全的，这是我自己整理的大模型视频教程，上面路线图的每一个知识点，我都有配套的视频讲解。

（都打包成一块的了，不能一一展开，总共300多集）

因篇幅有限，仅展示部分资料，需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档，有几百本，都是目前行业最新的。

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。

学会后的收获：
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

获取方式：
有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】

cesium-native+OpenGL开发笔记—渲染GIS球
坐标系转换OpenGL坐标系右手坐标系，X轴水平向右，Y轴竖直向上，Z轴指向屏幕外面。Y（绿色，朝上）^|||*---->X（红色，向右）//Z（蓝色，向前）（指向屏幕外）3DTiles坐标系右手坐标系，Z轴朝上Z（蓝色，朝上）^||/Y（绿色，朝屏幕内）|/*---->X（红色，朝右）glTF模型坐标系右手坐标系，Y轴朝上3DTiles和OpenGL坐标系上方向存在差异，实际绘制是在OpenGL
LK32T102学习2-GPIO
GPIO即可编程输入输出口，LK32T102有3组GPIO口，每组最多32条口线。GPIO口线可以实现很多的功能，可以说掌握了GPIO功能也就MCU编程也就基本实现了MCU的入门。GPIO功能使用要注意LTK320T的管脚是多功能的，可作为数字量管脚，也可以作为模拟量管脚。输入模式浮空输入模式输入完全由外部输入决定PU，PD都不导通上拉输入模式IO悬空时输入为高电平PU导通，PD不导通下拉输入模式
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
动态规划、背包问题入门 2303_Alpha 动态规划代理模式算法笔记 c语言
目录1、动态规划定义2、数塔问题题目描述：思路：代码实现：3、最长有序子序列问题描述：代码实现：动态规划基本思想特点4、背包问题①01背包问题空间复杂度优化②完全背包③多重背包二进制优化④二维费用背包1、动态规划定义动态规划是一种用于解决优化问题的算法策略，它的核心是把一个复杂的问题分解为一系列相互关联的子问题，并通过求解子问题的最优解来构建原问题的最优解。它将一个问题分解为若干个子问题，然后从最
MySQL CDC与Kafka整合指南：构建实时数据管道的完整方案亲爱的非洲野猪 mysql kafka 数据库
一、引言：现代数据架构的实时化需求在数字化转型浪潮中，实时数据已成为企业的核心资产。传统批处理ETL（每天T+1）已无法满足以下场景需求：实时风险监控（金融交易）即时个性化推荐（电商）物联网设备状态同步微服务间数据一致性本文将深入探讨如何通过MySQLCDC与Kafka的整合，构建高效可靠的实时数据管道。二、技术选型：三大CDC工具深度对比功能矩阵比较特性DebeziumCanalMaxWell多
鸿蒙开发进阶（HarmonyOS ）开发ArkTS卡片页面凹~凸~曼 HarmonyOS 鸿蒙开发 OpenHarmony harmonyos 华为鸿蒙系统前端 android ui 移动开发
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）开发者可以使用声明式范式开发ArkTS卡片页面。如下卡片页面由DevEcoS
表观遗传风暴：深圳AI-BioFab终极防御战全纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站⚡《表观遗传风暴：深圳AI-BioFab终极防御战全纪实》副标题：抗癌疫苗灌装倒计时90秒惊现组蛋白叛乱，中国启动虫洞计算化解文明级生物危机2025年7月2日14:26光明科学城急电当第184支抗癌疫苗注入冷链罐的瞬间，B3层突爆刺眼蓝光！培养舱内数千细胞染色体疯狂解旋，量子钟在14:26:03
医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题——2025年临床转化瓶颈突破与多中心验证报告残酷现实：FDA2025Q1报告显示，87%的AI影像工具因临床转化失败止步于III期试验破局曙光：斯坦福-梅奥联合研究证实，多模态融合使肺结节良恶性判别AUC提升至0.98（单模态上限0.91）一
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
Transformer已死？2025年十大替代架构实战评测
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站封面图建议：十大架构3D渲染图环绕碎裂的Transformer图标，背景为动态性能雷达图副标题：实测推理速度/显存占用/长文本能力，附迁移成本决策树一、争议源起：Transformer的时代性局限（2025版）graphLRA[Transformer痛点]-->B[显存黑洞：千亿模型推理需1.6
生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南》副标题：基于2025年英特尔Loihi3芯片的工业级部署实战（附能耗对比&代码库）封面建议：脉冲神经网络动态脉冲传导图覆盖在神经形态芯片显微结构上，标注「能效比：传统GPU的1/800」一、2025生物启发AI的临界点突破生物神经特性事件
《从Backprop到Diffusion：深度学习的算法进化树全景图》 HeartException 学习人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《从Backprop到Diffusion：深度学习的算法进化树全景图》**展开系统性解析。全文基于算法原理-技术突破-产业重塑的三层逻辑链，融合2025年最新研究成果与产业数据，呈现深度学习四十年的底层技术迁徙路径从Backprop到Diffusion：深度学习的算法进化树全景图副标题：一部算法
语言模型之谜：提示内容与格式的交响诗步子哥 AGI通用人工智能语言模型人工智能自然语言处理
当代人工智能领域中，语言模型（LLM）正以前所未有的规模和深度渗透到各行各业。从代码生成到数学推理，从问答系统到多项选择题，每一次技术的跃进都离不开一个看似简单却充满玄机的关键环节——提示（prompt）的设计。而在这场提示优化的探索中，内容与格式的双重奏正逐渐揭开其神秘面纱，谱写出一曲宏大的交响诗。本文将带您走进“内容格式集成提示优化（CFPO）”的奇幻世界，揭示如何透过细腻的内容雕琢和精妙的格
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
聚焦的伟力：注意力机制与Transformer的创世纪田园Coder 人工智能科普人工智能科普
当LSTM和GRU凭借其精密的门控系统，成功驯服了时间的长河，让神经网络能够跨越数十甚至数百步记住关键信息，并在机器翻译、文本生成等领域大放异彩时，一个看似微小却影响深远的瓶颈逐渐浮出水面，尤其是在序列到序列（Seq2Seq）框架中。在标准的Seq2Seq模型（如用于神经机器翻译）里，编码器（通常是一个RNN如LSTM）需要将整个输入序列（如一个英语句子）的信息压缩成一个固定长度的上下文向量（Co
GPT-SoVITS项目重大更新全解析：从语音合成到多语言支持的技术演进胡晗研
GPT-SoVITS项目重大更新全解析：从语音合成到多语言支持的技术演进GPT-SoVITS项目地址:https://gitcode.com/gh_mirrors/gp/GPT-SoVITS项目概述GPT-SoVITS是一个先进的语音合成与转换系统，集成了GPT模型与SoVITS技术，能够实现高质量的语音合成、语音转换以及多语言混合处理。该系统不断迭代更新，在语音质量、训练效率和多语言支持等方面持
【大数据入门核心技术-DolphinScheduler】（二）DolphinScheduler安装部署-集群模式 forest_long 大数据技术入门到21天通关大数据 spark hive hadoop 交互 flink mapreduce
目录一、部署模式1、单机模式2、伪集群模式3、集群模式二、部署安装1、下载2、创建mysql元数据库3、配置一键部署脚本4、初始化数据库5、一键部署DolphinScheduler6、访问DolphinSchedulerUI三、启停命令一、部署模式DolphinScheduler支持多种部署模式，包括单机模式（Standalone）、伪集群模式（PseudoCluster）、集群模式（Cluste
【性能优化与架构调优（一）】Java 应用性能优化
Java应用性能优化：从JVM到并发编程的全方位解析一、JVM调优：打造高性能运行环境1.1JVM内存模型与核心参数配置JVM内存结构主要包含堆(Heap)、栈(Stack)、方法区(MethodArea)、本地方法栈(NativeMethodStack)和程序计数器(PCRegister)。其中，堆是GC的主要区域，可通过以下参数进行调优：#JVM启动参数示例（以生产环境常用配置为例）java-
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
OpenLayers 入门指南：序言凌往昔 OpenLayers 入门指南 WebGIS OpenLayers
本专栏旨在帮助零GIS基础的开发人员系统掌握OpenLayers这一强大的开源Web地图库，通过“理论+实战”结合的方式，逐步实现从创建地图到构建一个基础地图应用模版。无论你是前端开发者、GIS爱好者，都可以通过此专栏零基础开始用OpenLayers开发一个基础地图应用。如果你对OpenLayers已经有过了解和使用，且对API也掌握的比较熟了，不建议订阅此专栏！一、前端框架Vue3TypeScr
Alpha系统联结大数据、GPT两大功能，助力律所管理降本增效资讯分享周大数据 gpt
如何通过AI工具实现法律服务的提质增效,是每一位法律人都积极关注和学习的课题。但从AI技术火爆一下,法律人一直缺乏系统、实用的学习资料,来掌握在法律场景下AI的使用技巧。今年5月,iCourt携手贵阳律协大数据与人工智能专业委员会,联合举办了《人工智能助力律师行业高质量发展巡回讲座》,超过100家律所的律师参与活动。讲座上,iCourtAIGC研究员、AlphaGPT产品研发负责人兰洋,为贵州律协
Python 爬虫入门（九）：Scrapy安装及使用「详细介绍」 blues_C Python爬虫实战 python 爬虫 scrapy
Python爬虫入门（九）：Scrapy安装及使用「详细介绍」前言1.Scrapy简介2.Scrapy的安装2.1环境准备2.2安装Scrapy3.创建Scrapy项目3.1创建项目3.2项目结构简介4.编写爬虫4.1创建爬虫4.2解析数据4.3运行爬虫5.存储数据5.1存储为JSON文件5.2存储到数据库5.2.1MongoDB6.处理请求和响应6.1请求头设置6.2处理响应7.高级功能7.1使
RICE模型或KANO模型在具体UI评审时的运用经验 Alex艾力的IT数字空间设计规范前端框架原型模式产品经理需求分析 ux 制造
模型是抽象的产物，结合场景才好说明（数据为非精确实际数据，仅供参考，勿照搬）。案例一：RICE模型解决「支付流程优化」vs「首页动效升级」优先级争议背景：APP电商模块在迭代中面临两个需求冲突——支付团队主张优化支付失败提示（减少用户流失），设计团队提议增加首页3D商品动效（提升视觉吸引力）。双方争执不下。应用过程：RICE模型量化评估（参考）：支付优化：Reach（覆盖人数）：支付流程涉及100
【AI大模型学习路线】第三阶段之RAG与LangChain——第十五章（LangChain与Chain组件）LLMChain,Sequential Chain详解？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十五章（LangChain与Chain组件）LLMChain,SequentialChain详解？【AI大模型学习路线】第三阶段之RAG与LangChain——第十五章（LangChain与Chain组件）LLMChain,SequentialChain详解？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十五
区块链重构信任链：跨境电商代购如何用代码破解“假货-失联-物流造假”困局？ Joe13265449558 跨境电商独立站无货源自建站代购系统
区块链技术如何解决跨境电商代购的信任与溯源难题？在跨境电商代购市场年增速达28%的背景下，消费者对商品真伪、物流透明度和支付安全性的质疑却与日俱增。2024年，中国消费者协会数据显示，跨境电商代购投诉量同比激增187%，其中"货不对板""物流造假""付款后失联"成为三大核心痛点。区块链技术凭借其去中心化、不可篡改和智能合约等特性，正在重构跨境电商代购的信任体系，为行业提供从商品生产到交付的全链路解
【机器学习|学习笔记】组合特征（Feature Combinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。努力毕业的小土博^_^ 机器学习学习笔记机器学习学习笔记人工智能神经网络深度学习
【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。文章目录【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达
当我的代码评审开始 “AI 打工”：聊聊这个让我摸鱼更心安的神器 Honesty861024 ci/cd ai git
作为一个每天和代码打交道的打工人，最头疼的莫过于提完MR后漫长的等待——reviewer可能在开会、可能在改bug、可能在摸鱼，而你的代码只能在“进行中”状态里默默吃灰。更惨的是偶尔遇到“人工漏检”，上线后发现奇奇怪怪的bug，只能对着屏幕疯狂道歉：“这锅我背，下次一定仔细查！”直到我发现了这个藏在云效里的神器——yunxiao-LLM-reviewer，现在我的MR终于有了一个24小时在线的“A
展锐 ISP 模块功能特点与应用场景评估：轻量化影像处理方案的实战能力分析
展锐ISP模块功能特点与应用场景评估：轻量化影像处理方案的实战能力分析关键词：展锐ISP、图像信号处理、3DNR、HDR合成、YUV输出、图像管线、降噪算法、调色引擎、应用场景评估、移动终端影像系统摘要：作为国产SoC平台中的关键影像处理核心，展锐ISP（ImageSignalProcessor）聚焦轻量化、低功耗与快速集成三大特性，广泛应用于中低端移动终端、AIoT摄像头及定制化影像设备。相较于
19｜Whisper+ChatGPT：请AI代你听播客 _Rye_ AI大模型 whisper chatgpt
今天，我们的课程开始进入一个新的主题了，那就是语音识别。过去几周我们介绍的ChatGPT虽然很强大，但是只能接受文本的输入。而在现实生活中，很多时候我们并不方便停下来打字。很多内容比如像播客也没有文字版，所以这个时候，我们就需要一个能够将语音内容转换成文本的能力。作为目前AI界的领导者，OpenAI自然也不会放过这个需求。他们不仅发表了一个通用的语音识别模型Whisper，还把对应的代码开源了。在
网络资源模板--基于Android Studio 实现的喝水提醒App 编程乐学 Android 网络项目模板 android studio android ide 安卓大作业移动端开发大作业喝水提醒
目录一、测试环境说明二、项目简介三、项目演示四、部设计详情（部分)注册页面首页统计页五、项目源码一、测试环境说明二、项目简介本应用采用经典的MVC（Model-View-Controller）架构，将数据模型（Model）、视图（View）和控制器（Controller）分离，提高代码的可维护性和可扩展性。Model：负责数据的存储和处理，包括用户信息、饮水记录等。使用Room数据库来实现数据的持
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓