socket模型第2页

使用PyTorch搭建Transformer神经网络:入门篇

本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。

DASA13·2025-03-23 00:21

解析大模型归一化：提升训练稳定性和性能的关键技术

引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。

秋声studio·2025-03-23 00:19

PyTorch数据归一化处理：transforms

torchvision.transforms：常用的图像预处理方法*torchvision.datasets：常用的数据集Dataset实现*torchvision.models：常用的CV（预训练）模型实现

2401_87555420·2025-03-22 23:48

深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践

一、引言：模型泛化能力的核心挑战在深度学习模型开发中，欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计，工业级深度学习项目中有63%的失败案例与这两个问题直接相关。

古月居GYH·2025-03-22 22:43

OpenManus 架构的详细技术实现

一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层：LLM层模型选择与适配：OpenManus允许用户替换底层LLM（如mPLUG-Owl3、Qwen、Llama等），通过统一接口调用模型

大势下的牛马·2025-03-22 22:12

WRF移动嵌套结合伏羲模型与CFD（PALM）高精度多尺度降尺度分析研究

本文将详细介绍如何使用WRF移动嵌套技术结合伏羲（Fuxi）模型，并通过CFD模型PALM实现精细化降尺度，以满足城市或区域局地精细化气象预报的需求。

Hardess-god·2025-03-22 22:10

深入探讨盘古大模型的高精度多尺度能力

随着人工智能技术的快速发展，大模型的研究逐渐进入新的阶段。其中，盘古大模型以其卓越的高精度和多尺度处理能力成为研究热点。

Hardess-god·2025-03-22 22:40

使用Ollama部署开源大模型

Ollama是一个简明易用的本地大模型运行框架,可以一键启动启动并运行Llama3、Mistral、Gemma和其他大型语言模型。安装MacOS，Windows用户直接在官网下载页下载安装包即可。

好好学习 666·2025-03-22 22:09

01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员

用上该算法后，Qwen2.5-32B模型只经过RL训练，不引入蒸馏等其他技术，在AIME2024基准上拿下50分，优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen，且

·2025-03-22 22:24

量子位招聘 | DeepSeek帮我们改的招聘启事

如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。

·2025-03-22 22:54

AI巨浪中的安全之舵：天空卫士助力人工智能落地远航

近期，众多企业纷纷接入DeepSeek大模型，迅速推动了大型模型应用的广泛铺开。

天空卫士·2025-03-22 22:09

CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读

ACompositeBackboneNetworkArchitectureforObjectDetection论文阅读介绍方法CBNetV2融合方式对Assistant的监督实验与SOTA的比较在主流backbone架构上的通用性与更宽更深的网络比较与可变形卷积的兼容在主流检测器上的模型适用性在

Laughing-q·2025-03-22 22:38

如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测，从安装依赖项、准备数据集、配置YOLOv8、训练和评估模型以及构建GUI应用程序展示检测

如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测，从安装依赖项、准备数据集、配置YOLOv8、训练和评估模型以及构建GUI应用程序展示检测文章目录1.安装依赖2.数据准备3.配置YOLOv83.1

计算机C9硕士_算法工程师·2025-03-22 22:08

TCP异步通信_服务端

usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Net;usingSystem.Net.Sockets;

DamnF--·2025-03-22 21:07

机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现

本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。

Hardess-god·2025-03-22 21:07

LLM的工具调用能力（如Function Calling）

LLM的工具调用能力（如FunctionCalling）是增强大模型实用性的核心技术，使其能够通过生成结构化指令与外部系统交互。

maxmaxma·2025-03-22 21:35

MSE分类时梯度消失的问题详解和交叉熵损失的梯度推导

前文请移步笔者的另一篇博客：大模型训练为什么选择交叉熵损失（Cross-EntropyLoss）：均方误差（MSE）和交叉熵损失的深入对比MSE分类时梯度消失的问题详解我们深入探讨MSE（均方误差）的梯度特性

阿正的梦工坊·2025-03-22 21:34

使用Python和LangChain构建检索增强生成（RAG）应用的详细指南

使用Python和LangChain构建检索增强生成（RAG）应用的详细指南引言在人工智能和自然语言处理领域，利用大语言模型（LLM）构建复杂的问答（Q&A）系统是一个重要应用。

m0_57781768·2025-03-22 21:33

学习111

项目名称项目简介主要功能技术原理GitHub地址browser-use智能浏览器工具，让AI像人类一样操作浏览器，实现网页自动化网页浏览与操作、多标签页管理、视觉识别与内容提取、操作记录与重复执行、自定义动作支持、主流LLM模型支持为大语言模型服务的创新

麋鹿叔叔·2025-03-22 21:31

使用LangChain实现基于LLM和RAG的PDF问答系统

目录前言一.大语言模型(LLM)1.什么是LLM？2.LLM的能力与特点二、增强检索生成(RAG)三.什么是LangChain？

张同学吧·2025-03-22 20:00

基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践

第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？

weixin_贾·2025-03-22 20:59

AI 赋能应急管理：ChatGPT、DeepSeek、Grok 的应用探索

个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能（AI）技术的快速发展，大语言模型（LLM）在应急管理领域的应用逐步扩大。

一ge科研小菜菜·2025-03-22 20:58

DeepSeek的崛起：2025新春国产AI模型的全球影响力

摘要在2025年新春之际，国产AI模型DeepSeek以现象级的姿态迅速崛起，凭借免费、易用及高性能的特点，吸引了全球科技界的广泛关注。

耶耶Norsea·2025-03-22 20:27

一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！

前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。

小城哇哇·2025-03-22 20:26

每天分析一个开源项目：open_deep_research

它模拟了OpenAI和Gemini的DeepResearch流程，但提供了更强的自定义能力，允许用户配置模型、Prompt、报告结构

申非zz·2025-03-22 20:56

ONE Deep模型：LG AI Research的开源突破

摘要由LGAIResearch开发的ONEDeep系列开源AI模型，参数规模覆盖2.4亿至32亿。经评估，2.4B参数规模的ONEDeep模型在性能上优于同类其他模型，展现出显著优势。

耶耶Norsea·2025-03-22 20:26

anythingLLM 使用教程

一、anythingLLM简介anythingLLM是一款灵活且功能强大的语言模型，它基于先进的深度学习架构构建，旨在为用户提供多样化的自然语言处理服务。

惟贤箬溪·2025-03-22 19:24

GitHub项目推荐--基于LLM的开源爬虫项目

以下是一些基于大语言模型（LLM，LargeLanguageModel）的开源爬虫项目，它们结合了自然语言处理（NLP）技术与爬虫的功能，能在一定程度上提升爬取的智能化和精度。

惟贤箬溪·2025-03-22 19:24

深度解析大模型推理框架：原理、应用与实践

在当今数据驱动的时代，大模型推理框架已经成为人工智能领域的重要支柱。

百度_开发者中心·2025-03-22 19:24

大模型推理框架：从理论到实践的全面解析

然而，深度学习模型的训练和推理过程往往涉及大量数据和复杂计算，传统的计算框架难以满足需求。因此，大模型推理框架应运而生，成为解决这一问题的关键。

百度_开发者中心·2025-03-22 19:23

毕业论文代码实验（Python\MATLAB）基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测模型

一、项目背景1.1光伏功率预测意义在能源结构转型背景下（国家能源局2025规划），光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响，光伏出力具有显著波动性，导致：电网调度难度增加（±15%功率波动）电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合：分钟级辐照度变化与小时级天气模式共存非线性映射关系：气象因素与发电功率呈高阶非线性关系数据模态差异：数值天气预报(NWP

清风AI·2025-03-22 19:51

DeepSeek 部署指南 (使用 vLLM 本地部署)

DeepSeek部署指南(使用vLLM本地部署)本文档将指导您如何使用vLLM在本地部署DeepSeek语言模型。

AGI大模型资料分享员·2025-03-22 19:51

流数据（Streaming Data）处理

在看代码之前，我们应当首先知道流数据与webSocket之间的区别（两者不能同一而论），因为存在区别所以在读取数据时使用相对较大的差距下面我将概述我对两者区别的一个总结（若有不对，请斧正）流数据（StreamingData

人间无人事·2025-03-22 19:47

LLM-Agent方法评估与效果分析

1.引言近年来，随着大型语言模型（LLM）的快速发展，基于强化学习（RL）对LLM进行微调以使其具备代理（Agent）能力成为研究热点。

·2025-03-22 18:50

大模型学习-让其他电脑可访问本地ollama的模型并进行流式响应

目录让其他电脑可访问本地ollama流式响应让其他电脑可访问本地ollama默认情况下，其他电脑不能直接访问本地Ollama服务。解决方法：让Ollama监听局域网地址，而不是localhost我们可以让Ollama监听局域网IP，在Ollama服务器上运行：setOLLAMA_HOST=0.0.0.0:11434ollamaserve注意：这种方式只对当前CMD窗口有效，关闭窗口后就会失效。如果

Gratitute_林腾·2025-03-22 17:35

软件工程简答题整理

软件工程考试简答题整理瀑布模型是软件工程中应用最广泛的过程模型，试述采用瀑布模型进行软件开发的基本过程，该过程有何特点？

~进无止境~·2025-03-22 17:03

OSI七层模型

OSI七层模型传输过程当你在微信上发送一句“你吃了吗”时，这条消息会经历一个从你的手机到接收者手机的复杂旅程。这个过程涉及到网络通信中的七层模型，即OSI（开放系统互连）模型。

_洛_神·2025-03-22 17:02

大规异构集群混合并行分布式训练系统，解决算力不均衡问题 HETHUB

视频教程在这：3.2大规模异构集群，混合并行分布式系统，解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因：同一种GPU数量有限难以构建大规模集群：训练大规模模型依赖于大量的计算资源

爱串门的小马驹·2025-03-22 16:29

软件工程简答

通用过程模型的定义内容通⽤过程框架定义了5种框架活动——沟通、策划、建模、构建以及部署。⼀系列普适性活动——项⽬跟踪控制

Ruannn（努力版）·2025-03-22 16:58

【架构设计】前置知识

通过Go学习并发模型（Gorouti

GIS程序媛—椰子·2025-03-22 16:28

Windows faster whisper GUI-v0.8.5-开源版[AI支持超过100种语言的人声分离/声音转文本字幕]

pwd=vydu#WindowsfasterwhisperGUI-v0.8.5-开源版[AI支持超过100种语言的人声分离/声音转文本字幕]whisperX+faster-whisper+Demucs把模型下载

私人珍藏库·2025-03-22 16:27

LLM 大模型技术知识最佳学习路径图发布！

近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。

AGI-杠哥·2025-03-22 15:54

Python异步编程：从基础到高级

Python的异步编程模型（基于asyncio）为开发者提供了一种高效的方式来处理高并发任务，而无需依赖多线程或多进程。异步编程不仅可以提高程序的性能，还能简化并发代码的复杂性。

CarlowZJ·2025-03-22 15:54

基于Linux的多进程并发服务器设计与实现

系统架构该服务器采用主-从进程模型（Master-Worker模式）：主进程（Master进程）：负责监听客户端连接请求，并将连接

名誉寒冰·2025-03-22 15:52

MiniMind：完全从 0 训练自己的大模型

是B站UP主近在远方的远开源的一个微型语言模型，改进自DeepSeek-V2、Llama3结构，项目包含整个数据处理、pretrain、sft、dpo的全部阶段，包含混合专家(MoE)模型。

三花AI·2025-03-22 15:49

探索Python中的集成方法：Stacking

在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。

Echo_Wish·2025-03-22 15:19

【Python】 Stacking: 强大的集成学习方法

我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响

音乐学家方大刚·2025-03-22 15:19

MiniMind：3小时完全从0训练一个仅有26M的小参数GPT，最低仅需2G显卡即可推理训练！

概述MiniMind是一个开源的微型语言模型，它的设计目标是让个人GPU用户也能够快速推理甚至训练语言模型。它的体积仅为26M，大约是GPT3的1/7000，非常适合快速部署和实验。

哈罗·沃德·2025-03-22 15:19

跟着黑马学MySQL基础篇笔记(1)-概述与SQL

03.安装与启动启动netstartmysql80netstopmysql80客户端连接mysql[-h127.0.0.1][-P3306]-uroot-p04.mysql数据模型关系型数据库RDBMS05

小杜不吃糖·2025-03-22 15:18

Stacking算法：集成学习的终极武器

1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来

civilpy·2025-03-22 14:16

推荐频道

socket模型