阿Q说代码

亚马逊云科技产品测评』活动征文｜通过使用Amazon Neptune来预测电影类型初体验

文章目录

- 福利来袭
- Amazon Neptune
- - 什么是图数据库
  - 为什么要使用图数据库
  - 什么是Amazon Neptune
  - Neptune 的特点
- 快速入门
- - 环境搭建
  - - notebook
  - 图神经网络快速构建
  - - 加载数据
    - 配置端点
    - Gremlin 查询
    - 清理
- 删除环境
- - - S3 存储桶删除

授权声明：本篇文章授权活动官方亚马逊云科技文章转发、改写权，包括不限于在 Developer Centre, 知乎，自媒体平台，第三方开发者媒体等亚马逊云科技官方渠道

福利来袭

前几天有小伙伴在群里灵魂发问：双11到来之际，阿里云、华为云、腾讯云哪家云服务的价格优惠力度最大？看到这个问题，群友各抒己见，展开了激烈的讨论，最终得出结论：三家国内云服务厂商提供的产品差异不大，价格优惠也不相上下。

看到这里，我将目光默默的转向了国外的云服务厂商亚马逊云（AWS）。大家作为 IT 人应该都知道亚马逊云在全球云市场中的地位举足轻重。据2021年全球云计算IaaS市场报告显示，亚马逊云市场份额高达38.9%，而国内最牛的阿里云也仅占9.5%。

来到亚马逊云的官网，我发现亚马逊云科技提供了100余种产品免费套餐。其中，计算资源Amazon EC2首年12个月免费，750小时/月；存储资源 Amazon S3 首年12个月免费，5GB标准存储容量；数据库资源 Amazon RDS 首年12个月免费，750小时；Amazon Dynamo DB 25GB存储容量永久免费。

至于活动地址嘛，双手奉上，赶快来白嫖呀！同时给大家奉上数据库免费试用链接及上手教程

在AWS帐号注册过程中值得注意的一点：填写信用卡或者借记卡卡号时，虽然网址中标记的是VISA或者mastercard，其实普通的信用卡也是可以的。

当然除了价格优势之外，亚马逊云科技的优势还体现在以下方面：

亚马逊云科技负责云自身的安全合规，不仅保证底层云基础设施和云服务的安全和合规；还提供了超过280多项安全、合规和治理方面的服务与工具。
亚马逊云科技有着覆盖全球的基础设施。
亚马逊云科技拥有超过200大类的云服务，从广度和深度上都能满足数字化出海和出海数字化的技术需求。
亚马逊云科技与全球超过10万家合作伙伴一起为出海企业提供从咨询、迁移到解决方案构建、到云上交付和运维的完整服务。
在全球，亚马逊是多个领域的引领者，包括亚马逊电商、智能物流、智能语音助手、智慧零售以及设备等多个领域。

Amazon Neptune

在了解Amazon Neptune之前，我们先来了解一下“图数据库”的概念。

什么是图数据库

如上图所示，将结点的人物和箭头表示的关系构成的图进行存储和查询的数据库就被称为图数据库。图数据库强调数据之间的关联关系，它将数据间的联系视为和数据本身同等重要。

为什么要使用图数据库

在互联网飞速发展的今天，传统的关系型数据库在处理关系操作方面表现出疲软的态势，而图数据库通过存储数据与关系，能将访问数据结点和关系的操作提升至线性时间复杂度，甚至能在一秒内遍历百万级的关系边，性能显著。

我们可以利用图数据库以多种方式表示现实世界实体之间的相互关系，包括行为、所有权、亲属关系、购买选择、个人联系、家庭关系等。以下是截止2021年8月，DB-ENGINES中图数据库前二十位的排行榜名单，我们可以看到Amazon的Neptune排在第八位。接下来就让我们来了解下Amazon Neptune。

什么是Amazon Neptune

Amazon Neptune是一项快速、可靠且完全托管式的图数据库服务，可用来帮助我们轻松构建和运行适用于高度互连数据集的应用程序。Neptune的核心是一个专门打造的高性能图形数据库引擎，此引擎经过优化，可存储数十亿条关系并以数毫秒级延迟查询图形。

Neptune 的特点

Neptune 支持流行的图表查询语言 Apache TinkerPop W3C SPARQL Grimlin 和 Neo4J 的 OpenPher，可让我们构建查询，高效地浏览高度互连数据集。
Neptune具有高度可用性，带有只读副本， point-in-time Amazon S3 的持续备份以及跨可用区的复制。
Neptune 提供了数据安全功能，并支持加密静态数据和传输中的数据。
Neptune 是完全托管的，因此再也无需担心数据库管理任务，例如硬件预配置、软件修补、设置、配置或备份。

光说不练假把式，接下来就让我们操练起来吧！

快速入门

环境搭建

首先我们需要登录到AWS的控制台

在控制台顶上搜索cloudshell

打开cloudshell之后如果出现如下页面，需要切换一下节点，如图所示

然后我们就可以创建 S3 存储桶了

其中cheetah-qing为自己的桶名，需要自定义。

我发现该桶名不支持下划线“_”。

接着我们需要通过命令来创建“堆栈“，命令如下：

aws cloudformation create-stack --stack-name get-started-neptune-ml --template-url https://s3.amazonaws.com/ee-assets-prod-us-east-1/modules/4f0f18a83e6148e895b10d87d4d89068/v1/gcr-buildon-selfpace/gcr-buildon-neptune-ml-nested-stack.json --capabilities CAPABILITY_IAM --region us-east-1 --disable-rollback

执行完命令后，大约需要等待30分钟：此时后台会启动一系列的服务。

我们可以通过在控制台顶上搜索cloudformation来查看堆栈是否创建完成，如果get-started-neptune-ml显示 CREATE_COMPLETE表示服务创建完成。

notebook

在搜索栏输入neptune，点击进入，导航栏选择“笔记本”，点击右侧的“查看笔记本文档”。

倘若没有 notebook，需确定地区是否选择正确，默认为美国东部，其次确认后台服务是否都启动完成。

图神经网络快速构建

我们可以根据上方打开的“ Amazon Neptune ML ”笔记来进行操作。在控制台输入命令来检查集群是否已正确配置可以运行 Neptune ML。

开始试验之前先来张步骤图感受下

加载数据

我们使用 Bulk Loader来加载数据，其流程与将数据摄入Amazon Neptune完全相同。通过编写脚本可以实现自动执行从MovieLens网站下载数据，调整数据格式，并将数据载入Neptune的全过程。脚本如下：

s3_bucket_uri="s3://cheetah-qing"
# remove trailing slashes
s3_bucket_uri = s3_bucket_uri[:-1] if s3_bucket_uri.endswith('/') else s3_bucket_uri

cheetah-qing为我们刚才创建的桶名称

执行response = neptune_ml.prepare_movielens_data(s3_bucket_uri)命令即可下载 MovieLens 数据，并将其调整为可被 Neptune 的 Bulk Loader 兼容的格式。

执行结果为

Completed Processing, data is ready for loading using the s3 url below:
s3://cheetah-qing/neptune-formatted/movielens-100k

操作完成后，执行%load -s {response} -f csv -p OVERSUBSCRIBE --run加载数据。

配置端点

执行命令来创建端点，并获取到推理端点的端点名称。

setup_node_classification=True
setup_node_regression=True
setup_link_prediction=True
setup_edge_classification=True
setup_edge_regression=True

endpoints=neptune_ml.setup_pretrained_endpoints(s3_bucket_uri, setup_node_classification, setup_node_regression, setup_link_prediction, setup_edge_classification, setup_edge_regression)

node_classification_endpoint=endpoints['node_classification_endpoint_name']['EndpointName']
node_regression_endpoint=endpoints['node_regression_endpoint_name']['EndpointName']
link_prediction_endpoint=endpoints['prediction_endpoint_name']['EndpointName']
edge_classification_endpoint=endpoints['edge_classification_endpoint_name']['EndpointName']
edge_regression_endpoint=endpoints['edge_regression_endpoint_name']['EndpointName']

Gremlin 查询

现在终于到了我们的电影类型预测环节了，我们一起来看看如何使用这些端点借助 Gremlin 查询进行推断。

在预测电影类型前，我们先执行

来验证图谱中，Forrest Gump 这个 movie 的 genre不包含任何 genre 值。

接下来我们修改这个查询，来预测 Apollo 13 的类型，开始之前先来设置一下：

指定要在 Gremlin 查询中使用的推理端点：g.with("Neptune#ml.endpoint","")
指定我们想要获取该属性的预测值：with("Neptune#ml.classification")

将这些内容结合在一起就可以得到下方的查询，该查询可通过我们的产品知识图谱预测电影 Forrest Gump 的 genre。执行命令：

%%gremlin
g.with("Neptune#ml.endpoint","${node_classification_endpoint}").
  V().has('title', 'Forrest Gump (1994)').properties("genre").with("Neptune#ml.classification").value()

查看结果可知，预测结果似乎是正确的，Forrest 似乎被正确预测为 Drama 类型。

很多情况下，我们可能需要预测一个节点的多个类别。例如在我们的产品知识图谱中，一部电影很可能被归类为多个类型，我们可能需要预测所有这些类型。默认情况下，Neptune ML 会返回排名第一的结果，但我们可以使用 .with("Neptune#ml.limit",3) 配置选项指定希望返回的结果数量。一起看看针对Forrest Gump 返回的，排名前三的结果吧。

Neptune ML 返回的每个值都有一个与之关联的置信度分数，而无论预测结果的置信度如何，上述查询都会返回排名前三的结果。虽然该分数在查询时不可用，但它可用于筛选掉置信度较低的预测。

假设我们想要返回Forrest Gump预测的排名前三的类型，但前提是这些结果必须满足特定的置信度要求。为此，可以使用.with("Neptune#ml.threshold",0.2D)选项为查询添加筛选器，如下所示。

如上所示，目前我们只得到了 Drama 这个预测类型，因为这是唯一高于阈值的预测结果。

清理

我们已经使用Amazon Neptune来完成了预测电影类型的初体验，我们之前创建的 SageMaker 端点依然在运行并会按照标准费率产生费用。如果已完成 Neptune ML 的试用工作，希望避免产生这种重复性的成本，那么可以运行neptune_ml.delete_pretrained_endpoints(endpoints)来删除所创建的推断端点。

除了推断端点的成本外，我们之前使用的CloudFormation脚本也创建了多个额外资源。如果我们的全部操作均已完成，那么我们得删除 CloudFormation 栈，以避免产生重复的费用。

删除环境

为了防止之后的额外扣费，必须进行下面的删除环境操作，

S3 存储桶删除

选择 cloudshell，执行aws s3 rb s3://cheetah-qing --force删除 S3 存储桶

至此，我们的使用Amazon Neptune来完成预测电影类型的初体验就已经完成了，现在我们来总结一下它的优势：

Amazon Neptune 支持 Gremlin 和 SPARQL 的开放图谱 API，并为这些图形模型及其查询语言提供高性能。
Neptune 可在三个可用区内支持最多 15 个低延迟读取副本，从而扩展读取容量并每秒执行超过 10 万个图形查询。
Neptune 旨在提供超过 99.99% 的可用性。其存储系统具有容错能力并能自我修复，专为云而构建，可以跨三个可用区复制六个数据副本。
Amazon Neptune 为您的数据库提供多级安全保护，包括使用 Amazon VPC 进行网络隔离、支持终端节点访问的 IAM 身份验证、HTTPS 加密的客户端连接、使用您通过 AWS Key Management Service (KMS) 创建和控制的密钥对静态数据进行加密。
Neptune 会自动持续地监控您的数据库并将其备份到 Amazon S3.因此可实现精细的时间点恢复。

如果有问题或者有更好的体验方式，欢迎留言或私信阿Q呦，我们一起进步！

你可能感兴趣的:(aws,Amazon,Neptune,亚马逊云,图数据库)

一文清楚比较Kiro与Cursor
AWS公司最近发布了AIIDE。以下是Kiro与Cursor两款AI编程IDE的核心差异总结：1.核心定位与开发范式维度KiroCursor诞生背景亚马逊2025年推出，对标CursorVSCode分支，2023年起流行核心范式规范驱动开发：先写自然语言需求→AI生成完整模块（含测试、文档）AI增强编码：边写代码→实时AI补全/重构目标用户企业/大型团队、AWS深度用户个人开发者/小团队、学习者2
破解 VMware 迁移难题：跨平台迁移常见问题及自动化解决方案七夜zippoe 运维自动化运维 VMware
在企业IT架构向混合云、多云演进的进程中，VMware虚拟化环境的跨平台迁移成为关键任务。无论是迁移至KVM、Hyper-V等开源虚拟化平台，还是AWS、Azure等公有云，迁移过程往往面临兼容性障碍、数据损耗、业务中断等难题。本文深入剖析跨平台迁移的核心痛点，结合自动化技术提出系统性解决方案，助力企业实现平滑迁移。一、跨平台迁移的常见痛点及根源分析VMware迁移的复杂性源于虚拟化层、硬件架构、
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
AWS 管理秘籍（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/cf1c4e1db999839ba88fc56df4011156译者：飞龙协议：CCBY-NC-SA4.0序言AWS平台的增长速度非常快，正在被各行各业广泛采用。正如俗话所说，朋友不会让朋友建立数据中心。不管从哪个角度看，按需计算、网络和存储的模式将持续存在。尤其是当你看到AWS平台在功能和增强方面的更新速度时，很难再去反对站在巨人的肩膀上，尤其是
AWS Terraform 架构指南（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/8b2d222956a050c7632b9eee086dadcf译者：飞龙协议：CCBY-NC-SA4.0第七章：7在项目中实现Terraform您准备好开始使用Terraform开发您的AWS基础设施了吗？在本章中，您将学习Terraform的基础知识，并了解如何在AWS中部署您的第一个模板。我们将介绍选择合适的AWS提供商和选择满足您项目需求的
【ceph】坏盘更换，osd的具体操作向往风的男子 ceph ceph
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
【ceph】ceph集群更换osd时，找不到坏盘位置，怎么查找坏盘对应的序列号---业内称“点灯”
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
贾子军事五定律（Kucius‘ Five Laws of War）：跨越时空的军事智慧洞察
贾子军事五定律（Kucius'FiveLawsofWar）：跨越时空的军事智慧洞察摘要：本文深入剖析贾子军事五定律，即“战争就是政治，情报就是数字，兵法就是艺术，打仗就是数学，全胜就是智慧”，结合世界著名兵法尤其是中国古代兵法，以及古今战争实例，包括一战、二战及战后冲突，探讨其在不同历史时期的体现与应用。同时，联系当前国际形势，阐述该定律对现代军事战略与决策的深远指导意义，旨在揭示其跨越时空的军事
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
ECR仓库CloudFormation模板完整指南 ivwdcwso 运维与云原生自动化 aws 运维 ECR CloudFormation 镜像容器
概述本文档详细介绍了一个通用的AmazonECR（ElasticContainerRegistry）仓库CloudFormation模板，该模板支持多业务组、参数化配置，并包含完整的安全策略、生命周期管理和监控功能。模板特性核心功能✅支持4个业务组：app、ai、mall、frontend✅灵活的服务名手动输入✅多环境支持（dev/test/staging/prod）✅自动镜像扫描和安全检查✅生命
如何利用AWS Lambda作为Serverless数据库进行大数据处理 AI天才研究院 AI人工智能与大数据自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术Serverless数据库一直是构建数据分析应用的主要选择之一。它能帮助客户节省运行服务所需的服务器成本、快速弹性扩展和自动伸缩能力，并且能提升整体性能，有效减少运维和开发资源投入。但是，在实际生产环境中，它们也面临着很多技术上的挑战，比如如何让Serverless数据库服务可以像传统数据库一样，做到高并发处理、实时计算等。而AWSLambda为Serverless数据
探秘无服务器数据库：Amazon Aurora Serverless 深度解析春风十里敲代码 serverless 数据库云原生
在数字化浪潮下，数据库技术不断革新，无服务器数据库成为备受瞩目的新兴力量。其中，AmazonAuroraServerless凭借独特优势，在云数据库领域大放异彩，为现代应用开发带来全新思路。现代应用追求卓越用户体验，要求快速响应、全球可用，还要能处理海量数据。传统单体应用架构已力不从心，微服务化与无服务器架构兴起。在数据库需求上，应用不再满足于单一模式，而是需要专库专用的数据服务。比如，电商应用中
AWS规则引擎 Jasper张 AWS WebRTC aws 云计算 webrtc 服务器
AWS的规则引擎，通常指的是AWSIoTCore规则引擎（AWSIoTRulesEngine），它是AWSIoT服务中的一个核心组件。用途：从IoT设备接收数据并触发相应动作AWSIoTRulesEngine可以实时处理来自设备发送到AWSIoT的MQTT消息或HTTP消息，并根据你定义的规则，把数据：存储到AWS服务（如S3、DynamoDB、Timestream）发送到其他服务（如Lambda
利用 Python 脚本批量查找并删除指定 IP 的 AWS Lightsail 实例忘记安全带 Python网络自动化运维 tcp/ip aws 网络云计算自动化服务器 python
在AWSLightsail管理中，随着实例数量的增多，我们常常会遇到这样一个问题：“我知道某个公网IP地址，但不知道它关联的是哪台实例。”或者：“我有一批老旧的实例只知道IP，需要一键定位并选择删除。”如果你逐台在AWS控制台中点开每台实例、查看其IP，效率低下且极易出错。本文将介绍如何通过Python脚本，批量查找绑定特定IP的实例，并可交互式地选择是否删除。该脚本支持自动遍历多个区域、并发执行
Amazon Lightsail 实战指南 flybirding10011
AmazonLightsail实战指南AmazonLightsail是亚马逊推出的简单易用的虚拟服务器服务，旨在让用户轻松快速地启动和管理虚拟私有服务器(VPS)。在本指南中，我们将介绍如何使用AmazonLightsail来创建、管理和配置您的虚拟服务器。步骤1:创建Lightsail实例登录AWS管理控制台，并导航到AmazonLightsail页面。点击“创建实例”按钮。在“选择实例位置”中
Amazon Lightsail 全解析：中小企业上云
在企业数字化转型的浪潮中，越来越多的中小企业、创业团队和个人开发者开始寻求更简单、成本更可控的云服务解决方案，AWS推出了专为轻量应用打造的一站式云服务平台——AmazonLightsail。它集计算、存储、网络、数据库、容器等能力于一体，以极低的学习成本和固定月费的定价模式，帮助用户快速启动并管理Web项目、API服务、数据库应用等。本文我将带您全面了解Lightsail的功能优势、应用场景以及
AWS成本监控告警系统完整解析 ivwdcwso 运维与云原生 aws python Cost 云成本运维开发
完整代码展示#!/usr/bin/python3importboto3,json,requestsimportpandasaspdfromdatetimeimportdatetime,timedelta#创建CostExplorer客户端client=boto3.client('ce')
TPAMI 2024 | 利用相机原始快照进行高效的视觉计算小白学视觉论文解读 IEEE TPAMI 数码相机 TPAMI 深度学习顶刊论文论文解读
题目：EfficientVisualComputingWithCameraRAWSnapshots利用相机原始快照进行高效的视觉计算作者：ZhihaoLi;MingLu;XuZhang;XinFeng;M.SalmanAsif;ZhanMa源码链接：https://njuvision.github.io/rho-vision摘要传统相机在传感器上捕获图像辐照度（RAW），并使用图像信号处理器（IS
Linux部署MinIO与Spring Boot整合实战指南 luoqinqin linux spring boot 运维
一、MinIO简介与核心概念MinIO是一款高性能的分布式对象存储服务，兼容AmazonS3API，适用于存储图片、文档等非结构化数据。核心术语：Bucket：存储对象的容器（类似文件夹）Object：存储的基本单元（文件+元数据）AccessKey/SecretKey：身份验证凭证二、Linux环境MinIO部署1.单节点安装#下载二进制文件wgethttps://dl.min.io/serve
跨境电商：别让系统问题毁掉你的 Prime Day （Amazon）爆款机会！无妄（跨境电商）经验分享 java
凌晨两点，一位亚马逊Prime会员刷着首页的限时Deal，被你精心打造的一款产品吸引。他点击、加入购物车、付款——动作一气呵成。订单提交成功，交易完成。但你的后台系统却未能及时接收到这条订单，或因接口异常、库存未同步而触发了超卖；又或者，物流状态迟迟未更新，导致履约延迟，仓储物流产能缺乏管控，导致大量货物堆积到单一渠道等等，最终影响店铺评分和用户体验。与此同时，你的广告预算早已烧完，却没有带来预期
AWS MES集成：PLM到车间秒级同步方案百态老人 aws postman 云计算
以下是针对"AWSMES集成框架：通过Lambda转换PLMBOM→DynamoDB→MQTT至车间"的完整技术方案，结合AWS服务特性和制造业需求设计：一、架构设计目标数据流闭环：实现PLM系统到车间设备的自动化数据管道实时性：BOM变更秒级同步至车间可靠性：MQTTQoS1保障消息必达无服务器化：降低运维成本，按需伸缩二、技术组件详解1.PLMBOM数据解析数据结构特征：多视图结构（EBOM/
AWS VPC Peering atom goper aws
在AWS不同账号之间使用VPCPeering（虚拟私有云对等连接）可以让两个VPC安全地互相通信，即使它们在不同的AWS账户中。这个过程分为发起者账号和接受者账号两部分。以下是详细的操作步骤：前提条件两个VPC不能有重叠的CIDR地址范围。双方都要有操作权限（比如IAM权限允许创建、接受Peering）。双方的Region要么相同，要么支持跨区域Peering。步骤详解1️⃣发起Peering（在
spring boot项目配置使用minion
一.Minio概述Minio是一款开源的高性能对象存储服务，兼容AmazonS3API，适用于私有云、混合云及边缘计算场景。它采用分布式架构设计，支持水平扩展，提供数据加密、版本控制、生命周期管理等企业级功能，适用于存储非结构化数据（如图片、视频、日志等）。核心特性S3兼容：完全兼容AmazonS3API，现有S3工具可直接对接。高性能：基于Golang编写，优化了并发和吞吐量，适合高负载场景。分
运维打铁: 数据库主从复制与读写分离配置懂搬砖运维打铁原力计划运维数据库 adb
文章目录思维导图一、数据库主从复制原理配置步骤1.主库配置2.从库配置3.验证配置二、数据库读写分离原理配置方法1.中间件实现2.应用层实现总结思维导图数据库主从复制与读写分离配置数据库主从复制数据库读写分离原理配置步骤主库配置从库配置验证配置原理配置方法中间件实现应用层实现一、数据库主从复制原理数据库主从复制是一种将主数据库的数据复制到一个或多个从数据库的技术。主数据库负责处理写操作，从数据库负
语言大模型综述
Paper:ASurveyofLargelanguageModels目录Paper:ASurveyofLargelanguageModels综述概要LLM关键技术规模定律（ScalingLaws）预训练与微调对齐调优（AlignmentTuning）外部工具集成GPT系列模型的技术演进模型检查点和APIPre-Training数据准备和处理数据准备数据预处理数据调度架构EmergentArchit
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
aws 数据库迁移_AWS Loft的数据库周 dnc8371 数据库大数据 mysql java python
aws数据库迁移这是我的笔记：https://databaseweekoctober2019sf.splashthat.comAWS上的数据库：合适工作的合适工具在许多此类谈话中，我并没有做过深刻的记录。我正在关注重点。PostgreSQL排在MySQL之后。AWS上8种类型的数据库：关系型核心价值文件在记忆中图形搜索时间序列分类帐搜索：AWSDatabaseServices对于关系，他们有Ama
Amazon S3的分段上传，大文件上传，上传进度条，列出分段上传，中止分段上传，重启续传功能实现你熬夜了吗？开发语言 java spring boot spring 前端 vue vue.js
我们在上传大文件的时候往往需要采用分片的方式，Amazon虽然提供了这种方式，但是不能实现我们后端在（宕机/重启）之后导致的文件丢失，大文件上传到一半可能会丢失数据的问题。本文将利用本地线程池加数据库记录的方式，实现后端（宕机/重启）后恢复之前正在上传的文件，顺便利用SSE（ServerSendEvent）实现（宕机/重启）后进度条的还原。首先引入maven，我用的是下面这个，目前最新版本1.12
springboot + neo4j 功能使用风行傲天 spring boot neo4j windows
注意：1、使用jpa处理数据时，如果对象中有relationship关系，数据中没有写关系，更新数据时会将原有的关系删除掉(出来方法可以先查询出原来的数据，然后在编辑)2、集成添加依赖org.springframework.bootspring-boot-starter-data-neo4jspring:#neo4j图数据库neo4j:uri:bolt://localhost:7687authen
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他