云布道师

【2023 云栖】阿里云田奇铣：大模型驱动 DataWorks 数据开发治理平台智能化升级

云布道师

本文根据 2023 云栖大会演讲实录整理而成，演讲信息如下：

演讲人：田奇铣 | 阿里云 DataWorks 产品负责人

演讲主题：大模型驱动 DataWorks 数据开发治理平台智能化升级

随着大模型掀起 AI 技术革新浪潮，大数据也进入了与 AI 深度结合的创新时期。2023 年云栖大会上，阿里云 DataWorks 产品负责人田奇铣发布了 DataWorks Copilot、DataWorks AI 增强分析、DataWorks 湖仓融合数据管理等众多新产品能力，让 DataWorks 这款已经发展了 14 年的大数据开发治理平台产品，从一站式向智能化不断升级演进。

Data+AI 双轮驱动

进入 AIGC 时代，AI for Data 和 Data for AI 成为当下的热词。AI for Data，这个比较好理解，通过大模型驱动的 AI 智能助手，可以提升数据平台工具的效率。DataWorks 为企业搭建了一站式、全链路的工具链，在这个过程中，也源源不断地为企业构建数据资产，比如数据模型、元数据、数据血缘、数据指标等，在大模型时代，这些也可以称之为企业专属的领域知识，借助大模型强大的语义理解、推理、上下文学习、记忆能力，通过大模型的 Prompt Engineering，DataWorks 一站式平台可以为 AI 智能助手提供更接近的、更及时的、更全面的上下文信息，从而可以让AI 获得更好的效果和性能，这是 Data for AI。有了良好的数据基础，今天我们发布的众多新品就是借助 AI 大模型的能力，通过 Data + AI 双轮驱动，为数据开发和分析提供了新的范式，进一步提升企业获得数据价值的效率。

云栖发布： DataWorks Copilot 智能 SQL 编程助手提升 30% 数据开发分析效率

DataWorks Copilot 是基于 NL2SQL 大模型打造的 SQL 编程助手，我们使用基于公开的数据集训练和微调的 NL2SQL 大模型，结合 Prompt Engineering，提供了丰富的自然语言生成 SQL 的操作。

SQL 生成

输入想要查询分析的自然语言描述，例如“统计最近 7 天的商品销售排行”，DataWorks Copilot 将自动生成对应的 SQL 语句。

SQL 续写

在 SQL IDE 中编写 SQL 代码时，DataWorks Copilot 能够提供智能代码提示建议，提升 SQL 编程效率。

SQL 纠错

当 SQL 运行报错时，DataWorks Copilot 可提供一键纠错服务，帮助 ETL 工程师和分析师快速修复 SQL 错误。

SQL 注释

以前写代码注释是个负担，我们自己不想写注释，却又希望别人的代码有注释。DataWorks Copilot 可以批量为建表语句生成字段 Comment 信息，也可以为 SQL 语句添加逐行注释，提升 SQL 的可读性。

SQL 解释

对于部分业务人员或者分析师，经常拿到是数仓工程师给到一段比较复杂的取数脚本，使用到的一些高级 SQL 语法和函数不懂什么意思但又想改一改取数逻辑,以前就要到处查资料或者请教别人。DataWorks Copilot 可以直接对 SQL 代码进行解释，帮助我们的业务人员更快理解 SQL 逻辑、用途，提高取数分析和 SQL 学习的效率。
DataWorks Copilot 智能 SQL 编程助手，在我们内部已经使用了一段时间了，根据我们的一些观测，可以为 ETL 开发和数据分析提效 30% 以上。
从 GUI 到 LUI，DataWorks Copilot 辅助 ETL 数仓开发
40 多年前出现了图形用户界面（GUI），大模型强大的自然语言理解能力，带来了全新的自然语言用户界面（LUI），这也是一种全新的人机交互方式，一个软件产品，能否提供 LUI，这也是大模型应用从AI智能助手迈向 AI 原生应用的标志能力之一。DataWorks 也在思考和探索，如何将复杂的产品操作逻辑隐藏在背后，借助大模型，对用户提供简单直接、更符合人性的自然语言用户界面。
我们做了一些产品实践。举几个应用场景，在实际工作中，找表是件头疼的问题，业务人员为了计算一个指标要找数仓的同学问该用哪张表，数仓同学天天应付这类咨询，也很烦躁。DataWorks Copilot 则可以提供通过自然语言快捷找表，让找表这件事情不用东问西问，从而提升企业的数据消费效率。在 ETL 开发过程中，有些操作是比较复杂或者繁琐的，比如调度配置、参数配置、数据质量规则配置，过去往往需要到不同的产品页面来回跳转和手工配置，现在 DataWorks Copilot 提供了对话式的自然语言用户界面，在一个统一对话窗口中，通过自然语言交互就可以完成很多跨产品工具的操作，比如说一句“给某某表配置一个什么质量规则”就可以完成数据质量检测的规则配置。未来，我们将持续丰富自然语言交互界面的覆盖范围。

DataWorks Copilot 提供了两种模型服务，第一种是基于公开数据集训练和微调的NL2SQL 大模型，当前在阿里云 DataWorks 官网可以直接申请参与邀测。如果有的企业对我们的模型效果有更高的期待，或者希望 Copilot 能够回答更贴近企业内部业务，我们可以提供企业专属的模型微调服务，结合阿里云人工智能平台 PAI 以及大模型专家服务，可以为企业量身定制专属代码大模型以及私有化大模型部署服务。

云栖发布：DataWorks AI 增强数据分析

企业在数据生产建设上投入这么多资源，最终希望是洞察数据中的业务价值，指导企业的经营、决策。传统的统计分析方法常常先假设一种统计模型，然后根据数据样本来估计模型参数，从而了解数据的特征，但实际中往往有很多数据并不符合假设的统计模型。探索性数据分析强调让数据自身“说话”，先对数据特征、统计量进行探索，然后再选取合适的模型进一步分析，这是一种更加贴合实际情况的分析方法。在 AI 时代，数据洞察也不断向智能化演进，AI 增强分析利用 AI 技术，可以加速或者自动化数据探索与洞察，帮助分析师从手工数据探索中解放出来。AI 技术还能更好地发现数据中隐藏的规律和趋势，帮助分析师进一步突破自身固有认知的局限。
DataWorks 联合 DataV 数据可视化产品，深度结合 AI 技术，推出了 AI 增强分析产品。目前提供了四项核心能力：

自动数据探查

自动探查数据集，无需专业技术背景即可快速了解数据特征、统计分布。

AI 自动图表生成

基于自动数据探查的信息，自动生成数据图表卡片，结合 AI 技术，自动识别不同数据字段组合之间的相关性并生成图表，不需要你手动写很多 SQL 进行分析，可以帮助你快速获得灵感，保存见解。

AI 智能数据查询

结合大模型技术，通过自然语言生成 SQL 查询数据，并自动为查询结果自动推荐和生成数据图表卡片。

一键构建和分享数据报告

可以像制作 PPT 一样，将上面生成的数据图表卡片一键生成数据长图报告，支持导出为图片或者一键分享。
DataWorks AI 增强分析，让数据自己“说话”，将数据洞察过程尽可能的自动化、无代码化，通过 AI 还能自动发现数据中的潜在趋势，讲好数据故事，表达数据观点。这款产品目前在公测当中，大家开通 DataWorks 后进入数据分析产品即可申请公测体验。

云栖发布：DataWorks 湖仓融合数据管理

随着市场的不断变化，企业业务也不断的发展，企业面临的竞争和不确定性也越来越大，数据需求从简单的查询、统计到 BI 到数据科学到推荐预测到 AI 应用，整体上从简单的固定查询统计到复杂多变灵活的智能化分析，相应企业数据架构也发生了变化，从数据库到数据仓库到数据湖，再到湖仓融合，整个演进过程是在追求更高的数据效率和更好更快的满足企业的各种灵活多变的数据需求。湖仓融合数据架构既兼顾数据仓库的规范性和企业级能力，又兼顾数据湖的灵活性和生态开放性，成为越来越多企业所关注的数据架构。
DataWorks 当前全面支持湖仓融合的数据管理，在存储层，离线数据仓库MaxCompute 和实时数据仓库 Hologres 以及数据湖存储 OSS/OSS-HDFS，它们之间已经在存储层做了无缝的打通，不需要复制移动数据就可以进行数据的联邦查询。在这之上，DataWorks 提供了统一的湖仓融合数据管理用户界面。

实时数据秒级入湖

在数据集成上，DataWorks 本身支持 50 多种异构数据源的离线、实时同步入仓。今年新增实时数据入湖的能力，实现数据秒级实时入湖，并且支持在数据同步过程中自动进行库表字段的更新，同时在这个过程中也能够进行元数据的自动发现和注册，借助 DLF 可以在 DataWorks 数据地图里进行湖仓统一的元数据管理。

湖仓融合 ETL 开发调度

面向湖仓融合架构中多种计算引擎，如 MaxCompute、Hologres、Spark、Hive、Presto 等，提供了统一的 ETL 任务开发、任务编排调度和运维服务，实现统一的数据开发流水线，解决企业因数据架构不统一造成的数据生产链路割裂、不稳定等难以管理的问题。

湖仓融合数据治理

DataWorks 新增支持了湖仓融合数据治理。不仅能支持湖仓统一的元数据管理、数据建模和数据质量管理，而且 DataWorks 的主动式、自动化数据治理工具“DataWorks 数据治理中心”也全面支持了 EMR+OSS 数据湖。
DataWorks 数据治理中心，将成熟的数仓治理能力全面扩展到了 EMR+OSS 数据湖。为了简化湖仓架构下的数据治理难度，让数据治理不再是运动式的，而是能够真正可持续、可跟进、可落地，DataWorks 数据治理中心，新增了“数据治理计划”功能，来协助用户完成主动式的数据治理规划和诊断。
数据治理计划内置了面向数据管理者的计算存储的成本治理、任务的稳定性治理等数据治理场景的模板，支持企业设置一个数据治理目标，提供多个维度的数据治理健康度的评估模型，帮助大家去评估数据治理的成效。
数据治理计划面向数据治理的执行者，提供 60 余项覆盖 5 个维度的治理规则库，结合设置的数据治理目标方向，数据治理产品可以自动推荐圈选和目标相关的数据治理问题，并且提供相应的治理手段和方法，帮助数据治理的执行者可以及时的发现问题解决问题。同时数据治理中心提供事前的问题拦截，在数据开发阶段可以事前发现很多的问题，比如代码规范问题，表明任务名命名规范问题，可以进行提前的拦截，这些事前拦截的插件和事后问题发现的插件都是允许支持企业自己定义。
数据治理应用：成本优化-无效任务自动化下线
随着企业业务的不断变化，企业人员变动，不可避免地会出现越来越多的无效数据任务，每天都在消耗着大量的计算成本和存储成本。传统的手动治理，需要依赖数据工程师人工分析判断，进行复杂的影响分析，还存在与相关被影响人员的沟通协同成本，极容易因不小心失误影响了线上任务造成故障，从而导致数据工程师因害怕出问题而对无效任务不敢治理，不愿治理。
DataWorks 数据治理中心，提供了一项称之为“优雅下线”的产品功能，可对无效任务进行批量的流程化、自动化的下线治理。首先会自动进行任务下线的影响分析，然后将任务下线分解为延迟调度、暂停调度、下线任务、备份产出表、删除产出表五个步骤，每个步骤还提供一个静默期并自动通知相关责任人或者受影响人。整个过程类似于一种“灰度下线”机制，一旦出问题可以快速恢复，并将影响范围降到最低。
在阿里内部数据团队，原先治理下线一组涉及到 30 个责任人的 1000 个任务，从拉群拉会沟通，分析下线影响，制定下线计划，各自分别执行下线操作到结果跟进，要花费 3-5 个月时间。有了 DataWork s数据治理中心的优雅下线功能，2 天完成治理动作，1 周完成影响观察，15 天即可正式结项。DataWorks 数据治理中心的优雅下线已经帮助阿里内部数仓团队成功下线了数万个无效任务，节省在大量的存储计算成本。
DataWorks 数据治理中心已经在 DataWorks 企业版提供服务，近期也会推出企业版的试用活动，大家可以关注产品的官网信息。

从 2009 年诞生在阿里巴巴集团内部开始，DataWorks 一直是一站式平台的倡导者与坚定执行者，包含从数据集成、数据开发的工具链、数据治理的工具链，以及到数据消费侧的分析及服务的产品，我们通过一站式平台不断为企业构建、沉淀企业的数据资产。在 AI 时代，DataWorks 将 14 年积累的产品能力不断与大模型进行融合创新，为企业一站式智能化的数据平台产品，提升企业数据流转效率，加速企业数据价值获取。

阿里云服务器4核8G配置购买及价格类文章汇总（10篇）阿里云最新优惠和活动汇总
阿里云服务器4核8G配置如何购买？价格是多少？4核8G配置的阿里云服务器可以通过云服务器产品页购买也可以通过阿里云活动去下单购买，一般通过活动购买的用户比较多，但是不同实例规格的阿里云服务器价格不一样，带宽不同价格也不一样，本文为大家汇总了10篇关于阿里云服务器4核8G配置购买教程文章和价格类文章，分为购买类文章和价格类文章，以供大家参考如何购买阿里云服务器4核8G配置和最新优惠价格是多少。阿里云
阿里云国际 CDN 和低延迟全球云解决方案九河云阿里云网络服务器安全
延迟与隐藏程度成反比。C数据存在，并且连接已建立，但在接收客户端请求响应和显示用户请求的内容时存在明显延迟。将数据从源移动到目标时，会出现即时丢失。延迟是数据发送器和数据接收器之间的时间差。此外，当通过云响应用户查询时，这种延迟会被放大。有多种因素会导致满足用户请求的潜在延迟。想象一下，您在美国数据中心部署了服务，并且您的用户遍布全球。在此拓扑中，来自美国的用户将能够以正常（如果不是很好）的性能使
AIGC图生视频技术下的巴黎奥运高光时刻阿里云视频云 AIGC与媒体生产 AIGC
共享，奥运夺金时刻。巴黎奥运会的高光片段中国奥运的夺金时刻动漫风格下的别样风态以下AI动漫视频内容BY「阿里云视频云」智能生成从首金到21金镜头倒转尽情回顾······更多巴黎奥运高光时刻更多AIGC精彩内容可在「新华社官方」新媒体账号观看阿里云视频云用视频云+AI，持续助力奥运
阿里云服务器4核8G配置可选实例规格及最新优惠价格表（2023最新）阿里云最新优惠和活动汇总
阿里云4核8G服务器有十几种实例规格可选，其中计算型c7、通用算力型u1和计算优化型c7（国外地域）三种实例规格有优惠，其中计算型c7实例4核8G配置1M带宽优惠价格为3127.61元1年、5M带宽优惠价格为3862.01元1年；通用算力型u1实例4核8G配置1M带宽1367.86元1年、5M带宽优惠价格为1735.06元1年；计算优化型c7（国外地域）实例4核8G配置1M带宽5907.19元1年
Python国内常用镜像源和使用方法 wfqlt163 Python 基础操作 python 开发语言
常用的镜像源：1、企业镜像：豆瓣https://pypi.doubanio.com/simple/网易https://mirrors.163.com/pypi/simple/阿里云https://mirrors.aliyun.com/pypi/simple/腾讯云https://mirrors.cloud.tencent.com/pypi/simple2、高校镜像：清华大学（推荐）：https:/
为用户都喜欢购买阿里云服务器？阿里云服务器有何优势？阿里云最新优惠和活动汇总
随着企业数字化转型的加速和云计算技术的日益成熟，云服务器已成为企业搭建应用、存储和处理数据的重要基础设施。在众多云服务提供商中，阿里云以其卓越的性能、丰富的产品线、出色的技术支持和强大的生态系统，赢得了众多用户的青睐。那么，阿里云服务器到底有哪些优势？为何如此多的用户选择使用阿里云服务器呢？阿里云服务器优势图.jpg阿里云服务器的优势一、技术领先，性能卓越阿里云作为国内最早涉足云计算领域的企业之一
ios私钥证书(p12)导入失败，Windows OpenSSl 1.1.1 下载书边事. 其他
ios私钥证书(p12)导入失败如果你用的OpenSSL版本是v3那么恭喜你V3必然报这个错，解决办法将OpenSSL3降低成v1。WindowsOpenSSl1.1.1下载阿里云网盘下载地址：OpenSSLV1
阿里云服务器ECS试用攻略，阿里云个人与企业试用云服务器介绍阿里云最新优惠和活动汇总
一直以来，阿里云都在尽全力帮助您更好地使用云服务器，现在，阿里云为我们提供1个月试用服务，您可在一个月内免费使用云服务器，帮助实现您的业务需求。个人和企业用户均可以申请试用，个人用户可以申请基础版试用，企业用户可以申请企业版试用，下面是阿里云服务器ECS试用攻略，分为个人版和企业版。个人版试用攻略（基础版试用）适合用户：学生、个人、初创企业试用规格：新手上云1-4核产品任您选试用台数：支持1台、多
【VSCode扩展】通义灵码运行提示“此应用无法在你的电脑上运行” coderYYY VSCode bug解决方案前端 vue.js 编辑器 visual studio vscode
作者：coderYYY个人简介：前端程序媛，目前主攻web前端，后端辅助，其他技术知识也会偶尔分享欢迎和我一起交流！（评论和私信一般会回！！）个人专栏推荐：《前端项目教程以及代码》自从半月前，通义灵码一运行就会报这个错尝试了以下方法，都无法解决：阿里云官方方法：删除c盘的.lingma卸载重新安装通义灵码以管理员身份运行VSCode防火墙设置准入安装之前的版本最后是在扩展设置里面解决的路径不填也可
Docker 安装配置和基本命令详解以及案例示范 J老熊 docker 容器运维面试 linux
1.引言容器化技术的快速发展给软件开发和运维带来了革命性的变化，Docker作为这一领域的领军者，已经成为软件开发和部署流程中的重要工具。Docker的轻量化、快速启动和高效资源利用让开发者能够在不同的环境中实现一致的开发体验。本篇文章将详细讲解如何在CentOS系统中安装Docker，如何配置阿里云镜像加速，Docker的基本命令和语法，以及通过实际的电商交易系统案例来演示如何在Docker环境
阿里云新用户账号看不到2核2G49.68元1年的云服务器是怎么回事？阿里云最新优惠和活动汇总
阿里云2022年的双11大促活动“金秋云创季”活动正在火热进行中，但是有部分用户明明看到活动中有说明，此次双11活动有2核2G49.68元1年、2核4G100元1年的云服务器，但是自己的账号虽然还未购买过阿里云产品，应该算是新账号，但是看到的价格却要远远高于这个价格，那么阿里云新用户账号看不到2核2G49.68元1年的云服务器是怎么回事呢？下面小编为大家做个分析，你就知道原因了。为什么我们账号看不
【Trace】QQ+微信聊天记录分析工具 civilpy pandas
Trace-痕迹阿里云：https://www.alipan.com/s/x6fqXe1jVg1百度云:https://pan.baidu.com/s/1FmchOjK2wAMwE5aQds7pIw?pwd=td7s该工具使用前，先配置随机码（当前）：85EC【范例1】QQ个人聊天记录分析第1步：导出个人聊天记录或QQ群聊天记录，格式txt第2步：打开软件Trace-痕迹.exe，会自动弹出两个窗
[INSTALL] MSYS2 -- Windows下的类Linux环境 ERIC-ZI 工具类 Windows windows linux 运维
一、安装1.从https://www.msys2.org/下载安装msys2也可以从镜像:http://mirrors.aliyun.com/msys2/distrib/x86_64/下载最新的安装包msys2-x86_64-20230718.exe2.更新下载源为阿里云sed-i"s#https\?://mirror.msys2.org/#http://mirrors.aliyun.com/ms
阿里云服务器百亿补贴活动，部分云服务器价格比双11活动还便宜阿里云最新优惠和活动汇总
目前正值阿里云2022年双11大促活动金秋云创季活动期间，云服务器价格在活动主会场和云服务器分会场都能看到，下面小编要介绍的几款云服务器是在主会场和云服务器分会场没有的，只在百亿补贴活动中有，而且部分云服务器价格比双11活动价格还便宜哦，一起来看看吧！关于阿里云2022年双11大促活动的云服务器价格表，小编在“阿里云2022年双11大促活动云服务器配置及活动报价表汇总”一文中已经汇总了，大家可自行
Java 基于 SpringBoot+vue 的大学生科创项目在线管理系统（附源码）程序员徐师兄 java spring boot vue.js 大学生科创项目管理系统大学生科创项目
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》Python项目实战《100套》
EG边缘计算网关连接中移ONENET物联网平台（MQTT协议）成都纵横智控科技官方账号边缘计算网关物联网工业网关边缘计算物联网 MQTT 中移ONENET
上文：EG边缘计算网关连接阿里云物联网平台（MQTT协议）需求概述本章节主要实现一个流程：EG8200mini采集ModbusRTU数据，通过MQTT协议连接中移ONENET物联网平台ModbusRTU采集此处不做过多赘述，可参考其他案例（串口读取Modbus传感器数据）介绍。下文默认已经采集到ModbusRTU数据。要采集的Modbus点位表：地址(Doc)数据类型属性名称00001Boolea
Windows .NET8 实现远程一键部署，几秒完成发布，提高效率 - CICD 安得权 CICD windows .net
1.前言场景（工作环境一键部署到远端服务器[阿里云]）CICD基本步骤回顾https://blog.csdn.net/CsethCRM/article/details/1416046382.环境准备服务器端IP：106.15.74.25（阿里云服务器）客户端：工作电脑/开发电脑2.1安装7z服务器和客户端（工作电脑）均需安装安装目录：C:\ProgramFiles\7-Zip\7z.exe2.2安
阿里云服务器2核4G配置多少钱？不同地域收费标准与最新活动价格分享阿里云最新优惠和活动汇总
阿里云服务器2核4G配置多少钱？2核4G配置的阿里云服务器选择不同实例规格和地域，其收费标准和活动价格都是不一样的，本文为大家展示阿里云服务器2核4G配置可选的实例规格有哪些？不同地域之间的收费价格是多少？目前最新的活动价格是多少？以供大家了解参考。一、阿里云服务器2核4G配置可选实例规格2核4G配置的阿里云服务器目前可选实例规格有共享标准型s6、计算型c8y、计算型c7、AMD计算型c7a、高主
月入十万第三十七天赵小虎虎
嘿嘿，今天注册了好多交易所，接下来学会搬砖，这样每天就可以不用早出晚归的去上班啦，理想很丰满，现实也不算太骨感，就看自己的行动能力了。网格交易可能是投入本金较小，网格密度不够，每天盈利1块不到[手动捂脸]，一个月下来连我买阿里云服务器的零头钱都不够[在捂一次脸]。好在对网格交易的理论摸清楚了，轻量化服务器也懂得是个啥东东了。哈哈，学习点东西总要交点学费及智商税。今天下午大盘往下走，one也不知中了
KVM虚拟化平台大西瓜不爱告诉你姓名虚拟化 KVM虚拟化
前言1、云计算的定义云计算的定义用户可以在任何时间、地点通过网络获取所需要的计算资源、网络资源、存储资源并且按量计费、弹性伸缩云计算就是一个大的租赁渠首云计算这个大的资源池中的各种资源(以租赁的形式)云计算所汇聚的这部分资源(通过云平台的方式汇聚这些资源)而云平台比如:阿里云、华为云这些云平台使用到的底层平台技术为OpenStack而OpenStack利用了什么技术将资源可以划分给不同的用户使用呢
阿里云限量云产品通用代金券，购买什么都可以用（省钱必用）阿里云最新优惠和活动汇总
阿里云有通用代金券吗？当然是有的，很多朋友买服务器时候都喜欢稳定且安全的阿里云服务器，在购买之前都喜欢了解一下阿里云有没有免费的代金券，阿里云是有云产品通用代金券，下面小编给大家演示一下如何领取和使用阿里云产品通用代金券。一、云产品通用在哪里领取？如何领取？阿里云限量云产品通用代金券领取：点击进入阿里云官方云小站链接，进入页面后点击代金券下面的立即领取即可。云小站代金券图.png领取之后，在我们购
【已解决】Python报错：ModuleNotFoundError: No module named ‘requests‘ 程序员洲洲 python 开发语言 requests
本文摘要：已解决ERROR:Couldnotfindaversionthatsatisfiestherequirement，并总结提出了几种可用解决方案。同时结合人工智能GPT排除可能得隐患及错误。作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。公粽号：洲与AI。作者优秀专栏：洲洲每周都会举办一些送书活动，欢迎大家关
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
阿里云2024年有什么优惠活动？阿里云30个热门优惠活动汇总阿里云最新优惠和活动汇总
对于想要购买阿里云各种云产品的用户来说，不管是新用户还是老用户，最为关心的是阿里云当下有哪些优惠活动，本文汇集了2024年阿里云官方目前正在进行中的所有优惠活动，其中优惠券和代金券活动4个，官方精选活动10个，其他热门活动16个，以供参考。2024阿里云活动中心图.png一、优惠券和代金券活动4个阿里云官方会不定期为用户发放优惠券和优惠券等福利，在购买过程中使用优惠券或优惠券可享受满减优惠，202
购买阿里云活动云服务器后如何升级带宽和数据盘？升级需要多少钱？有没有优惠？阿里云最新优惠和活动汇总
在购买阿里云活动云服务器后，很多用户后期随着业务和流量的增加，会面临带宽和数据盘不足的问题，需要升级带宽和数据盘以满足使用需求。而有的用户在购买之前就知道后期自己可能会需要升级云服务器的带宽或者数据库，系统提前知道阿里云服务器升级带宽和数据库的收费标准以及升级流程和升级时有没有相关优惠。因此，本文将为大家介绍阿里云服务器带宽和数据盘的收费标准，以及如何升级带宽和数据盘和阿里云针对云服务器升级带宽和
注册阿里云新用户有什么优惠？2023年阿里云新用户最新优惠政策阿里云最新优惠和活动汇总
不管是阿里云还是腾讯云或者华为云，这些云服务商都是非常喜欢新用户的，云服务商之间为了争取新用户，都会推出各种各样优惠政策，作为国内知名度最高的云服务商，阿里云自然会为新用户提供很多优惠政策。本文整理汇总了2023年阿里云新用户最新优惠政策，了解这些优惠政策可帮助我们在选购阿里云产品时少走很多弯路，最大化的享受优惠政策带来的福利。阿里云针对新用户的优惠，从注册账号、试用云产品、正式购买云产品等各个环
Nacos微服务注册地址为内网IP的解决办法 Morgan7
问题描述当Docker中的服务A,向Nacos注册时候,Nacos获取到的是Docker的内部IP,导致另外一个服务B,想通过注册中心调用服务A,由于服务B从nacos注册中心获取到的是服务A内部IP,这样导致两个公网微服务无法互相访问或者部署在阿里云上，微服务获取的是内网ip，注册到Nacos的也是内网ip解决方法spring.cloud.nacos.discovery.ip=本机公网IPspr
阿里云产品2023年特卖，数十款云产品1元起阿里云最新优惠和活动汇总
阿里云推出2023年云产品特卖活动，此活动汇聚阿里云热门云产品，1元起体验阿里云安全、稳定、领先的云服务！账号完成实名认证还送满减优惠券，助您低成本轻松上云！下面是活动详细内容。活动中心图.png活动直达：1、点此进入阿里云2023年云上特卖活动2、点此进入阿里云官网领券平台一、云服务器产品特卖面向个人/企业新用户的新购优惠（以下优惠只可享受1台1次，不可叠加享受）：1.购买轻量应用服务器指定配置
frp最简实用配置 Vistyxio tcp/ip 阿里云腾讯云华为云 ssh ubuntu linux
1下载frp在此处下载frp，注意选择正确的系统版本。我用的阿里云的Ubuntu系统的服务器，下载linux_amd64.tar.gz这个版本。在服务器上使用如下指令下载并解压（注意链接对应版本）。cd~wgethttps://github.com/fatedier/frp/releases/download/v0.54.0/frp_0.54.0_linux_amd64.tar.gztar-zxv
避坑指南：ECS 与 RDS 选购的那些“坑”，你踩了几个？吃面不喝汤66 后端开发服务器运维
在阿里云上部署项目时，ECS和RDS是我们常用的云计算资源。然而，许多人在选购和配置这两者时容易踩坑，比如在VPC、可用区等关键配置上的选择。这篇文章将结合我踩过的坑，分享选购ECS和RDS的最佳实践，帮助大家避免那些隐藏的“地雷”。️场景回顾：当我以为很简单的时候...在项目初期，我根据需求购买了一台ECS实例和一个RDS数据库实例，想着这样能快速搭建出项目环境。结果购买完后才发现，ECS和RD
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，