Memory_2020

presto/trino 入门介绍实战

引言

Presto是一款分布式SQL查询引擎，它能够在大规模数据集上实现快速、交互式的查询。本文将介绍Presto的基本概念并结合一些实际的代码示例，能够让的大家快速入门并在实际项目中应用。

官网：Launch Presto: Local download, JDBC, Docker or on AWS Cloud

1. Presto 简介

facebook开源的prestodb是一个分布式的sql引擎，支持多种数据源接入，采用统一的sql语句进行查询。内部实现也类似spark，将这个查询分为分析、优化、阶段划分、执行这些步骤。

Presto是由Facebook开发的分布式sql查询引擎，用来进行高速、实时的数据查询
Presto的产生是为了解决Hive的MapReduce模型太慢且不能通过BI等工具展现HDFS的问题
Presto是一个计算引擎，它不存储数据，通过丰富的connector获取第三方服务的数据，并支持扩展。可以通过连接Hive，来实现快速query hive table
可以跨数据源进行联合查询

2019年，prestodb分化为prestodb和prestosql，prestosql有原始团队维护，现改名为trino。分化近两年后，从生态上看，trino势头明显强过prestodb。例如，下面几点只有在trino中才有：

聚合下推支持

join下推支持

elasticsearch索引支持通配*

后面的研究都基于trino进行。

查询例子

# 联合查询hive的表和mysql的表
select * from hive.testdb.tableA a join mysql.testdb.tableB b
where a.id = b.id

show catalogs
show schemas

2. Presto 数据模型

Presto 是一款分布式 SQL 查询引擎，其数据模型基于表（Table）和架构（Schema）。Presto 不存储数据，而是通过连接各种数据源进行实时查询。以下是 Presto 的核心数据模型元素：

Schema（架构）：
- Schema 是 Presto 中的顶层命名空间，用于组织和隔离表。每个表都属于一个特定的 Schema。
- 在 Presto 中，Schema 可以看作是一个数据库，不同的是，Presto 的 Schema 通常指向不同的数据源。
Table（表）：
- Table 是 Presto 中的数据存储单元。每个表都属于一个特定的 Schema。
- Presto 支持从各种数据源（如 Hive、MySQL、PostgreSQL 等）中的表执行查询。
Column（列）：
- 表中的每一列代表了数据的一个属性。列定义了数据的类型，如整数、字符串、日期等。
- 查询时，可以引用表中的特定列以检索相应的数据。
Row（行）：
- 表中的每一行代表了一条记录。每行中的数据按列排列，形成一个记录的完整集合。
Connector（连接器）：
- 连接器是 Presto 中用于连接到不同数据源的插件。每个连接器负责实现 Presto 与特定数据源的交互。
- Presto 可以同时连接到多个数据源，能够跨越多种类型的数据存储执行查询。
Catalog（目录）：
- 目录是 Presto 中用于组织连接器的逻辑单元。每个连接器都注册到一个或多个目录中。
- 通过目录，Presto 可以了解到底有哪些数据源可以查询。
Session（会话）：
- 会话是 Presto 中的查询执行环境。每个查询都在一个独立的会话中执行，会话保持了查询的上下文信息。
- 在会话中可以设置各种配置选项，如查询超时时间、内存限制等。

Presto的数据模型相当灵活，用户可以通过 SQL 查询语言访问和操作各种数据源中的数据。通过连接器的引入，Presto 可以与不同类型的存储系统协同工作，提供统一的查询接口，使得数据分析变得更加方便和高效。

3. 聚合下推

聚合下推是我们最关心的特性。我们知道sql引擎本质上是在引擎侧对数据进行计算处理的，在大数据条件下，如果所有的数据都在引擎侧计算处理，性能比较差，稳定性也有问题，主要体现在：

大量数据的拉取，对源数据库造成的IO压力和网络开销

大量数据留存在引擎侧进行计算，引擎本身有OOM的风险

一般而已，sql引擎都支持一种要pushdown的优化策略。例如如果用户查询中包含对数据源数据的过滤语义，那么过滤操作可以下放给数据源进行，这个优化称为“过滤下推”。绝大多数sql引擎都支持过滤下推。此外还有projection下推（投影下推）。但是却极少有引擎支持聚合下推。

用户对数据的查询需求，其实往往是聚合分析场景。而一般的sql引擎只能将源数据拉取到引擎中进行聚合计算，区别可能仅仅是单机聚合或者分布式聚合。presto或spark，作为分布式sql引擎，利用MR思想，支持对大量数据进行分布式聚合。

然而，随着数据量的变大，即使是分布式聚合，依然要面临大量数据从数据源拉取的尴尬。我们知道绝大多数的数据库都是支持聚合操作的，而且许多列式数据库、时序数据库聚合查询的性能是极其强悍的。那么作为sql引擎是否能支持将聚合查询也下沉给数据库完成呢？

trino于2020/06发布的版本中声称在数据源接口层支持applyAggregation函数，这意味着数据库如果有能力完成聚合查询，可以实现该函数，提高查询性能，减少数据传输。Release 335 (14 Jun 2020) — Trino 436 Documentation

通过详细调研，trino目前仅有jdbc相关的数据源实现了applyAggregation。为了，验证和深入理解applyAggregation，尝试在elasticsearch数据源上实现聚合pushdown。

最终，实现了term aggregation和min/max/sum/avg/count(x)/count(*)，下面是测试的基本功能，可以看到对于40000条记录的index，下推聚合的性能明显高于普通聚合：

The following simple test is based on an index of more than 40000 records.
The difference in query efficiency between the two methods can be figured out.

trino:default> select hostname, avg("values") from elasticsearch.default.slmday60 group by hostname;
hostname | _col1
---------------+-------------------
192.168.21.58 | 4992.663530635401
192.168.21.59 | 4989.727731732876
(2 rows)
Query 20210225_091409_00005_rb8ni, FINISHED, 1 node
Splits: 17 total, 17 done (100.00%)
0.53 [2 rows, 0B] [3 rows/s, 0B/s]
trino:default> set session elasticsearch.aggregation_pushdown_enabled=false;
SET SESSION
trino:default> select hostname, avg("values") from elasticsearch.default.slmday60 group by hostname;
hostname | _col1
---------------+-------------------
192.168.21.58 | 4992.663530635401
192.168.21.59 | 4989.727731732876
(2 rows)
Query 20210225_091431_00007_rb8ni, FINISHED, 1 node
Splits: 50 total, 50 done (100.00%)
2.80 [42.1K rows, 1.68MB] [15.1K rows/s, 617KB/s]] ]>对比聚合下推和非聚合下推情况下的执行计划：
非聚合下推

 
  聚合下推  
   Fragment 0 [SINGLE]                                               
     Output layout: [hostname, _efgnrtd]                           
     Output partitioning: SINGLE []                                
     Stage Execution Strategy: UNGROUPED_EXECUTION                 
     Output[hostname, _col1]                                       
     │   Layout: [hostname:varchar, _efgnrtd:double]               
     │   Estimates: {rows: ? (?), cpu: ?, memory: 0B, network: ?}  
     │   _col1 := _efgnrtd                                         
     └─ RemoteSource[1]                                            
            Layout: [hostname:varchar, _efgnrtd:double]            
                                                                   
 Fragment 1 [SOURCE]                                               
     Output layout: [hostname, _efgnrtd]                           
     Output partitioning: SINGLE []                                
     Stage Execution Strategy: UNGROUPED_EXECUTION                 
     TableScan[elasticsearch:AGG:slmday60, grouped = false]        
         Layout: [hostname:varchar, _efgnrtd:double]               
         Estimates: {rows: ? (?), cpu: ?, memory: 0B, network: 0B} 
         hostname := hostname::varchar                             
         _efgnrtd := _efgnrtd_0::double           
  多个group by，多个聚合函数都没有问题，也可以支持没有groupby情况下的聚合，例如： 
  select count(*) 
from elasticsearch.default.slmday60 
where "@timestamp" > TIMESTAMP '2020-04-13' and "@timestamp" < TIMESTAMP '2020-04-13 00:01:00'

 
  count(x)：使用value_count(field)聚合 
  count(*): 使用value_count("_id")聚合 
  4. 安装与配置 
  下面是简单安装的步骤，具体安装方式可能有所不同，请参考Presto官方文档Deploying Presto — Presto 0.284 Documentation。 
  # 下载Presto压缩包
wget https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.267/presto-server-0.267.tar.gz

# 解压
tar -xvf presto-server-0.267.tar.gz

# 进入Presto目录
cd presto-server-0.267

# 配置Presto节点
cp etc/node.properties{.example,}

# 配置连接器（例如Hive）
cp etc/catalog/hive.properties{.example,}
 
  5. 启动 Presto 节点 
  # 启动Presto服务
bin/launcher start
 
  6. Presto 实战示例 
  6.1 连接到 Presto 
  使用Presto CLI连接到Presto服务器： 
  # 连接到Presto
presto --server localhost:8080 --catalog hive --schema default
 
  6.2 执行 SQL 查询 
  在Presto CLI中执行简单的SQL查询： 
  -- 查询Hive中的数据
SELECT * FROM test_db LIMIT 10;
 
  6.3 连接其他数据源 
  Presto支持多种数据源，如MySQL、PostgreSQL等。首先，需要在etc/catalog目录下配置相应的属性文件。以下是连接MySQL的示例： 
  # 复制MySQL配置文件
cp etc/catalog/mysql.properties{.example,}
 
  编辑mysql.properties，配置MySQL连接信息： 
  connector.name=mysql
connection-url=jdbc:mysql://192.168.101.32:3306/test
connection-user=root
connection-password=root123 
  然后，重新启动Presto节点： 
  bin/launcher restart
 
  之后，就可以写sql查询不同数据源之间的数据了 
  # 联合查询hive的表和mysql的表
select * from hive.testdb.tableA a join mysql.testdb.tableB b
where a.id = b.id

show catalogs
show schemas
 
  7. 结语 
  Presto的强大之处在于它能够无缝连接各种数据源，提供快速、交互式的数据分析能力。在实际项目中，结合Presto的灵活性，可以更方便地处理大规模数据集，加速数据分析和决策过程。希望这篇文章对大家了解和使用Presto有所帮助。


    
        你可能感兴趣的:(大数据,数据仓库,后端)
        
            
                
                    Mongodb数据库的基本语法及使用
                        璟*
Python
                        数据库MongoDB（芒果数据库）数据存储阶段文件管理阶段（.txt.doc.xls）优点：数据可以长期保存可以存储大量的数据使用简单缺点：数据一致性差数据查找修改不方便数据冗余度可能比较大数据库管理阶段优点：数据组织结构化降低了冗余度提高了增删改查的效率容易扩展方便程序调用，做自动化处理缺点：需要使用sql或者其他特定的语句，相对比较复杂几个概念数据：能够输入到计算机中并被识别处理的信息集合数据
                    
                    132java ssm springboot基于大数据的吉林省农村产权交易数据分析可视化平台系统（源码+文档+运行视频+讲解视频）
                        QQ2279239102
springboot大数据数据分析开发语言mavenvue.js
                        文章目录系列文章目录目的前言一、详细视频演示二、项目部分实现截图三、技术栈后端框架springboot前端框架vue持久层框架MyBaitsPlus系统测试四、代码参考源码获取目的摘要：本文介绍了基于JavaSSM和SpringBoot开发的吉林省农村产权交易数据分析可视化平台系统，为农村产权交易市场提供决策支持。系统前端利用HTML、CSS和JavaScript构建直观的可视化界面，后端运用Ja
                    
                    系统对接方案_浅谈RPA系统
                        weixin_39881760
系统对接方案
                        首先本文是有感而发，其次是我本身是大数据和人工智能领域产品多年从业者，并不局限于RPA领域，做过一些RPA项目也和客户沟通并且提供过顾问和咨询服务，所以有一定理解。从网上可见的大部分文章包括本问题下面的回答中，都可以看到，大部分是宏观回答，从狭义来说，RPA可以是一个软件工具、可以是一套系统也可以是一个平台；RPA可以让办公自动化、业务流程自动化。从广义来说，任何一个可被规则化且突发、未知情况少的
                    
                    CORS 跨域资源共享
                        disgare
计算机基础csrf服务器ajax
                        CORS跨域资源共享跨域同源策略为什么有跨域限制发生跨域时，允许进行的操作跨域限制的资源处理跨域常用的方法CORS请求简单请求复杂请求后端支持跨域代码支持CORS支持JSONP支持ng浏览器一般使用CORS（跨域资源共享）来处理跨域问题。同源导致了不同源数据不能互相访问，而在开发中我们很多时候需要用第一个页面的脚本访问第二个页面里的数据，所以制定了一些允许跨域的策略跨域同源策略在了解真正的网络攻击
                    
                    一文揭秘！Java 如何与 Elasticsearch 完美 “牵手”？
                        程序员顾茗
javaelasticsearch
                        引言本文适合有一定Java编程基础，且对搜索引擎技术感兴趣，尤其是希望在项目中运用Elasticsearch实现高效数据检索与分析功能的开发人员阅读。在当今大数据和高并发的时代，高效的数据检索与分析变得愈发关键。Elasticsearch作为一款强大的分布式搜索和分析引擎，受到了广泛青睐。而Java作为企业级开发的主流语言，如何与Elasticsearch无缝结合，发挥出最大效能呢？今天，就让我们
                    
                    从 ISO 到 GMT+8：Vue 前端时间格式的奇妙之旅！
                        小丁学Java
产品资质管理系统vue.js前端javascript
                        “从ISO到GMT+8：Vue前端时间格式的奇妙之旅！”作者：小丁|日期：2025-03-04嘿，各位前端探险家‍‍！今天我要带你们走进一个时间格式的“变形记”：从前端的ISO格式（"2025-03-04T07:28:17.058Z"）到后端期待的GMT+8"yyyy-MM-ddHH:mm:ss"（"2025-03-0415:28:17"），我如何在Vue项目中搞定这个“时间旅行”的小挑战？别急，
                    
                    Getter 和 Setter 的秘密：为什么 Location 不翼而飞？
                        小丁学Java
产品资质管理系统状态模式
                        标题：Getter和Setter的秘密：为什么Location不翼而飞？️‍♂️嘿，各位技术探险家！欢迎来到今天的博客，今天我们要聊一个既基础又充满戏剧性的问题：为什么我的location字段没有getter方法就没法返回给前端？这是一个发生在Java和JSON序列化世界中的小小“悬案”，让我们戴上侦探帽，一起揭开它的神秘面纱吧！故事的开端：Location的失踪案想象一下，你是一个勤奋的后端开发
                    
                    【AI深度学习基础】Pandas完全指南入门篇：数据处理的瑞士军刀 （含完整代码）
                        arbboter
人工智能人工智能深度学习pandas数据处理数据分析数据清洗数据分析效率提升
                        Pandas系列文章导航入门篇进阶篇终极篇一、引言在大数据与AI驱动的时代，数据预处理和分析是深度学习与机器学习的基石。Pandas作为Python生态中最强大的数据处理库，以其灵活的数据结构（如DataFrame和Series）和丰富的功能（数据清洗、转换、聚合等），成为数据科学家和工程师的核心工具。Pandas以Series（一维标签数组）和DataFrame（二维表格）为核心数据结构，提供高
                    
                    vue+element ui多表单统一验证
                        as-鲨鱼辣椒
jsjavascripthtmlvue.jselementui
                        场景每个产品对应多个应用,当对产品进行修改的时,可同时修改应用相关参数,从后端接受应用参数集合,每个应用生成动态表单,点击确认按钮,对所有表单进行统一认证,验证成功再将数据保存至数据库;HTML代码//特别注意ref这里的index,填在$refs['xx']--xx就是这个ref<el-form:ref="'app
                    
                    Vue+ElementUI+SpringMVC实现分页
                        史天航
java入门篇
                        Vue+ElementUI+SpringMVC实现分页这一段时间写项目用到了Vue+ElementUI，这里记录一下使用ElementUI内置分页插件结合后端SSM框架的实现思路和实现过程。其中遇到了很多坑，我会尽量把见到的坑都记录下来，希望对你有所帮助。首先让我们看一下最终效果：起步本博文的主要讲一下Vue+ElementUI结合后端SpringMVC实现分页的实现思路，基本的elementUI
                    
                    若依前后端不分离登录大致代码
                        m0_71908411
okhttp
                        前端：地址：ruoyi-ui/src/views/login.vue中的方法下面这个就是登陆方法，看我注解。this.$store.dispatch是调用vuex中actions中的方法，是vuex相关知识。handleLogin(){this.$refs.loginForm.validate(valid=>{if(valid){this.loading=true;//判断是否勾选记住密码的操作i
                    
                    对“预训练”的理解
                        衣衣困
深度学习神经网络自然语言处理
                        预训练有什么用传统的机器学习是偏数学的，对数据的量不做过多要求，而深度学习的项目通常是有大量的数据可供使用。在平常的任务或者项目中，我们可能并没有大量数据，只有少量数据，在这时我们就可以通过“借用”有大数据支持的模型的参数，作为基准，这样就能提高效率和准确率。因为他们神经网络的浅层是相似的，也就是说，在任务相似的情况下，可以用已有的模型即“预训练”好的模型参数实现小数据量的模型训练。预训练可以节省
                    
                    Java 大视界 -- Java 大数据机器学习模型的可解释性增强技术与应用（107）
                        青云交
大数据新视界Java大视界大数据java可解释性AISHAPLIME因果推理可视化交互
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java 大视界 -- Java 大数据在智慧环保污染源监测与预警中的应用（104）
                        青云交
大数据新视界Java大视界java大数据智慧环保污染源监测实时预警FlinkLSTM
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java 大视界 -- Java 大数据分布式文件系统的性能调优实战（101）
                        青云交
大数据新视界Java大视界java大数据Java大数据分布式文件系统性能调优HDFSImpala
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java 大视界 -- 深入剖析 Java 大数据实时 ETL 中的数据质量保障策略（97）
                        青云交
大数据新视界Java大视界Java大数据实时ETL数据质量保障数据清洗数据校验机器学习算法统计方法
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java 大视界 -- 绿色大数据：Java 技术在节能减排中的应用与实践（90）
                        青云交
大数据新视界Java大视界java大数据绿色大数据节能减排算法优化分布式计算资源管理
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java 大视界 -- 大数据伦理与法律：Java 技术在合规中的作用与挑战（87）
                        青云交
大数据新视界Java大视界java大数据大数据伦理大数据法律数据加密访问控制应对策略
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java 大视界 -- 区块链赋能 Java 大数据：数据可信与价值流转（84）
                        青云交
大数据新视界Java大视界java大数据数据可信价值流转智能合约共识机制区块链
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java 大视界 -- 基于 Java 的大数据流处理容错机制与恢复策略（113）
                        青云交
大数据新视界Java大视界java大数据流处理容错机制CheckpointExactly-Once故障恢复
                        亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
                    
                    Java后端面试到底要如何准备？
                        财高八斗者
Java程序员JavaJava编程java面试jvm
                        我把面试准备拆成以下几个步骤：1.写简历2.整理好自己最熟悉的项目，相对有代表性的项目。3.整理自己的技术栈4.收拾好自己的自我介绍5.被八股文6.模拟面试7.针对模拟面试表现出来的问题进行改进8.开始投投简历本人10年开发经验，做过coder、做过领导、也做过架构师，面试过500人+。现在全职做技术分享和面试辅导。针对自己多年的面试经验，以及被面试的经验，我自己整理了一份面试小抄：《面试小抄》《
                    
                    AI生成的web框架 包含前后端 k8s管理等
                        LCY133
人工智能前端kubernetes
                        好的，我现在需要根据用户提供的技术栈来设计一个Web平台的搭建方案。用户提到的技术包括前端、后端、算法，GitLab、Jenkins，阿里云ACK和ECS，MongoDB、Redis，Docker、K8s、Nginx。我需要综合考虑这些技术的整合，确保整个架构的高效、可靠和可扩展。首先，用户之前已经得到了一个架构方案，现在可能希望进一步细化或者调整。我需要回顾之前的方案，看看是否有遗漏或可以优化的
                    
                    后端有没有开“跨域通行证”，对前端有什么影响？—— 一看就懂的对比指南
                        劲雨波
前端前端javascript
                        一、快递员的规矩：跨域问题的核心想象浏览器是个严格的快递员，遵守一个规矩：“只送同小区快递，除非对方小区开了通行证！”这里的“通行证”就是后端的CORS配置。后端有没有开这个通行证，直接影响前端能不能顺利发送请求。二、两种场景对比：后端开没开通行证？场景1：后端没开通行证（没配置CORS）对前端的影响：开发时：快递员（浏览器）直接拒单！#控制台报错Accesstofetchat'http://ap
                    
                    大智能：大数据+大模型+大算力_大算力大数据大模型
                        AI学习不迷路
大数据大模型人工智能语言模型ai产品经理算力
                        在近日举行的“2022中国人工智能产业年会”主论坛上，中国人工智能学会监事长、中国工程院院士蒋昌俊在报告中表示，人工智能的发展已经历了数十年的过程，大模型ChatGPT在今年春节前后突然出现，大家还没有来得及深度思考就已经“扑面而来”。蒋昌俊大智能的研究进展科学技术的研究约分为两大范式，一是牛顿力学奠定了理论计算的范式，二是开普勒开启数据的范式。之后经历了实验归纳、理论的逻辑推演，以及计算模拟、最
                    
                    Vue.js中的MVVM
                        FwgForth
vue.jsflutter前端
                        MVVM（Model-View-ViewModel）是一种软件架构模式，它在Vue.js中得到了广泛应用。本文将详细介绍MVVM模式在Vue.js中的实现方式，并提供相应的源代码示例。Model（模型）：在Vue.js中，模型代表应用程序的数据和业务逻辑。模型可以是从后端API获取的数据，也可以是前端应用程序内部的状态。在Vue.js中，我们可以使用Vue实例的data属性来定义模型。varapp
                    
                    大模型时代，后端程序员如何避免被AI卷死？
                        
后端go程序员人工智能
                        我是王中阳，专注帮程序员升职加薪。最近后台收到很多留言：“AI都能写代码了，咱们后端是不是要失业了？”说实话，去年我也慌过。当看到AI能够快速生成代码，甚至某些简单的代码任务完成得比牛马程序员还要出色时，内心的焦虑感油然而生。但后来我通过深入研究和实践发现，这波AI浪潮里藏着巨大的升职加薪机会。今天说点大实话，教你怎么把AI变成涨薪工具。先泼盆冷水：这3类程序员真的危险了只会CRUD的API搬运工
                    
                    场景题：有40亿个QQ号如何去重？仅1GB内存
                        
后端java面试
                        场景题：有40亿个QQ号如何去重？仅1GB内存场景题也有一些套路可以考虑，比如去重、判断给定数据是否存在1.大数据去重1.1现在有40亿个QQ号如何去重？仅1GB内存参考链接：https://juejin.cn/post/7396332696660131849介绍2种方法：Bitmap和布隆过滤器方法一：Bitmap首先介绍下什么是位图Bitmap位图是使用bit数组表示的，它只存储0或者1，因此
                    
                    国产化替代 | 星环科技TDH替代IBM数仓，助力城商行构建湖仓一体平台
                        
ibm
                        城商行构建湖仓一体平台|TDH替代IBM数仓IBM的数仓NetezzaEOL是2023年，数仓Netezza生命周期结束了。数仓产品停止提供支持和更新，不再为该产品提供修复漏洞或功能改进的服务。某城市商业银行在此背景下，启动数据仓库系统升级项目，将数据仓库从IBMNetezza迁移到星环科技大数据基础平台TDH，不但成功实现了数据仓库的国产化替代，还建设了新一代的湖仓一体平台，为银行业务发展提供新
                    
                    【Elasticsearch】使用Data Streams
                        risc123456
Elasticsearchelasticsearch
                        在Elasticsearch中，数据流（DataStreams）是一种用于处理时间序列数据的高级功能，它提供了一种高效、可扩展的方式来管理和查询大量的时序数据。以下是结合网页内容对Elasticsearch中“使用数据流”的详细说明：---1.什么是数据流？数据流是一种逻辑结构，用于管理时间序列数据。它由多个后端索引（BackingIndices）组成，这些索引在内部自动管理，用户无需手动操作。数
                    
                    探秘React：构建现代界面的利器
                        ai_todo
从0到0.01入门Reactreact.js前端前端框架
                        文章目录React是一个用于构建用户界面的JavaScript库1.组件化开发2.JSX语法3.虚拟DOM4.单向数据流5.组件生命周期6.状态管理7.ReactRouter8.生态系统9.兼容性和跨平台vue3和react的异同点vue3和react的语法上的异同点附录：「简历必备」前后端实战项目（推荐：⭐️⭐️⭐️⭐️⭐️）「作者简介」：不知名十八线技术博主「推荐主页」：阿珊和她的猫「简历必备
                    
                                书其实只有三类
                                    西蜀石兰
类
                                    一个人一辈子其实只读三种书，知识类、技能类、修心类。 
 
知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？ 
知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
                                
                                《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他
                                    bylijinnan
tcp
                                    《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。 
 
这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： 
http://pcvr.nl/tcpip/ 
 
下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 
 
1.
                                
                                Linux—— 静态IP跟动态IP设置
                                    eksliang
linuxIP
                                    一.在终端输入 
vi /etc/sysconfig/network-scripts/ifcfg-eth0 
静态ip模板如下： 
DEVICE="eth0"      #网卡名称
BOOTPROTO="static" #静态IP（必须）
HWADDR="00:0C:29:B5:65:CA" #网卡mac地址
IPV6INIT=&q
                                
                                Informatica update strategy transformation
                                    18289753290

                                    更新策略组件：   标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表   forward  rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
                                
                                使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态
                                    酷的飞上天空
request
                                    现象就是： 
程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。 
刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。 
经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 
连接地址如下http://twistedmatrix.
                                
                                利用预测分析技术来进行辅助医疗
                                    蓝儿唯美
医疗
                                    2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊 所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着 什么。  
克利夫兰诊所负责企业信息管理和分析的医疗
                                
                                java 线程(一)：基础篇
                                    DavidIsOK
java多线程线程
                                                                                            &nbs
                                
                                Tomcat服务器框架之Servlet开发分析
                                    aijuans
servlet
                                    最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析： 
 
疑问： 为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？ 
 
分析之我见： doGet方法的
                                
                                揭秘玖富的粉丝营销之谜 与小米粉丝社区类似
                                    aoyouzi
揭秘玖富的粉丝营销之谜
                                    玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。 
  
　　近日，一直坚持微信粉丝营销
                                
                                Java web的会话跟踪技术
                                    百合不是茶
url会话Cookie会话Seession会话Java Web隐藏域会话
                                    会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点 
  
会话:多次请求与响应的过程 
  
  
1,url地址传递参数,实现页面跟踪技术 
         格式:传一个参数的 
url?名=值  
    传两个参数的 
url?名=值 &名=值 
  
关键代码
                                
                                web.xml之Servlet配置
                                    bijian1013
javaweb.xmlServlet配置
                                    定义： 
<servlet>
  <servlet-name>myservlet</servlet-name>
  <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class>
  <init-param>
   <param-name>
                                
                                利用svnsync实现SVN同步备份
                                    sunjing
SVN同步E000022svnsync镜像
                                    1. 在备份SVN服务器上建立版本库 
   svnadmin create test 
2. 创建pre-revprop-change文件 
    cd test/hooks/ 
    cp pre-revprop-change.tmpl pre-revprop-change 
3. 修改pre-revprop-
                                
                                【分布式数据一致性三】MongoDB读写一致性
                                    bit1129
mongodb
                                    本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括： 
 
 数据一致性概述与CAP 
 最终一致性(Eventually Consistency) 
 网络分裂(Network Partition)问题 
 多数据中心(Multi Data Center) 
 多个写者(Multi Writer)最终一致性 
 一致性图表(Consistency Chart) 
 数据
                                
                                Anychart图表组件-Flash图转IMG普通图的方法
                                    白糖_
Flash
                                    问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。 
  
那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
                                
                                Window 80端口被占用 WHY?
                                    bozch
端口占用window
                                    平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？ 
   下面坐下总结： 
        1、web服务器是最经常见的占用80端口的，例如：tomcat , apache  , IIS , Php等等； 
        2
                                
                                编程之美-数组的最大值和最小值-分治法（两种形式）
                                    bylijinnan
编程之美
                                    

import java.util.Arrays;

public class MinMaxInArray {

	/**
	 * 编程之美 数组的最大值和最小值 分治法
	 * 两种形式
	 */
	public static void main(String[] args) {
		int[] t={11,23,34,4,6,7,8,1,2,23};
		int[] 
                                
                                Perl正则表达式
                                    chenbowen00
正则表达式perl
                                    首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是： 
 
 
 
匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m） 
 
 
 
替换：s/<pattern>;/<replacement>;/ 
 
 
 
转化：tr/<pattern>;/<replacemnt>;
                                
                                [宇宙与天文]行星议会是否具有本行星大气层以外的权力呢?
                                    comsci

                                     
 
      举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ 
 
   &
                                
                                Oracle Profile 使用详解
                                    daizj
oracleprofile资源限制
                                    Oracle Profile 使用详解 转 
一、目的： 
Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。 
 
二、条件： 
创建profile必须要有CREATE PROFIL
                                
                                How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis
                                    dengkane
elasticsearchLucene
                                    This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. 
HipChat started in an unusual space, one you might not 
                                
                                循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序
                                    dcj3sjt126com
c算法
                                    # include <stdio.h>

int main(void)
{
	int n;
	int i;
	int f1, f2, f3;

	f1 = 1;
	f2 = 1;

	printf("请输入您需要求的想的序列：");
	scanf("%d", &n);

	for (i=3; i<n; i
                                
                                macbook的lamp环境
                                    dcj3sjt126com
lamp
                                      
sudo vim /etc/apache2/httpd.conf 
  
/Library/WebServer/Documents 
是默认的网站根目录 
  
重启Mac上的Apache服务 
    
这个命令很早以前就查过了，但是每次使用的时候还是要在网上查： 
停止服务：sudo /usr/sbin/apachectl stop 
开启服务：s
                                
                                java ArrayList源码 下
                                    shuizhaosi888
ArrayList源码
                                    版本 jdk-7u71-windows-x64 
  
JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890    
  
	/**
	 * 从这个列表中移除所有c中包含元素
	 */
	public boolean removeAll(Collection<?> c) {
                                
                                Spring Security（08）——intercept-url配置
                                    234390216
Spring Securityintercept-url访问权限访问协议请求方法
                                    intercept-url配置 
目录 
1.1     指定拦截的url 
1.2     指定访问权限 
1.3     指定访问协议 
1.4     指定请求方法 
   

1.1   &n
                                
                                Linux环境下的oracle安装
                                    jayung
oracle
                                    linux系统下的oracle安装 
本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
                                
                                hotspot虚拟机
                                    leichenlei
javaHotSpotjvm虚拟机文档
                                    JVM参数  
http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html 
  
JVM工具 
http://docs.oracle.com/javase/6/docs/technotes/tools/index.html 
  
JVM垃圾回收 
http://www.oracle.com
                                
                                读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活”
                                    noaighost
Webnode.js
                                    读《Node.js项目实践：构建可扩展的Web应用》 
——引编程慢慢变成系统化的“砌砖活” 
眼里的Node.JS 
初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
                                
                                快速开发Android应用
                                    rensanning
android
                                    Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 
Android Libraries 和 
Android UI/UX Libraries。 
 
编码越少，Bug越少，效率自然会高。 
 
但可能由于 根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
                                
                                理解Java中的弱引用
                                    tomcat_oracle
java工作面试
                                    　不久之前，我 
面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。   　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
                                
                                标签输出html标签" target="_blank">关于标签输出html标签
                                    xshdch
jsp
                                    http://back-888888.iteye.com/blog/1181202 
 
 
关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， 
&nb
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.