weixin_39761696

dataframe两个表合并_什么才是真正的DataFrame

今天要介绍的 paper 是 Towards Scalable Dataframe Systems，目前还是预印本。作者 Devin Petersohn 来自 Riselab，该实验室的前身是大名鼎鼎的 APMLab，诞生了 Apache Spark、Apache Mesos 等一系列著名开源项目。

本篇文章会大致分三部分：

什么是真正的 DataFrame？
为什么现在的所谓 DataFrame 系统，典型的如 Spark DataFrame，有可能正在杀死 DataFrame 的原本含义。
从 Mars DataFrame 的角度来看这个问题。

什么是真正的 DataFrame？起源最早的 "DataFrame" (开始被称作 "data frame")，来源于贝尔实验室开发的 S 语言。"data frame" 在 1990 年就发布了，书《S 语言统计模型》第3章里详述了它的概念，书里着重强调了 dataframe 的矩阵起源。书中描述 DataFrame 看上去很像矩阵，且支持类似矩阵的操作；同时又很像关系表。 R 语言，作为 S 语言的开源版本，于 2000 年发布了第一个稳定版本，并且实现了 dataframe。pandas 于 2009 年被开发，Python 中于是也有了 DataFrame 的概念。这些 DataFrame 都同宗同源，有着相同的语义和数据模型。

DataFrame数据模型 DataFrame 的需求来源于把数据看成矩阵和表。但是，矩阵中只包含一种数据类型，未免过于受限；同时，关系表要求数据必须要首先定义 schema。对于 DataFrame 来说，它的列类型可以在运行时推断，并不需要提前知晓，也不要求所有列都是一个类型。因此，DataFrame 可以理解成是关系系统、矩阵、甚至是电子表格程序(典型如 Excel)的合体。

跟关系系统相比，DataFrame 有几个特别有意思的属性，让 DataFrame 因此独一无二。

保证顺序，行列对称

首先，无论在行还是列方向上，DataFrame 都是有顺序的；且行和列都是一等公民，不会区分对待。拿 pandas 举例子，当创建了一个 DataFrame 后，无论行和列上数据都是有顺序的，因此，在行和列上都可以使用位置来选择数据。

1]:

因为行和列的对称关系，因此聚合函数在两个方向上都可以计算，只需指定 axis 即可。

In [

如果熟悉 numpy(数值计算库，包含多维数组和矩阵的定义)，可以看到这个特性非常熟悉，从而可以看出 DataFrame 的矩阵本质。

丰富的 API

DataFrame 的 API 非常丰富，横跨关系(如 filter、join)、线性代数(如 transpose、dot)以及类似电子表格(如 pivot)的操作。还是以 pandas 为例，一个 DataFrame 可以做转置操作，让行和列对调。

[10]: df2 = df.copy()

直观的语法，适合交互式分析

用户可以对 DataFrame 数据不断进行探索，查询结果可以被后续的结果复用，可以非常方便地用编程的方式组合非常复杂的操作，很适合交互式的分析。

列中允许异构数据

DataFrame 的类型系统允许一列中有异构数据的存在，比如，一个 int 列中允许有 string 类型数据存在，它可能是脏数据。这点看出 DataFrame 非常灵活。

[10]: df2 = df.copy()

数据模型

现在我们可以对什么是真正的 DataFrame 正式下定义：

DataFrame 由二维混合类型的数组、行标签、列标签、以及类型(types 或者 domains)组成。在每列上，这个类型是可选的，可以在运行时推断。从行上看，可以把 DataFrame 看做行标签到行的映射，且行之间保证顺序；从列上看，可以看做列类型到列标签到列的映射，同样，列间同样保证顺序。行标签和列标签的存在，让选择数据时非常方便。

13]: df.

这里的 index 和 columns 就分别是行和列标签。我们可以很容易选择一段时间(行上选择)和几列(列上选择)数据。当然这些建立在数据是按顺序存储的基础上。按顺序存储的特性让 DataFrame 非常适合用来做统计方面的工作。

17]: df3 = df.shift(

从例子看到，正因为数据是按顺序存放的，因此我们可以索引保持不变，整体下移一行，这样，昨天的数据就到了今天的行上，然后拿原数据减去位移后的数据时，因为 DataFrame 会自动按标签做对齐，因此，对于一个日期，相当于用当天的数据减去了前天的数据，这样就可以做类似于环比的操作。这简直太方便了。试想，对于关系系统来说，恐怕需要想办法找一列作为 join 的条件，然后再做减法等等。最后，对于空数据，我们还可以填充上一行(ffill)或者下一行的数据(bfill)。想在关系系统里想达到同样效果，想必是需要大费周章的。 DataFrame 的真正含义正在被杀死近几年，DataFrame 系统如同雨后春笋般出现，然而，这其中的绝大多数系统只包含了关系表的语义，并不包含我们之前说的矩阵方面的意义，且它们大多也并不保证数据顺序，因此真正 DataFrame 所拥有的统计和机器学习方面的特质也不复存在。这些 “DataFrame” 系统的出现，让 “DataFrame” 这个词本身几乎变得没有意义。数据科学家们为了处理大规模的数据，思维方式不得不作出改变，这其中必然存在风险。 Spark DataFrame 和 Koalas 不是真正的 DataFrame 这些 DataFrame 系统的代表是 Spark DataFrame， Spark 当然是伟大的，它解决了数据规模的问题；同时又首次把 ”DataFrame“ 的概念带到了大数据的领域。但其实它只是 spark.sql的另一种形式(当然 Spark DataFrame 确实在 spark.sql 下)。Spark DataFrame 只包含了关系表的语义，schema 需要确定，数据也并不保证顺序。

那么会有同学说 Koalas 呢？Koalas 提供了 pandas API，用 pandas 的语法就可以在 spark 上分析了。实际上，因为 Koalas 也是将 pandas 的操作转成 Spark DataFrame 来执行，因为 Spark DataFrame 内核本身的特性，注定 Koalas 只是看上去和 pandas 一致。为了说明这点，我们使用数据集(Hourly Ridership by Origin-Destination Pairs)，只取 2019 年的数据。对于 pandas，我们按天聚合，并按 30 天滑动窗口来计算平均值。

[22]: df = pd.read_csv(

如果是 Koalas，因为它的 API 看上去和 pandas 一致，因此，我们按照 Koalas 的文档做 import 替换。

1]:

然后令人惊讶的是，结果并不一致。大费周章后才查到，原因是顺序问题，聚合的结果后并不保证排序，因此要得到一样的结果需要在 rolling 前加 sort_index()，确保 groupby 后的结果是排序的。

In

默认的排序规则非常重要，这对以时间作为索引的数据尤其关键，而且这让数据科学家更容易观察数据，也更容易复现结果。所以，在使用 Koalas 时请小心，要时刻关注你的数据在你心中是不是排序的，因为 Koalas 很可能表现地和你想的不一致。让我们再看 shift，它能工作的一个前提就是数据是排序的，那么在 Koalas 中调用会发生什么呢？

In [6]: df.shift(1)
---------------------------------------------------------------------------

这个报错可能会让数据科学家们震惊，什么，我就做了个 shift 啊，报错里掺杂着 Java 异常栈和一大堆看不懂的错误。这里真正的错误和 Date 是时间戳有关，那么我们只取 int 类型的字段做 shift 总可以了吧。

In

确实可以运行，但却看到一句话，大意是数据会被放到一个分区来执行，这正是因为数据本身之间并不保证顺序，因此只能把数据收集到一起，排序，再调用 shift。这样就不再是一个分布式的程序了，甚至比 pandas 本身更慢。如 DataFrame.dot 等矩阵相关的操作在 Koalas 里也不包含，这些操作已经很难用关系代数来表达了。 PyODPS DataFrame 相信用过 MaxCompute(原名 ODPS，阿里云自研的大数据系统)，应该会听说过 PyODPS。这个库是我们前几年的产品，PyODPS 里也包含一个 DataFrame，而 PyODPS DataFrame 在执行的时候会被编译到 ODPS SQL 来执行。提 PyODPS DataFrame 的原因是，我们在几年前就发现，虽然它提供了 pandas-like 的接口，一定程度上让用户能用类似 pandas 的思维解决问题，然而，当用户问我们，如何向后填充数据？如何通过索引获取数据？答案都是不能。原因也是一样的，因为 PyODPS DataFrame 只是将计算代理给不保证有序、只有关系代数算子的引擎来执行。如果系统本身的数据模型不是真正的 DataFrame 模型，仅仅让接口看起来像是远远不够的。 Mars DataFrame 因此这里要说到 Mars DataFrame，其实我们做 Mars 的初衷和这篇 paper 的想法是一致的，因为现有的系统虽然能很好地解决规模问题，但那些传统数据科学包中好的部分却被人遗忘了，我们希望 Mars 能保留这些库中好的部分，又能解决规模问题，也能充分利用新硬件。 Mars DataFrame 会自动将 DataFrame 分割成很多小的 chunk，每个 chunk 也是一个 DataFrame，而无论是 chunk 间还是 chunk 内的数据，都保证顺序。

图里的示例中，一个行数 380、列数 370 的 DataFrame，被 Mars 分成 3x3 一共 9 个 chunk，根据计算在 CPU 还是 NVIDIA GPU 上进行，用 pandas DataFrame 或者 cuDF DataFrame 来存储数据和执行真正的计算。可以看到，Mars 既会在行上，也会在列上进行分割，这种在行上和列上的对等性，让 DataFrame 的矩阵本质能得以发挥。在单机真正执行时，根据初始数据的位置，Mars 会自动把数据分散到多核或者多卡执行；对于分布式，会将计算分散到多台机器执行。 Mars DataFrame 保留了行标签、列标签和类型的概念。因此能够想象如同 pandas 一样，可以在比较大的数据集上根据标签进行筛选。

1]: import mars.dataframe

Mars 会保持和 pandas 一致的排序特性，因此对于 groupby 等操作，无需担心结果和所想不一致。

6]:

对于 shift，不光结果正确，而且执行时能利用多核、多卡和分布式的能力。

In

不只是 DataFrame Mars 还包含 tensor 模块来支持并行和分布式化 numpy，以及 learn 模块来并行和分布式化 scikit-learn，因此可以想象，如 mars.tensor.linalg.svd 可以直接作用在 Mars DataFrame 上，这就赋予了 Mars 超越 DataFrame 本身的语义。

1]:

总结《Towards Scalable DataFrame Systems》赋予了 DataFrame 学术定义。而要做到可扩展的DataFrame，首先必须是真正的 DataFrame，其次才是可扩展。在我们看来，Mars 是真正的 DataFrame，它生来目标就是可扩展，而 Mars 又不仅仅是 DataFrame。在我们看来，Mars 在数据科学领域大有可为。 Mars 诞生于 MaxCompute 团队，MaxCompute 原名 ODPS，是一种快速、完全托管的EB级数据仓库解决方案。Mars 即将通过 MaxCompute 提供服务，购买了 MaxCompute 服务的用户届时可以开箱即用体验 Mars 服务。敬请期待。

Mars 开源项目地址：

https://github.com/mars-project/mars

Mars 中文文档：

https://docs.pymars.org/zh_CN/latest/

大sql如果不能加索引，还能怎么优化 —— hint学习 ckh_user 数据库 sql 数据库 oracle
大sql如果不能加索引，还能怎么优化当前问题：要执行简单查询sql【select字段1，字段2，……，字段40from表where条件groupby字段1，字段2，……，字段40】，但对应表里数据量大，且查询字段和groupby字段是由动态配置的，于是这里不方便加索引，普通查询耗时2个小时以上。解决方案：这里便用hint的并行解决，新的sql【select/*+parallel(8)*/字段1，字
深入理解Java中的泛型编程 egzosn java 开发语言
深入理解Java中的泛型编程大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！1.泛型的基础概念在Java中，泛型编程是一种强大的编程范式，它允许我们编写可以操作各种类型的代码，而不必在每次使用时重复编写代码。泛型提供了类型安全性和代码重用的机制。1.1定义泛型类和方法登录后复制packagecn.juwatech.generics;publicclassBox{pri
支持selenium的chromedriver更新到125.0.6422.60 代码的乐趣 selenium 测试工具
最近chrome释放新版本：125.0.6422.60如果运行selenium自动化测试出现以下问题是，是需要升级chromedriver才可以解决的。selenium.common.exceptions.SessionNotCreatedException:Message:sessionnotcreated:ThisversionofChromeDriveronlysupportsChromev
TensorBoard可视化工具支持哪些类型的图表？ alankuo 人工智能
TensorBoard支持多种类型的图表，以下是详细介绍：标量图（Scalars）定义与用途：用于展示单个数值随时间（通常是训练步骤或迭代次数）的变化情况。在深度学习模型训练中，最常见的是损失函数值和评估指标（如准确率、精确率、召回率等）的变化曲线。示例：例如，在训练一个图像分类模型时，记录训练集和测试集上的损失函数值。通过标量图，可以直观地看到随着训练轮次（epochs）的增加，损失函数值是如何
《企业网络安全架构与实战指南：从蓝队防御到零信任网络部署》 Yimuzhizi 网络安全 web安全安全网络安全人工智能架构网络搜索引擎
项目：《企业网络安全架构与实战指南：从蓝队防御到零信任网络部署》姓名：飞花似梦Flydream日期：2024年11月21日目录蓝队基础企业网络架构高层管理IT管理中央技术团队安全部门企业管理技术信息安全管理成熟度模型（ISM3）安全职能安全团队成员典型企业网络分区模糊的边界外部攻击面身份管理识别Windows典型应用识别Linux典型应用识别WEB服务识别客户端设备身份和访问管理目录服务企业数据存
Django ORM查询示例：获取主键为1的记录标题 Leon_Jinhai_Sun django 数据库 oracle
>>>Entry.objects.values_list('headline',flat=True).get(pk=1)'Firstentry'这段代码是使用Django框架的ORM（Object-RelationalMapping，对象关系映射）系统来查询数据库中的一条记录。下面是代码的详细解释：Entry.objects.values_list('headline',flat=True).ge
Python 的打包神器 — Nuitka LinkSLA 云计算 python 开发语言
一.pyinstaller和Nuitka使用感受1.1使用需求这次也是由于项目需要，要将python的代码转成exe的程序，在找了许久后，发现了2个都能对python项目打包的工具——pyintaller和nuitka。这2个工具同时都能满足项目的需要：隐藏源码。这里的pyinstaller是通过设置key来对源码进行加密的；而nuitka则是将python源码转成C++（这里得到的是二进制的py
solidity基础 -- 可视范围第十六年盛夏. Solidity 区块链搭建和维护智能合约区块链智能合约
在Solidity编程语言中，可视范围（Visibility）用于控制合约中变量和函数的访问权限。这对于确保合约的安全性、模块化以及代码的可维护性至关重要。Solidity提供了四种可视范围修饰符：public、private、external和internal。以下将结合给定代码进行详细介绍。注意：使用继承时请确保代码的正确性，以防丢失个人财产，在这里友情提示您，不要复制来源不明的solidit
Python中selenium的玩法，小朋友看了都说学会了 2401_87361571 python selenium 开发语言
2.selenium的作用和工作原理利用浏览器原生的API，封装成一套更加面向对象的SeleniumWebDriverAPI，直接操作浏览器页面里的元素，甚至操作浏览器本身（截屏，窗口大小，启动，关闭，安装插件，配置证书之类的）webdriver本质是一个web-server，对外提供webapi，其中封装了浏览器的各种功能不同的浏览器使用各自不同的webdriver3.selenium的安装以及
数据库用户管理比特知识工坊 MySQL专栏数据库 adb android
数据库用户管理1.创建用户MySQL在安装是，会默认创建一个名位root的用户，该用户拥有超级权限，可以控制整个MySQL服务器。在对MySQL的日常管理和操作中，通常创建一些具有适当权限的用户，尽可能的不用或少用root登录系统，以此来确保数据的安全访问。可以使用createuse语句创建用户，并设置相应密码：createuser用户[indentifiedby[password]'passwo
实验四 XML 无尽罚坐的人生 #Java Web xml
实验四XML目的：1、安装和使用XML的开发环境2、认识XML的不同类型3、掌握XML文档的基本语法4、了解DTD的作用5、掌握DTD的语法6、掌握Schema的语法实验过程：1、安装XML的编辑器，可以选择以下之一a)XMLSpyb)VScode，Vscode中安装XML插件2、给定一个XML文档test.xmltom24Python1861111111118622222222sammy25C+
第七章 C - D 开头的术语 yaoxin521123 IRIS相关术语 oracle 数据库
文章目录第七章C-D开头的术语当前设备(currentdevice)当前目录(currentdirectory)基于游标的SQL(cursor-basedSQL)游标(cursor)自定义存储(customstorage)以D开头的术语数据库(database)数据库缓存(databasecache)数据库加密(databaseencryption)数据库加密密钥(database-encrypt
实验九视图的使用无尽罚坐的人生数据库 oracle java
实验九视图的使用一、实验目的1．熟悉视图的操作。二、实验内容及要求用SQL语句完成下列功能。使用数据库为SCHOOL数据库。1．建立一视图View_CSTeacher，列出计算机系各个老师的资料(姓名、性别、职称)。createviewView_CSTeacher(姓名,性别,职称)asselectteac_id,teac_sex,techpostfromteachert,deparmentdwh
Java重要面试名词整理（二十三）：DDD架构正在绘制中 Java面试 java 面试架构
文章目录DDD如何应对软件核心复杂性？技术主动理解业务“刚刚好”解决问题。概念通用语言-定义上下文的含义领域和子域-确定逻辑边界领域子域限界上下文（BoundedContext）-定义领域边界的利器上下文映射图（ContextMapping）-集成三种集成方式上下文映射的种类DDD的战术设计实体和值对象实体（Entity）值对象（ValueObject）聚合和聚合根聚合聚合根领域事件（Domain
mybatis（78/134）一缕叶 mybatis mybatis
前天学了很多，关于java的反射机制，其实跳过了new对象，然后底层生成了字节码，创建了对应的编码。手搓了一遍源码，还是比较复杂的。对于多表联立，假设2表需要1表的主键（外键），但是原本是自增字段，那么就需要在标签中设useGeneratedKeys="true"keyProperty="id"，来返回对应需要的主键如：idinsertintot_carvalues(null,#{carNum},
为你「量身打造」的Python快速入门到实战和“图文双杀”（第1期）创文工作室 Python基础教程 python
Hello，大家好，欢迎来到创文工作室，这里是为你量身打造的Python快速入门到实战第1期。相信各位python学子一定愁于没有合适的教材而心急如焚吧，不用担心，这里是创文工作室为你良心打造的Python入门到实战,请大家先看目录目录0.写在前面0.1作者感言0.2Python介绍0.3Python安装1.注释1.1单行注释1.2多行注释2.输入与输出1.1输出1.1.1单行输出1.1.2多行输
SQLite 附加数据库 zhang.fang 数据库 sqlite oracle
假设这样一种情况，当在同一时间有多个数据库可用，您想使用其中的任何一个。SQLite的ATTACHDATABASE语句是用来选择一个特定的数据库，使用该命令后，所有的SQLite语句将在附加的数据库下执行。语法SQLite的ATTACHDATABASE语句的基本语法如下：ATTACHDATABASEfile_nameASdatabase_name;如果数据库尚未被创建，上面的命令将创建一个数据库，
Air监听代码神器 Cas狗 Go语言常用开发组件 Go语言 Gin框架 Air 实时监听开发效率
Air监听代码神器一、作用在使用Go语言的gin框架在本地做开发调试的时候，经常需要在变更代码之后频繁的按下Ctrl+C停止程序并重新编译再执行，这样就不是很方便。二、安装AirGogoget-ugithub.com/cosmtrek/airMaccurl-fLoairhttps://git.io/darwin_airLinuxcurl-fLoairhttps://git.io/linux_air
python期末复习——python知识要点敲代码痛苦吗？ Python 其他 python
1、Python语言的特点及书写规范。特点：Python语言是一种面向对象的解释型语言1、解释型，开源，简单，易学，免费2.可扩展性，丰富的库，可移植性，面向对象3.规范的代码，可读性较强书写规范：缩进；注释；每个import只导入一个模块，尽量避免一次导入多个模块；语句太长可以在行尾使用续行符’’’’，来表示下面紧接的一行仍然属于当前的语句，也可以使用括号来包含多行内容；使用必要的空格和空行增强
《攻克语言密码：教AI理解隐喻与象征》程序猿阿伟人工智能
在自然语言处理（NLP）领域，让计算机理解人类语言中的隐喻和象征，是迈向更高语言理解水平的关键一步。从“时间就是金钱”这样的概念隐喻，到文学作品里象征着坚韧的“寒梅”，这些非字面意义的表达方式承载着丰富的情感与文化内涵。然而，对于基于规则和数据驱动的NLP模型来说，理解隐喻和象征一直是块难啃的硬骨头。理解隐喻与象征：人类语言的独特魅力隐喻和象征作为常见的修辞手法，为语言表达增添了生动性与深度。隐喻
golang 性能分析(pprof) _萤火 Golang golang
采样方式net/http/pprof适用于程序长期运行的线上服务底层也是调用的runtime/pprof提供的函数，封装成接口对外提供网络访问如果是使用了HTTP包的路由，则只需要import_"net/http/pprof"即可此时会自动把相关路由路径注册到了默认的http.DefaultServeMux上packagepproffuncinit(){http.HandleFunc("/debu
力扣刷题——第一题一维数组的动态和姬公子521 力扣刷题专栏 leetcode 算法动态规划
力扣刷题第一题一维数组的动态和第一题一维数组的动态和给你一个数组nums。数组「动态和」的计算公式为：runningSum[i]=sum(nums[0]…nums[i])。请返回nums的动态和。示例1：输入：nums=[1,2,3,4]输出：[1,3,6,10]解释：动态和计算过程为[1,1+2,1+2+3,1+2+3+4]。来源：力扣（LeetCode）链接：https://leetcode.
python系列：如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？坦笑&&life #python python fastapi windows
如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？问题：回答：虽然`Pydantic模型`过去不允许使用`Query字段`，并且必须在单独的依赖类中实现查询`parameter-parsing`，如本答案和本答案所示，但这一点最近发生了变化，因此，可以使用`BaseModel类`将`Q
Go Gin 框架学习笔记「已注销」 Go Web restful golang json
GoGin框架学习笔记Gin描述轻量级httpweb框架，允许速度非常快最擅长的是Api接口的高并发入门创建默认的路由引擎r=gin.Default()启动http服务，默认在8080端口r.Run(":8000")返回字符串c.String(200,"我是新闻页面")c.String(200,"值：%v","你好gin")gin支持RestFulr.PUT()r.GET()r.POST()r.D
Formality：黑盒(black box) 日晨难再 Synopsys #Formality 数字IC 硬件工程
相关阅读Formalityhttps://blog.csdn.net/weixin_45791458/category_12841971.html?spm=1001.2014.3001.5482简介在使用Formality时，黑盒(blackbox)的概念很重要，指的是一个其功能未知的设计。黑盒通常用于设计中不可综合的组件，包括RAM、ROM、模拟电路和硬核IP等。它也是需要匹配的对象之一，必须确
Python使用FastApi开发接口冉成未来 python fastapi 开发语言
文章目录python开发web框架简介FastApi安装安装依赖包代码编写创建数据库连接模块database.py创建数据库实体模块model.py创建实体类模型模块schemas.py创建操作数据库模块curd.py创建接收请求模块main.py创建运行模块run.py项目运行编写完以上代码，通过以下命令进行项目启动查看项目接口pyinstalle打包FastApi项目项目通过uvicorn运行
python力扣刷题记录——349. 两个数组的交集钟灵毓秀M 数据结构与算法 leetcode python
题目：349.两个数组的交集给定两个数组，编写一个函数来计算它们的交集。方法一：执行用时:52ms内存消耗:15.1MBclassSolution:defintersection(self,nums1:List[int],nums2:List[int])->List[int]:returnlist(set(nums1)&set(nums2))方法二：执行用时:68ms内存消耗:14.9MBclas
6.3、OTN 保护费光同步数字传送网络信息与通信传送网
一、光线路保护图示：图中上方部分展示了光线路保护的结构。可以看到有工作通道和保护通道，两端都有OLP（光线路保护）模块。原理：业务信号在工作通道传输，同时有一个独立的保护通道作为备份。当工作通道出现光纤失效等故障时，OLP模块会自动将业务切换到保护通道，实现业务的不间断传输。特点：适用组网：适用于链型组网，这种组网方式结构相对简单，成本较低。保护范围：主要针对线路光纤失效进行保护，能够有效应对因光
Nginx---已安装了nginx，如何启用http2.0协议 nginx
需求生产环境的nginx当初没有编译启用ngx_http_v2_module模块，因此网站不能启用http2.0协议，需要重新启用一下。现在有两个目录，分别是nginx的源码目录和nginx的安装目录，如图所示：操作流程获取安装目录中的nginx都已经启用了哪些模块；在源码目录中重新编译nginx，编译时要添加已启用的模块和ngx_http_v2_module模块；将编译生成的nginx文件，拷贝
适合win7的python版本_Python 3.9 发布，不再支持 Win7！ weixin_39928818 适合win7的python版本
Python3.9正式发布Python3.9和之后的版本将不再支持Windows7，还没用上Windows10的可以考虑换系统了。而且这里默认下载的是64位，不再是32位。版本亮点新的语法特性>>>x={"key1":"value1fromx","key2":"value2fromx"}>>>y={"key2":"value2fromy","key3":"value3fromy"}>>>x|y{'
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默