wangwei4078

Hadoop之AVRO

Avro是个支持多语言的数据序列化框架，支持c，c++，c＃，python，java，php，ruby，java。他的诞生主要是为了弥补Writable只支持java语言的缺陷。

1 AVRO简介

很多人会问类似的框架还有Thrift和Protocol，那为什么不使用这些框架，而要重新建一个框架呢，或者说Avro有哪些不同。首先，Avro和其他框架一样，数据是用与语言无关的schema描述的，不同的是Avro的代码生成是可选的，schema和数据存放在一起，而schema使得整个数据的处理过程并不生成代码、静态数据类型等，为了实现这些，需要假设读取数据的时候模式是已知的，这样就会产生紧耦合的编码，不再需要用户指定字段标识。

Avro的schema是JSON格式的，而编码后的数据是二进制格式（当然还有其他可选项）的，这样对于已经拥有JSON库的语言可以容易实现。

Avro还支持扩展，写的schema和读的schema不一定要是同一个，也就是说兼容新旧schema和新旧客户端的读取，比如新的schema增加了一个字段，新旧客户端都能读旧的数据，新客户端按新的schema去写数据，当旧的客户端读到新的数据时可以忽略新增的字段。

Avro还支持datafile文件，schema写在文件开头的元数据描述符里，Avro datafile支持压缩和分割，这就意味着可以做Mapreduce的输入。

2 Avro Schemas

2.1 Schema 定义

Schema是JSON格式的，包括下面三种形式：

1.JSON string类型,主要是原生类型

2.JSON 数组，主要是union

3.JSON 对象，格式：

{"type": "typeName" ...attributes...}

包括除原生类型和union以外的其他类型，attributes可以包括avro未定义的属性，这些属性并不会影响数据的序列化。

2.2 原生类型

总共8种原生类型null,boolean,int,long,float,double,bytes,strings.

1.原生类型不需要attributes

2.可以通过type指定“string” 和｛"type":"string"｝是等同的

3.不同语言的实现是不同的，比如double类型，在C,C++和java里就是double,而在Python里是float，在Ruby里是Float.

2.3 复合类型

1、records

records一般是序列化数据的最终展现单元，而且可以自己嵌套。

{
  "type":"record",
  "name":"LongList",
  "aliases":["LinkedLongs"],                     
  "fields" : [
    {"name":"value", "type": "long"},            
    {"name":"next", "type": ["LongList", "null"]}
  ]
}

2、enums，枚举。

{ "type": "enum",
  "name":"Suit",
  "symbols" :["SPADES", "HEARTS", "DIAMONDS","CLUBS"]
}

3、arrays，数组。

{"type": "array", "items":"string"}

4、maps

map，keys必须是string，所以这里只指定了values的类型

{"type": "map", "values": "long"}

5、unions

不能包含两个或者两个以上没有name属性的相同类型

["string", "null"]

6、fixed

size指定每个值占用多少个字节

{"type": "fixed", "size": 16,"name": "md5"}

2.4 三种mapping

generic mapping

针对一种语言来说可能有不同的mapping，但是所有语言必须支持动态mapping，在处理之前并不知道schema

specific mapping

java和C++都可以事先生成源代码，比generic mapping有更多domain-oriented的api

reflect mapping

使用反射将avro类型转换成java类型，但这种mapping比前两种都慢，故弃用。

3 Avro序列化与反序列化

3.1 准备工作

将一下schema保存成文件StringPair.avsc,放在src/test/resources目录下。

{
   "type":"record",
   "name":"StringPair",
    "doc":"A pair ofstrings",
    "fields":[
       {"name":"left","type":"string"},
       {"name":"right","type":"string"}
    ]
}

引入最新版本的avro时要主要，最新的avro包为1.7.4，依赖org.codehaus.jackson:jackson-core-asl:1.8.8包，但是maven库中已经没有该版本，所以要换成其他版本。


org.codehaus.jackson
jackson-core-asl
1.9.9

如果你用的是1.0.4版本的hadoop（或者其他版本），依赖于jackson-mapper-asl，如果与jackson-core-asl版本不一致就会产生找不到方法等异常你需要入引入相同版本。


org.codehaus.jackson
jackson-mapper-asl
1.9.9

3.2 generic方式

package com.sweetop.styhadoop;
 
import junit.framework.Assert;
import org.apache.avro.Schema;
import org.apache.avro.generic.GenericData;
import org.apache.avro.generic.GenericDatumReader;
import org.apache.avro.generic.GenericDatumWriter;
import org.apache.avro.generic.GenericRecord;
import org.apache.avro.io.*;
import org.junit.Test;
 
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.IOException;
 
/**
 * Created with IntelliJ IDEA.
 * User: lastsweetop
 * Date: 13-8-5
 * Time: 下午7:59
 * To change this template use File| Settings | File Templates.
 */
public class TestGenericMapping {
    @Test
    public void test() throwsIOException {
        //将schema从StringPair.avsc文件中加载
        Schema.Parser parser = newSchema.Parser();
        Schema schema =parser.parse(getClass().getResourceAsStream("/StringPair.avsc"));
 
        //根据schema创建一个record示例
          GenericRecord datum = newGenericData.Record(schema);
        datum.put("left","L");
        datum.put("right","R");
 
 
        ByteArrayOutputStream out =new ByteArrayOutputStream();
        //DatumWriter可以将GenericRecord变成edncoder可以理解的类型
       DatumWriter writer = newGenericDatumWriter(schema);
        //encoder可以将数据写入流中，binaryEncoder第二个参数是重用的encoder，这里不重用，所用传空
        Encoder encoder =EncoderFactory.get().binaryEncoder(out, null);
        writer.write(datum,encoder);
        encoder.flush();
        out.close();
 
       DatumReader reader=newGenericDatumReader(schema);
        Decoderdecoder=DecoderFactory.get().binaryDecoder(out.toByteArray(),null);
        GenericRecordresult=reader.read(null,decoder);
       Assert.assertEquals("L",result.get("left").toString());
       Assert.assertEquals("R",result.get("right").toString());
    }
}

result.get返回的是utf-8格式，需要调用toString方法，才能和字符串一致。

3.3 specific方式

首先使用avro-maven-plugin生成代码，pom的配置。


org.apache.avro
avro-maven-plugin
1.7.0


schemas
generate-sources
       
schema
 
        
           
               StringPair.avsc
           
src/test/resources                         ${project.build.directory}/generated-sources/java

avro-maven-plugin插件绑定在generate-sources阶段，调用mvn generate-sources即可生成源代码，我们来看下生成的源代码：

package com.sweetop.styhadoop;
 
/**
 * Autogenerated by Avro
 * 
 * DO NOT EDIT DIRECTLY
 */
@SuppressWarnings("all")
/** A pair of strings */
public class StringPair extendsorg.apache.avro.specific.SpecificRecordBase implementsorg.apache.avro.specific.SpecificRecord {
    public static finalorg.apache.avro.Schema SCHEMA$ = new org.apache.avro.Schema.Parser().parse("{\"type\":\"record\",\"name\":\"StringPair\",\"doc\":\"Apair ofstrings\",\"fields\":[{\"name\":\"left\",\"type\":\"string\",\"avro.java.string\":\"String\"},{\"name\":\"right\",\"type\":\"string\"}]}");
    @Deprecated
    public java.lang.CharSequence left;
    @Deprecated
    public java.lang.CharSequenceright;
 
    public org.apache.avro.SchemagetSchema() {
        return SCHEMA$;
    }
 
    // Used by DatumWriter.  Applications should not call.
    public java.lang.Object get(intfield$) {
        switch (field$) {
            case 0:
                return left;
            case 1:
                return right;
            default:
                throw neworg.apache.avro.AvroRuntimeException("Bad index");
        }
    }
 
    // Used by DatumReader.  Applications should not call.
    @SuppressWarnings(value ="unchecked")
    public void put(int field$,java.lang.Object value$) {
        switch (field$) {
            case 0:
                left =(java.lang.CharSequence) value$;
                break;
            case 1:
                right =(java.lang.CharSequence) value$;
                break;
            default:
                throw neworg.apache.avro.AvroRuntimeException("Bad index");
        }
    }
 
    /**
     * Gets the value of the 'left'field.
     */
    public java.lang.CharSequencegetLeft() {
        return left;
    }
    
     /**
     * Sets the value of the 'left'field.
     *
     * @param value the value toset.
     */
    public voidsetLeft(java.lang.CharSequence value) {
        this.left = value;
    }
 
    /**
     * Gets the value of the 'right'field.
     */
    public java.lang.CharSequencegetRight() {
        return right;
    }
 
    /**
     * Sets the value of the 'right'field.
     *
     * @param value the value toset.
     */
    public voidsetRight(java.lang.CharSequence value) {
        this.right = value;
    }
}

为了兼容之前的版本生成了一组get，put方法，1.6.0后生成添加了getter/setter方法，还有一个与Builder的类，没什么用已经被我删掉

schama里的name里可以使用命名空间，如com.sweetop.styhadoop.StringPair，这样生成的源代码才会是带package的。

那我们来看如果使用这个生成的类，和generic方式有什么不同：

package com.sweetop.styhadoop;
 
import junit.framework.Assert;
import org.apache.avro.Schema;
import org.apache.avro.io.*;
import org.apache.avro.specific.SpecificDatumReader;
import org.apache.avro.specific.SpecificDatumWriter;
import org.junit.Test;
 
import java.io.ByteArrayOutputStream;
import java.io.IOException;
 
/**
 * Created with IntelliJ IDEA.
 * User: lastsweetop
 * Date: 13-8-6
 * Time: 下午2:19
 * To change this template use File| Settings | File Templates.
 */
 public class TestSprecificMapping {
    @Test
    public void test() throwsIOException {
        //因为已经生成StringPair的源代码，所以不再使用schema了，直接调用setter和getter即可
        StringPair datum=newStringPair();
       datum.setLeft("L");
       datum.setRight("R");
 
        ByteArrayOutputStreamout=new ByteArrayOutputStream();
        //不再需要传schema了，直接用StringPair作为范型和参数，
       DatumWriter writer=newSpecificDatumWriter(StringPair.class);
        Encoder encoder=EncoderFactory.get().binaryEncoder(out,null);
        writer.write(datum,encoder);
        encoder.flush();
        out.close();
 
       DatumReader reader=newSpecificDatumReader(StringPair.class);
        Decoder decoder=DecoderFactory.get().binaryDecoder(out.toByteArray(),null);
        StringPairresult=reader.read(null,decoder);
       Assert.assertEquals("L",result.getLeft().toString());
       Assert.assertEquals("R",result.getRight().toString());
    }
 }

同点总结一下：

schema->StringPair.class, GenericRecord->StringPair。

4 AvroDatafile

4.1 datafile组成

datafile的组成如下图：

datafile分为文件头是数据块，如果看图还是不明白，那么看这个应该会很清楚，datafile文件头的schema：

{"type": "record", "name":"org.apache.avro.file.Header",
 "fields" : [
   {"name":"magic", "type": {"type": "fixed","name": "Magic", "size": 4}},
   {"name":"meta", "type": {"type": "map","values": "bytes"}},
   {"name":"sync", "type": {"type": "fixed","name": "Sync", "size": 16}},
  ]
}

要注意的是16字节的同步标记，这个标记意味着datafile支持随机读，并且可以做分割，也意味着可以作为mapreduce的输入。

DataFileReader可以通过同步标记去随机读datafile文件。

void   seek(long position)
Move to a specific, known synchronization point, one returned fromDataFileWriter.sync() while writing.
void   sync(long position)
Move to the next synchronization point after a position.

4.2 datafile写操作

以代码注释的方式进行讲解：

//首先创建一个扩展名为avro的文件（扩展名随意，这里只是为了容易分辨）
File file = new File("data.avro");
//这行和前篇文章的代码一致，创建一个Generic Record的datum写入类
DatumWriter writer = newGenericDatumWriter(schema);
//和Encoder不同，DataFileWriter可以将avro数据写入到文件中
DataFileWriterdataFileWriter = new DataFileWriter(writer);
//创建文件，并且写入头信息
dataFileWriter.create(schema,file);
//写datum数据
dataFileWriter.append(datum);
dataFileWriter.append(datum);
dataFileWriter.close();

4.3 datafile读操作

以代码注释的方式进行讲解：

//这行也和前篇文章相同，Generic Record的datum读取类，有点不一样的就是这里不需要再传入schema，因为schema已经包含在datafile的头信息里:

DatumReader reader=newGenericDatumReader();
        //datafile文件的读取类，指定文件和datumreader
        DataFileReaderdataFileReader=new DataFileReader(file,reader);
        //测试下读写的schema是否一致
       Assert.assertEquals(schema,dataFileReader.getSchema());
        //遍历GenericRecord
        for (GenericRecord record : dataFileReader){
           System.out.println("left="+record.get("left")+",right="+record.get("right"));
        }

5 Avro schema兼容

5.1 兼容条件

在实际的应用中，因为应用版本的问题经常遇到读和写的schema不相同的情况，幸运的是avro已经提供了相关的解决方案。

下面图示说明：

5.2 Record兼容

在hadoop的实际应用中，更多是以record的形式进行交互，接下来我们重点讲解下record的兼容。

首先从读写schema的角度取考虑，读写schema的不同无外乎就两种，读的schema比写的schema多了一个field，读的schema比写的schema少了一个field，这两种情况处理起来都很简单。

先看下写的schema：

{
   "type":"record",
   "name":"com.sweetop.styhadoop.StringPair",
    "doc":"A pair ofstrings",
    "fields":[
       {"name":"left","type":"string"},
       {"name":"right","type":"string"}
    ]
}

1、增加了field的情况

增加了field后的schema：

{
   "type":"record",
   "name":"com.sweetop.styhadoop.StringPair",
    "doc":"A pair ofstrings",
    "fields":[
       {"name":"left","type":"string"},
       {"name":"right","type":"string"},
       {"name":"description","type":"string","default":""}
    ]
}

用增加了field的schema取读数据。

new GenericDatumReader(null, newSchema)，第一个参数为写的schema，第二个参数为读的schema，

由于读的是avro datafile，schema已经在文件的头部指定，所以写的schema可以忽略掉。

    @Test
    public void testAddField()throws IOException {
        //将schema从newStringPair.avsc文件中加载
        Schema.Parser parser = newSchema.Parser();
        Schema newSchema =parser.parse(getClass().getResourceAsStream("/addStringPair.avsc"));
 
        File file = new File("data.avro");
       DatumReader reader = newGenericDatumReader(null, newSchema);
       DataFileReader dataFileReader = newDataFileReader(file, reader);
        for (GenericRecord record :dataFileReader) {
           System.out.println("left=" + record.get("left") +",right=" + record.get("right") + ",description="
                    +record.get("description"));
        }
    }

输出结果为：

left=L,right=R,description=
left=L,right=R,description=

description用默认值空字符串代替。

2、减少了field的情况

减少了field的schema：

{
   "type":"record",
   "name":"com.sweetop.styhadoop.StringPair",
    "doc":"A pair ofstrings",
    "fields":[
        {"name":"left","type":"string"}
    ]
}

用减少了field的schema取读取：

   @Test
    public void testRemoveField()throws IOException {
        //将schema从StringPair.avsc文件中加载
        Schema.Parser parser = newSchema.Parser();
        Schema newSchema = parser.parse(getClass().getResourceAsStream("/removeStringPair.avsc"));
 
        File file = newFile("data.avro");
       DatumReader reader = newGenericDatumReader(null, newSchema);
       DataFileReader dataFileReader = newDataFileReader(file, reader);
        for (GenericRecord record :dataFileReader) {
           System.out.println("left=" + record.get("left"));
        }
    }

输出结果为：

left=L
left=L

删除的field被忽略掉。

3、新旧版本schema

如果从新旧版本的角度取考虑。

新版本schema比旧版本schema增加了一个字段

1.新版本取读旧版本的数据，使用新版本schema里新增field的默认值

2.旧版本读新版本的数据，新版本schema里新增field被旧版本的忽略掉

新版本schema比旧版半schema较少了一个字段

1.新版本读旧版本的数据，减少的field被新版本忽略掉

2.旧版本读新版本的数据，旧版本的schema使用起被删除field的默认值，如果没有就会报错，那么升级旧版本。

5.3 别名

别名是另一个用于schema兼容的方法，可以将写的schema的field名字转换成读的schema的field，记住并不是加了aliases字段。

而是将写的filed的name属性变为aliases，读的时候只认name属性。

来看下加了别名的schema：

{
   "type":"record",
   "name":"com.sweetop.styhadoop.StringPair",
    "doc":"A pair ofstrings",
    "fields":[
       {"name":"first","type":"string","aliases":["left"]},
       {"name":"second","type":"string","aliases":["right"]}
    ]
}

使用别名schema去读数据，这里不能再用left，right，而要用first，second：

   @Test
    public void testAliasesField()throws IOException {
        //将schema从StringPair.avsc文件中加载
        Schema.Parser parser = newSchema.Parser();
        Schema newSchema =parser.parse(getClass().getResourceAsStream("/aliasesStringPair.avsc"));
 
        File file = newFile("data.avro");
       DatumReader reader = newGenericDatumReader(null, newSchema);
        DataFileReaderdataFileReader = new DataFileReader(file, reader);
        for (GenericRecord record :dataFileReader) {
           System.out.println("first=" +record.get("first")+",second="+record.get("second"));
        }
    }

输出结果为：

first=L,second=R
first=L,second=R

UNet 改进：添加Transformer注意力机制增强捕捉长距离依赖关系的能力听风吹等浪起 AI 改进系列 transformer 深度学习人工智能
目录1.Transformer注意力机制2.Unet改进3.代码1.Transformer注意力机制TransformerBlock是Transformer模型架构的基本组件，广泛应用于机器翻译、文本摘要和情感分析等自然语言处理任务。TransformerBlock是一个由两个子组件组成的构建块：多头注意力机制和前馈神经网络。这两个组件协同工作，处理和转换输入序列。多头注意力机制负责从输入序列中捕
Kubernetes集群版本升级程序员Realeo Java后端 kubernetes 容器云原生
集群升级注意事项升级集群版本建议逐步升级，比如v1.20.1–>v1.21.1–>v1.22.1–>v1.23.1–>v1.24.1，不能跨度过大，否则会报错。升级步骤查看集群版本[root@hadoop102~]#kubectlgetnodesNAMESTATUSROLESAGEVERSIONhadoop102Ready,SchedulingDisabledcontrol-plane,maste
【2025年饿了么春招-3月14日-第二题（200分）- 小红的排列构造】（题目+思路+Java&C++&Python解析+在线测试) 塔子哥学算法 java c++python 算法数据结构饿了么
题目内容小红希望你构造一个长度为nnn的排列，满足∑i=1n∗i\sum_{i
Apache OFBiz路径遍历漏洞(CVE-2024-36104) WuY1nSec 漏洞复现 apache
0x01漏洞描述ApacheOFBiz是美国阿帕奇（Apache）基金会的一套企业资源计划（ERP）系统。该系统提供了一整套基于Java的Web应用程序组件和工具。ApacheOFBiz18.12.14之前版本存在命令执行漏洞，该漏洞源于ControlFilter对路径限制不当导致用户能够访问ProgramExport导出功能执行Groovy代码。0x02影响版本ApacheOFBiz<18.12
Spring框架快速入门手册 Uncoverlove spring mysql mybatis java 后端
说明：本文试图将Spring框架的知识体系进行整合分析，并冠以自己的理解，为初学Spring框架的同学，提供一个快速入门手册。同时呢，也是为了总结一下工作学习中遇到的问题和经验，以免发生遗漏！文末将附上Spring的学习资料，以供大家学习~（申明一下：纯小白一枚，由于工作需要自学的Spring，或许某些理解会出现偏差，烦请各位斧正！不慎感激！！）快速入门推荐阅读书籍（欢迎补充）：1、《JavaEE
Java通过Apache POI操作Excel IT__learning 数据分析 java apache excel
1、添加依赖org.apache.poipoi3.9org.apache.poipoi-ooxml3.9joda-timejoda-time2.10.12、读EXCELpublicstaticvoidread()throwsException{FileInputStreamstream=newFileInputStream("D:\\Test\\file.xlsx");//1.创建工作簿对象,并指
【时时三省】(C语言基础)用printf函数输出数据时时三省【理论+经验】c语言入门 c语言基础知识点 c语言
山不在高，有仙则名。水不在深，有龙则灵。----CSDN时时三省在C程序中用来实现输出和输入的主要是printf函数和scanf函数。这两个函数是格式输入输出函数。用这两个函数时，程序设计人员必须指定输入输出数据的格式，即根据数据的不同类型指定不同的格式。printf函数（格式输出函数）用来向终端（或系统隐含指定的输出设备）输出若干个任意类型的数据。printf函数的一般格式printf函数的一般
英伟达系列显卡大解析B100、H200、L40S、A100 2301_78234743 java
家里有了变故。。。快手数分秋招一面面经我发现算法岗也不很难进啊(深度学习)算法想转数开…Java零基础校招学习路线突击版（吐血整理）等的花都谢了的华子最后给开了22k，武汉，应该是14a。不过在这几个月里我坚定了搞几年快钱回家和np朋友因骂了hr，boos被封了哈哈哈在央企想被开除需要做什么？2024小米分布式存储研发急招华为2012被毁意向我发现算法岗也不很难进啊(深度学习)在央企想被开除需要做
阿里巴巴发布 R1-Omni：首个基于 RLVR 的全模态大语言模型，用于情感识别新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/情感识别一直是AI领域的难题，尤其是视觉与音频信号的融合。单独依赖视觉或音频的模型，往往
java24种设计模式目录,为大家整理最全的24种设计模式详解，必收藏高补 java24种设计模式目录
设计模式六大原则单一职责原则一个方法尽可能做一件事情，一般来说不应该让一个方法承担多个职责。单一职责原则的英文名称是SingleResponsibilityPrinciple，简称是SRP。单一职责原则的定义是：应该有且仅有一个原因引起类的变更。SRP的原话解释是：Thereshouldneverbemorethanonereasonforaclasstochange.单一职责原则提出了一个编写程
结构型模式之适配器模式：让不兼容的接口兼容菜就多练少说设计模式适配器模式
在软件开发中，经常会遇到这样一种情况：系统的不同部分需要进行交互，但由于接口不兼容，导致无法直接使用。这时，适配器模式（AdapterPattern）就能派上用场。适配器模式是设计模式中的结构型模式，它的目的是通过创建一个适配器类来“包装”一个不兼容的接口，使得两个接口能够兼容、协作。简单来说，适配器模式就是“转换接口”模式。本文将深入探讨适配器模式，讲解其概念、应用场景，并展示如何在Java中实
【JS】JS中的jQuery库简介及使用方法菜就多练少说 javascript javascript jquery 开发语言
jQuery简介及使用方法jQuery简介如何使用jQuery1导入jQuery库2编写自己的jQuery文件3jQuery语法3.1基础语法3.2文档就绪函数3.3选择器3.4事件绑定函数结语jQuery简介jQuery是一个流行的JavaScript库，用于简化JavaScript编程。它提供了许多便捷的方法来处理DOM操作、事件处理、动画效果等，使得JavaScript开发变得更加简单和高效
高性能缓存利器：Caffeine 在 Spring Boot 中的应用阿里小阿希 JAVA 缓存 spring boot spring
在现代应用程序中，缓存是提高数据检索速度、减少对数据库或其他数据源访问次数的重要手段。SpringCache提供了多种缓存实现方式，而在我们的SpringBoot项目中，我们选择了Caffeine作为默认的缓存库。Caffeine简介Caffeine是一个基于Java8的高性能、近乎最佳的缓存库。它提供了多种优化技术，如写入时复制（Copy-on-Write）和分段锁（SegmentedLocki
Android自动化测试工具海棠如醉 web技术自动化运维
细解自动化测试工具Airtest-CSDN博客以下是几种常见的Android应用自动化测试工具：Appium：支持多种编程语言，如Java、Python、Ruby、JavaScript等。可以用于Web应用程序和原生应用程序的自动化测试，并支持iOS和Android平台。Espresso：由Google开发的AndroidUI测试框架，可用于测试应用程序的用户界面和与用户的交互。Espresso支
SpringBoot整合MinIO实现文件的上传下载以及获取预览URL .晚安. spring boot 后端 java web
SpringBoot整合MinIO实现文件的上传下载以及获取预览URLJDK17SpringBoot3参考https://min.io/docs/minio/linux/developers/java/API.html?ref=docs-redirect#uploadObject源码https://gitee.com/Uncommen/easy-min-io引入依赖在pom.xml中添加主要的依赖
Java并发——ThreadLocal .晚安. java 开发语言
Java——ThreadLocal什么是ThreadLocal？ThreadLocal可以翻译为线程本地存储，是用来解决多线程间对共享资源的访问安全性的一种技术。当我们在面临多线程并发问题时，例如线程A创建了对于一个共享资源（static）的访问链接，此时当线程A正在访问该资源时，线程B也通过该链接开始对资源进行访问，而当线程A访问资源完毕后关闭了对于资源的访问链接，那么线程B就会出错。一种解决方
Python说明一一代码 python
Python的主要特点：1.**易读易写**：Python的语法简洁明了，代码可读性高。2.**跨平台**：Python可以在多种操作系统上运行，如Windows、macOS、Linux等。3.**丰富的库**：Python拥有庞大的标准库和第三方库，涵盖了从Web开发到数据科学的多个领域。4.**动态类型**：Python是动态类型语言，变量不需要显式声明类型。5.**解释型语言**：Pytho
【HarmonyOS Next之旅】DevEco Studio使用指南(二) 枫叶丹4 HarmonyOS harmonyos 华为 HarmonyOS Next DevEco Studio
目录1->工程模板介绍2->创建一个新的工程2.1->创建和配置新工程2.1.1->创建HarmonyOS工程2.2.2->创建OpenHarmony工程1->工程模板介绍DevEcoStudio支持多种品类的应用/元服务开发，预置丰富的工程模板，可以根据工程向导轻松创建适应于各类设备的工程，并自动生成对应的代码和资源模板。同时，DevEcoStudio还提供了多种编程语言供开发者进行应用/元服务
Go语言实战，HTTP和gRPC多服务启动与关闭的最佳实践 zhuyasen go 后端 http rpc
在Go开发中，构建健壮的应用程序不仅需要关注核心业务逻辑，还要考虑服务的优雅启动与关闭。特别是在微服务架构中，如何优雅地启动和停止多个服务成为了系统设计中的一个重要议题。今天我们来深入探讨一款基于Go语言开发的app库，该库利用errgroup实现了服务的并发启动，并能在系统关闭时优雅地释放各项资源。一、设计原理解析在一个复杂的系统中，通常会有多个服务并行运行，如HTTP服务、gRPC服务等。如何
Go语言分布式ID生成策略优选：UUID、Snowflake、XID、ObjectID、Krand性能对比评测 zhuyasen golang 分布式
在高并发应用场景下，如订单系统、分布式数据库主键、消息队列等，分布式ID的生成至关重要。本文将基于Go语言，对多种分布式ID生成方案进行基准测试（Benchmark），并分析其性能及适用场景，帮助开发者选择最优方案。常见分布式ID生成方案在Go语言生态中，常见的分布式ID生成方案包括：XID（github.com/rs/xid）：基于MongoDBObjectID改进的方案，时间排序、唯一性强、无
java不用缓存实现token续签_JWT实现登陆认证及Token自动续期 deep go
过去这段时间主要负责了项目中的用户管理模块，用户管理模块会涉及到加密及认证流程，加密已经在前面的文章中介绍了，可以阅读：https://juejin.cn/post/6916150628955717646今天就来讲讲认证功能的技术选型及实现。技术上没啥难度当然也没啥挑战，但是对一个原先没写过认证功能的菜鸡甜来说也是一种锻炼吧技术选型要实现认证功能，很容易就会想到JWT或者session，但是两者有
认知科学：解决复杂问题的5个关键策略 AI天才研究院 AI大模型应用入门实战与进阶大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍认知科学是一门研究人类思维、认知和行为的科学。它涉及到大脑、神经科学、心理学、语言学、人工智能和计算机科学等多个领域。认知科学试图揭示人类如何理解和处理信息，以及如何进行决策和行动。在本文中，我们将探讨5个关键策略，这些策略可以帮助我们解决复杂问题。这些策略包括：模式识别规则抽取推理和逻辑推理知识表示和知识图谱多模态处理我们将在接下来的部分中详细讨论这些策略，并提供代码实例和数学模型公
人工智能：重塑未来生活与工作的科技力量 Geektec 问答专栏人工智能应用创新
方向一：介绍人工智能技术的发展历程和现状，指出它的应用领域和前景一、人工智能技术的发展历程人工智能（ArtificialIntelligence,AI）作为一门学科，其起源可以追溯到20世纪50年代。最初，AI的研究主要集中在逻辑推理、机器学习和自然语言处理等领域，目标是使机器能够模拟人类的智能行为。尽管在早期的探索中，AI遭遇了诸多挑战和瓶颈，但其发展潜力逐渐被认可，并在随后几十年中得到了迅速的
编程助手学Python--Deepseek对提示词模板PromptTemplate / ChatPromptTemplate / ChatMessagePromptTemplate 的理解 sunyaox 编程助手学Python python 服务器开发语言
编程助手学Python--Deepseek对提示词模板PromptTemplate/ChatPromptTemplate/ChatMessagePromptTemplate的理解1.PromptTemplate主要功能：示例：2.ChatPromptTemplate主要功能：示例：3.ChatMessagePromptTemplate主要功能：示例：总结在构建基于语言模型的应用程序时，Prompt
AI 行业发展趋势：科技创新引领未来变革我是阿萌畅聊AI 人工智能科技学习
在当今数字化时代，人工智能（AI）行业正以前所未有的速度蓬勃发展，深刻地改变着我们的生活、工作和社会格局。从基础技术的突破到广泛的应用场景拓展，AI展现出了一系列令人瞩目的发展趋势，预示着一个充满无限可能的未来。一、技术创新持续突破模型规模与性能提升AI模型正朝着更大规模、更复杂的方向发展。以GPT系列为代表的大语言模型，参数数量不断攀升，从GPT-2的15亿参数到GPT-4的万亿级参数，模型的语
计算机毕业设计Java河南省农村多元化养老服务管理系统设计与实现(源码+系统+mysql数据库+lw文档) 山逸网络数据库 java mysql
计算机毕业设计Java河南省农村多元化养老服务管理系统设计与实现(源码+系统+mysql数据库+lw文档)计算机毕业设计Java河南省农村多元化养老服务管理系统设计与实现(源码+系统+mysql数据库+lw文档)本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win1
离散数学-万字课堂笔记-期末考试-考研复习-北航离散数学1 桃木山人考研数学离散数学期末
第一章逻辑语言1.1逻辑运算1.2命题逻辑合式公式1.3谓词逻辑合式公式1.4自然语言命题第二章命题逻辑语义2.1命题合式公式语义2.2推论式与等价式的语义2.3变换合式公式的语义2.4命题公式范式2.5等式演算2.6完全集第三章谓词逻辑语义3.1谓词合式公式语义3.2推论关系和相等关系3.3前束范式与斯科伦范式3.4一阶理论语言3.5论域、结构与模型第四章逻辑公理系统4.1形式系统4.2命题逻辑
R 语言科研绘图第 31 期 --- 韦恩图-基础 TigerZ 生信宝库 r语言贴图程序人生开发语言
在发表科研论文的过程中，科研绘图是必不可少的，一张好看的图形会是文章很大的加分项。为了便于使用，本系列文章介绍的所有绘图都已收录到了sciRplot项目中，获取方式：R语言科研绘图模板---sciRplothttps://mp.weixin.qq.com/s/QA_8LVqjkdg4A16zLonw4w?payreadticket=HElUE5WWmBflodEFw10g0l2NrRotj8kbU
C/C++都有哪些开源的Web框架？草原上唱山歌笔记 c++开源前端
CppCMSCppCMS是一个采用C++语言开发的高性能Web框架，通过模版元编程方式实现了在编译期检查RESTful路由系统，支持传统的MVC模式和多种语言混合开发模式。CppCMS最厉害的功能是WebSocket，10万连接在内存中长期保存占用的大小不超过600MB，直接将WS和Node.js甩几条街。某自动驾驶公司的OTA服务使用该框架构建API网关，在编译阶段完成所有的接口参数校验，软件运
编程助手学Python--Deepseek对提示词自定义模板StringPromptTemplate的理解 sunyaox 编程助手学Python python 开发语言
编程助手学Python--Deepseek对提示词自定义模板StringPromptTemplate的理解主要功能核心属性和方法使用场景示例代码1.基本用法2.使用f-string格式3.结合其他模板类高级用法1.自定义模板格式2.动态生成模板总结StringPromptTemplate是一种用于生成字符串提示的模板类，通常用于构建基于语言模型的应用程序。它允许你定义一个包含占位符的字符串模板，并
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

Hadoop之AVRO

你可能感兴趣的:(java,语言,二进制,Hadoop)