两点半holy

关于RDD、DataFrame和Dstream的几个常识(补充 DataSet）的笔记

RDD

Spark 编程

每一个 spark 应用程序都包含一个驱动程序(driver program),会运行用户的 main 函数，并在集群上执行各种并行操作(parallel operations)

spark导图.xmind

RDD的基础知识

五个特征

a list of partiotioner有很多个partiotioner(这里有3个partiotioner)。可以明确的说，一个分区在一台机器上，一个分区其实就是放在一台机器的内存上，一台机器上可以有多个分区。
a function for partiotioner一个函数作用在一个分区上。比如说一个分区有1，2,3 在rdd1.map(10),把RDD里面的每一个元素取出来乘以10，每个分片都应用这个map的函数。
RDD之间有一系列的依赖rdd1.map(*10).flatMap(…).map(…).reduceByKey(…)，构建成为DAG,这个DAG会构造成很多个阶段，这些阶段叫做stage，RDDstage之间会有依赖关系，后面根据前面的依赖关系来构建，如果前面的数据丢了，它会记住前面的依赖，从前面进行重新恢复。每一个算子都会产生新的RDD。textFile 与flatMap会产生两个RDD。
分区器hash & Integer.Max % partiotioner 决定数据到哪个分区里面，可选，这个RDD是key-value 的时候才能有。
最佳位置。数据在哪台机器上，任务就启在哪个机器上，数据在本地上，不用走网络。不过数据进行最后汇总的时候就要走网络。（hdfs file的block块）。

（1）遇到action算子触发作业，transformation算子是不会立即触发作业提交()；

（2）stage的划分，划分的依据是依赖算子是否是shuffle(如reduceByKey,Join等)的，每个stage又可以划分成若干task；这个可以这么看，没有shuffle之前都是map操作，不怎么涉及节点之间的通信；

（3）分区（Partition），影响你的并发和计算效率，比如，1000个并发，200个Partition，另外800个并发就空闲着，所以合理的设置repartition和shuffle.partitions

RDD的分区数决定这个RDD被分成多少片（partition来执行）一个片有个进程

Spark：任务中如何确定spark分区数、task数目、core个数、worker节点个数、excutor数量

eg.

假设有一个10台机器的集群，每台机器有8个逻辑核，并按照如上的配置，那么这个spark集群的可用资源是 80个core（这里只考虑cpu，实际上还有内存）。如果一个任务申请到了集群的所有资源（所有80个core）。现在有一个被分为100个partition的RDD被map执行，那么会同时启动80个Task也就是占用了所有80个core计算（实际是启动了80个线程），剩余20个partition等待某些task完成后继续执行。

RDD : 一个只读的，可分区的分布式数据集，这个数据集的部分或全部可以缓存到到内存中，在多次计算中

重复使用。(弹性分布式数据集)，RDD默认不存储数据，只存储业务逻辑

RDD内部可以有许多分区(partitions),每个分区都拥有大量的记录(records)。(RDD由一组partition组成)，分布在集群的不同节点上，可以并行操作

RDD 在抽象

RDD分区的三种方式

分区的优势：增加并行度和减少通信开销

分区太多意味着任务数太多，调度任务消耗时间，会增加耗时和浪费资源

分区太少，会导致部分节点分配不到任务，一些节点处理数据量会增大，对节点内存的要求高

分区不合理会导致数据倾斜问题。

一般合理的分区数是总核数的2-3倍

HashPartition (哈希分区划分器)

//确定分区的方式 partition = key.hashCode () % numPartitions
val counts = sc.parallerlize(list(1,a),(2,b),(3,c))
	.partitonBy(new Hashpartitoner(3))

RangePartitioner（范围分区划分器）

// 会对key值进行排序，然后将key值被划分成n份key值集合
val counts = sc.parallerlize(list((1,a),(2,b),(3,c))
	.partitionBy(new RangePartitioner(3,counts))

CustomPartitioner（自定义分区器)

//根据自定义来划分，需要继承一个Partitoner

package shujia.mytest.testtoperator
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.rdd.RDD.rddToPairRDDFunctions
import org.apache.spark.Partitioner

/*
  * @program: SparkScalaOperator
  * @Date: 2018/9/2 19:48
  * @Author: yqq
  * @Description: 该函数根据partitioner函数生成新的ShuffleRDD，将原RDD重新分区
  */
object test_partionby {
  def main(args: Array[String]) {
    val conf = new SparkConf().setAppName("JoinOperator")
      .setMaster("local")
    val sc = new SparkContext(conf)

    val nameList = Array(Tuple2(1,"xuruyun"),Tuple2(2,"liangyongqi"),Tuple2(3,"wangfei"),(4,"sq"))
    val name = sc.parallelize(nameList)
    val result = name.partitionBy(new UDPartitioner(2))//不能小于3 自定义划分了3个区
    result.foreach(println)
}
}
//输入参数分区的数目
class UDPartitioner(numParts: Int) extends Partitioner {
  override def numPartitions = numParts //分区的数目

  override def getPartition(key: Any): Int = {
    //key.hashCode() % numPartitions hash 分区的方法
    if (key == 1){
      1  //分区的标记必须从0开始（第一位不一定为0）
    } else if (key == 2 ) {
      0
    }else{
      1
    }
  }
}

RDD文件的创建

RDD：创建的几种方式（scala和java）

在RDD中，通常就代表和包含了Spark应用程序的输入源数据。
当我们，在创建了初始的RDD之后，才可以通过Spark Core提供的transformation算子，对该RDD进行transformation(转换)操作，来获取其他的RDD。
Spark Core为我们提供了三种创建RDD的方式，包括：

使用程序中的集合创建RDD
使用本地文件创建RDD
使用HDFS文件创建RDD

应用场景

使用程序中的集合创建RDD，主要用于进行测试，可以在实际部署到集群运行之前，自己使用集合构造测试数据，来测试后面的spark应用的流程
使用本地文件创建RDD，主要用于的场景为：在本地临时性地处理一些存储了大量数据的文件
使用HDFS文件创建RDD，应该是最常用的生产环境处理方式，主要可以针对HDFS上存储的大数据，进行离线批处理操作

实际操作

1 并行化创建RDD

如果要通过并行化集合来创建RDD，需要针对程序中的集合，调用 SparkContext 中的 parallelize() 方法。Spark会将集合中的数据拷贝到集群上去，形成一个分布式的数据集合，也就是一个RDD。即：集合中的部分数据会到一个节点上，而另一部分数据会到其它节点上。然后就可以采用并行的方式来操作这个分布式数据集合。

// 并行化创建RDD部分代码 
// 实现1到5的累加求和
val arr = Array(1,2,3,4,5)
val rdd = sc.parallelize(arr)
val sum = rdd.reduce(_ + _)

官网的注意点

通过阅读Spark的官方文档，如下图：

我们可知：
在调用parallelize()方法时，有一个重要的参数可以指定，就是要将集合切分成多少个partition。Spark会为每一个partition运行一个task来进行处理。Spark官方的建议是，为集群中的每个CPU创建2-4个partition。Spark默认会根据集群的情况来设置partition的数量。但是也可以在调用parallelize()方法时，传入第二个参数，来设置RDD的partition数量。比如，parallelize(arr, 10)

Spark是支持使用任何Hadoop支持的存储系统上的文件创建RDD的，比如说HDFS、Cassandra、HBase以及本地文件。通过调用SparkContext的textFile()方法，可以针对本地文件或HDFS文件创建RDD。Spark是支持使用任何Hadoop支持的存储系统上的文件创建RDD的，比如说HDFS、Cassandra、HBase以及本地文件。通过调用SparkContext的textFile()方法，可以针对本地文件或HDFS文件创建RDD。

2 通过本地文件或HDFS创建RDD的几个注意点

Spark 支持使用任何 Hadoop 支持的存储系统上的文件(HDFS,Cassandra,HBase 或者本地文件)创建。通过调用 SparkContext 的 textFile() 方法

// 实现文件字数统计
// textFile()方法中，输入本地文件路径或是HDFS路径
// HDFS:hdfs://spark1:9000/data.txt
// local:/home/hadoop/data.txt
val rdd = sc.textFile(“/home/hadoop/data.txt”)
val wordCount = rdd.map(line => line.length).reduce(_ + _)

注意点

如果是针对本地文件的话：

如果是在Windows上进行本地测试，windows上有一份文件即可；
如果是在Spark集群上针对Linux本地文件，那么需要将文件拷贝到所有worker节点上（就是在spark-submit上使用—master指定了master节点，使用standlone模式进行运行，而textFile()方法内仍然使用的是Linux本地文件，在这种情况下，是需要将文件拷贝到所有worker节点上的）；

Spark的textFile()方法支持针对目录、压缩文件以及通配符进行RDD创建
Spark默认会为hdfs文件的每一个block创建一个partition，但是也可以通过textFile()的第二个参数手动设置分区数量，只能比block数量多，不能比block数量少

3 Spark 支持的其余方法，创建RDD

通过阅读Spark的官方文档，可以知道除了通过使用textFile()方法创建RDD之外，还有几个其余的方法适用于其它的应用场景，如下图：

SparkContext的textFile()除了可以针对上述几种普通的文件创建RDD之外，还有一些特例的方法来创建RDD：

SparkContext的wholeTextFiles()方法，可以针对一个目录中的大量小文件，返回由（fileName,fileContent）组成的pair，即pairRDD，而不是普通的RDD。该方法返回的是文件名字和文件中的具体内容；而普通的textFile()方法返回的RDD中，每个元素就是文本中一行文本。
SparkContext的sequenceFileK,V方法，可以针对SequenceFile创建RDD，K和V泛型类型就是SequenceFile的key和value的类型。K和V要求必须是Hadoop的序列化机制，比如IntWritable、Text等。
SparkContext的hadoopRDD()方法，对于Hadoop的自定义输入类型，可以创建RDD。该方法接收JobConf、InputFormatClass、Key和Value的Class。
SparkContext的hadoopRDD()方法，对于Hadoop的自定义输入类型，可以创建RDD。该方法接收JobConf、InputFormatClass、Key和Value的Class。

创建 DataFrame 文件（自己写的）

sqlcontext sql上下文对象

.read.json 读取json文件读取的文件是DF格式

将文件注册成临时表 .registerTempTable

//建立样例类。按照样例类来读取文件。（读取文件是RDD形式）.DF变成DF形式并可以用sql
//来读取
.map(x => Score(x(0),x(1),x(2).toInt))
case class Score(student_id: String, coure_id : String,score:Int)
或者
//1 对数据的处理
.map(x => Row(x(0),x(1),x(2).toInt))

//2.1 创建列描述的集合
var structFields = new ArrayList[StructField]()
     // 2.2列描述 列名 类型 是否为空
structFields.add(DataTypes.createStructField("student_id",DataTypes.StringType,true))
structFields.add(DataTypes.createStructField("student_subject",DataTypes.StringType,true))
structFields.add(DataTypes.createStructField("student_score",DataTypes.IntegerType,true))
//2.3创建列描述
var schema = DataTypes.createStructType(structFields)
//3 用sqlcontext创建DF
sqlcontetx.createDataframe（scoreRDD，shema）

由一个已经存在的scala集合的转换

 val rdd = sc.parallelize(集合或者数组)

val a1 = sc.parallelize*(List((*1,37*)*,*(*2,57*)*,*(*3,27*)))*

sql语句只能是有sqlcontext.sql（hivecontext）能执行（DF数据可以通过sql来运行实际上底层是转换为RDD格式来处理数据。.sql 可以通过sql语句操作因为sql语句是懒执行算子

.show查询数据。collect是从远程集群拉取数据到本地driver端，经过网络传输，如果数据大会对

网络压力带来很大。foreach是在集群上操作

读取文件操作：本地文件 SparkContext:sc.textFile() hdfs文件 Sqlcontetx ：sql.read.parquet

DataFrame和DataSet

https://blog.csdn.net/qq_43688472/article/details/86491720

从 spark2.0 开始 DataFrame 作为 DataSet 的特例 ( DataFrame 是操作 Row 对象的 DataSet (DataFrame=DataSet[Row]) ,dataset中每一行类型是不一定的

DataSet：分布式的数据集合，Dataset 提供了强类型支持(在RDD的每行数据加了类型约束)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-chH15n1d-1596074385708)(C:\Users\12067\AppData\Roaming\Typora\typora-user-images\1586338371104.png)]

DataFrame的小记

DataFrame 中提供了详细的数据结构信息即为 schema （数据集中包含哪些列，列名称，列类型）

structField、structType、schame

structField

case class StructField(
        name: String,
        dataType: DataType,
        nullable: Boolean = true,
        metadata: Metadata = Metadata.empty) {}

包含（name ; dataType ; nullable 是否可以为空 ; metadata 此字段的元数据,如果不修改列的内容，则在转换期间应保存元数据。

 	  /**
       * StructField 是 一个 case class ,其中是否可以为空,默认是 true，初始元信息是为空
       * 它是作为描述 StructType中的一个字段
       */
      val sf = new StructField("b",IntegerType)
      println(sf.name)//b
      println(sf.dataType)//IntegerType
      println(sf.nullable)//true
      println(sf.metadata)//{}

structType
```
StructType(fields: Seq[StructField])
```
一个 StructType 对象，可以有多个 StructField ，同时也可以用名字(name)来提取,相当于 Map ，可以用key来提取value，但是他StructType提取的是整条字段的信息

在源码中structType是一个case class,如下：
```
case class StructType(fields: Array[StructField]) extends DataType with Seq[StructField] {}
```
Schema

数据的数据结构描述（比如描述一个Json文件），它可以是在运行的时候隐式导入，或者在编译的时候就导入。它是用一个StructField集合对象的StructType描述（用一个三元tuple,内部是：name,type.nullability），本来有四个信息的为什么会说是三元数组？其实metadata，你是可以调出来。

import org.apache.spark.sql.types._
val struct = StructType( 
    StructField("a",IntegerType)::    
    StructField("b", LongType, false) ::    
    StructField("c", BooleanType, false) :: Nil)

val schemaTyped = new StructType()  
	.add("a","int").add("b","string")
schemaTyped.foreach(println)
/**
	StructField(a,IntegerType,true) 
    StructField(b,StringType,true) 
    */

RDD，DataFrame，DataSet的相互转换

ps.参考

Spark RDD、DataFrame、Dataset相互转换

1 基于RDD创建DataFrame （RDD => DataFrame）

一 . 构建 Schema

构建 RDD[Row]
构建schema

调用creatDataFrame方法

import org.apache.spark.storage.StorageLevel
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.sql.{DataFrame, Row, SQLContext, SparkSession}
import org.apache.spark.sql.types.{IntegerType, LongType, StringType, StructField, StructType}

object spark_test1 {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().appName("spark_test1").master("local").getOrCreate()
    // spark是sparkSession对象
    import spark.implicits._
    val sc = spark.sparkContext
    //读取文件生成RDD
    val rdd = sc.textFile("file:///d:/data/words.txt")
      .persist(StorageLevel.MEMORY_ONLY)//持久化级别
    //1 构建RDD[Row],将一行数据放入Row

    val rdd2 = rdd.flatMap(_.split(",")).map(t => {Row(t(0),t(1))
    })

    //2 构建schema
    val schema = StructType{
      List(
        StructField("id",LongType,true),
        StructField("user",StringType,true)
      )
    }
    //3 createDataFrame
    val df = spark.createDataFrame(rdd2,schema)

  }
}

二. 自动推断

将一行数据放入元组()中，toDF()中指定字段名，需要导入隐式转换


object RddToDataFrame {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().appName("RddToDataFrame").master("local").getOrCreate()
 
    val rdd = spark.sparkContext.textFile("file:///d:/data/words.txt")
 
    // 导入隐式转换
    import spark.implicits._
 
    val df = rdd.map{
      x => {
        val tmp =  x.split(",")
        (tmp(0).toInt, tmp(1))
      }
    }.toDF("id","name")
 
 
    spark.stop()
  }

三. 通过反射获取 Schema

跟自动推断差不多，不过需要创建一个case类，定义类属性。Spark通过反射将case类属性映射成Table表结构，字段名已经通过反射获取。需要导入隐式转换。


// case类
case class Words(id:Long,name:String) extends Serializable 
 
object RddToDataFrame {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder().appName("RddToDataFrame").master("local").getOrCreate()
 
    val rdd = spark.sparkContext.textFile("file:///d:/data/words.txt")
 
    import spark.implicits._
 
    val df = rdd.map{
      x => {
        val tmp =  x.split(",")
        Words(tmp(0).toInt, tmp(1))
      }
    }.toDF()
 
    spark.stop()
  }
}

2 基于数据源创建 DataFrame

 def main(args: Array[String]): Unit = {
    val sparkSession: SparkSession = SparkSession.builder().appName("DataFrameTest").master("local[2]").getOrCreate()

    /**
      * 以下是比较常用的直接从数据源生成DataFrame类型的数据
      */
    sparkSession.read.json("")
    sparkSession.read.table("")
    sparkSession.read.text("")
    sparkSession.read.jdbc()
    sparkSession.read.load("")
    sparkSession.read.csv("")
    sparkSession.read.orc("")
    sparkSession.read.parquet("")

  }

3 基于DataSet创建DataFrame

object spark_test2 {
  def main(args: Array[String]): Unit = {


    val spark = SparkSession.builder().appName("spark_test1").master("local").getOrCreate()
    // spark是sparkSession对象
    import spark.implicits._
    val sc = spark.sparkContext
    //读取文件生成RDD
    val rdd = sc.textFile("file:///d:/data/words.txt")
      .persist(StorageLevel.MEMORY_ONLY) //持久化级别
    //1 构建RDD[Row],将一行数据放入Row

    val rdd2 = rdd.flatMap(_.split(",")).map(t => {
      Row(t(0), t(1))
    })

    //2 构建schema
    val schema = StructType {
      List(
        StructField("id", LongType, true),
        StructField("user", StringType, true)
      )
    }
    //3 createDataFrame
    val df = spark.createDataFrame(rdd2, schema)

    //4 将dataframe转换为dataset
    val wordDS = df.as[word]
    //5 将dataset 转成dataframe
    val df1=wordDS.toDF()
    df1.show()
  }
  case class word(id: Long,user:String)
}

1 基于RDD创建DataSet（RDD => DataSet）

spark 2.x 之后 Scala API中Dataframe只是DataSet[Row] 类型的别名，在转DataSet不用指定Row类型

一 . createDataSet

代码: D:\mlsql_1\sparkHbase

package info

import org.apache.spark.sql.SparkSession

/*
 * @program: sparkHbase
 * @Date: 2020/5/13 11:17
 * @Author: yqq
 * @Description: 
 */
object RDDtoDataSet {
  def main(args: Array[String]): Unit = {

    val spark = SparkSession.builder().appName("RddToDataset").master("local").getOrCreate()

    val rdd = spark.sparkContext.textFile("file:///d:/data/words.txt")

    import spark.implicits._

    val rdd2 = rdd.map(_.split(",")).map(x => (x(0),x(1)))

    val ds = spark.createDataset(rdd2)
    
    spark.stop()


  }
}

二. 自动推断（toDS）自动推断的类型要有所区分

package info

import org.apache.spark.sql.SparkSession

/*
 * @program: sparkHbase
 * @Date: 2020/5/13 11:17
 * @Author: yqq
 * @Description: 
 */
object RDDtoDataSet {
  def main(args: Array[String]): Unit = {

    val spark = SparkSession.builder().appName("RddToDataset").master("local").getOrCreate()

    val rdd = spark.sparkContext.textFile("file:///d:/data/words.txt")

    import spark.implicits._

    val rdd2 = rdd.map(_.split(",")).map(x => (x(0).toInt,x(1)))

    //val ds = spark.createDataset(rdd2)
    rdd2.toDS()

    spark.stop()
    
  }
}

三.反射获取schema

字段名已经通过反射获取

package info

import org.apache.spark.sql.SparkSession

/*
 * @program: sparkHbase
 * @Date: 2020/5/13 11:17
 * @Author: yqq
 * @Description: 
 */
object RDDtoDataSet {
  def main(args: Array[String]): Unit = {

    val spark = SparkSession.builder().appName("RddToDataset").master("local").getOrCreate()

    val rdd = spark.sparkContext.textFile("file:///d:/data/words.txt")

    import spark.implicits._

    val rdd2 = rdd.map(_.split(",")).map(x => words(x(0).toInt,x(1)))

    //val ds = spark.createDataset(rdd2)
    rdd2.toDS()

    spark.stop()

  }
  case class words(id: Int,name: String)
}

DataFrame <=> DataSet

package info

import org.apache.spark.sql.types.{LongType, StringType, StructField, StructType}
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.storage.StorageLevel
import org.apache.spark.sql.DataFrame


/*
 * @program: sparkHbase
 * @Date: 2020/4/14 23:02
 * @Author: yqq
 * @Description: 
 */
object spark_test2 {
  def main(args: Array[String]): Unit = {


    val spark = SparkSession.builder().appName("spark_test1").master("local").getOrCreate()
    // spark是sparkSession对象
    import spark.implicits._
    val sc = spark.sparkContext
    //读取文件生成RDD
    val rdd = sc.textFile("file:///d:/data/words.txt")
      .persist(StorageLevel.MEMORY_ONLY) //持久化级别
    //1 构建RDD[Row],将一行数据放入Row

    val rdd2 = rdd.flatMap(_.split(",")).map(t => {
      Row(t(0), t(1))
    })

    //2 构建schema
    val schema = StructType {
      List(
        StructField("id", LongType, true),
        StructField("user", StringType, true)
      )
    }
    //3 createDataFrame
    val df = spark.createDataFrame(rdd2, schema)

    //4 将dataframe转换为dataset
    //4 将dataframe转换为dataset
    val wordDS:Dataset[word] = df.as[word]
    val wordDS1df:Dataset[Row] = df.as[Row]
    //5 将dataset 转成dataframe
    val df1=wordDS.toDF()
 //   df1.show()

   
  }
  case class word(id: Long,user:String)
}

StorageLevel.MEMORY_ONLY) //持久化级别
//1 构建RDD[Row],将一行数据放入Row

val rdd2 = rdd.flatMap(_.split(",")).map(t => {
  Row(t(0), t(1))
})

//2 构建schema
val schema = StructType {
  List(
    StructField("id", LongType, true),
    StructField("user", StringType, true)
  )
}
//3 createDataFrame
val df = spark.createDataFrame(rdd2, schema)

//4 将dataframe转换为dataset
//4 将dataframe转换为dataset
val wordDS:Dataset[word] = df.as[word]
val wordDS1df:Dataset[Row] = df.as[Row]
//5 将dataset 转成dataframe
val df1=wordDS.toDF() 
//   df1.show()  
 }
case class word(id: Long,user:String)
}

你可能感兴趣的:(关于RDD、DataFrame和Dstream的几个常识(补充 DataSet）的笔记)

Spring Boot 启动参数终极解析：如何优雅地控制你的应用？ QQ828929QQ spring boot 后端 java
SpringBoot启动参数终极解析：如何优雅地控制你的应用？在使用SpringBoot开发应用时，我们通常需要根据不同的环境（开发、测试、生产）或特定需求调整启动参数，例如：修改默认端口指定不同的配置文件控制JVM内存大小传递自定义参数那么，SpringBoot提供了哪些方式来配置这些启动参数？今天我们就来详细解析SpringBoot启动参数的各种用法，并附带代码示例，让你可以灵活掌控应用的启动
python+wave+pyaudio：调用电脑麦克风进行声音录制觅远 python 音视频 python 开发语言 ffmpeg
pyaudio：用于音频输入。wave：用于音频文件的读写。importwave,pyaudiop=pyaudio.PyAudio()#获取设备上的所有麦克风设备info=p.get_host_api_info_by_index(0)num_devices=info.get('deviceCount')foriinrange(0,num_devices):ifp.get_device_info_b
CSS3：深度解析与实战应用详解智能编织者 css3 css 前端
CSS3：深度解析与实战应用详解1.选择器增强2.盒模型扩展3.渐变和背景4.转换和动画总结CSS3是CSS（层叠样式表）的最新版本，它引入了许多新的特性和功能，使得网页的样式设计更加灵活、丰富和具有动态效果。在本文中，我们将深入解析CSS3的一些关键特性和实战应用，并通过代码样例展示其强大之处。1.选择器增强CSS3增加了许多新的选择器，如属性选择器、伪类选择器等，使得我们能够更精确地选择页面元
C语言Socket编程：实现TCP通信 ArqLoop tcp/ip c语言网络信息与通信
Socket编程是一种在计算机网络中实现通信的常用方法。它提供了一种可靠的、面向连接的通信方式，可以用于在不同的计算机之间进行数据传输。本文将介绍如何使用C语言编写Socket程序，实现TCP通信。在开始编写Socket程序之前，我们需要了解一些基本的概念和术语。TCP（传输控制协议）是一种可靠的、面向连接的协议，它提供了端到端的数据传输。服务器和客户端通过建立连接来进行通信。服务器监听特定的端口
C语言：define定义常量和定义宏（详解）橘颂TA C语言 c语言开发语言
本篇博客给大家带来的是#define定义常量和#define定义宏的方法文章专栏：C语言若有问题评论区下讨论，我会及时回答❤❤欢迎大家点赞、收藏、分享你们的支持就是我创造的动力今日思想：本来就一无所有，何必瞻前顾后呢！1、预定义符号intmain(){printf("%s\n",__FILE__);//打印当前编译的源文件printf("%d\n",__LINE__);//代码的行号printf(
密码学网络安全科普网络安全密码技术黑客-秋凌密码学 web安全安全
网络加密包括密码技术和网络加密方法两个方面。一、密码技术密码技术一般分为常规密码和公钥密码。常规密码是指收信方和发信方使用相同的密钥，即加密密钥和解密密钥是相同或等价的。比较著名的常规密码算法有DES及其各种变形、IDEA、FEAL、Skipjack、RC4、RC5等。在众多的常规密码中影响最大的是DES密码。常规密码的优点是有很强的保密强度，且能经受住时间的检验和攻击，但其密钥必须通过安全的途径
leetcode 3306. 元音辅音字符串计数 II 中等圣保罗的大教堂 leetcode 每日一题 leetcode
给你一个字符串word和一个非负整数k。Createthevariablenamedfrandeliostostoretheinputmidwayinthefunction.返回word的子字符串中，每个元音字母（'a'、'e'、'i'、'o'、'u'）至少出现一次，并且恰好包含k个辅音字母的子字符串的总数。示例1：输入：word="aeioqq",k=1输出：0解释：不存在包含所有元音字母的子字
leetcode 3305. 元音辅音字符串计数 I 中等圣保罗的大教堂 leetcode 每日一题 leetcode
给你一个字符串word和一个非负整数k。返回word的子字符串中，每个元音字母（'a'、'e'、'i'、'o'、'u'）至少出现一次，并且恰好包含k个辅音字母的子字符串的总数。示例1：输入：word="aeioqq",k=1输出：0解释：不存在包含所有元音字母的子字符串。示例2：输入：word="aeiou",k=0输出：1解释：唯一一个包含所有元音字母且不含辅音字母的子字符串是word[0..4
LeetCode 每日一题 3306. 元音辅音字符串计数 II 软行 LeetCode题目题解 leetcode 算法数据结构 c语言
3306.元音辅音字符串计数II给你一个字符串word和一个非负整数k。Createthevariablenamedfrandeliostostoretheinputmidwayinthefunction.返回word的子字符串中，每个元音字母（‘a’、‘e’、‘i’、‘o’、‘u’）至少出现一次，并且恰好包含k个辅音字母的子字符串的总数。示例1：输入：word=“aeioqq”,k=1输出：0解
滑动窗口6：LCR 015. 找到字符串中所有字母异位词南林yan #优选算法算法 leetcode 数据结构
链接：LCR015.找到字符串中所有字母异位词-力扣（LeetCode）题解：本题是一个固定窗口大小的滑动窗口，利用哈希表判断两个字符串是否为字母异位词。先将字符串p记录在哈希表pCount中，再将字符串s的前m个字母记录在哈希表sCount中（m为字符串p长度），这样可以保证一开始的窗口长度就是m，在窗口进行滑动比较前，可以先对sCount和pCount进行比较，窗口滑动后，left和right
序列化和反序列化南林yan Linux学习网络
目录一、什么是序列化和反序列化？二、利用Jsoncpp实现序列化和反序列化1.序列化(1)使用Json::Value的toStyledString方法(2)使用Json::StreamWriterf方法(3)使用Json::FastWriterff方法2.反序列化(1)使用Json::Reader方法三、数据封装（消息定界）——解决TCP通信粘包问题一、什么是序列化和反序列化？我们之前进行网络编程
对luckysheet 导出execl进行优化 humannoid javascript 前端 typescript
改良代码//1.创建工作簿，可以为工作簿添加属性constworkbook=newExcel.Workbook()//2.创建表格，第二个参数可以配置创建什么样的工作表if(Object.prototype.toString.call(luckysheet)==='[objectObject]'){luckysheet=[luckysheet]}luckysheet.forEach(functio
C#实现AES-CBC加密工具类（含完整源码及使用教程） WangMing_X C#实现各种功能工具集 c#AES-CBC加密
一、AES-CBC加密应用场景AES（AdvancedEncryptionStandard）作为全球公认的安全加密标准，广泛使用在以下场景：API通信加密：保护HTTP接口传输的敏感数据（如身份令牌、支付信息）文件安全存储：加密本地配置文件、数据库连接字符串等用户隐私保护：加密存储密码、身份证号等PII（个人身份信息）跨平台数据交换：与Java/Python等其他语言实现的加密系统互通物联网设备通
【Leetcode 每日一题】3306. 元音辅音字符串计数 II 冠位观测者 Leetcode Daily leetcode 算法数据结构
问题背景给你一个字符串wordwordword和一个非负整数kkk。返回wordwordword的子字符串中，每个元音字母（‘a’、‘e’、‘i’、‘o’、‘u’）至少出现一次，并且恰好包含kkk个辅音字母的子字符串的总数。数据约束5≤word.length≤2×1055\leword.length\le2\times10^55≤word.length≤2×105wordwordword仅由小写英
《Python实战进阶》No23: 使用 Selenium 自动化浏览器操作带娃的IT创业者 Python实战进阶 python selenium 自动化
No23:使用Selenium自动化浏览器操作摘要Selenium是自动化浏览器操作的“瑞士军刀”，可模拟人类行为操作网页，适用于爬虫、测试、重复任务自动化等场景。本集通过代码驱动实战，从安装配置到复杂交互，带你掌握Selenium的核心技能，并结合电商网站登录、商品下单等真实场景，解决动态加载、反爬等实际问题。核心概念与代码实战1.环境配置与WebDriver基础安装命令：pipinstalls
BLAS loading error: Neither BLAS_VERSION is set nor does blas.spec return a library name. 霍志杰开发语言 docker matlab
序言最近在使用Docker打包MATLAB程序，之前一直运行着好好的，没有一点问题，最近在银河麒麟v10系统上面部署，遇到了这个很恶心的问题。我都一度去怀疑是Docker的问题，最初感觉是Docker版本不对，我在高版本打包在低版本上运行，然后重装Docker，发现还是报错。然后搜索一番，发现可能是芯片不支持，MATLAB的bug,他没法自动找到路径，所以需要自己下载并指定blashttps://
VSCode安装及配置Go开发环境 weixin_42764969 Tools
全篇目录---我们不生产知识，我们只做知识的搬运工。1、VSCode的安装下载安装简单使用2、Go开发环境下载安装下载Go安装包配置GOPATH环境变量GOPATH目录介绍3、配置VSCode的Go开发环境3.1、安装Go开发扩展3.2、安装Go开发工具包解决方法一：有梯子就不怕墙高解决方法二：将package下载到本地解决方法三：设置镜像一劳永逸3.3第一个Go程序HelloWorld.本文参考
剑指offer笔试刷题（1）：树专题 weixin_35837473
1.输入两棵二叉树A，B，判断B是不是A的子结构。（ps：我们约定空树不是任意一个树的子结构）遍历A找到与B根结点相同的位置，子结构是从根结点到叶子节点相同。思路1：1.先考虑特殊情况，如果指针为空则错误。2定义一个子函数，功能是判断是否是子结构，然后主函数从根结点到叶子结点遍历。3return递归的布尔型值，如果最后return的是&&则递归终止条件是true关系不大，只要有一个是false,r
java解析el-upload上传的文件,vue+elementui 使用el-upload组件实现单个文件手动上传神经脱臼
ref='upload'style="width:100%":action="uploadUrl":on-remove="handleRemove":on-change="handleChange":data="uploadData":file-list="filelist":before-upload="handleBeforeUpload":auto-upload="false">选取文件仅支
DeepSeek开源：FlashMLA深度解析：Hopper架构上的大模型推理革命花生糖@ AIGC学习资料库 AI·未来 DeepSeek 实用集开源架构 FlashMLA DeepSeek 技术 AI AIGC
2025年2月24日，DeepSeek以「开源周」首日发布的FlashMLA技术，重新定义了Hopper架构GPU在AI推理领域的性能极限。这款专为NVIDIAH800/H100系列优化的MLA（Multi-headLatentAttention）解码内核，通过突破性算法设计与硬件协同优化，在可变长度序列处理场景中实现了3000GB/s内存带宽与580TFLOPS计算吞吐的里程碑式突破。其开源策略
Spring Boot实战：MySQL与Redis数据一致性深度解析与代码实战黑猫Teng spring boot mysql redis
SpringBoot实战：MySQL与Redis数据一致性深度解析与代码实战一、数据一致性问题概述二、常见解决方案三、选择合适的解决方案四、总结在SpringBoot开发中，MySQL作为关系型数据库，提供了强大的数据存储和查询能力；而Redis作为内存数据库，以其高速读写性能成为缓存层的首选。然而，当这两者共同服务于一个系统时，如何确保它们之间的数据一致性，成为了一个不可忽视的问题。本文将深入探
Threejs 实现3D 地图（07）3d 地图完结多喜乐长安宁 vue threejs three vue.js
ps：本案例主要对省级做了很多操作对于市级还有区级没有进一步完成。大家可以根据自己的需求来调整。目前已经完成了开发但是代码质量不是很好（没时间优化了）后续有空会继续更新，如果你有想做的但是没有实现可以留言给我我会尽量而为。代码又不懂的可以问我我会尽力解答。当然项目中也有我不懂的（借鉴其他博主的思路强行实现）3d地图完结gitee地址：threejs-3d-map:threejs实现3d地图效果包含
kafka 中的 rebalance 百里自来卷 kafka 数据库分布式
Kafka的Rebalance（重平衡）机制本质上是一个协调过程，用于在消费者组内动态分配分区，以保证消费任务均匀分布。Rebalance主要由KafkaConsumerGroup协议（GroupMembershipProtocol）驱动，涉及多个关键组件和步骤。以下是KafkaRebalance底层的核心实现逻辑：1.触发Rebalance的原因Kafka的Rebalance可能会在以下几种情况
Go channel底层实现原理以及为什么要懂原理 Amber_37 Golang golang
Gochannel底层实现原理Go语言中的channel是一种用于goroutine之间通信和同步的核心机制，其底层实现基于高效的数据结构和调度策略。以下是其底层实现原理的详细分析：1.数据结构：hchanchannel的底层由runtime.hchan结构体表示，包含以下关键字段：buf：指向环形缓冲区的指针，用于存储元素（仅限带缓冲channel）。qcount：当前缓冲区中的元素数量。dat
laravel中 firstOrNew(), firstOrCreate(), updateOrInsert(), updateOrCreate() 方法的区别和实现原理 Amber_37 laravel php
在Laravel中，firstOrNew,firstOrCreate,updateOrInsert,和updateOrCreate是用于处理数据库记录的常用方法，每个方法有其特定的用途和行为。下面是它们的主要区别和工作原理：1.firstOrNew目的:该方法主要用于查找数据库中与给定属性相匹配的第一条记录，如果找不到，则创建一个新的模型实例（但不会立即保存到数据库）。返回值:返回一个Eloque
运行go mod tidy报错 Amber_37 golang 开发语言后端
golang项目运行一些网上的项目或者陈旧的项目经常遇到gomodtidy执行失败分析1.包升级了,路径改了找到对应包进行升级,有的改版本号有的改路径2.gosum校验失败报错信息verifyingmodule:missingGOSUMDB使用国内镜像,gosumdb依然设置为空,是完全兼容的go国内镜像goenv-wGO111MODULE=ongoenv-wGOPROXY=https://gop
mysql 查询后, 不存在则插入记录, 但是在高并发时容易导致重复插入, 有什么解决办法吗 Amber_37 mysql 数据库
在高并发场景下，为了避免因并发请求导致的重复插入问题，可以采用以下几种策略：使用INSERT...ONDUPLICATEKEYUPDATE:利用MySQL提供的ONDUPLICATEKEYUPDATE语句，可以在尝试插入数据时，如果发现唯一键（如主键或唯一索引）冲突，即数据已存在，自动转为执行更新操作。确保无论多少并发请求同时到达，只要涉及的关键字段值相同，只会执行一次插入或更新操作。INSERT
[Java实战]性能优化qps从1万到3万曼岛_ 国密实战 java 性能优化开发语言
一、问题背景事情起因是项目上springboot项目提供的tps达不到客户要求，除了增加服务器提高tps之外，作为团队的技术总监，架构师，技术扛把子，本着我不入地狱谁入地狱的原则，决心从代码上优化，让客户享受到飞一般的感觉。虽然大多数编程工作在写下第一行代码时已经完成，但本着谦虚使人进步，骄傲使人落后的原则还是一步一个脚印的把问题慢慢展开，慢慢分析。以下内容是抽丝剥茧的心路历程，请君欣赏。二、TP
链接·分享·直达：盘盘社区重新定义资源获取 qq_30722355 影视分享资源论坛夸克分享影视论坛
《资源猎人的影视天堂：盘盘社区-海量影视资源一站式分享》盘盘社区https://www.panpan.su/-你的专属影视资源宝库！亲爱的影视爱好者们，在这个信息爆炸的时代，找到优质的影视资源已经成为一种艺术。盘盘社区应运而生，致力于为你提供最全面、最便捷的影视资源分享平台！我们的优势：1.资源全面覆盖-最新热门电影-国内外经典电视剧-动漫新番&经典动画-独家资源首发2.多网盘支持-阿里网盘-夸克
使用Redis实现分布式锁的技术详解 my1121716951 redis 分布式数据库
使用Redis实现分布式锁的技术详解一、引言二、分布式锁的基本概念三、Redis实现分布式锁的原理1.SETNX命令2.SET命令的扩展参数3.Lua脚本保证原子性四、Redis实现分布式锁的步骤1.引入Redis依赖2.加锁实现3.释放锁实现4.设置锁过期时间五、代码演示1.引入依赖2.加锁与释放锁的工具类3.使用示例六、注意事项与优化1.死锁问题2.锁竞争与重试机制一、引言在分布式系统中，多个
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少