Rinnki

[Scala学习笔记] Spark开发小笔记

Spark开发小笔记：从0开始的Spark建图生活
持续更新中……

0.开发平台Zeppelin

支持多种语言，默认是scala(背后是spark shell)，SparkSQL, Markdown 和 Shell。
是一个基于web的笔记本，支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。

1.RDD

Spark里的计算都是操作RDD进行，那么学习RDD的第一个问题就是如何构建RDD，构建RDD从数据来源角度分为两类：第一类是从内存里直接读取数据，第二类就是从文件系统里读取，当然这里的文件系统种类很多常见的就是HDFS以及本地文件系统了。

/* 使用makeRDD创建RDD */
val rdd01 = sc.makeRDD(List(1,2,3,4,5,6))
val r01 = rdd01.map { x => x * x }
println(r01.collect().mkString(","))
/*通过文件系统构造RDD*/
val rdd:RDD[String] = sc.textFile("file:///D:/sparkdata.txt", 1)
val r:RDD[String] = rdd.flatMap { x => x.split(",") }
println(r.collect().mkString(","))
/*通过调用SparkContext的parallelize方法，
在一个已经存在的Scala集合上创建的（一个Seq对象）。
集合的对象将会被拷贝，创建出一个可以被并行操作的分布式数据集。*/
data = [1, 2, 3, 4, 5]  
distData = sc.parallelize(data)  
/*一旦分布式数据集（distData）被创建好，它们将可以被并行操作。*/
/*并行集合的一个重要参数是slices，表示数据集切分的份数。
Spark将会在集群上为每一份数据起一个任务。典型地，你可以
在集群的每个CPU上分布2-4个slices. 一般来说，Spark会尝
试根据集群的状况，来自动设定slices的数目。然而，你也可以
通过传递给parallelize的第二个参数来进行手动设置。*/

RDD的操作分为转化操作（transformation）和行动操作（action），RDD之所以将操作分成这两类这是和RDD惰性运算有关，当RDD执行转化操作时候，实际计算并没有被执行，只有当RDD执行行动操作时候才会促发计算任务提交，执行相应的计算操作。区别转化操作和行动操作也非常简单，转化操作就是从一个RDD产生一个新的RDD操作，而行动操作就是进行实际的计算。

2.import

Hive + sql(数据类型) + 参数配置(SparkConf, SparkContext)

import org.apache.spark.sql.hive.HiveContext
import org.apache.spark.sql._
import org.apache.spark.{SparkConf, SparkContext}

为了让Spark能够访问Hive，必须为Spark添加Hive支持。Spark官方提供的预编译版本，通常是不包含Hive支持的，需要采用源码编译，编译得到一个包含Hive支持的Spark版本。
Spark的所有数据类型都定义在包org.apache.spark.sql中，你可以通过import org.apache.spark.sql._访问它们。
每个Spark程序都是需要导入SparkContext的. SparkContext使得Spark驱动的程序access the cluster through a resource manager(YARN, or Spark’s cluster manager)。为了建立SparkContext首先需要创建SparkConf.SparkConf存储构造器参数，这些参数将由你编写的程序传入SparkContext。
'. _ '用于隐式导入包中全部内容

3.package

package定义: 文件顶部package定义

package com.sunny.scala.service

package特性：

同一个包定义，可以在不同的scala源文件中的; 一个scala源文件内，可以包含两个包。
子包中的类，可以访问父包中的类。
相对包名与绝对包名，使用_root_，引用绝对包名。

4.class，Object，Trait区别

class：在scala中，类名可以和对象名为同一个名字，该对象称为该类的伴生对象，类和伴生对象可以相互访问他们的私有属性，但是他们必须在同一个源文件内。类只会被编译，不能直接被执行，类的申明和主构造器在一起被申明，在一个类中，主构造器只有一个所有必须在内部申明主构造器或者是其他申明主构造器的辅构造器，主构造器会执行类定义中的所有语句。scala对每个字段都会提供getter和setter方法，同时也可以显示的申明，但是针对val类型，只提供getter方法，默认情况下，字段为公有类型，可以在setter方法中增加限制条件来限定变量的变化范围，在scala中方法可以访问改类所有对象的私有字段。
object：在scala中没有静态方法和静态字段，所以在scala中可以用object来实现这些功能，直接用对象名调用的方法都是采用这种实现方式，例如Array.toString。对象的构造器在第一次使用的时候会被调用，如果一个对象从未被使用，那么他的构造器也不会被执行；对象本质上拥有类（scala中）的所有特性，除此之外，object还可以一扩展类以及一个或者多个特质：例如，
abstract class ClassName（val parameter）{}
object Test extends ClassName(val parameter){}
注意：object不能提供构造器参数，也就是说object必须是无参的
trait：在java中可以通过interface实现多重继承，在Scala中可以通过特征（trait）实现多重继承，不过与java不同的是，它可以定义自己的属性和实现方法体，在没有自己的实现方法体时可以认为它时java interface是等价的，在Scala中也是一般只能继承一个父类，可以通过多个with进行多重继承。
trait TraitA{}
trait TraitB{}
trait TraitC{}
object Test1 extends TraitA with TraitB with TraitC{}

5.初始化配置

object GenGraph {
    def main(args: Array[String]) {
        /** 初始化配置 */
		val conf = new SparkConf().setAppName("example")
        val sc = new SparkContext(conf)
        val sqlContext = new HiveContext(sc)

6.创建字段结构并添加描述

val vertexSchema = new StructType()
            .add("p_id", LongType)
            .add("label_id", LongType)

StructType(fields):表示一个拥有StructFields (fields)序列结构的值，StructType(fields) ，注意fields是一个StructField序列，相同名字的两个StructField不被允许。
StructField(name, dataType, nullable):代表StructType中的一个字段，字段的名字通过name指定，dataType指定field的数据类型，nullable表示字段的值是否有null值。StructField(name, dataType, nullable)。

7. HashMap

import scala.collection.mutable.HashMap

/**Initializing*/
/**3元素法*/
val hashMap1: HashMap[String, String] = HashMap(("PD","Plain Donut"),("SD","Strawberry Donut"),("CD","Chocolate Donut"))
/**key->value法*/
val hashMap2: HashMap[String, String] = HashMap("VD"-> "Vanilla Donut", "GD" -> "Glazed Donut")
/**EMPTY ONE*/
val emptyMap: HashMap[String,String] = HashMap.empty[String,String]

/**Access*/
println(s"Element by key VD = ${hashMap2("VD")}")
hashMap1 += ("KD" -> "Krispy Kreme Donut") 
hashMap1 -= "CD"/**加减元素*/
hashMap1 ++= hashMap2 /**一个hashMap加到另一个上*/

8.定义函数

/**规范化写法,scala函数的返回值是最后一行代码*/
def addInt(a:Int,b:Int) : Int = {
	var total : Int = a + b
	return total
	}
/**Unit，是Scala语言中数据类型的一种，表示无值,用作不返回任何结果的方法*/
def returnUnit(): Unit = {
	println("shows!")
	}
/**不写明返回值的类型，程序会自行判断，最后一行代码的执行结果为返回值*/
def addInt(a:Int,b:Int) = {
	a+b
	}
/**只有一行的写法*/
def addInt (a:Int,b:Int) = x + y
/**最简单写法：def ,{ },返回值都可以省略，此方法在spark编程中经常使用。*/
val addInt = (x: Int,y: Int) => x + y

9.条件判断和循环

for循环：是不断的循环一个集合，然后for循环后面的{}代码块部分会根据for循环()里面提取的集合的item来作为{}的输入进行流程控制。

for循环中加入的if叫做条件守卫，用于限制for循环，
想跳出for循环，除了加入if守卫以外，还可以使用return关键字

for(i<-0 to 5 if i==5){
    println(i)
    }

10.sql取数文本

val sql=
        """
           |select user_id,
           |       user_type,
           |       city_id,
           |       bank_type,
           |       edge_weight,
           |       edge_count
           |  from $sourceTable
           | where datekey = $datekey
        """.stripMargin

11.match-case模式匹配

match到的case即进行对应case的操作：

def getSalary(name:String,age:Int){
	name match{
	//从前往后匹配
	case "Spark"=>println("$150000/year")
	case "Hadoop"=>println("$100000/year")
	//加入判断条件(用变量接受参数)
	case _name if age>=5 =>println(name+":"+age+" $140000/year")
	case _  =>println("$90000/year")//都不匹配时
	}
	}
	//对类型进行匹配
def getMatchType(msg:Any){
	msg match{
	case i : Int=>println("Integer")
	case s : String=>println("String")
	case d : Double=>println("Double")
	case _=>println("Unknow type")
	}
	}

12.map()和flatMap()

map()将原数据的每个元素传给函数func进行格式化，返回一个新的分布式数据集。
flatMap(func)跟map(func)类似，但是每个输入项可成为0个或多个输出项(所以func函数应该返回的是一个序列化的数据而不是单个数据项)。flatMap(func)也会对每一条输入进行执行的func操作，然后每一条输入返回一个对象，但是最后会将所有的对象再合成为一个对象。
map返回的数据对象的个数和原来的输入数据是相同的，而flatMap返回的个数则是不同的。

var mapResult = textFile.map(line => line.split("\\s+"))

13. parse()

13.1 java.text.SimpleDateFormat的parse()

import java.text.SimpleDateFormat
val simpleDateFormat = new SimpleDateFormat("yyyyMMdd")
val date = simpleDateFormat.parse(datekey);

*容易踩坑注目
Q1:Date formats 是线程不安全的。推荐为每个线程创建单独的format实例。如果多线程并发访问同一个format实例，必须加同步操作，正确写法如下：

class DateUtils {
    public static SimpleDateFormat format = new SimpleDateFormat("yyyy-MM-dd HH:mm");
    private static final Object LOCK = new Object();
    // OK
    public Date parseString(String datetime) throws Exception {
        synchronized (LOCK) {
            return format.parse(datetime);
        }
    }
    // OK
    public Date parseStringV2(String datetime) throws Exception {
        SimpleDateFormat format = new SimpleDateFormat("yyyy-MM-dd HH:mm");
        return format.parse(datetime);
    }
}

Q2：在很多时候程序使用SimpleDateFormat都能正常执行，并不会报错；但有时发现日志出现java.text.ParseException: Unparseable date: "2017-03-20 02:10"异常，为什么还抛出这种异常呢？
当使用format方法将Date转成String时，SimpleDateFormat可实例化为任意期望的时间格式；但是使用parse方法将String转为Date时，SimpleDateFormat定义的格式与参数String的格式必须完全一致，不然就会出现Unparseable date。

14.字符串插值

字符串插值允许使用者将变量引用直接插入处理过的字面字符中。编译器会对它做额外的工作。待处理字符串字面通过“号前的字符来标示。

def getHeterEdgeSql(sourceTable:String, datekey: Int) :String=
        s"""
           |select user_id,
           |  from $sourceTable
           | where datekey = $datekey
        """.stripMargin

Scala 提供了三种创新的字符串插值方法：s,f 和 raw:

在任何字符串前加上s，就可以直接在串中使用变量了。
字符串插值器也可以处理任意的表达式:

println(s"1+1=${1+1}") /*将会输出字符串1+1=2。*/

在任何字符串字面前加上 f，就可以生成简单的格式化串，功能相似于其他语言中的 printf 函数。当使用 f 插值器的时候，所有的变量引用都应当后跟一个printf-style格式的字符串，如%d。f 插值器利用了java中的字符串数据格式。这种以%开头的格式在 [Formatter javadoc] 中有相关概述。如果在具体变量后没有%，则格式化程序默认使用 %s（串型）格式。

val height=1.9d
val name="James"
println(f"$name%s is $height%2.2f meters tall")
/*James is 1.90 meters tall f 插值器是类型安全的。*/
/*如果试图向只支持 int 的格式化串传入一个double 值，编译器则会报错.*/
val height:Double=1.9d

除了对字面值中的字符不做编码外，raw 插值器与 s 插值器在功能上是相同的。

s"a\nb"
res0:String=
a
b 
/*这里，s 插值器用回车代替了\n。而raw插值器却不会如此处理。*/
raw"a\nb"
res1:String=a\nb /*当不想输入\n被转换为回车的时候，raw 插值器是非常实用的。*/

spark图计算GraphX

GraphX的核心抽象是Resilient Distributed Property Graph，一种点和边都带属性的有向多重图。它扩展了Spark RDD的抽象，有Table和Graph两种视图，而只需要一份物理存储。两种视图都有自己独有的操作符，从而获得了灵活操作和执行效率。
对Graph视图的所有操作，最终都会转换成其关联的Table视图的RDD操作来完成。这样对一个图的计算，最终在逻辑上，等价于一系列RDD的转换过程。因此，Graph最终具备了RDD的3个关键特性：Immutable、Distributed和Fault-Tolerant，其中最关键的是Immutable（不变性）。逻辑上，所有图的转换和操作都产生了一个新图；物理上，GraphX会有一定程度的不变顶点和边的复用优化，对用户透明。

*.override in Scala

override是覆盖的意思，在很多语言中都有，在scala中，override是非常常见的。
当一个类extends另外一个类的时候，override的规则基本如下：

子类中的方法要覆盖父类中的方法，必须写override。
子类中的属性val要覆盖父类中的属性，必须写override。
父类中的变量不可以覆盖。

多线程同步机制：深入解析互斥锁的原理与实践码事漫谈 c++java jvm 数据结构
文章目录1.多线程同步问题1.1数据竞争1.2未定义行为2.互斥锁（Mutex）的原理2.1加锁2.2解锁3.线程的运行、阻塞、等待状态3.1运行状态（Running）3.2阻塞状态（Blocked）3.3等待状态（Waiting）3.4状态转换流程图图的解释4.C++中的`std::mutex`4.1使用`std::mutex`4.2`std::lock_guard`5.总结在多线程编程中，同步
PyEcharts教程（009）：PyEcharts绘制水球图文理棵 Python数据分析 python 信息可视化数据分析 PyEcharts
文章目录1、什么是水球图2、水球图示例：任务完成度1、什么是水球图水球图（Liquidchart）是PyECharts提供的一种非常形象的图表类型，适合展示百分比类指标，如健康评分、任务完成度、系统利用率等，水位高度越高表示数值越大，图形本身看起来像一个装水的圆球，非常直观。2、水球图示例：任务完成度1️⃣实现代码：frompyechartsimportoptionsasoptsfrompyech
AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
Python商务数据分析——Matplotlib 数据可视化学习笔记爱吃代码的小皇冠 python numpy matplotlib pandas 学习笔记数据分析
一、Matplotlib基础认知1.1库功能与定位核心作用：将数据可视化展示，提升数据直观性与说服力应用场景：绘制折线图、饼图、柱状图等2D/3D图表双接口模式：MATLAB风格：通过pyplot函数快速绘图（自动管理图形对象）面向对象：显式创建Figure和Axes对象（适合复杂绘图）1.2核心对象架构容器类：图(Figure)、坐标系(Axes)、坐标轴(Axis)、刻度(Tick)基础类：线
PCIe学习笔记（26） IC纯小白学习笔记网络
ErrorForwarding（错误转发）错误转发(也称为数据中毒)，通过设置EP位表示。下面是一些使用错误转发的例子:•例#1:从主存读取遇到不可纠正的错误•例#2:PCI写到主存的奇偶校验错误•例#3:内部数据缓冲区或缓存上的数据完整性错误错误转发使用模型•错误转发仅用于读取完成数据，AtomicOp完成数据，AtomicOp请求数据或写数据，从不用于错误在“头”(请求阶段，地址/命令等)的情
SapphireRapids NVMe Aggregate Performance with灵活IO测试--学习笔记（二）向阳生活学习笔记网络
4.主机系统配置由于NVMe控制器使用队列和数据缓冲区，这些队列和数据缓冲区可以托管在主机系统内存空间的任何位置，因此假设主机系统具有足够的内存容量和内存带宽来同时处理多个NVMe访问，以避免受到内存带宽限制。主机系统是Sapphire-Rapid2S系统，每个插槽上配置了8个DDR564GB,1DPC,运行在每个插槽上的速度为4800MTS（例如，共1TB内存容量）。4.1根端口的硬盘数量Sap
Linux学习笔记：PCIe内核篇（1）：初始化与枚举流程 ZH_2025 嵌入式协议篇 PCIE
根据system.map查看内核中PCIe加载流程：root@zh-vm:~#cat/boot/System.map-5.15.0-130-generic|greppci|grepinitcallffffffff8350ff68d__initcall__kmod_pci__453_6907_pci_realloc_setup_params0ffffffff83510098d__initcall__
UBOOT学习笔记（六）：UBOOT启动--CPU架构及板级初始化阶段 ZH_2025 uboot &linux启动篇 linux arm
3.1、_mainENTRY(_main)#ifdefined(CONFIG_TPL_BUILD)&&defined(CONFIG_TPL_NEEDS_SEPARATE_STACK)ldrr0,=(CONFIG_TPL_STACK)/*TPL（三级引导）使用独立栈*/#elifdefined(CONFIG_SPL_BUILD)&&defined(CONFIG_SPL_STACK)ldrr0,=(C
SpreadJS 迷你图：数据趋势可视化的利器 spreadjs
引言在数据处理和分析领域，直观地展示数据趋势对于理解数据和做出决策至关重要。迷你图作为一种简洁而有效的数据可视化方式，在显示数据趋势方面发挥着重要作用，尤其在与他人共享数据时，能够快速传达关键信息。SpreadJS作为一款强大的电子表格组件，对迷你图功能提供了丰富的支持。本文将详细介绍SpreadJS迷你图的特点、优势、创建方式以及与GcExcel的兼容情况。迷你图的概述与作用迷你图是单个工作表单
鸿蒙(HarmonyOS)应用开发实战——自定义安全键盘案例 CTrup HarmonyOS 移动开发鸿蒙开发 harmonyos 安全音视频移动开发鸿蒙开发组件化
往期知识点整理鸿蒙（HarmonyOS）北向开发知识点记录~被裁员后，踏上了鸿蒙开发求职之路持续更新中……介绍金融类应用在密码输入时，一般会使用自定义安全键盘。本示例介绍如何使用TextInput组件实现自定义安全键盘场景，主要包括TextInput.customKeyboard绑定自定义键盘、自定义键盘布局和状态更新等知识点。效果图预览实现思路1.使用TextInput的customKeyboa
遥感影像数据处理-大图滑窗切分为小图 GIS潮流遥感语义分割
功能需求据所周知，遥感影像的尺寸有大有小，大的达到几万x几万像素，而图像分割算法模型在训练中尺寸适中，比如256x256，512x512，1024x1024等等，如果直接将遥感影像的原图输入模型中进行训练，大概率会提示内存和显存不足，因此针对遥感影像的模型训练，一般都需要将影像裁剪为小图。裁剪后的效果图如下：解决思路基于上面的需求，写了一套裁剪算法流程。主要考虑的是在裁剪过程中，从左往右、从上到下
Python 数据分析：numpy，抽提，基本索引。听故事学知识点怎么这么容易？好开心啊没烦恼 numpy python 数据分析 numpy 开发语言数据挖掘人工智能机器学习
目录1示例代码2欢迎纠错3免费爬虫------以下关于Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导
ZLG嵌入式笔记 | 工业现场掉电，系统异常如何破解？ ZLG 致远电子边缘计算 ZLG嵌入式开发应用笔记嵌入式硬件
在工业现场，设备常因掉电导致文件系统损坏或数据丢失。本文将介绍如何通过硬件和系统设计优化，解决这一问题，提升设备稳定性。前言在工业应用现场，不可避免会出现异常掉电或者一些偶发性频繁上下电的情况，这样对系统是有非常大的影响的，特别是写数据过程中发生了掉电，可能会引发下列异常：引起文件系统损坏或者系统异常；数据丢失，带来经济损失。这是非常典型的产品运行过程中有写数据操作，但数据
ZLG嵌入式笔记 | rootfs镜像制作其实没那么难 ZLG 致远电子边缘计算 ZLG嵌入式开发应用笔记个人开发物联网
在嵌入式Linux开发中，文件系统的打包和镜像制作是关键步骤。本文介绍了Linux核心板文件系统的打包与镜像制作方法，适合嵌入式开发人员快速上手。前言致远电子Linux核心板提供的系统固件里，除了镜像文件之外，通常还会提供文件系统压缩包。镜像文件可以直接用于烧写到目标板，而文件系统压缩包则可以进行部分修改，修改后重新制作镜像文件烧写。这里只讲直接用编译好的二进制文件对文件系
疏通经脉: Bridge 联通逻辑层和渲染层风铃喵游从零搭建小程序框架架构前端小程序架构
本节概述经过前面两节的开发，我们已经完成了小程序逻辑线程和UI线程的启动引擎准备，这节开始，我们将完善nativebridge层的搭建，构建起逻辑线程和UI线程之间的桥梁。开始之前我们先来回顾一下逻辑引擎小节相关的流程图:一次小程序的启动过程，我们在创建好小程序的逻辑引擎worker和绘制引擎webview之后，从启动到渲染依次会经过:通知webview加载小程序资源，如果是首次启动，还需要通知逻
逻辑引擎：执行小程序JS代码风铃喵游从零搭建小程序框架架构小程序前端架构
本节概述上小节我们完成了基础的小程序双线程架构的搭建，我们通过Worker启动了一个逻辑线程用于执行小程序JS代码，使用iFrame创建了一个UI线程，用于渲染小程序的页面；这节开始我们将分别针对双线程的具体逻辑进行实现，本节我们先从逻辑线程入手，看看JS代码是如何在Worker线程内运行的；开始之前，我们先通过一个图来看看小程序启动过程，双线程之间的通信流程:从图上可以看到，小程序的启动分别由逻
基于django+Spark+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等) 阿勇学长大数据项目实战案例 Java精品毕业设计实例 Python数据可视化项目案例大数据 django spark 国漫推荐与可视化平台毕业设计 Java
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
FOC学习笔记（3）结构性凸极与饱和性凸极的区别及其在无感FOC中的影响 desssq FOC记录笔记单片机嵌入式硬件 foc算法
电机凸极性(Saliency)是指由于转子磁路不对称性导致的直轴(d轴)和交轴(q轴)磁阻或电感存在差异的特性。这种不对称性表现为d轴(与转子永磁体磁场方向一致)磁阻通常较大(电感较小)，而与之正交的q轴磁阻通常较小(电感较大)。凸极性是无位置传感器控制(特别是高频注入法)实现转子位置估算的关键物理基础，尤其在零速和低速工况下至关重要。凸极性主要来源于两种机制：结构性凸极和饱和性凸极。结构性凸极是
物联网嵌入式硬件开发管理指南（超详细版）：基于三种外包方式的三阶段策略 Hy行者勇哥绿色智造 ·产品设计与管理物联网嵌入式硬件 struts
目录摘要1.引言2.物联网嵌入式硬件开发概述3.软硬件工作边界与技术细节3.1硬件工作内容与技术细节需求分析：原理图设计：PCB设计：样机制造：硬件测试：量产支持：3.2软件工作内容与技术细节固件开发：通信协议：应用逻辑：软件测试：软硬件集成：3.3软硬件交互与物联网特性4.三阶段外包策略规划（三种方式）4.1阶段一：技术顾问外包4.2阶段二：部分开发外包4.3阶段三：独立开发外包5.非专业管理者
学习笔记2：redis基本操作
学习笔记2：redis基本操作启动服务在命令行中输入以下指令即可启动redis服务：[redis-server文件的路径][redis.conf文件的路径]进入客户端在命令行中输入以下指令即可进入操作redis的客户端：[redis-cli文件的路径]常用操作redis服务的指令#启动redis服务systemctlstartredis#重启redis服务systemctlrestartredis
【笔记】DIDs 去中心化身份的相关名词释义 m0_47843842 去中心化
Authenticate身份验证是一个过程（通常是某种类型的协议），通过该过程，实体可以使用一种或多种验证方法证明其具有特定属性或掌控特定秘密。对于DID，一个常见的例子是证明对与DID文档中发布的公钥相关联的私钥的控制。Decentralizedidentifier(DID)不需要中心注册机构的全球唯一持久标识符，因为它是通过加密方式生成和/或注册的。DID的通用格式在DID核心规范[DID-C
ECDSA数字签名
ECDSA算法（深入浅出密码学笔记）ECDSA标准中的步骤与DSA方案的步骤在概念上紧密相连，但ECDSA中的离散对数问题是在椭圆曲线群中构建起来的。因此，实际计算一个ECDSA签名所执行的算术运算与DSA中的完全不同。ECDSA标准是针对素数域Zp\mathbb{Z}_pZp和有限域GF(2m)GF(2^m)GF(2m)上的椭圆曲线定义的密钥生成使用椭圆曲线EEE，其中：模数为ppp；系数为aa
python + selenium通过滑块验证 weixin_51144854 python selenium 爬虫 opencv
1、介绍使用python进行自动化操作或者爬虫过程中，可能会遇到需要进行验证的情况。本文介绍了两种通过滑块验证的方法：轮廓检测通过OpenCV进行轮廓检测，找到滑块背景中缺口的位置，计算缺口到滑块的距离。模板匹配通过OpenCV分析滑块背景图与滑块的相似度，找到滑块背景图中与滑块最相似的区域就是缺口的位置，然后计算缺口到滑块的距离。2、轮廓检测测试地址：https://accounts.douba
【学习】《算法图解》第九章学习笔记：迪杰斯特拉算法程序员
一、迪杰斯特拉算法概述迪杰斯特拉算法（Dijkstra'salgorithm）是一种解决带权有向图上单源最短路径问题的贪心算法，由荷兰计算机科学家艾兹赫尔·迪杰斯特拉（EdsgerW.Dijkstra）于1956年提出。该算法常用于路由协议，也可以用作其他图算法的子程序。（一）算法适用场景迪杰斯特拉算法适用于：带权有向图（每条边都有权重）所有权重都为非负值（不能有负权边）需要找出从一个顶点到图中所
实战｜StarRocks 通过 JDBC Catalog 访问 MongoDB 的数据
方案介绍本文档介绍如何通过StarRocks的JDBCCatalog功能，结合MongoDBBIConnector，将MongoDB数据便捷接入StarRocks，实现数据打通和SQL查询分析，以下是整体流程图。前提条件StarRocks环境：版本≥3.0，支持JDBCCatalog功能。MongoDBBIConnector：已安装并运行，版本需与MongoDB兼容（参考MongoDB官方文档）。
MCP+A2A：从实验室到生产环境的落地之旅 CarlowZJ AI应用落地+MCP+A2A 数据库 MCP+A2A
目录摘要一、引言二、MCP与A2A概念讲解（一）MCP（ModelContextProtocol）（二）A2A（Application-to-Application）（三）MCP与A2A的融合三、MCP+A2A技术架构图与工作流程图（一）整体架构图（二）工作流程图四、MCP+A2A代码示例（一）基于Python的MCP+A2A通信示例（二）基于Java的MCP+A2A应用集成示例五、MCP+A2A
CNN-GRU混合模型学习笔记 weixin_54372988 cnn gru 学习
GRU学习笔记CNN：卷积神经网络GRU（GateRecurrentUnit），门控循环单元CNN：卷积神经网络3个组成部分：1.卷积层——提取图像局部特征2.池化层——降维（防止过拟合）3.全连接层——输出结果一个卷积核扫完整张图片，得到每个小区域的特征值具体应用中通常有多个卷积核CNN可能有多层结构，如LeNet-5：卷积层–池化层–卷积层–池化层–卷积层–全连接层处理时间序列（1D序列）：（
Kyle的天机学堂学习笔记 Z2475269074 学习笔记
本文将展示一个小白从0->1完成项目的全部历练已经心得PS:要求做到真正的自我思考而不是对着教程敲代码，并借用AI进行辅佐与思考DAY1Maven子工程会继承父工程所有依赖有三套生命周期，互不干扰且同一生命周期内执行命令会以此完成之前的命令1.clean2.default(compile,test，package,install)3.site(deploy)对象DTO数据传输对象，用于服务端与客户
Autosar 下电过程-基于ETAS工具赞哥哥s Autosar进阶 autosar etas EcuM
文章目录前言下电流程图POST_RUNPreShutDownShutdown总结前言本文介绍基于ETAS工具对应的BIP包的下电过程，仅供参考。下电流程图目前下电都是走的网络管理的下电流程。POST_RUN上层检测到下电请求后（如Nm状态由ReadySleep到PreBusSleep）先将模式切换到APP_MODE_REQUEST_POST_RUN示例如下：FUNC(void,NM_CODE)Nm
WPF学习笔记（6）——WPF+Stylet+MVVM：ListBox添加项、获取所选项、删除项、删除所选项 billy_gisboy #WPF/MVVM wpf mvvm c#
功能描述使用Stylet框架，对WPF进行MVVM模式下的开发。不在xaml.cs中写业务逻辑，业务逻辑均在VM中，且业务逻辑只针对属性，不涉及ListBox控件。实现功能：（1）ListBox添加一个项，项具有图片、信息（2）展示一个所选项的信息（3）删除一个项（4）删除所选项实现效果首先创建学生类namespaceStyletTest.Model{publicclassStudent{////
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc