rainharder

Beam学习笔记

编程指导

https://beam.apache.org/documentation/programming-guide/

创建驱动程序，定义pipeline，包括输入、转换、输出，以及执行参数（主要包括runner，决定pipeline运行的后端）
1. 创建pipeline，设置参数
2. 创建初始的PCollection
3. 对PCollection应用PTransform：可以对PCollection中每个元素进行修改、过滤、分组、分析等操作，输出新的PCollection；PTransform可以很复杂，自由组合
4. 输出最终的PCollection到外部数据源
5. 在真实的Runner上运行pipeline
抽象出了
- Pipeline：囊括了从头到尾的整个数据处理任务，包括读取输入数据，转换该数据以及写入输出数据。其描述了由PCollection为节点，PTransform为边组成的DAG。
- PCollection：分布式数据集，不可变，有界或无界（流式数据）
- PTransform：表示数据处理操作或步骤，输入1个或多个PCollection，对每个元素做处理，输出0个或多个PCollection
- I/O Source和Sink PTransform的IO库，用来将数据读取或写入各种外部存储系统的库

Pipeline

PipelineOptions options = PipelineOptionsFactory.fromArgs(args).withValidation().create();
解析命令行获取参数 .withValidation验证必填参数是否存在，参数是否合法
扩展参数
通过getter和setter，用注解提供help说明和默认值

public interface MyOptions extends PipelineOptions {
    @Description("Input for the pipeline")
    @Default.String("gs://my-bucket/input")
    String getInput();
    void setInput(String input);

    @Description("Output for the pipeline")
    @Default.String("gs://my-bucket/output")
    String getOutput();
    void setOutput(String output);
}

// 注册使用
PipelineOptionsFactory.register(MyOptions.class);
MyOptions options = PipelineOptionsFactory.fromArgs(args)
                                                .withValidation()
                                                .as(MyOptions.class);

PCollection

TextIO.Read
reads from an external text file and returns a PCollection whose elements are of type String, each String represents one line from the text file
Create.of(Java集合)
setCoder(StringUtf8Coder.of()) 元素编码器
PCollection特性
- 只属于一个Pipeline，不同Pipeline间不能共享
- 支持任意类型，但元素的类型必须相同，即一个PCollection只能包含一种类型的元素
- 支持元素schema：大部分情况下PCollection的元素支持反射，如JSON、ProtoBuffer、Avro和数据库记录。schema可以为元素字段提供命名，操作起来更丰富灵活。
- 不支持随机访问单独元素。PTransform单独处理每个元素，元素之间无关
- 无界数据看作由连续的有限窗口组成，聚合转换作用与单个窗口
- 每个元素都有一个时间戳，一般用元素被读取或添加的时间，也可以用元素自带的时间

PTransform

PTransform可以用方法链的形式调用

ParDo

ParDo（Parallel Do）类似Map/Shuffle/Reduce的Map，对每个元素执行变换函数，输出N个元素。
可以逐个元素进行过滤、格式化/类型转换、提取字段、运算等处理。
DoFn缓存数据时注意不要依赖调用次数，调用次数是无法保证的
lifecyclem没看明白？？？

GroupByKey

GroupByKey 类似Map/Shuffle/Reduce的Shuffle，multimap变uni-map
因为需要全部数据，所以只能用于非全局窗口或聚合触发，
对多个PCollection使用时，必须要求相同的开窗策略和窗口大小，否则不能对各PCollection同时处理

CoGroupByKey

CoGroupByKey 类似join，把两个集合按key聚合，把value串起来
没看到multimap会怎样，应该先调GroupByKey

Combine

Combine 一种聚合操作，将集合中的元素结合，如sum、max、min等
简单的可以只实现1个函数，复杂的需要实现4个函数：
- createAccumulator：创建保存累积结果的本地实例
- addInput：累积输入，增加单个元素到累积结果中
- mergeAccumulators：合并各累积实例，如多个worker的实例
- extractOutput：提取要输出的结果
Combine.globally 输出的结果集只有一个元素
.withoutDefaults() 如果输入是空数据集，则输出空的结果集，不会生成缺省值的结果集
Combine 对非全局窗口有两个选项，必须指定一种
.withoutDefaults
.asSingletonView：provide a default value for each empty window when used as a side input没看懂？？？
Combine.perKey(CombineFn) 按key对val进行combine

Flatten

Flatten 合并多个PCollection为一个，类似python list的extend效果
merge多个PCollection时，要求各PCollection的开窗策略和窗口大小compatible，应该是因为只有这样才能同时处理各集合

Partition

Partition 将一个PCollection分成固定个数的数据集
个数必须要在图构建时确定下来：可以在构建前传参调整，运行时不能修改
PartitionFn 返回的是PCollectionList的下标，确定元素归属结果中的哪个PCollection

transforms编写须知

转换函数会存在多份，同时运行在不同机器上，相互之间独立，没有通信或共享状态
函数对象必须是可序列化的，这样才能发往其他机器
- 函数对象中的Transient fields不会被传输，因为不会被自动序列化
  - 可以重新计算出来，或者不想序列化的字段可以用transient关键字标记
- 避免在序列化之前向字段加载大量数据
- 函数对象apply后再改动是无效的（理解为传值，不是传址）
- Take care when declaring your function object inline by using an anonymous inner class instance. In a non-static context, your inner class instance will implicitly contain a pointer to the enclosing class and that class’ state. That enclosing class will also be serialized, and thus the same considerations that apply to the function object itself also apply to this outer class
  这条太复杂，不想踩坑就不要在匿名内部类里声明函数对象？？？
函数对象必须是thread-compatible，因为Beam SDK不是线程安全的
线程安全五个等级：
- immutable 不可变对象
- thread-safe 线程安全的，可以放心使用，如java.util.Timer
- conditionally thread-safe 条件线程安全的，如Vector和Hashtable，一般是安全的，除非存在几个方法调用之间的顺序不能被打断，这时可以用额外的锁来完成
- thread-compatible 可以使用synchronized （objectReference)来协助完成对线程的调用
- thread-hostile 不安全的
一个函数对象实例只会被一个worker的单个线程使用，除非自己建线程，这时就要自己负责同步
函数对象最好是幂等的，不知道会调用多少次

Side inputs

是ParDo的另一种形式的输入，每次处理PCollection的元素时，DoFn都可以访问SideInputs
当ParDo处理时需要额外数据，而且该数据不能写死，需要从输入或其他pipeline分支生成时，用SideInputs
对于开窗的PCollection，每个windows有一个PCollectionView
如果主输入和side inputs窗口一致，两者的窗口一一对应，就可以直接找到相应的side input窗口
如果不一致，会根据主输入元素的窗口去找side input的合适的窗口。比如主窗口是1分钟的固定窗口，side input是1小时的固定窗口，则主输入元素对找相应小时的side input窗口
如果主输入的元素在多个窗口中，每个窗口中都会调用一次processElement，每次找到side input窗口可能不一样
如果side input有多个trigger，beam选择最新的一个

Additional outputs

ParDo可以有一个主输出和多个额外输出，在DoFn里根据条件选择不同的集合输出

	// Specify the tag for the main output.
	.withOutputTags(wordsBelowCutOffTag,
	// Specify the tags for the two additional outputs as a TupleTagList.
                          TupleTagList.of(wordLengthsAboveCutOffTag)
                                      .and(markedWordsTag)));

DoFn还有其他参数：
- @Timestamp Instant timestamp
- Window: 要与PCollection的窗口匹配，如果元素落入多个窗口，每个窗口会被调用处理一次
- PaneInfo：使用trigger时可以通过PaneInfo获取当前触发的信息。Using PaneInfo you can determine whether this is an early or a late firing, and how many times this window has already fired for this key.
- PipelineOptions
@OnTimer 具体怎么用还没看？？？

Pipeline I/O

支持通配符
如：TextIO.read().from(“protocol://my_bucket/path/to/input-*.csv”));
获取的PCollection的集合（或者元素是List）？再使用Flatten转换为一个PCollection
文件输出默认输出多个文件，可以添加前缀、后缀，中间自动添加数字（应该有格式化的方法）

Schemas

Schemas provide us a type-system for Beam records that is independent of any specific programming-language type.

如果不同类的字段相同，通过Schema，Beam可以无缝转换这些类的对象。

使用注解
@DefaultSchema(JavaBeanSchema.class)
@SchemaCreate
支持原始类型、集合（ARRAY、ITERABLE、MAP）和嵌套
通过继承LogicalType扩展schema类型，可以做为field的类型
枚举、OneOf（联合union）
使用方便，可以直接用字段名访问，支持内嵌字段、通配
可以增删、重命名schema字段

windowing

默认只有一个全局窗口
对于无界数据，至少采用一种措施
- 设置一个非全局窗口
- 设置一个触发器
设置窗口后，对后面的非窗口类的Transform无效，直到一个需要窗口的Transform才有效
一个元素可能属于多个窗口，比如滑动窗口会创建重叠的窗口
Fixed time窗口是开闭区间，即[开始时间，开始时间+时长)
Sliding time窗口，参数开窗间隔和窗口时长，对周期性统计比较有用
是不是开窗周期和时长相同就和Fixed time一样了？
Session窗口，通过元素间的时间间隔划分窗口
global窗口，一般用于有限数据源
无界不做聚合类操作应该也可以用
.withAllowedLateness可以延长窗口关闭的时间
.outputWithTimestamp增加时间戳

Triggers

默认在windows时关闭时触发
默认几种触发器
- 基于事件时间，默认触发器
- 基于处理时间
- 数据驱动：数据满足一定条件触发
- 以上组合
触发器还提供两个额外的能力
- 允许提交早期结果：在所有数据到达前，如一定时间或一定数据
- 允许处理延迟的数据
AfterWatermark基于事件时间触发，watermark超过窗口结束时触发，然后每次延迟数据到来时再触发
watermark的行为怎么理解？？？
- withEarlyFirings 用来提前供预估
- withLateFirings 用来后续修正
AfterProcessingTime基于处理时间触发
pastFirstElementInPane 数据到达后的一段时间触发
AfterPane基于数据驱动触发
elementCountAtLeast：元素个数接收到一定个数后触发，不够数量不会触发
pane：每次触发器提交的数据
设置触发器时，必须同时设置窗口的累积模式
- accumulatingFiredPanes 保留历史数据
- discardingFiredPanes 不保存历史数据
withAllowedLateness影响后续转换生成的PCollection，需要显示调用Window.configure().withAllowedLateness()修改
组合触发器
- AfterWatermark.pastEndOfWindow与.withEarlyFirings/.withLateFirings
- Repeatedly.forever 一直触发，可以搭配.orFinally做退出
- AfterEach.inOrder 顺序执行各触发器
- AfterFirst 各触发器有一个满足就执行，就是多个触发器的逻辑“或”
- AfterAll 所有触发器全满足才执行，就是多个触发器的逻辑“与”
- orFinally 触发一次后不再触发

  .apply(Window
      .configure()
      .triggering(AfterWatermark // 基于时间时间
           .pastEndOfWindow()   // BEAM估计数据已经全到了（watermark超出windows）
           .withLateFirings(AfterProcessingTime // 基于处理时间修正延迟的数据
                .pastFirstElementInPane() // 接收到数据后，延迟10分钟触发
                .plusDelayOf(Duration.standardMinutes(10))))
      .withAllowedLateness(Duration.standardDays(2))); // 留2天时间处理延迟数据，2天后彻底关闭窗口

Metrics

用于提供一些后台信息
- 检查错误数量
- 监测RPC调用次数
- 获取当前处理的元素数量
指标的名称由命名空间和名字组成，命名空间可以避免重名，也可以查询整个命名空间的指标
每个指标都有它的作用范围，表明在执行pipeline的哪个步骤，哪段代码在运行
指标不需要提前声明，可以在运行时创建
如果后端不支持某个上报指标，可以忽略，不会导致pipeline失败，如果不支持某个查询指标，可以只返回支持的部分
目前有三种指标类型
- Counter：只能表示一个计数，long型，可增减
- Distribution：值的分布情况（直方图）
- Gauge：获取正在处理的最新值之一（因为有多个worker同时在执行）
度量指标可以导出到外部，用MetricsOptions配置，默认5秒输出一次

State and Timers

为开发人员提供手工管理每个key状态，可以在聚合方面提供更细粒度的控制
state API按key存储状态，数据集需要时PCollection>类型
ParDo可以声明状态变量，并赋值及更新，状态只对当前处理的key可见
开窗的情况下，第一个key读到的状态是空的，当窗口关闭时会进行gc
如果状态处理用于在DoFn内实现状态机，需要注意元素的顺序是不能保证的
状态的类型
- ValueState 标量状态值，可以被读写
- CombiningState 也是保存一个值，写的时候通过Combiner（如sum、max等）生成合适的值更新
- BagState 可以用于保存处理过的元素
state.read()会导致runner阻塞，多个state顺序读取时可能增大延迟
通过@AlwaysFetched预取状态
如果有代码分支不需要state时，@AlwaysFetched会增加不必要的预取，可以通过readLater异步读取，让runnrer在后面一起批量读取

Timers

Beam支持per-key定时回调API
一个定时器只能设置一个时间戳，后面设置的覆盖前面设置的
Event-time定时器可以用于基于事件时间的聚合
Processing-time定时器一般用于创建大批数据，也可用于定时触发事件，可以设置绝对时间和相对时间
动态定时器，通过TimerMap可以设置多个不同的定时器，可以根据定时器标签动态选择
Timer output timestamps 没看懂？？？
state的GC
- 窗口关闭state即被回收
- 用定时器回收

执行模型

https://beam.apache.org/documentation/runtime/model

元素的序列化和传输是分布式执行中代价最高的操之一
避免的方法：失败后在本地重新处理，限制输出分发到其他机器
传输元素的原因
- 分组操作时需要把元素路由到相应的worker上
- 重新分发元素调整并发
- 把元素广播到所有worker
- 同一worker的转换之间可能可以避免序列化，之间传内存中的元素
元素持久化的原因
- 有状态的DoFn，需要保存一些状态
- 输出处理结果时，需要保存为checkpoint
并行的尴尬：不能顺序执行（如给PCollection里每个元素顺序编号），不能全量操作（如把所有元素输出或保存检查点状态）
分批处理：由runner划分，流处理选小批，批处理选大批
一批由一个worker执行，多个worker可以并行
如果单个转换失败，可能由其他worker重新执行
如果多个转换失败，一般由当前worker重新执行失败的操作，可以避免转换间持久化的代价

WordCount示例

https://beam.apache.org/get-started/wordcount-example/

Pipeline
Pipeline用来定义处理流程，可以通过PipelineOptions定义runner等
其描述了由PCollection为节点，PTransform为边组成的DAG。
PipelineOptions
可以指定runner等
runner有多种：Direct（本地），Spark等
PCollection
PCollection.apply(PTransform)，设置处理实例
TextIO.read().from(文件) 读文件生成PCollection，每个元素为一行数据
TextIO.write().to(?)
FlatMapElements.into(结果类型).via(指定函数) 一种PTransform，每个元素执行指定的函数，结果不保持分组，所有元素重新组成集合[kv,kv,kv,kv]
MapElements.into(结果类型).via(指定函数)，结果保持输入的分组，[ [kv,kv], [kv, kv]]
结果类型用TypeDescriptors创建，如

TypeDescriptors.strings()
TypeDescriptors.kvs(TypeDescriptors.strings(), TypeDescriptors.integers()))

Count.perElement() 一种PTransform，将PCollection按key计数，结果集为key/value(整型，计数)
p.run().waitUntilFinish(): run()是异步，用waitUntilFinish()阻塞
自定义DoFn，由Transform调用

static class ExtractWordsFn extends DoFn {
    ...

    @ProcessElement
    public void processElement(ProcessContext c) {
        ...
    }
}

自定义PTransform，组合多个转换，更好的模块化和复用
PTransform<输入集合类型,输出集合类型>

public static class CountWords extends PTransform,
    PCollection>> {
  @Override
  public PCollection> expand(PCollection lines) {

    // Convert lines of text into individual words.
    PCollection words = lines.apply(
        ParDo.of(new ExtractWordsFn()));

    // Count the number of times each word occurs.
    PCollection> wordCounts =
        words.apply(Count.perElement());

    return wordCounts;
  }
}

ParDo.of(new DoFn()) 通过DoFn快速创建一个PTransform
调试两张方法
- 日志: 需要Slf4j
- PAssert：小规模测试数据集
window：无界数据没有结束，需要定义处理的范围，即将流数据转换为批数据，流变成N个窗口
Window.<数据类型>into(FixedWindows.of(窗口时间))
- FixedWindows：固定窗口
- 滑动窗口
- 会话窗口
时间戳：PCollection中每个元素都有时间戳，由创建PCollection的源赋值，可以使用数据自带或处理时间等

Mobile Gaming示例

https://beam.apache.org/get-started/mobile-gaming-example

skew 时间差，事件产生到处理的时间差
KV.of(gInfo.getKey(field), gInfo.getScore())) 创建KV实例
Sum.integersPerKey() 按key对value(整型)求和
WithTimestamps.of((GameActionInfo i) -> new Instant(i.getTimestamp()))) 为元素增加时间戳
Filter.by(过滤函数) 过滤元素
GlobalWindows 全局窗口能处理从开始到当前的所有数据，其他窗口如FixedWindows只能处理一段时间的数据
Window.triggering(Trigger)

Window.into(new GlobalWindows())
                // Get periodic results every ten minutes.
                .triggering(
                    Repeatedly.forever(
                        AfterProcessingTime.pastFirstElementInPane().plusDelayOf(TEN_MINUTES)))
                .accumulatingFiredPanes()
                .withAllowedLateness(allowedLateness))

通过触发器调用accumulatingFiredPanes

Repeatedly.forever 一直执行
Create a composite trigger that repeatedly executes the trigger repeated, firing each time it fires and ignoring any indications to finish.

AfterProcessingTime
A Trigger trigger that fires at a specified point in processing time, relative to when input first arrives.

AfterProcessingTime.pastFirstElementInPane().plusDelayOf(TEN_MINUTES)
第一个元素到达后的十分钟，用ProcessingTime计算

accumulatingFiredPanes()
Returns a new Window PTransform that uses the registered WindowFn and Triggering behavior, and that accumulates elements in a pane after they are triggered.
累积触发的窗格，即通过触发器将数据细分为窗格，可以保存之前窗格的数据，与后来的数据累积计算
withAllowedLateness()
默认情况下，当watermark通过end-of-window之后，再有之前的数据到达时，这些数据会被删除。
为了避免有些迟到的数据被删除，因此产生了allowedLateness的概念。
简单来讲，allowedLateness就是针对event time而言，对于watermark超过end-of-window之后，还允许有一段时间（也是以event time来衡量）来等待之前的数据到达，以便再次处理这些数据。

对于trigger是默认的EventTimeTrigger的情况下，allowedLateness会再次触发窗口的计算，而之前触发的数据会buffer起来，直到watermark超过end-of-window + allowedLateness的时间，窗口的数据及元数据信息才会被删除

问题：全局窗口没有watermakr，allowedLateness有什么用？？？

启发式水印

Window.into(FixedWindows.of(teamWindowDuration))
                // We will get early (speculative) results as well as cumulative
                // processing of late data.
                .triggering(
                    AfterWatermark.pastEndOfWindow()
                        .withEarlyFirings(
                            AfterProcessingTime.pastFirstElementInPane()
                                .plusDelayOf(FIVE_MINUTES))
                        .withLateFirings(
                            AfterProcessingTime.pastFirstElementInPane()
                                .plusDelayOf(TEN_MINUTES)))
                .withAllowedLateness(allowedLateness)
                .accumulatingFiredPanes()

AfterWatermark.pastEndOfWindow()
Creates a trigger that fires when the watermark passes the end of the window.

.withEarlyFirings() watermark到达窗口结束前的某个点触发
Creates a new Trigger like the this, except that it fires repeatedly whenever the given Trigger fires before the watermark has passed the end of the window.

.withLateFirings() watermark达到窗口结束后的某个点触发
Creates a new Trigger like the this, except that it fires repeatedly whenever the given Trigger fires after the watermark has passed the end of the window.

withAllowedLateness和accumulatingFiredPanes调用顺序有什么影响？？

Values.create() 从KV中提取value
Mean.globally().asSingletonView() 对全部值计算平均值
Returns a PTransform that produces a PCollectionView whose elements are the result of combining elements per-window in the input PCollection.
Mean.globally().withoutDefaults()
Returns a PTransform identical to this, but that does not attempt to provide a default value in the case of empty input.
Metrics.counter(namespace, name) Create a metric that can be incremented and decremented, and is aggregated by taking the sum
withSideInputs(PCollectionView) 会将值(PCollectionView类型)广播给其他需要的worker
c.sideInput(globalMeanScore) 使用sideInput的值

问题：两个数据是异步的，平均值是变化的，多次运行结果可能不一致？？？

Sessions.withGapDuration(间隔时长)
在间隔时长内新数据则认为会话结束，新开窗口，否则数据继续在原窗口里处理
withTimestampCombiner(TimestampCombiner.END_OF_WINDOW) 用窗口结束时间作为输出的时间戳
Combine.perKey(x -> 0) 不关心其他数据，只要key，value直接填0，（可能是因为只有KV，没有List/Array）
DoFn还有带窗口信息的成员函数void processElement(ProcessContext c, BoundedWindow window)

  /** Calculate and output an element's session duration. */
  private static class UserSessionInfoFn extends DoFn, Integer> {
    @ProcessElement
    public void processElement(ProcessContext c, BoundedWindow window) {
      IntervalWindow w = (IntervalWindow) window;
      int duration = new Duration(w.start(), w.end()).toPeriod().toStandardMinutes().getMinutes();
      c.output(duration);
    }
  }

你可能感兴趣的:(资料收藏)

C、C++编程学习资料收藏勇往直前996 C++学习 C编程 Linux应用数据库数据结构
怎么算入门，我觉得可以入手做一些项目就算入门了。需要掌握至少一门编程语言，例如，C/C++或者Java；需要学习数据结构与算法，至少掌握常见的数据结构与算法；需要学习数据库知识，因为做项目几乎离不开数据库，数据库必须掌握；掌握一门技能，例如后端开发、web开发、移动端开发、人工智能等；当然还需要进一步精进，可以学习操作系统，计算机网络，计算机组织原理、汇编等相关专业课程。C语言刚开始就是泡书，然后
介绍一款适合于程序员使用的浏览器悠然而为之小程序软件工程人工智能搜索引擎编辑器
DT浏览器不同于普通意义上的浏览器，DT的含义就是数据资料的意思，更专注于资料的收集和管理，是一款资料管理类的浏览器，也是一款面向教育、培训、编程、技术和科研等资料收集领域的手机软件，主要有网络搜索、资料收藏（可分类和排序）、人工智能写作、人工智能知识问答、内部交流（自己管理，自由度高，隐私和安全性强）、直播上课、日程提醒、笔记本、资料分享等功能。DT浏览器是一款专为手机安卓系统设计的小型、快速且
给你介绍一款适合教培行业的手机软件，很好用，关键还是免费的悠然而为之软件工程小程序 AI写作编辑器搜索引擎
给你介绍一款适合教培行业的手机软件，很好用，关键还是免费的，DT浏览器不同于普通意义上的浏览器，DT的含义就是数据资料的意思，更专注于资料的收集和管理，是一款资料管理类的浏览器，也是一款面向教育、培训、编程、技术和科研等资料收集领域的手机软件，主要有网络搜索、资料收藏（可分类和排序）、人工智能写作、人工智能知识问答、内部交流（自己管理，自由度高，隐私和安全性强）、直播上课、日程提醒、笔记本、资料分
教培行业的手机软件应该有哪些功能悠然而为之软件工程小程序 AI写作编辑器搜索引擎
DT浏览器是一款面向教育行业的手机软件，主要有网络搜索、资料收藏（可分类和排序，只有DT浏览器有这个功能）、人工智能写作、人工智能知识问答、内部交流（功能比某信强大，自己管理，自由度高，隐私和安全性强）、直播上课、日程提醒、笔记本等功能。浏览器不仅包括网络浏览，也包括对收藏的网址分类排序的浏览，和对笔记本保存的资料的浏览，在写笔记的同时，还可以在网络上搜索相关内容，收藏相关内容，并且对收藏的内容进
第三方教育导教服务小猪趣学：学习方法你选对了吗？ 60aa1d8251e4
现在是信息过剩、知识大爆炸的时代，每个人都渴望尽最大可能掌握技能和本领，每天报各种各样的课程，给自己定下各种阅读计划，恨不得把所有知识都塞在大脑里。但是在学习的过程中，经常遇到这样的问题：每天都接触了很多知识，但好像啥也没学会？资料收藏了一大堆，要用的时候一个都记不起来？认认真真写笔记，但怎么都想不出来两个内容之间的联系？这是因为我们的知识都是碎片化的。但碎片化的知识没有任何联系，看似都了解一点，
一米阳光（231—235）你不懂夜的黑
黑白之间的随性生活一米阳光（231—235）231我喜欢摄影。我拍照不是为了要发朋友圈，而是喜欢摄影这门技艺，喜欢用照片来记录某个瞬间，喜欢从摄影中欣赏美。我发朋友圈主要是记录，记录对我来讲重要的人和事，记录我对工作、生活的随感，附加一些照片大多没有实际意义，有指向的也与文字相关。转发一些文章到自己的朋友圈，并不代表我就认同文中的观点，只作为资料收藏，有可能针对资料写点东西。在朋友圈炫耀些什么或向
iOS 资料收藏寒飌
更多整理资料尽在一平米小站《iOS网络高级编程iPhone和iPad的企业应用开发英文》链接:https://pan.baidu.com/s/1L_7uDJrjAHw6W0DWH2eplw密码:53md《iOS网络高级编程iPhone和iPad的企业应用开发中文》链接:https://pan.baidu.com/s/1soKaH3TAkfwu-znTQo2Ghw密码:d24y《IOS应用逆向工程：
摘录：我们正在进入自由货币时代，投资和交易将会跟网购一样方便咸叔说
本文非原创，仅做资料收藏原作者：作者:鸵鸟创投媒体/长庚巴比特长铗：比原链的最大特点是项目的团队、产品定位并不是凭空而来，团队成员都是深耕于这个领域多年的最早一批区块链从业者，产品本身是为解决真实的商业需求而设计，并不是为创新而创新。比原链参考其它公链项目的基金会的组织架构，设计了持币者大会、自治委员会、管理委员会的三层治理结构，同时还做了许多去中心化的组织创新，比如在持币人投票中引入币天权重因子
实施方法论 -【名词解释】【资料收藏】【自用】 qq_50900404 PMP 产品运营产品经理
实施方法论-【名词解释】【资料收藏】【自用】文章目录实施方法论-【名词解释】【资料收藏】【自用】名词解释PM/PMOSOPSOWWBSDODSITUATPRD人天评估Sprint（冲刺周期）Story（故事）ETL环境准备BU原型图参考及其他好用文章名词解释PM/PMOPM和PMO，它们分别代表项目经理和项目管理办公室。一般来说，这两个职位属于同一个项目组，PM负责具体的项目执行，PMO则是为PM
十位素描大师的创作手稿，骨灰级资料收藏！高考美术传播
如果你不知道这些大咖千万别说自己学过素描今天给大家介绍十位素描大师每个人都在艺术史上都做出卓越的贡献欣赏一下，领略下大师素描的魅力①列昂纳多·达·芬奇（1452—1519）意大利文艺复兴三杰之一也是整个欧洲文艺复兴时期最完美的代表是世界的艺术巨匠和科学巨匠▼-素描作品-▼②米开朗基罗·博那罗蒂（1475-1564）1475年3月6日出生于意大利佛罗伦斯柏里斯镇是意大利文艺复兴时期伟大的绘画家、雕塑
有哪些好工具值得推荐给大学生？一只大花猫不爱吃鱼
学习资料收藏整理工具Pinbox日常学习经常会在网上搜索一些学习资料，或者使用自学网站学习，那么这么多网站要怎么记住并能很好的管理呢，这就需要用到Pinbox了，它是一个专门做收藏的工具软件，可以收藏网页，文本及图片，经常用的网站还可以设置快捷键，一键打开。这是我收藏的一些关于设计之类的网站，在Pinbox发现里面还能看到很多别人分享的优秀收藏，觉得有用可以一键克隆到自己的收藏集提示一下Pinbo
搜索引擎珊瑚贝
这篇文章只是为了网上找资料方便一点，对网上的资料收藏一下一、Luceue搜索引擎，java版可以参考的文档有:https://www.cnblogs.com/meiyy/p/6925271.htmlhttp://blog.csdn.net/u014386474/article/details/51614180二、Sphinx搜索引擎，常用php语言http://www.sphinxsearch.o
公告：CSDN个人空间即将改版 csdn产品官方博客网站公告公告游戏 sns 相册互联网活动
尊敬的用户：你们好！CSDN个人空间将在2012年4月初全新改版上线！CSDN个人空间是2008年8月推出的基于CSDN用户的SNS服务，致力于给广大用户提供在线社交、技术分享和资料收藏的服务。随着互联网和技术的发展，用户涌现出了更多的个人资料管理和分享需求，目前的个人空间已经不能很好地满足。因此我们收集了很多用户反馈的意见，并进行了多次讨论，最终根据CSDN技术社区的特点和用户最集中的诉求对个人
瑞芯微RV1126/1109开发流程之资料收藏 xidaoliang123 瑞芯微RV1126 嵌入式
RKMedia—FireflyWikihttps://blog.csdn.net/u013171226/category_11410227.html目前该博主已经建立专栏[RV1109/RV1126系列]-3.RV1109/1126RKNNAPI接口的C++封装_Ant5985的博客-CSDN博客读取RV1126CPU温度NPUCPU频率_夜星辰2022的博客-CSDN博客_ddrrv1126频率
陶渊明《桃花源记》及译文(本文只作资料收藏) 水乡醉客
晋太元中，武陵人捕鱼为业。缘溪行，忘路之远近。忽逢桃花林，夹岸数百步，中无杂树，芳草鲜美，落英缤纷，渔人甚异之。复前行，欲穷其林。林尽水源，便得一山，山有小口，仿佛若有光。便舍船，从口入。初极狭，才通人。复行数十步，豁然开朗。土地平旷，屋舍俨然，有良田美池桑竹之属。阡陌交通，鸡犬相闻。其中往来种作，男女衣着，悉如外人。黄发垂髫，并怡然自乐。见渔人，乃大惊，问所从来。具答之。便要还家，设酒杀鸡作食。
创业金句（资料收藏）甲坤
6:3:1原则：花60%的时间，去跟影响你人生、对你人生有价值的10%的人在一起。花30%的时间，去跟经常与你有互动的30%的人交流。剩下的60%的人，如果你们的生命中有没有彼此都不重要，那么只需花10%的时间去维系。这是一个倒置逆反的、人脉资源的经营法则。不要补人生短板，而要找到人生最长的长板，把它变得无限长，没有人跟你竞争，你就赢了。人生成功的几张牌：学历是铜牌，能力是银牌，人脉是金牌，智慧是
中小学期末考来临，各科资料收藏起来哈！每天三分钟教育
几个月前，教育局公布了中小学校历，中小学寒假的时间是2020年1月18日到2月8日，2月9日学生正式报到。一看日历，发现明年的春节也比往常来的要更早！1月25日就过春节啦~近日，教育局相关负责人表示，最快下周能够确定期末考时间；而很多中小学的老师们推算，期末考试大约在1月9日-10日之间，一般比春节提前半个月左右。信息来源家长帮那么小编也在此为大家准备了丰厚的中小学各科资料包哟~小学语文初中语文初
CAD数据导入ArcGIS方法小结 ExcaliburSun ArcGIS arcgis 数据
转载自http://bbs.3s001.com/thread-151077-1-1.html，仅用做资料收藏一、常用方法：1．直接在ARCMAP（ARCGIS的桌面模式）中加载CAD的DWG格式文件，运用EXPORTDATA命令输出shape数据（ARCGIS的数据组织方式之一）。这种方法简单快速，且能保存完整CAD数据信息，但对CAD数据要求较高，需要CAD多线段闭合成面，否则会出现数据丢失。2
学习资料收藏 bluemoon213
webservice&remoting&WCFhttp://lovecherry.cnblogs.com/category/20743.html
三款提高学习效率的软件 teamojiao
1.程序快捷打开助手——launchy有了它你使用电脑工作的效率提高3倍，不是夸张哟，这是我使用它一年来的经验。2.工作列表提醒——todolist记事的一个小软件，随时随地记录一切重要的任务分配，按时按量软件工程化我们的工作学习生活。3.学习资料收集——资料收藏大师这款软件是我前几天才发现的，一使用我就喜欢上它了，通过它你凌乱的资料就可以完美的整理起来，想查就查，想看就看，永远都可以找到。
起点 zhang_bamboo
前几天，在微博里看见一句话，一个人的成功关键在于做不做总结，怎么做总结，觉得有些领悟，最重要的是，经理曾经也给我说过这样的话，再次做个标记，将日常看见的一些自己觉得有价值的东西分类整理，希望在遇到的时候能手到擒来。其实个人觉得做资料分类整理，资料收藏大师是最好的选择，但是，家里一份，公司一份，有点麻烦，所以，在家里看到的，就整理在这，公司看到的就收藏到资料收藏大师里面。呵呵，希望自己说到做到
常见的个人知识管理软件工具 iteye_9067
大多数的个人知识管理软件是内置网页编辑器的原理开发的，和Office文档基本上是没有关系的，最多只能作为附件；如mybase、NoteExpress、资料收藏大师、PKM2、紫轩资料管理大师等等，网文快捕、友益文书就不用说了。目前，只发现”针式PKM”、“Word文档－资料管理系少数几个软件是基于Office文档的。PKM软件工具链接：0.为知知识管理(WizKnowledgePersonal)基
C# 正则表达式资料 matengzy C#C#正则表达式 regex
正则表达式学习资料收藏，转载自网络：http://www.cnblogs.com/stg609/archive/2009/06/03/1492709.html作者：stg609出处：http://stg609.cnblogs.com/本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。摘要：正则表达式(RegularE
不错的网站~ 收藏了qwq StrongerIrene #前端 2020
1我最开始看的这篇https://github.com/liangxiaojuan/vue-todos2很全的资料收藏https://github.com/budaLi/-Learning-materials-3在线压缩图片的网站http://www.bejson.com/ui/compress_img/==========================js学习https://www.cnblo
PCI总线(资料收藏) sherry1026 存储工作嵌入式 cache 扩展 ide
PCI技术规格简介控制系统架构：一个完整的控制处理系统一般由CPU、北桥（NorthernBridge）、南桥（SouthernBridge）、PCI-PCI桥、以及其他功能设备组成。而对于一些相对高端的期间或者设备，我们往往是通过PCI总线施加控制或者数据传送，（当然一些低端的还有其他控制接口，不过我们就先不管了）从1992年创立规范到如今，PCI总线已成为了计算机的一种标准总线。由PCI总线构
资料收藏专用 @Hds 资料收藏专用
Linux中GFP的意思linuxgfp意思e820与kernel物理内存映射e820与kernel物理内存映射linux内核e820来源及相关知识Linux中的宏Linux宏：__ASSEMBLY__Linuxkernel中常见的宏整理Linux-64位系统内存分配Linux-64位系统内存分配x86_64Linux的内存管理区Linuxpageallocationfailure的问题处理-lo
2014一年开发技术资料收藏整理(一) weixin_34072458
Bookmarks书签栏c#多线程排队队列实现的源码-菜鸟先飞-博客频道-CSDN.NETC#创建windows服务并定时执行-wei_jie_zhang的专栏-博客频道-CSDN.NET一个非常精妙的SQL语句-leapenemc的专栏-博客频道-CSDN.NETc#执行Dos命令-C#编程语言程序开发技术文章_C#编程-红黑联盟C#操作消息队列-C#编程语言程序开发技术文章_C#编程-红黑联盟
收集的一些 i00500i 2012-2
经典.net资料收藏[转]使用SqlBulkCopy类加载其他源数据到SQL表在数据回发时，维护ASP.NETTree控件的位置vagerent的vs2005网站开发技巧ASP.NET2.0小技巧－－内部控件权限的实现图片滚动代码。css——之三行三列等高布局DatagirdTemplateColumn类型列中如何设定日期格式为yyyy-MM-dd格式？SQLServer各种日期计算方法在sqls
2015一年开发技术资料收藏整理(二) weixin_34217773
Bookmarks书签栏SOHU-DBProxy/dbha.mdatmaster·SOHUDBA/SOHU-DBProxy·GitHubwyouflf/xUtils·GitHubAndroid常用組件_人人IT網FormDevJFormDesigner5.1.1|百度云网盘|下载|破解|uploaded|nitroflare|rapidgator|Crack,注册,KeyGenapache集成多个
Oracle数据库资料收藏 bingwang08 Oracle
Oracle数据库资料收藏1、UNIX基本培训-[fjlin]2、AIX入门与提高（1）－中文-[richard_he]3、PL/SQL上课记录-[jxdco]4、[分享]2005年IBM原厂的AIX培训资料-[fsm]5、Oracle入门让学习更轻松-[migrator]6、我看得懂的Oracle管理器OEM操作指南-[tiren]7、一些平时收集的Oracle的资料-[ll7777]8、Ora
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持