魏晓蕾

【Flink】基于 Flink 的电商用户行为分析（二）

1、市场营销商业指标统计分析

模块创建和数据准备

继续在 UserBehaviorAnalysis 下新建一个 maven module 作为子项目，命名为 MarketAnalysis。
这个模块中我们没有现成的数据，所以会用自定义的测试源来产生测试数据流，或者直接用生成测试数据文件。

APP 市场推广统计

随着智能手机的普及，在如今的电商网站中已经有越来越多的用户来自移动端，相比起传统浏览器的登录方式，手机 APP 成为了更多用户访问电商网站的首选。对于电商企业来说，一般会通过各种不同的渠道对自己的 APP 进行市场推广，而这些渠道的统计数据（比如，不同网站上广告链接的点击量、APP 下载量）就成了市场营销的重要商业指标。
首先我们考察分渠道的市场推广统计。在 src/main/scala 下创建
AppMarketingByChannel.scala 文件。由于没有现成的数据，所以我们需要自定义一个测试源来生成用户行为的事件流。

自定义测试数据源

定义一个源数据的样例类 MarketingUserBehavior，再定义一个 SourceFunction，用于产生用户行为源数据，命名为 SimulatedEventSource：

case class MarketingUserBehavior(userId: Long, behavior: String, channel: String, timestamp: Long)

class SimulatedEventSource extends RichParallelSourceFunction[MarketingUserBehavior]{
	var running = true
	val channelSet: Seq[String] = Seq("AppStore", "XiaomiStore", "HuaweiStore", "weibo", "wechat", "tieba")
	val behaviorTypes: Seq[String] = Seq("BROWSE", "CLICK", "PURCHASE", "UNINSTALL")
	val rand: Random = Random
	override def run(ctx: SourceContext[MarketingUserBehavior]): Unit = {
		val maxElements = Long.MaxValue
		var count = 0L
		while (running && count < maxElements) {
			val id = UUID.randomUUID().toString.toLong
			val behaviorType = behaviorTypes(rand.nextInt(behaviorTypes.size))
			val channel = channelSet(rand.nextInt(channelSet.size))
			val ts = System.currentTimeMillis()
			ctx.collectWithTimestamp(MarketingUserBehavior(id, behaviorType, channel, ts), ts)
			count += 1
			TimeUnit.MILLISECONDS.sleep(5L)
		}
	}
	override def cancel(): Unit = running = false
}

分渠道统计

另外定义一个窗口处理的输出结果样例类 MarketingViewCount，并自定义
ProcessWindowFunction 进行处理，代码如下：

case class MarketingCountView(windowStart: Long, windowEnd: Long, channel: String, behavior: String, count: Long)

object AppMarketingByChannel {
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		env.setParallelism(1)
		
		val stream: DataStream[MarketingUserBehavior] = env.addSource(new SimulatedEventSource)
			.assignAscendingTimestamps(_.timestamp)
		stream
			.filter(_.behavior != "UNINSTALL")
			.map(data => {
				((data.channel, data.behavior), 1L)
			})
			.keyBy(_._1)
			.timeWindow(Time.hours(1), Time.seconds(1))
			.process(new MarketingCountByChannel())
			.print()
		env.execute(getClass.getSimpleName)
	}
}

class MarketingCountByChannel() extends ProcessWindowFunction[((String, String), Long), MarketingViewCount, (String, String), TimeWindow] {
	override def process(key: (String, String), context: Context, elements: Iterable[((String, String), Long)], out: Collector[MarketingViewCount]): Unit = {
		val startTs = context.window.getStart
		val endTs = context.window.getEnd
		val channel = key._1
		val behaviorType = key._2
		val count = elements.size
		out.collect( MarketingViewCount(formatTs(startTs), formatTs(endTs), channel, behaviorType, count) )
	}
	private def formatTs (ts: Long) = {
		val df = new SimpleDateFormat ("yyyy/MM/dd-HH:mm:ss")
		df.format (new Date (ts) )
	}
}

不分渠道（总量）统计

同样我们还可以考察不分渠道的市场推广统计，这样得到的就是所有渠道推广的总量。在 src/main/scala 下创建 AppMarketingStatistics.scala 文件，代码如下：

object AppMarketingStatistics {
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		env.setParallelism(1)
		
		val stream: DataStream[MarketingUserBehavior] = env.addSource(new SimulatedEventSource)
			.assignAscendingTimestamps(_.timestamp)
		stream
			.filter(_.behavior != "UNINSTALL")
			.map(data => {
				("dummyKey", 1L)
			})
			.keyBy(_._1)
			.timeWindow(Time.hours(1), Time.seconds(1))
			.process(new MarketingCountTotal())
			.print()
		env.execute(getClass.getSimpleName)
	}
}

class MarketingCountTotal() extends ProcessWindowFunction[(String, Long), MarketingViewCount, String, TimeWindow]{
	override def process(key: String, context: Context, elements: Iterable[(String, Long)], 	 out: Collector[MarketingViewCount]): Unit = {
		val startTs = context.window.getStart
		val endTs = context.window.getEnd
		val count = elements.size
		out.collect( MarketingViewCount(formatTs(startTs), formatTs(endTs), "total","total", count) )
	}
	private def formatTs (ts: Long) = {
		val df = new SimpleDateFormat ("yyyy/MM/dd-HH:mm:ss")
		df.format (new Date (ts))
	}
}

页面广告分析

电商网站的市场营销商业指标中，除了自身的 APP 推广，还会考虑到页面上的广告投放（包括自己经营的产品和其它网站的广告）。所以广告相关的统计分析，也是市场营销的重要指标。
对于广告的统计，最简单也最重要的就是页面广告的点击量，网站往往需要根据广告点击量来制定定价策略和调整推广方式，而且也可以借此收集用户的偏好信息。更加具体的应用是，我们可以根据用户的地理位置进行划分，从而总结出不同省份用户对不同广告的偏好，这样更有助于广告的精准投放。

页面广告点击量统计

接下来我们就进行页面广告按照省份划分的点击量的统计。在 src/main/scala 下创建 AdStatisticsByGeo.scala 文件。同样由于没有现成的数据，我们定义一些测试数据，放在 AdClickLog.csv 中，用来生成用户点击广告行为的事件流。
在代码中我们首先定义源数据的样例类 AdClickLog，以及输出统计数据的样例类 CountByProvince。主函数中先以 province 进行 keyBy，然后开一小时的时间窗口，滑动距离为 5 秒，统计窗口内的点击事件数量。具体代码实现如下：

case class AdClickLog(userId: Long, adId: Long, province: String, city: String, timestamp: Long)
case class CountByProvince(windowEnd: String, province: String, count: Long)

object AdStatisticsByGeo {
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		env.setParallelism(1)

		val adLogStream: DataStream[AdClickLog] = env.readTextFile("YOURPATH\\resources\\AdClickLog.csv")
			.map(data => {
				val dataArray = data.split(",")
				AdClickLog(dataArray(0).toLong, dataArray(1).toLong, dataArray(2), dataArray(3), dataArray(4).toLong)
			})
			.assignAscendingTimestamps(_.timestamp * 1000L)
		val adCountStream = adLogStream
			.keyBy(_.province)
			.timeWindow(Time.minutes(60), Time.seconds(5))
			.aggregate(new CountAgg(), new CountResult())
			.print()
		env.execute("ad statistics job")
	}
}

class CountAgg() extends AggregateFunction[AdClickLog, Long, Long]{
	override def add(value: AdClickLog, accumulator: Long): Long = accumulator + 1L
	override def createAccumulator(): Long = 0L
	override def getResult(accumulator: Long): Long = accumulator
	override def merge(a: Long, b: Long): Long = a + b
}

class CountResult() extends WindowFunction[Long, CountByProvince, String, TimeWindow]{
	override def apply(key: String, window: TimeWindow, input: Iterable[Long], out: Collector[CountByProvince]): Unit = {
		out.collect(CountByProvince(formatTs(window.getEnd), key, input.iterator.next()))
	}

	private def formatTs (ts: Long) = {
		val df = new SimpleDateFormat ("yyyy/MM/dd-HH:mm:ss")
		df.format (new Date (ts) )
	}
}

黑名单过滤

上节我们进行的点击量统计，同一用户的重复点击是会叠加计算的。在实际场景中，同一用户确实可能反复点开同一个广告，这也说明了用户对广告更大的兴趣；但是如果用户在一段时间非常频繁地点击广告，这显然不是一个正常行为，有刷点击量的嫌疑。所以我们可以对一段时间内（比如一天内）的用户点击行为进行约束，如果对同一个广告点击超过一定限额（比如 100 次），应该把该用户加入黑名单并报警，此后其点击行为不应该再统计。
具体代码实现如下：

case class AdClickLog(userId: Long, adId: Long, province: String, city: String, timestamp: Long)
case class CountByProvince(windowEnd: String, province: String, count: Long)
case class BlackListWarning(userId: Long, adId: Long, msg: String)

object AdStatisticsByGeo {
	val blackListOutputTag = new OutputTag[BlackListWarning]("blacklist")
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		env.setParallelism(1)
		
		val adLogStream: DataStream[AdClickLog] = env.readTextFile("D:\\Projects\\BigData\\UserBehaviorAnalysis\\MarketAnalysis\\src\\main\\resources\\AdClickLog.csv")
			.map(data => {
				val dataArray = data.split(",")
				AdClickLog(dataArray(0).toLong, dataArray(1).toLong, dataArray(2), dataArray(3), dataArray(4).toLong)
			})
			.assignAscendingTimestamps(_.timestamp * 1000L)
		val filterBlackListStream = adLogStream
			.keyBy(logData => (logData.userId, logData.adId))
			.process(new FilterBlackListUser(100))
		val adCountStream = filterBlackListStream
			.keyBy(_.province)
			.timeWindow(Time.minutes(60), Time.seconds(5))
			.aggregate(new countAgg(), new countResult())
			.print()
		filterBlackListStream
			.getSideOutput(blackListOutputTag)
			.print("black list")
		env.execute("ad statistics job")
	}
	
	class FilterBlackListUser(maxCount: Long) extends KeyedProcessFunction[(Long, Long), AdClickLog, AdClickLog] {
		// 保存当前用户对当前广告的点击量
		lazy val countState: ValueState[Long] = getRuntimeContext.getState(new ValueStateDescriptor[Long]("count-state", classOf[Long]))
		// 标记当前（用户，广告）作为 key 是否第一次发送到黑名单
		lazy val firstSent: ValueState[Boolean] = getRuntimeContext.getState(new ValueStateDescriptor[Boolean]("firstsent-state", classOf[Boolean]))
		// 保存定时器触发的时间戳，届时清空重置状态
		lazy val resetTime: ValueState[Long] = getRuntimeContext.getState(new ValueStateDescriptor[Long]("resettime-state", classOf[Long]))
		
		override def processElement(value: AdClickLog, ctx: KeyedProcessFunction[(Long, Long), AdClickLog, AdClickLog]#Context, out: Collector[AdClickLog]): Unit = {
			val curCount = countState.value()
			// 如果是第一次处理，注册一个定时器，每天 00 ： 00  触发清除
			if( curCount == 0 ){
				val ts = (ctx.timerService().currentProcessingTime() / (24*60*60*1000) + 1) * (24*60*60*1000)
				resetTime.update(ts)
				ctx.timerService().registerProcessingTimeTimer(ts)
			}
			// 如果计数已经超过上限，则加入黑名单，用侧输出流输出报警信息
			if( curCount > maxCount ){
				if( !firstSent.value() ){
					firstSent.update(true)
					ctx.output( blackListOutputTag, BlackListWarning(value.userId, value.adId,"Click over " + maxCount + " times today.") )
				}
				return
			}
			
			// 点击计数加 1
			countState.update(curCount + 1)
			out.collect( value )
		}
		
		override def onTimer(timestamp: Long, ctx: KeyedProcessFunction[(Long, Long), AdClickLog, AdClickLog]#OnTimerContext, out: Collector[AdClickLog]): Unit = {
			if( timestamp == resetTime.value() ){
				firstSent.clear()
				countState.clear()
			}
		}
	}
}

class countAgg() extends AggregateFunction[AdClickLog, Long, Long] {
	override def add(value: AdClickLog, accumulator: Long): Long = accumulator + 1L
	override def createAccumulator(): Long = 0L
	override def getResult(accumulator: Long): Long = accumulator
	override def merge(a: Long, b: Long): Long = a + b
}

class countResult() extends WindowFunction[Long, CountByProvince, String, TimeWindow]{
	override def apply(key: String, window: TimeWindow, input: Iterable[Long], out: Collector[CountByProvince]): Unit = {
		out.collect(CountByProvince(formatTs(window.getEnd), key, input.iterator.next()))
	}
	private def formatTs(ts: Long) = {
		val df = new SimpleDateFormat("yyyy/MM/dd-HH:mm:ss")
		df.format(new Date(ts))
	}
}

2、恶意登录监控

模块创建和数据准备

继续在 UserBehaviorAnalysis 下新建一个 maven module 作为子项目，命名为 LoginFailDetect。在这个子模块中，我们将会用到 flink 的 CEP 库来实现事件流的模式匹配，所以需要在 pom 文件中引入 CEP 的相关依赖：


	org.apache.flink
	flink-cep-scala_${scala.binary.version}
	${flink.version}

同样，在 src/main/目录下，将默认源文件目录 java 改名为 scala。

代码实现

对于网站而言，用户登录并不是频繁的业务操作。如果一个用户短时间内频繁登录失败，就有可能是出现了程序的恶意攻击，比如密码暴力破解。因此我们考虑，应该对用户的登录失败动作进行统计，具体来说，如果同一用户（可以是不同 IP）在 2 秒之内连续两次登录失败，就认为存在恶意登录的风险，输出相关的信息进行报警提示。这是电商网站、也是几乎所有网站风控的基本一环。

状态编程

由于同样引入了时间，我们可以想到，最简单的方法其实与之前的热门统计类似，只需要按照用户 ID 分流，然后遇到登录失败的事件时将其保存在 ListState 中，然后设置一个定时器，2 秒后触发。定时器触发时检查状态中的登录失败事件个数，如果大于等于 2，那么就输出报警信息。
在 src/main/scala 下创建 LoginFail.scala 文件，新建一个单例对象。定义样例类 LoginEvent，这是输入的登录事件流。登录数据本应该从 UserBehavior 日志里提取，由于 UserBehavior.csv 中没有做相关埋点，我们从另一个文件 LoginLog.csv 中读取登录数据。
代码如下：
LoginFailDetect/src/main/scala/LoginFail.scala

case class LoginEvent(userId: Long, ip: String, eventType: String, eventTime: Long)

object LoginFail {
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		env.setParallelism(1)
		
		val loginEventStream = env.readTextFile("YOUR_PATH\\resources\\LoginLog.csv")
			.map( data => {
				val dataArray = data.split(",")
				LoginEvent(dataArray(0).toLong, dataArray(1), dataArray(2), dataArray(3).toLong)
			})
			.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor[ApacheLogEvent](Time.milliseconds(3000)) {
				override def extractTimestamp(element: ApacheLogEvent): Long ={
					element.eventTime * 1000L
				}
			})
			.keyBy(_.userId)
			.process(new MatchFunction())
			.print()
		env.execute("Login Fail Detect Job")
	}
	
	class MatchFunction extends KeyedProcessFunction[Long, LoginEvent, LoginEvent] {
		// 定义状态变量
		lazy val loginState: ListState[LoginEvent] = getRuntimeContext.getListState(new ListStateDescriptor[LoginEvent]("saved login", classOf[LoginEvent]))
		override def processElement(login: LoginEvent, context: KeyedProcessFunction[Long, LoginEvent, LoginEvent]#Context, out: Collector[LoginEvent]): Unit = {
			if (login.eventType == "fail") {
				loginState.add(login)
			}
			// 注册定时器，触发事件设定为 2 秒后
			context.timerService.registerEventTimeTimer(login.eventTime * 1000 + 2 * 1000)
		}
	
		override def onTimer(timestamp: Long, ctx: KeyedProcessFunction[Long, LoginEvent, LoginEvent]#OnTimerContext, out: Collector[LoginEvent]): Unit = {
			val allLogins: ListBuffer[LoginEvent] = ListBuffer()
			import scala.collection.JavaConversions._
			for (login <- loginState.get) {
				allLogins += login
			}
			loginState.clear()
			if (allLogins.length > 1) {
				out.collect(allLogins.head)
			}
		}
	}
}

状态编程的改进

上一节的代码实现中我们可以看到，直接把每次登录失败的数据存起来、设置定时器一段时间后再读取，这种做法尽管简单，但和我们开始的需求还是略有差异的。这种做法只能隔 2 秒之后去判断一下这期间是否有多次失败登录，而不是在一次登录失败之后、再一次登录失败时就立刻报警。这个需求如果严格实现起来，相当于要判断任意紧邻的事件，是否符合某种模式。
于是我们可以想到，这个需求其实可以不用定时器触发，直接在状态中存取上一次登录失败的事件，每次都做判断和比对，就可以实现最初的需求。
上节的代码 MatchFunction 中删掉 onTimer，processElement 改为：

override def processElement(value: LoginEvent, ctx: KeyedProcessFunction[Long, LoginEvent, Warning]#Context, out: Collector[Warning]): Unit = {
	// 首先按照 type 做筛选，如果 success 直接清空，如果 fail 再做处理
	if ( value.eventType == "fail" ){
		// 如果已经有登录失败的数据，那么就判断是否在两秒内
		val iter = loginState.get().iterator()
		if ( iter.hasNext ){
			val firstFail = iter.next()
			// 如果两次登录失败时间间隔小于 2 秒，输出报警
			if ( value.eventTime < firstFail.eventTime + 2 ){
				out.collect( Warning( value.userId, firstFail.eventTime, value.eventTime, "login fail in 2 seconds." ) )
			}
			// 把最近一次的登录失败数据，更新写入 state 中
			val failList = new util.ArrayList[LoginEvent]()
			failList.add(value)
			loginState.update( failList )
		} else {
			// 如果 state 中没有登录失败的数据，那就直接添加进去
			loginState.add(value)
		}
	} else
		loginState.clear()
}

CEP 编程

上一节我们通过对状态编程的改进，去掉了定时器，在 process function 中做了更多的逻辑处理，实现了最初的需求。不过这种方法里有很多的条件判断，而我们目前仅仅实现的是检测“连续 2 次登录失败”，这是最简单的情形。如果需要检测更多次，内部逻辑显然会变得非常复杂。那有什么方式可以方便地实现呢？
很幸运，flink 为我们提供了 CEP（Complex Event Processing，复杂事件处理）库，用于在流中筛选符合某种复杂模式的事件。接下来我们就基于 CEP 来完成这个模块的实现。
在 src/main/scala 下继续创建 LoginFailWithCep.scala 文件，新建一个单例对象。样例类 LoginEvent 由于在 LoginFail.scala 已经定义，我们在同一个模块中就不需要再定义了。
代码如下：
LoginFailDetect/src/main/scala/LoginFailWithCep.scala

object LoginFailWithCep {
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		env.setParallelism(1)
		
		val loginEventStream = env.readTextFile("YOUR_PATH\\resources\\LoginLog.csv")
			.map( data => {
				val dataArray = data.split(",")
				LoginEvent(dataArray(0).toLong, dataArray(1), dataArray(2), dataArray(3).toLong)
			})
			.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor[ApacheLogEvent](Time.milliseconds(3000)) {
				override def extractTimestamp(element: ApacheLogEvent): Long ={
					element.eventTime * 1000L
				}
			})
			
		// 定义匹配模式
		val loginFailPattern = Pattern.begin[LoginEvent]("begin")
			.where(_.eventType == "fail")
			.next("next")
			.where(_.eventType == "fail")
			.within(Time.seconds(2))
			
		// 在数据流中匹配出定义好的模式
		val patternStream = CEP.pattern(loginEventStream.keyBy(_.userId), loginFailPattern)
		
		// .select 方法传入一个 pattern select function ，当检测到定义好的模式序列时就会调用
		val loginFailDataStream = patternStream
			.select((pattern: Map[String, Iterable[LoginEvent]]) => {
				val first = pattern.getOrElse("begin", null).iterator.next()
				val second = pattern.getOrElse("next", null).iterator.next()
				(second.userId, second.ip, second.eventType)
			})
			
		// 将匹配到的符合条件的事件打印出来
		loginFailDataStream.print()
		env.execute("Login Fail Detect Job")
	}
}

3、订单支付实时监控

在电商网站中，订单的支付作为直接与营销收入挂钩的一环，在业务流程中非常重要。对于订单而言，为了正确控制业务流程，也为了增加用户的支付意愿，网站一般会设置一个支付失效时间，超过一段时间不支付的订单就会被取消。另外，对于订单的支付，我们还应保证用户支付的正确性，这可以通过第三方支付平台的交易数据来做一个实时对账。在接下来的内容中，我们将实现这两个需求。

模块创建和数据准备

同样地，在 UserBehaviorAnalysis 下新建一个 maven module 作为子项目，命名为 OrderTimeoutDetect。在这个子模块中，我们同样将会用到 flink 的 CEP 库来实现事件流的模式匹配，所以需要在 pom 文件中引入 CEP 的相关依赖：


	org.apache.flink
	flink-cep-scala_${scala.binary.version}
	${flink.version}

同样，在 src/main/目录下，将默认源文件目录 java 改名为 scala。

代码实现

在电商平台中，最终创造收入和利润的是用户下单购买的环节；更具体一点，是用户真正完成支付动作的时候。用户下单的行为可以表明用户对商品的需求，但在现实中，并不是每次下单都会被用户立刻支付。当拖延一段时间后，用户支付的意愿会降低。所以为了让用户更有紧迫感从而提高支付转化率，同时也为了防范订单支付环节的安全风险，电商网站往往会对订单状态进行监控，设置一个失效时间（比如 15 分钟），如果下单后一段时间仍未支付，订单就会被取消。

使用 CEP 实现

我们首先还是利用 CEP 库来实现这个功能。我们先将事件流按照订单号 orderId 分流，然后定义这样的一个事件模式：在 15 分钟内，事件“create”与“pay”非严格紧邻：

val orderPayPattern = Pattern.begin[OrderEvent]("begin")
	.where(_.eventType == "create")
	.followedBy("follow")
	.where(_.eventType == "pay")
	.within(Time.seconds(5))

这样调用.select 方法时，就可以同时获取到匹配出的事件和超时未匹配的事件了。
在 src/main/scala 下继续创建 OrderTimeout.scala 文件，新建一个单例对象。定义样例类 OrderEvent，这是输入的订单事件流；另外还有 OrderResult，这是输出显示的订单状态结果。订单数据也本应该从UserBehavior 日志里提取，由于 UserBehavior.csv 中没有做相关埋点，我们从另一个文件 OrderLog.csv 中读取登录数据。
完整代码如下：
OrderTimeoutDetect/src/main/scala/OrderTimeout.scala

case class OrderEvent(orderId: Long, eventType: String, eventTime: Long)
case class OrderResult(orderId: Long, eventType: String)

object OrderTimeout {
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setParallelism(1)
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		
		val orderEventStream = env.readTextFile("YOUR_PATH\\resources\\OrderLog.csv")
			.map( data => {
				val dataArray = data.split(",")
				OrderEvent(dataArray(0).toLong, dataArray(1), dataArray(3).toLong)
			})
			.assignAscendingTimestamps(_.eventTime * 1000)
			// 定义一个带匹配时间窗口的模式
		val orderPayPattern = Pattern.begin[OrderEvent]("begin")
			.where(_.eventType == "create")
			.followedBy("follow")
			.where(_.eventType == "pay")
			.within(Time.minutes(15))
			
		// 定义一个输出标签
		val orderTimeoutOutput = OutputTag[OrderResult]("orderTimeout")
		// 订单事件流根据 orderId  分流，然后在每一条流中匹配出定义好的模式
		val patternStream = CEP.pattern(orderEventStream.keyBy("orderId"), orderPayPattern)
		val completedResult = patternStream.select(orderTimeoutOutput) {
			// 对于已超时的部分模式匹配的事件序列，会调用这个函数
			(pattern: Map[String, Iterable[OrderEvent]], timestamp: Long) => {
				val createOrder = pattern.get("begin")
				OrderResult(createOrder.get.iterator.next().orderId, "timeout")
			}
		} {
			// 检测到定义好的模式序列时，就会调用这个函数
			pattern: Map[String, Iterable[OrderEvent]] => {
				val payOrder = pattern.get("follow")
				OrderResult(payOrder.get.iterator.next().orderId, "success")
			}
		}
		// 拿到同一输出标签中的 timeout  匹配结果（流）
		val timeoutResult = completedResult.getSideOutput(orderTimeoutOutput)
		completedResult.print()
		timeoutResult.print()
		env.execute("Order Timeout Detect Job")
	}
}

使用 Process Function 实现

我们同样可以利用 Process Function，自定义实现检测订单超时的功能。为了简化问题，我们只考虑超时报警的情形，在 pay 事件超时未发生的情况下，输出超时报警信息。
一个简单的思路是，可以在订单的 create 事件到来后注册定时器，15 分钟后触发；然后再用一个布尔类型的 Value 状态来作为标识位，表明 pay 事件是否发生过。
如果 pay 事件已经发生，状态被置为 true，那么就不再需要做什么操作；而如果 pay 事件一直没来，状态一直为 false，到定时器触发时，就应该输出超时报警信息。
具体代码实现如下：
OrderTimeoutDetect/src/main/scala/OrderTimeoutWithoutCep.scala

object OrderTimeoutWithoutCep {
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		env.setParallelism(1)
		
		val orderEventStream = env.readTextFile("YOUR_PATH\\resources\\OrderLog.csv")
			.map( data => {
				val dataArray = data.split(",")
				OrderEvent(dataArray(0).toLong, dataArray(1), dataArray(3).toLong)
			})
			.assignAscendingTimestamps(_.eventTime * 1000)
			.keyBy(_.orderId)
			
		// 自定义一个 process function ，进行 order 的超时检测，输出超时报警信息
		val timeoutWarningStream = orderEventStream
			.process(new OrderTimeoutAlert)
		timeoutWarningStream.print()
		env.execute()
	}
	
	class OrderTimeoutAlert extends KeyedProcessFunction[Long, OrderEvent, OrderResult]{
		lazy val isPayedState: ValueState[Boolean] = getRuntimeContext.getState(new ValueStateDescriptor[Boolean]("ispayed-state", classOf[Boolean]))
		override def processElement(value: OrderEvent, ctx: KeyedProcessFunction[Long, OrderEvent, OrderResult]#Context, out: Collector[OrderResult]): Unit = {
			val isPayed = isPayedState.value()
			if (value.eventType == "create" && !isPayed) {
				ctx.timerService().registerEventTimeTimer(value.eventTime * 1000L + 15 * 60 *1000L)
			} else if (value.eventType == "pay") {
				isPayedState.update(true)
			}
		}
		
		override def onTimer(timestamp: Long, ctx: KeyedProcessFunction[Long, OrderEvent, OrderResult]#OnTimerContext, out: Collector[OrderResult]): Unit = {
			val isPayed = isPayedState.value()
			if (!isPayed) {
				out.collect(OrderResult(ctx.getCurrentKey, "order timeout"))
			}
			isPayedState.clear()
		}
	}
}

来自两条流的订单交易匹配

对于订单支付事件，用户支付完成其实并不算完，我们还得确认平台账户上是否到账了。而往往这会来自不同的日志信息，所以我们要同时读入两条流的数据来做合并处理。这里我们利用 connect 将两条流进行连接，然后用自定义的 CoProcessFunction 进行处理。
具体代码如下：
TxMatchDetect/src/main/scala/TxMatch

case class OrderEvent( orderId: Long, eventType: String, txId: String, eventTime: Long )
case class ReceiptEvent( txId: String, payChannel: String, eventTime: Long )

object TxMatch {
	val unmatchedPays = new OutputTag[OrderEvent]("unmatchedPays")
	val unmatchedReceipts = new OutputTag[ReceiptEvent]("unmatchedReceipts")
	
	def main(args: Array[String]): Unit = {
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		env.setParallelism(1)
		env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
		
		val orderEventStream = env.readTextFile("YOUR_PATH\\resources\\OrderLog.csv")
			.map( data => {
				val dataArray = data.split(",")
				OrderEvent(dataArray(0).toLong, dataArray(1), dataArray(2), dataArray(3).toLong)
			})
			.filter(_.txId != "")
			.assignAscendingTimestamps(_.eventTime * 1000L)
			.keyBy(_.txId)
	
		val receiptEventStream = env.readTextFile("YOUR_PATH\\resources\\ReceiptLog.csv")
			.map( data => {
				val dataArray = data.split(",")
				ReceiptEvent(dataArray(0), dataArray(1), dataArray(2).toLong)
			})
			.assignAscendingTimestamps(_.eventTime * 1000L)
			.keyBy(_.txId)
			
		val processedStream = orderEventStream
			.connect(receiptEventStream)
			.process(new TxMatchDetection)

		processedStream.getSideOutput(unmatchedPays).print("unmatched pays")
		processedStream.getSideOutput(unmatchedReceipts).print("unmatched receipts")
		processedStream.print("processed")
		env.execute()
	}
	
	class TxMatchDetection extends CoProcessFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]{
		lazy val payState: ValueState[OrderEvent] = getRuntimeContext.getState(new ValueStateDescriptor[OrderEvent]("pay-state",classOf[OrderEvent]) )
		lazy val receiptState: ValueState[ReceiptEvent] = getRuntimeContext.getState(new ValueStateDescriptor[ReceiptEvent]("receipt-state", classOf[ReceiptEvent]) )
	
		override def processElement1(pay: OrderEvent, ctx: CoProcessFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]#Context, out: Collector[(OrderEvent, ReceiptEvent)]): Unit = {
			val receipt = receiptState.value()
			if( receipt != null ){
				receiptState.clear()
				out.collect((pay, receipt))
			} else{
				payState.update(pay)
				ctx.timerService().registerEventTimeTimer(pay.eventTime * 1000L)
			}
		}
	
		override def processElement2(receipt: ReceiptEvent, ctx: CoProcessFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]#Context, out: Collector[(OrderEvent, ReceiptEvent)]): Unit = {
			val payment = payState.value()
			if( payment != null ){
				payState.clear()
				out.collect((payment, receipt))
			} else{
				receiptState.update(receipt)
				ctx.timerService().registerEventTimeTimer(receipt.eventTime * 1000L)
			}
		}
	
		override def onTimer(timestamp: Long, ctx: CoProcessFunction[OrderEvent, ReceiptEvent, (OrderEvent, ReceiptEvent)]#OnTimerContext, out: Collector[(OrderEvent, ReceiptEvent)]): Unit = {
			if ( payState.value() != null ){
				ctx.output(unmatchedPays, payState.value())
			}
			if ( receiptState.value() != null ){
				ctx.output(unmatchedReceipts, receiptState.value())
			}
			payState.clear()
			receiptState.clear()
		}
	}
}

4、电商常见指标汇总

现在的电子商务：
1、大多买家通过搜索找到所买物品，而非电商网站的内部导航，搜索关键字更为重要；
2、电商商家通过推荐引擎来预测买家可能需要的商品。推荐引擎以历史上具有类似购买记录的买家数据以及用户自身的购买记录为基础，向用户提供推荐信息；
3、电商商家时刻优化网站性能，如 A/B Test 划分来访流量，并区别对待来源不同的访客，进而找到最优的产品、内容和价格；
4、购买流程早在买家访问网站前，即在社交网络、邮件以及在线社区中便已开始，即长漏斗流程（以一条推文、一段视频或一个链接开始，以购买交易结束）。
相关数据指标：关键词和搜索词、推荐接受率、邮件列表/短信链接点入率

电商 8 类基本指标

1、总体运营指标：从流量、订单、总体销售业绩、整体指标进行把控，起码对运营的电商平台有个大致了解，到底运营的怎么样，是亏是赚。

2、站流量指标：即对访问你网站的访客进行分析，基于这些数据可以对网页进行改进，以及对访客的行为进行分析等等。

3、销售转化指标：分析从下单到支付整个过程的数据，帮助你提升商品转化率。也可以对一些频繁异常的数据展开分析。

4、客户价值指标：这里主要就是分析客户的价值，可以建立 RFM 价值模型，找出那些有价值的客户，精准营销等等。

5、商品类指标：主要分析商品的种类，那些商品卖得好，库存情况，以及可以建立关联模型，分析那些商品同时销售的几率比较高，而进行捆绑销售，有点像啤酒和尿布的故事。

6、市场营销活动指标，主要监控某次活动给电商网站带来的效果，以及监控广告的投放指标。

7、风控类指标：分析卖家评论，以及投诉情况，发现问题，改正问题。

8、市场竞争指标：主要分析市场份额以及网站排名，进一步进行调整。

你可能感兴趣的:(BigData,BigData,Components)

DeepSeek 助力 Vue 开发：打造丝滑的日期选择器（Date Picker），未使用第三方插件宝码香车 #DeepSeek #Vue vue.js 前端 javascript ecmascript DeepSeek
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录DeepSeek助力Vue开发：打造丝滑的日期选择器（DatePicker），未使用第三方插件前言进入安装好的DeepSeek页面效果指令输入**属性（Props）****事件（Events）**组件代码，src\components\Dat
Spring常用注解和组件优人ovo spring java 数据库
引言了解Spring常用注解的使用方式可以帮助我们更快速理解这个框架和其中的深度注解@Configuration：表示该类是一个配置类，用于定义SpringBean。@EnableAutoConfiguration：启用SpringBoot的自动配置功能，让SpringBoot根据类路径中的依赖自动配置应用。@ComponentScan：启用组件扫描，SpringBoot会扫描该类所在包及其子包下
Springboot正常启动但打开页面遇到404错误 m0_74823827 领取Java全套学习资料 vip1024p spring boot 后端 java
开发基于SpringBoot的应用程序过程中，springboot正常启动但打开页面遇到404错误。原因分析与解决方案原因一：控制器未被Spring容器扫描到症状描述：启动应用时无明显错误提示，但尝试访问特定URL时收到404错误。原理：声明bean的四大注解，要想生效，还需要被组件扫描注解@ComponentScan扫描·@ComponentScan注解虽然没有显式配置，但是实际上已经包含在了启
别人的Vue文件怎么使用 CCSBRIDGE 了解Vue vue.js 前端 javascript
1.了解Vue项目结构当你创建一个空的Vue项目时，默认会有以下目录和文件：-src/-components/-views/-App.vue-main.jscomponents/:放置可复用的小组件。views/:放置页面级别的组件，比如登录页面、首页等。App.vue:根组件。main.js:Vue应用入口文件。2.将xxx.vue放到views文件夹打开你的项目目录。找到src/views文件
Ubuntu下配置安装Hadoop 2.2 weixin_30501857 大数据 java 运维
---恢复内容开始---这两天玩Hadoop，之前在我的Mac上配置了好长时间都没成功的Hadoop环境，今天想在win7虚拟机下的Ubuntu12.0464位机下配置，然后再建一个组群看一看。参考资料：1.InstallingsinglenodeHadoop2.2.0onUbuntu：http://bigdatahandler.com/hadoop-hdfs/installing-single-
[转载] awesome big data weixin_30343157 javascript java runtime ViewUI
原文:https://github.com/onurakpolat/awesome-bigdata#graph-data-model作者把分布式领域相关的大部分开源项目和论文分类整理了一遍,造福人类啊.AwesomeBigDataAcuratedlistofawesomebigdataframeworks,resourcesandotherawesomeness.Inspiredbyawesome
鸿蒙开发：组件样式的复用
前言我们先看一段简单的代码，可以看看发现有什么问题。@Entry@ComponentstructIndex{build(){Column(){Text("1").width(50).height(50).backgroundColor(Color.Red).margin({top:10})Text("2").width(50).height(50).backgroundColor(Color.Re
2014 6月，比较老了金金2019
AwesomeBigDataAcuratedlistofawesomebigdataframeworks,resourcesandotherawesomeness.Inspiredbyawesome-php,awesome-python,awesome-ruby,hadoopecosystemtable&big-data.Yourcontributionsarealwayswelcome!Awes
Unity3D中的ECS架构上班摸鱼君 unity unity
在Unity3D中，ECS（EntityComponentSystem）架构是一种不同于传统OOP（面向对象编程）的方法，它强调数据驱动的设计，可以显著提升性能和扩展性。在ECS中，主要有三个核心概念：Entity（实体）、Component（组件）和System（系统）。下面是一个基本的Unity3DECS例子，用于展示如何创建一个简单的ECS架构来管理实体和组件。1.创建EntitiesEnt
Unity DOTS的核心之ECS 你一身傲骨怎能输 Unity引擎技术 unity 游戏引擎
ECS-UnityDOTS的核心EntityComponentSystem(ECS)是一个gameplay层面的框架，它是建立在渲染引擎、物理引擎之上的，主要解决的问题是如何建立一个模型来处理游戏对象(GameObject)的更新操作。以帮助更好地理解ECS的工作原理及其优势。ECS的核心概念Entity（实体）：实体是ECS架构中的基本单位，代表游戏中的一个对象。每个实体都是一个唯一的ID，实际
推荐开源项目：Tango 组件库 - React 开发者的低代码宝藏孙爽知Kody
推荐开源项目：Tango组件库-React开发者的低代码宝藏tango-componentsAnUIlibraryfortangolow-codebuilder项目地址:https://gitcode.com/gh_mirrors/ta/tango-components在日益增长的低代码开发趋势中，Tango组件库犹如一颗璀璨的新星，以其专为TangoLowCodeBuilder设计的React组
对React中类组件和函数组件的理解？开发小途 react.js 前端
React中的类组件和函数组件是两种不同的组件定义方式，它们都可以用来创建UI，但在语法、特性和使用场景上有一些区别。以下是它们的详细对比和理解：1.类组件（ClassComponents）特点基于ES6的类：类组件是通过继承React.Component或React.PureComponent来定义的。状态管理：类组件可以通过this.state和this.setState来管理组件的内部状态。
element plus 去掉select选择框的边框，并修改右侧图标 a濯 elementplus css 前端
1.去掉选择框边框::v-deep.el-select__wrapper{box-shadow:none;}::v-deep.is-hovering{box-shadow:none!important;}2.修改选择框右侧图标新建CaretBottom.vue文件内容：将新建的vue文件引入到select选择框所在的文件importCaretBottomfrom'../components/Car
vue中实现数字滚动效果 a濯 vue.js 前端 javascript
安装vue-count-tonpminstallvue-count-to引入vue-count-toimportCountTofrom'vue-count-to'exportdefault{components:{CountTo},data(){return{startVal:0,endVal:2021,duration:2000,//动画持续时间，单位为毫秒decimals:0,//小数点后保留
Centos7服务器运维服务系统安装过程中遇到的问题总结阿卜力米提40 服务器运维
Centos7服务器运维服务系统安装过程中遇到的问题总结centos服务器运维由于我们Sinesafe的客户要求网站的服务器要装Centos7版本所以给大家分享下安装的过程与经验,如果需要深入的服务器运维服务也可以找我们。机器域名机器别名xxx.xxx.xxx.xxxbigdata1xxx.xxx.xxx.xxxbigdata2xxx.xxx.xxx.xxxbigdata33台机器用户名和密码：用
vue3+vite项目，elementPlus自定义主题
vue3+vite配置elementPlus主题需要安装一下两个插件：unplugin-vue-componentsunplugin-auto-import开始配置：第一步、安装插件pnpminstall-Dunplugin-vue-componentsunplugin-auto-import//我这里使用pnpm安装，当然大家如果没有配置安装pnpm可以使用npm/cnpm第二步、配置插件（在v
arcgis api 4 「已注销」 Web前端经验分享前端前端框架
BaseDynamicLayer继承自layer类动态地图图层，无法在浏览器中缓存；不支持3D中的自定义动态图层BuildingSceneLayer继承自layer类，用于SceneView中可视化具有详细内部的建筑物，加载BIM相关。其子类为BuildingComponentSublayer；BuildingComponentSublayers包含3D对象功能，表示建筑组件，如门，管道或AC单元
【大数据治理】局外人_Jia 大数据安全人工智能
大数据治理（BigDataGovernance）是指通过一系列策略、流程和技术手段，确保大数据的质量、安全性、合规性和可用性，从而最大化数据的价值。以下是大数据治理的核心内容、挑战和最佳实践：1.大数据治理的核心内容1.1数据质量管理确保数据的准确性、完整性、一致性和及时性。数据清洗：处理缺失值、重复数据和错误数据。数据验证：定义数据规则，确保数据符合业务需求。数据监控：实时监控数据质量，及时发现
Compose Canvas 折线图安果移不动 #038Compose 动态规划算法
packagecom.anguomob.compose.ui.componentsimportandroid.util.Logimportandroidx.compose.foundation.Canvasimportandroidx.compose.foundation.layout.*importandroidx.compose.foundation.shape.RoundedCornerSh
简记一段数据清洗项目经历 Jo乔戈里 sql database mysql python
声明：该项目是从github上下载的，原项目地址在:https://github.com/TurboWay/bigdata_analyse这个数据分析项目选自其中的"Amoy_job",即"10万条厦门招聘数据分析",但是没有严格沿用里面的代码，绝大部分都是自己思考所做的数据清洗。注意，此处仅是数据清洗，尚未进入到真正的数据分析和可视化，得出结论这些阶段！代码镇楼:fromcollectionsi
KEIL修改工程名 woainizhongguo. 经验分享
假设原来的工程文件名是first，要改成second1.在工程文件目录中，将first.uvopt和first.uvproj名字改成second.uvopt和second.uvproj。2.其他first文件统统删除。3.打开second.uvproj,4.点击品字形图标，在弹出的界面上，双击“ProgectComponents”下面的工程名，修改成second5.点击project》Option
第60节鸿蒙应用开发中组件截图川石课堂软件测试 harmonyos 华为鸿蒙鸿蒙系统华为云华为od
在鸿蒙应用开发中，组件截图是一个重要的功能，它允许开发者获取应用中各个组件的图像。以下是对鸿蒙应用开发中组件截图的详细解析：一、组件截图的基本概念组件截图是指截取鸿蒙应用界面中的特定组件的图像。这通常用于调试、测试或生成应用文档等场景。通过组件截图，开发者可以直观地查看组件的渲染效果，从而确保应用的界面符合预期。二、组件截图的实现方式在鸿蒙应用开发中，组件截图主要通过componentSnapsh
vue表格使用分页对el-pagination封装 2401_87880413 vue.js javascript 前端
components中封装为通用组件constprops=defineProps({total:{required:true,type:Number},page:{type:Number,default:1},limit:{type:Number,default:20},pageSizes:{type:Array,default(){return[10,20,30,50]}},pagerCount
[论文笔记] llama3.2 蒸馏心心喵论文笔记论文阅读
参考链接：LLaMA3.2技术报告：GitHub-meta-llama/llama-stack:ModelcomponentsoftheLlamaStackAPIs[2407.21783]TheLlama3HerdofModelshttps://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/HuggingFac
【Linux】《how linux work》第十七章夯实基础 linux后端翻译
Chapter17.BuildingontheBasics（第17章夯实基础）ThechaptersinthisbookhavecoveredthefundamentalcomponentsofaLinuxsystem,fromlow-levelkernelandprocessorganization,tonetworking,tosomeofthetoolsusedtobuildsoftware
⚡️⚡️Vitest，解锁 Vue 组件测试的高效之道
⚡️⚡️Vitest：解锁Vue组件测试的高效之道原文链接：TestingVuecomponentswithVitest作者：JacobAndrewSky译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！现代前端开发需要强大的测试实践，以
Apache HttpClient SSL配置指南
前置准备SpringBoot项目Maven依赖依赖类SpringBoot项目网络上有很多教程，这里不多介绍。Mavenorg.apache.httpcomponentshttpclient4.5.14依赖类按照Httpclient的设计要求编写一个响应信息处理类，也可以使用匿名内部类或者Lambda表达式。publicclassCustomHttpClientResponseHandlerimpl
【Linux】《how linux work》第十四章 Linux 桌面简介 linux翻译
Chapter14.ABriefSurveyoftheLinuxDesktop（Linux桌面简介）ThischapterisaquickintroductiontothecomponentsfoundinatypicalLinuxdesktopsystem.OfallofthedifferentkindsofsoftwarethatyoucanfindonLinuxsystems,thedesk
⚡️⚡️Vitest，解锁 Vue 组件测试的高效之道
⚡️⚡️Vitest：解锁Vue组件测试的高效之道原文链接：TestingVuecomponentswithVitest作者：JacobAndrewSky译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！现代前端开发需要强大的测试实践，以
推荐开源项目：@quickbaseoss/babel-plugin-styled-components-css-namespace 芮奕滢Kirby
推荐开源项目：@quickbaseoss/babel-plugin-styled-components-css-namespacebabel-plugin-styled-components-css-namespaceAbabelplugintoaddcssnamespaces(andincreasespecificity)ofstyled-componentclasses.项目地址:https:
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16]root@192.168.11.10:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s