lomtom

【大数据 Spark】利用电影观看记录数据,进行电影推荐

利用电影观看记录数据,进行电影推荐。

利用电影观看记录数据,进行电影推荐。
准备
- 1、任务描述：
- 2、数据下载
- 3、部分数据展示
实操
- 1、设置输入输出路径
- 2、配置spark
- 3、读取Rating文件
- 4、读取movie文件
- 5、保存结果
- 6、结果
你可能会遇到的问题
- 问题一：结果输出目录已存在
- 问题二：缺少hadoop环境变量

【大数据 Spark】利用电影观看记录数据,进行电影推荐_第1张图片

准备

1、任务描述：

在推荐领域有一个著名的开放测试集，下载链接是：http://grouplens.org/datasets/movielens/，该测试集包含三个文件，分别是ratings.dat、sers.dat、movies.dat，具体介绍可阅读：README.txt。

请编程实现：通过连接ratings.dat和movies.dat两个文件得到平均得分超过4.0的电影列表，采用的数据集是：ml-1m

2、数据下载

下载（大小约为5.64M）后解压，会有movies.dat、ratings.dat、ReadMe、users.dat四个文件。

3、部分数据展示

movies.dat 部分数据：

MovieID::Title::Genres

1::Toy Story (1995)::Animation|Children's|Comedy
2::Jumanji (1995)::Adventure|Children's|Fantasy
3::Grumpier Old Men (1995)::Comedy|Romance
4::Waiting to Exhale (1995)::Comedy|Drama
5::Father of the Bride Part II (1995)::Comedy
6::Heat (1995)::Action|Crime|Thriller
7::Sabrina (1995)::Comedy|Romance
8::Tom and Huck (1995)::Adventure|Children's
9::Sudden Death (1995)::Action
10::GoldenEye (1995)::Action|Adventure|Thriller
11::American President, The (1995)::Comedy|Drama|Romance
12::Dracula: Dead and Loving It (1995)::Comedy|Horror
13::Balto (1995)::Animation|Children's
14::Nixon (1995)::Drama
15::Cutthroat Island (1995)::Action|Adventure|Romance
16::Casino (1995)::Drama|Thriller
17::Sense and Sensibility (1995)::Drama|Romance
18::Four Rooms (1995)::Thriller
19::Ace Ventura: When Nature Calls (1995)::Comedy
20::Money Train (1995)::Action

ratings.dat 部分数据：

UserID::MovieID::Rating::Timestamp

1::1193::5::978300760
1::661::3::978302109
1::914::3::978301968
1::3408::4::978300275
1::2355::5::978824291
1::1197::3::978302268
1::1287::5::978302039
1::2804::5::978300719
1::594::4::978302268
1::919::4::978301368
1::595::5::978824268
1::938::4::978301752
1::2398::4::978302281
1::2918::4::978302124
1::1035::5::978301753
1::2791::4::978302188
1::2687::3::978824268
1::2018::4::978301777
1::3105::5::978301713
1::2797::4::978302039

实操

将我们刚刚下载的数据存放到我们的项目中，项目目录结构如下，创建我们的主程序movie.scala

1、设置输入输出路径

这里使用数组保存我们的输入输出文件，方便后面的修改以及使用

    val files = Array("src/main/java/day_20200425/data/movies.dat",
      "src/main/java/day_20200425/data/ratings.dat",
      "src/main/java/day_20200425/output")

2、配置spark

val conf = new SparkConf().setAppName("SparkJoin").setMaster("local")
val sc = new SparkContext(conf)

3、读取Rating文件

读取Ratings.dat文件，根据其内容格式我们将其用：：分隔开两个部分，最后计算出电影评分。

 // Read rating  file
    val textFile = sc.textFile(files(1))

    //提取(movieid, rating)
    val rating = textFile.map(line => {
      val fileds = line.split("::")
      (fileds(1).toInt, fileds(2).toDouble)
    })

    //get (movieid,ave_rating)
    val movieScores = rating
      .groupByKey()
      .map(data => {
        val avg = data._2.sum / data._2.size
                 (data._1, avg)
               })

4、读取movie文件

Join操作的结果(ID,((ID,Rating),(ID,MovieName)))
RDD的keyBy(func)实际上是为每个RDD元素生成一个增加了key的

由于有时候数据的列数很多，不只是按一项作为key来排序，有时候需要对其中两项进行排序，Spark的RDD提供了keyBy的方法。

val movies = sc.textFile(files(0))
    val movieskey = movies.map(line => {
       val fileds = line.split("::")
        (fileds(0).toInt, fileds(1)) //(MovieID,MovieName)
     }).keyBy(tup => tup._1)

5、保存结果

保存评分大于4的电影

val result = movieScores
     .keyBy(tup => tup._1)
     .join(movieskey)
     .filter(f => f._2._1._2 > 4.0)
     .map(f => (f._1, f._2._1._2, f._2._2._2))
//     .foreach(s =>println(s))

    val file = new File(files(2))
    if(file.exists()){
      deleteDir(file)
    }
    result.saveAsTextFile(files(2))

6、结果

他会自动生成output文件夹，里面有四个文件，_SUCECCESS代表成功的意思，里面没有任何内容，part-00000就是我们的需要的数据。

部分结果：

(1084,4.096209912536443,Bonnie and Clyde (1967))
(3007,4.013559322033898,American Movie (1999))
(2493,4.142857142857143,Harmonists, The (1997))
(3517,4.5,Bells, The (1926))
(1,4.146846413095811,Toy Story (1995))
(1780,4.125,Ayn Rand: A Sense of Life (1997))
(2351,4.207207207207207,Nights of Cabiria (Le Notti di Cabiria) (1957))
(759,4.101694915254237,Maya Lin: A Strong Clear Vision (1994))
(1300,4.1454545454545455,My Life as a Dog (Mitt liv som hund) (1985))
(1947,4.057818659658344,West Side Story (1961))
(2819,4.040752351097178,Three Days of the Condor (1975))
(162,4.063136456211812,Crumb (1994))
(1228,4.1875923190546525,Raging Bull (1980))
(1132,4.259090909090909,Manon of the Spring (Manon des sources) (1986))
(306,4.227544910179641,Three Colors: Red (1994))
(2132,4.074074074074074,Who's Afraid of Virginia Woolf? (1966))
(720,4.426940639269406,Wallace & Gromit: The Best of Aardman Animation (1996))
(2917,4.031746031746032,Body Heat (1981))
(1066,4.1657142857142855,Shall We Dance? (1937))
(2972,4.015384615384615,Red Sorghum (Hong Gao Liang) (1987))

你可能会遇到的问题

问题一：结果输出目录已存在

描述：

Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory file:/D:/Projects/JAVA/Scala/src/main/java/day_20200425/data/output already exist

分析：由于运行，然后输出文件夹已存在，则需要删除该目录
解决：方法一：手动删除、方法二：加入以下代码

1、主程序中
    val file = new File(files(2))
    if(file.exists()){
      deleteDir(file)
    }


2、删除函数
  /**
    * https://www.cnblogs.com/honeybee/p/6831346.html
    * 删除一个文件夹,及其子目录
    *
    * @param dir 目录
    */
  def deleteDir(dir: File): Unit = {
    val files = dir.listFiles()
    files.foreach(f => {
      if (f.isDirectory) {
        deleteDir(f)
      } else {
        f.delete()
        println("delete file " + f.getAbsolutePath)
      }
    })
    dir.delete()
    println("delete dir " + dir.getAbsolutePath)
  }

问题二：缺少hadoop环境变量

描述：

ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path java.io.IOException

分析：
在windows环境下没有配置hadoop环境的原因。
解决：
下载：https://github.com/amihalik/hadoop-common-2.6.0-bin，并且将其bin目录配置为系统的环境变量（path），然后再代码中加入以下代码，例如我的目录为E:\\Program\\hadoop\\hadoop-common-2.6.0-bin，那么则需要加入：

 System.setProperty("hadoop.home.dir", "E:\\Program\\hadoop\\hadoop-common-2.6.0-bin")

你可能感兴趣的:(【大数据 Spark】利用电影观看记录数据,进行电影推荐)

Python day18 赵英英俊 Python训练 python
@浙大疏锦行pythonday18.内容：昨天学习了聚类算法的一些基本内容，今天继续学习相关知识分析簇的特征和相关含义（使用可视化来进行分析，也可以使用ai）代码：shap.initjs()#初始化SHAP解释器explainer=shap.TreeExplainer(model)shap_values=explainer.shap_values(x1)#这个计算耗时shap_values.sha
【完全掌握】PyPDF2/PyPDF4深度指南：Python轻松实现PDF读取与操作的15个高级技巧莫比乌斯@卷技术技巧 #文档处理扩展 python pdf 服务器
【完全掌握】PyPDF2/PyPDF4深度指南：Python轻松实现PDF读取与操作的15个高级技巧1.PDF库基础了解1.1PyPDF2与PyPDF4的关系与选择PyPDF2是一个历史悠久的PythonPDF处理库，而PyPDF4是其改进和维护的分支版本：#安装PyPDF2pipinstallPyPDF2#或安装PyPDF4（推荐）pipinstallPyPDF4PyPDF4相比PyPDF2有以
教育的起点金凤尾竹
教育的起点是什么？当然是基于了解。如果是班级，要基于观察和数据调查，如果是个人，要基于观察、记录。有调查才有发言权，这是颠古不破的真理。“苏神”说：“教育的重要任务在于渐渐养成儿童从事紧张的、创造性的脑力劳动的习惯，儿童应当学会在某一特定的时间摆脱周围的一切，以便于集中精力去达到教师或他自己所提出的目标，要努力做到使儿童养成这种专心致志的习惯。只有在这样的条件下，脑力劳动才可以成为儿童喜爱的事情。
思鸿教育：教师资格证考前复习策略及技巧媳妇别闹丿
搞好考前复习，是教师资格考试取得好成绩的一个重要因素。考前复习实质上就是重新学习已学过的知识、技能，从而巩固地掌握知识技能，培养能力。将所学知识进行复习，无异于炒“冷饭”，掌握一些复习的策略和技巧是大有必要的。在考前复习阶段，常有一些参加考试的学员反映：自己想复习，也有时间学习，只是一拿起书本就犯困，并伴有厌倦、烦躁的情绪。这是复习迎考过程中产生心理疲劳的具体表现。心理疲劳不像生理疲劳那样可以通过
10万+的小秘密告诉我们，自媒体人要爆文，推广渠道的建设更重要新桌
自媒体人应该换个角度分析10万+,其实想要写出爆文,宣传和推广的渠道建设更为重要每一位自媒体人、新媒体运营者,都希望能写出更多的10W+,所以今天我们就编辑了几组数据去从另一个角度看待这个问题,当然拍脑门子想出的数据没有实际意义,但希望今天的内容可以帮助大家做一个思维的拐弯,再我们更多专注内容本身的同时,别忘了,渠道建设也很重要。只有双管齐下,才能取得好的效果。
七、Zabbix — Proxy分布式监控胖胖不胖、《Zabbix速学即学即用》zabbix 分布式服务器运维监控
目录配置Zabbix-proxy代理1.安装代理2.安装并配置数据库（proxy不能与zabbix-server共享数据库）3.发送zabbix-server源码包中初始化脚本到proxy主机并导入数据库4.修改代理配置文件5.web页面添加并配置代理Zabbix-agent客户端配置1.修改配置文件2.web页面修改，把这些主机修改为通过代理获取数据减少zabbix-server压力便于多地设备
减肥记录第二天爱偷懒的喵主
昨天下午吃了冰淇淋，香芋派，晚上没吃饭，不过没有禁受住炸鸡的诱惑，把炸鸡吃了，还吃了一个苹果。炸鸡冰淇淋最有热量，不过表扬的是没吃晚饭，今早体重57.4。今天不吃高热量食物。下午瑜伽一小时，加油！每天体重不能增加。天天好心情。
大树、师生与校园 eggplant
2021年8月23日星期一学校建校于上世纪60年代初，至今还是原址，校园不大还很成旧，但却有欣欣向荣的蓬勃生机，这要归功于上世纪九十年代校园里栽种的十几棵香樟树，短短二十多年，它们就从当初的几米长成了十几米高的大树，每一棵大树的枝杈都如打开的巨伞，给校园里四处游戏的孩子们带来了阴凉。因为枝杈发散太多，夏天常有暴风雷电，为了避免枝杈折断，学校请来了专业的林业园艺师进行修剪，他们搭上梯子，用上大锯子、
“错过交复盘”的复盘尹建艳
Hi式复盘Day39/3652019.2.21正月初十七星期四因为今天总部品牌来地区有会议，所以在昨天晚上完成了复盘，以此避免因忙起来耽误了；今天的会议从早上10点一直进行至下午1点30结束的，中途在近1点的时候查看手机时才想起来“已经完美的错过了交复盘的时间”反思最近这几天这种情况也偶尔在出现，但就复盘来讲，都在千均一发的时刻赶上了。。。今天这事让我心里有点慌，所以要好好找找原因：因为我一直把复
频繁记录着，因为生活值得。 SmileJoker笔迹
1、始终不明白没有结果的人为什么要相遇2、挣钱就好其他都俗3、是个凡人偶尔烦人4、有在好好生活5、外界的声音都是参考6、用野草纪念我吧玫瑰太贵了野草遍地都是7、我深知这是我一个人的困局8、不忙你说我在听9、雨都停了这片天灰什么呢10、长相跟不上审美经济跟不上品味11、开导朋友一套又一套轮到自己拿绳子套一套12、发呆是唯一不用付费的宇宙漫游13、频繁记录着因为生活值得
【华为OD机试真题 2025C卷】161、机器人可活动的最大网格点数目 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od 机器人 c++华为OD机试真题 java 机器人可活动的最大网格点数目 c语言
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新，有代码问题
MacBook电脑一键切换输入法工具，超好用！ macfortg
我们在日常使用MacBook电脑时，如果使用多种输入法的话，会显得比较麻烦和繁琐。那么自动切换输入法不仅可以帮我们使用快捷键进行切换，做到一键切换非常的便利和方便。而且在自动切换输入法中可以使用自动切换输入法的APP和网页对应式的输入法自动化的切换输入法，只要你设置好了之后，切换APP或者打开网页都能得到自己想要的输入法。1、设置快捷键，快速切换，省时省力！用户可以设置快捷键，指定输入法的切换。而
某国产数据库“热情过头”的发布会，该收收了！ IT邦德数据库国产数据库数据库
作者：IT邦德中国DBA联盟(ACDU)成员，15年DBA工作经验Oracle、PostgreSQLACECSDN博客专家及B站知名UP主，全网粉丝15万+擅长主流Oracle、MySQL、PG、高斯及Greenplum备份恢复，安装迁移，性能优化、故障应急处理文章目录01兼容性？02多模融合？03性能玄学？04智能运维？05终极暴击总结哥们儿，还记得十年前DBA圈那场著名论战不？OLTP和OLA
全链路压测：影子库与影子表之争阿里巴巴中间件数据库分布式 java 人工智能大数据
01业界盛传的全链路压测是什么Aliware全链路压测诞生于阿里巴巴双11备战过程，如果说双11大促是阿里业务的“期末考试”，全链路压测就是大考前的“模拟考试”，诞生后被誉为双11稳定性保障的“核武器”。全链路压测通过在生产环境对业务大流量场景进行高仿真模拟，获取最真实的线上实际承载能力、执行精准的容量规划，确保系统可用性。分布式架构和业务快速发展给业务系统带来了不确定性。分布式环境的任意节点都可
利用Windows .NET特性和Unicode规范化漏洞攻击DNN (DotNetNuke) sechub windows .net dnn
概述DNN（前身为DotNetNuke）是2003年建立的最古老的开源内容管理系统之一，使用C#（.NET）编写，由活跃的爱好者社区维护。它也被企业广泛使用。漏洞背景CVE-2017-9822历史案例我们熟悉这项技术是因为CVE-2017-9822，该漏洞允许通过DNNPersonalizationcookie的不安全反序列化进行远程代码执行（RCE）。这个CVE一直是反序列化攻击的绝佳案例研究。
在家怎么赚钱？不想出去打工有在家赚钱的项目推荐吗古楼
这几年的疫情让很多人觉得钱越来越不够花了，大家都意识到发展副业很重要。平时上班已经耗费了我们很多时间和精力，所以能在家赚钱的副业才是我们最好的选择。今天我就总结了几个宅在家里就能赚钱的小技巧，一起来看看吧！副业兼职一：淘宝客（也是目前小编在做的副业之一）这个已经有好几年的历史了，经过发放链接和优惠券的方法来帮助店铺发布推行链接，获取优惠信息，网购市场非常大，任何人都需要一个买东西享最低优惠价的软件
分享适合新手的副业！互联网副业推荐！氧惠超好用
有一句话说得好，逆水行舟，不进则退。在这里我也送给你一句话，逆流而上，效率翻倍。在大环境不稳定的情况下，如果我们还能够抓住市场当中的机遇逆流而上的话，那我们和别人之间的差距就会加速拉大。2023年最有希望的8大行业，不差于投资买房，看你适合做哪一行？今天我就加以整理分享给你，希望你好好收藏。第一、单身经济为什么我把这个行业放在第一个来讲呢？那就是因为在2021年，我们听得最多的一个话题就是人口出生
Java实现简单秒杀功能
在商城项目中，秒杀功能可以说是必不可少的，下面我将使用SpringBoot集成Redis、RabbitMQ、MyBatis-Plus和MySQL来实现一个简单的秒杀系统，系统将包含以下核心功能：使用Redis进行库存预减和用户限流；使用RabbitMQ进行异步下单，提高系统吞吐量；使用MyBatis-Plus操作MySQL数据库；利用Redis执行Lua脚本的原子性防止商品超卖；接口限流（使用Re
教育内卷-不论生几个，都能给你卷进去手曲一指
今天咱们来说一说一个热门的概念——教育内卷。许多人把内卷比喻成电影院现象。就是说大家在电影院看电影，第一排的人站起来了，挡住了第二排，然后第二排就站起来了，挡住了第三排，以此类推，最后整个电影院的人都站起来了，可是这其中并没有人受益，只是多付出了成本。这个比喻很形象的解释了只要总收益不变，内部所有人的额外付出都是一场零和博弈。其实，这个例子并不贴切，因为电影院现象并不能反应内卷的两个独特状态：第一
DeepSeekMath：突破开源语言模型在数学推理中的极限 AI专题精讲强化学习人工智能强化学习 AI技术应用
温馨提示：本篇文章已同步至"AI专题精讲"DeepSeekMath：突破开源语言模型在数学推理中的极限摘要数学推理由于其复杂且结构化的特性，对语言模型构成了重大挑战。本文介绍了DeepSeekMath7B，该模型在DeepSeek-Coder-Base-v1.57B的基础上继续进行了预训练，使用了来自CommonCrawl的120B数学相关token，同时包含自然语言和代码数据。DeepSeekM
vue实现超出字数中间用省略号显示
显示效果：传统节日里的氛围......传统节日里的氛围原理：利用vue中的过滤器filterhtml代码：{{hashName|ellipsis}}js代码：filters:{ellipsis(value){letlen=value.length;if(!value)return''if(value.length>20){returnvalue.substring(0,8)+'......'+va
卡罗林斯卡学院与华大等团队联合发表人类、猪、小鼠大脑中的蛋白编码基因图谱尐尐呅
美国时间2020年3月5日，由卡罗林斯卡学院、瑞典皇家理工学院和华大等团队共同完成的一项题目为“人类、猪、小鼠大脑中的蛋白编码基因图谱”的研究发表于Science（影响因子41）。该研究基于多种转录组学方法和抗体图谱技术，对大脑不同区域进行了全面、深入的分子解析，并且提供了高质量的蛋白编码基因的分子图谱，为进一步研究提供了有力的武器。该研究成功地构建了哺乳动物大脑的基因图谱，是对现有的若干个大脑图
MySQL 配置性能优化实操指南：分版本5.7和8.0适配方案挑战者666888 mysql 《Java面试精选》adb mysql 性能优化服务器数据库 linux 运维
在MySQL性能优化中，不同版本的特性差异会直接影响优化效果。本文基于MySQL5.7和8.0两个主流版本，通过版本适配的配置代码、场景举例和通俗解释，让优化方案更精准落地。一、硬件与系统配置优化（基础层优化）1.服务器硬件选型实战建议CPU：高并发场景优先选多核CPU（如16核IntelXeon），但避免盲目堆核（MySQL5.7对超32核利用率下降明显，8.0有显著改进）。举例：电商秒杀服务器
告别手动引入！PHP自动加载终极指南，效率提升90% Jay_MIng php android 开发语言 linux nginx java python
在没有自动加载机制的前提下，想要使用不同文件的类时，需要逐个手动将文件引入才行require'classes/MyClass.php';//......$obj=newMyClass();这种情况会导致维护困难，随着项目扩大变得难以管理。因此自动加载是PHP中一种重要的机制。自动加载允许在首次使用类时动态加载类文件，而不需要手动包含每个类文件PHP中推荐使用spl_autoload_registe
分布式定时器：原理设计与技术挑战你一身傲骨怎能输架构设计分布式
文章摘要分布式定时器用于在分布式系统中可靠、准确地触发定时任务，常见实现方案包括：基于数据库/消息队列的定时扫描、分布式任务调度框架（如Quartz集群、xxl-job）、时间轮/延迟队列（如Redis/Kafka）以及Zookeeper/Etcd协调服务。主要技术挑战包括时钟同步、任务幂等、高可用、负载均衡和故障恢复等。核心难点在于保证任务唯一性、调度精度与分布式一致性，技术选型需权衡轻量级（R
接口压测：性能极限测试全解析
文章摘要接口压测是通过模拟高并发请求对API接口进行性能测试，评估其承载能力、响应速度和稳定性。核心内容包括并发访问、高频调用、参数多样性测试及异常场景验证，常用工具如JMeter、Locust等。关键指标包括QPS、响应时间、错误率等，需在接近生产环境测试并逐步加压，以发现性能瓶颈，确保系统在业务高峰期的可靠性。通过压测可优化接口性能，为系统扩容提供数据支撑。1.为什么要做接口压测？验证接口的最
常用 SQL 语句摘录未来无限 C#Winform设计
语句功能--数据操作SELECT--从数据库表中检索数据行和列INSERT--向数据库表添加新数据行DELETE--从数据库表中删除数据行UPDATE--更新数据库表中的数据--数据定义CREATETABLE--创建一个数据库表DROPTABLE--从数据库中删除表ALTERTABLE--修改数据库表结构CREATEVIEW--创建一个视图DROPVIEW--从数据库中删除视图CREATEINDE
应用层流量与缓存累积延迟解析你一身傲骨怎能输计算机网络缓存
文章摘要应用层流量指OSI模型中应用层协议（如HTTP、gRPC）产生的数据交互，常见于Web请求、微服务通信等场景。缓存累积延迟指多级缓存或消息队列机制中，各级延迟叠加导致数据更新滞后，例如数据库更新后，因消息队列、缓存刷新等环节延迟，用户最终看到的数据可能滞后数秒。两者分别描述了网络通信的数据流机制和分布式系统中的延迟问题。1.应用层流量应用层流量，一般指的是在网络通信的OSI七层模型中，**
六味地黄丸哪个牌子好？六味地黄丸十大品牌排行榜古楼
提到六味地黄丸,想必大家都不会觉得陌生,它是中医常用的一味补肾中药,具有滋阴补肾的作用,常用于治疗肾阴亏损所导致的头晕耳鸣、腰膝酸软、潮热盗汗等症状,是肾虚患者常用的药物。那么,市面上这么多六味地黄丸,到底哪个牌子好?哪个又值得买呢?下面小编就带大家来了解一下。在分享之前给大家推荐一个互联网最新导购平台【高省】，邀请码XHXQ43，高省是目前返利最高的电商导购平台。作为一个全面的电商导购平台,高省
UE5 官方案例Lyra 全特性详解 13.背包系统Inventory System 2 CloudHu1989 ue5 游戏开发游戏程序
目录0.前言1.代码架构2.具体实现2.1游戏内商店界面2.2物品基类2.3物品类2.4物品槽2.5背包槽0.前言前段时间基于Lyra的背包系统做了一个商店,因为后面要和Lyra进行解耦了,所以这里先把这个基于Lyra的成果记录下来,便于大家做参考.区块链游戏商店原型展示这是实现的大概效果,实际上还不完善,不过这是有个迭代的过程的,先把这个原型分享出来吧,解耦之后的版本在迭代成功后再进行详细解析.
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他