撕得失败的标签

【头歌实训】PySpark Streaming 数据源

文章目录

第1关：MySQL 数据源
- 任务描述
- 相关知识
- - PySpark JDBC 概述
  - PySpark JDBC
  - PySpark Streaming JDBC
- 编程要求
- 测试说明
- 答案代码
第2关：Kafka 数据源
- 任务描述
- 相关知识
- - Kafka 概述
  - Kafka 使用基础
  - PySpark Streaming Kafka
- 编程要求
- 测试说明
- 答案代码

第1关：MySQL 数据源

任务描述

本关任务：读取套接字流数据，完成词频统计，将结果写入 Mysql 中。

编程要求

打开右侧代码文件窗口，在 Begin 至 End 区域补充代码，执行程序，读取套接字流数据，按空格进行分词，完成词频统计。在 Mysql 中创建 work 数据库，在该库中创建表 wordcount，添加字段 word（字符型），字段 count（整型），将词频统计结果写入该表中。

代码文件目录： /data/workspace/myshixun/project/step1/work.py

套接字流相关信息：

地址：localhost
端口：8888
输入数据：

待程序启动后（5s），请在 60 秒内写入数据，如果需要调整时间，你可以通过修改代码文件中 time.sleep(60) 来指定时间。

When summer comes, people like to go to the beach and play in the seawater.
It is such a good way to drive away the hotness.
But it has been reported that many people drawn while they were swimming on the beach. 
The people who died were good at swimming, the reason they got killed was the invisible demon under the seawater. 
In the afternoon, there are some vortexes under the seawater, which people can’t see. 
When people go swimming, they will be absorbed by the vortexes, even though they are good at swimming, they can’t resist the strong power.
So when we go to play in the beach, we must take care.

输入内容后，注意按回车。

Mysql 信息：

账号：root
密码：123123
地址：localhost
端口：3306

请在程序运行完成后再进行评测，否则会影响最终结果。

测试说明

平台将对你编写的代码进行评测，如果与预期结果一致，则通关，否则测试失败。

答案代码

from findspark import init
init()
import time
import pymysql
from pyspark import SparkContext
from pyspark.streaming import StreamingContext

sc = SparkContext(appName="mysql_streaming", master="local[*]")

ssc = StreamingContext(sc, 10)

# 设置检查点
ssc.checkpoint("/usr/local/work")

# 累加器(状态更新)
def updateFunction(newValues, runningCount):
    if runningCount is None:
        runningCount = 0
    return sum(newValues, runningCount)

# 设置套接字流
############### Begin ###############
inputStream = ssc.socketTextStream("localhost", 8888)

############### End ###############

pairs = inputStream.flatMap(lambda x: x.split(" ")).filter(lambda x: x != "").map(lambda word: (word, 1))

wordCounts = pairs.updateStateByKey(updateFunction)

wordCounts.pprint(100)

def dbfunc(records):

# 根据传入的 records 参数，完成数据写入 Mysql 操作

############### Begin ###############
	# 连接 MySQL 数据库
    connection = pymysql.connect(
        host='localhost',
        user='root',
        password='123123',
        database='work',
        port=3306,
    )

    with connection.cursor() as cursor:
        # 根据传入的 records 参数，完成数据写入 Mysql 操作
        for record in records:
            word, count = record
            cursor.execute('INSERT INTO wordcount (word, count) VALUES (%s, %s)', (word, count))

    connection.commit()
    connection.close()

############### End ###############

# 分区设置
def func(rdd):
    repartitionedRDD = rdd.repartition(3)
    repartitionedRDD.foreachPartition(dbfunc)

wordCounts.foreachRDD(func=func)

ssc.start()

time.sleep(60)

ssc.stop()

打开一个命令行窗口

# 启动 mysql 服务
service mysql start
# 进入 mysql
mysql -uroot -p123123
# 创建 test 库
create database if not exists work;
# 创建表
use work;
create table if not exists wordcount(
    word varchar(50),
    count int
);
# 退出 mysql
exit
# 创建检查点目录
mkdir -p /usr/local/work/
nc -l -p 8888

再打开一个窗口

chmod 777 /data/workspace/myshixun/project/step1/work.py
python3 /data/workspace/myshixun/project/step1/work.py # 现在开始运行代码文件，请在 60 秒内创建文件并写入下面数据

回到第一个窗口，把下面数据粘贴上去再打一个回车

When summer comes, people like to go to the beach and play in the seawater.
It is such a good way to drive away the hotness.
But it has been reported that many people drawn while they were swimming on the beach. 
The people who died were good at swimming, the reason they got killed was the invisible demon under the seawater. 
In the afternoon, there are some vortexes under the seawater, which people can’t see. 
When people go swimming, they will be absorbed by the vortexes, even though they are good at swimming, they can’t resist the strong power.
So when we go to play in the beach, we must take care.

第2关：Kafka 数据源

任务描述

本关任务：读取 Kafka 生产的数据，完成输出。

编程要求

打开右侧代码文件窗口，在 Begin 至 End 区域补充代码。在 Kafka 中创建一个 topic，作为一个生产者，完善程序，读取 Kafka 流数据并以 append 方式输出。通过 spark-submit 的方式运行代码文件，将输出信息保存到 /data/workspace/myshixun/project/step2/result.txt 结果文件中。

代码文件目录： /data/workspace/myshixun/project/step2/work.py

Kafka 相关信息：

Kafka 主目录：/opt/kafka
Zookeeper 主目录：/opt/zookeeper
Zookeeper 地址：localhost:2181

Kafka 输入内容：

程序启动后（15s左右），请在 60 秒内写入数据，如果需要调整时间，你可以通过修改代码文件中 .awaitTermination(timeout=60) 的 timeout 指定时间。

Hello world!
Hello python!
Hello spark!
Hello Kafka!
I love bigdata.

提交命令：

注意压缩文件。

spark-submit --master local[*] --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.0.2 --py-files xxx.zip xxx.py > /data/workspace/myshixun/project/step2/result.txt

请等待程序运行完成后进行评测，否则会影响最终结果。

测试说明

平台将对你编写的代码进行评测，如果与预期结果一致，则通关，否则测试失败。

答案代码

from pyspark.sql import SparkSession
  
spark = SparkSession.builder.appName("kafka_stream").master("local[*]").getOrCreate()

############### Begin ###############

df = spark \
    .readStream \
    .format("kafka") \
    .option("kafka.bootstrap.servers", "localhost:9092") \
    .option("subscribe", "test") \
    .option("startingOffsets","latest") \
    .load()


table = df.selectExpr("CAST(value AS STRING) as message")

table.writeStream \
    .trigger(processingTime='5 seconds') \
    .outputMode("append") \
    .option("truncate", "false")\
    .format("console") \
    .start() \
    .awaitTermination(timeout=60) 

############### Begin ###############

进入右侧命令行窗口

# kafka 依赖 zookeeper，所以需要先启动 zookeeper 服务
cd /opt/zookeeper
bin/zkServer.sh start conf/zoo.cfg
# 启动 Kafka 服务
cd /opt/kafka
bin/kafka-server-start.sh -daemon config/server.properties
# 创建 topic
bin/kafka-topics.sh --zookeeper localhost:2181 --create --replication-factor 1 --partitions 1 --topic test
# 创建 producer 生产者
bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test

再打开一个命令行窗口

cd /data/workspace/myshixun/project/step2/
zip work.zip work.py
spark-submit --master local[*] --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.0.2 --py-files work.zip work.py > result.txt

回到前一个命令行窗口，在程序启动 15s 左右时间后再填入下面数据，并且在 60s 内完成写入

Hello world!
Hello python!
Hello spark!
Hello Kafka!
I love bigdata.

你可能感兴趣的:(【头歌实训】,pyspark,streaming,Kafka,mysql,kafka,头歌实训)

【实战派×学院派】39｜PRD 写得很厚，开发还是一问三不知？郭菁菁 (BA/PM)实战派常踩的坑学院派如何补上业务分析需求分析 BA
学院派：用三层结构+重点高亮+同步讲解，让PRD真正成为开发读得懂、用得上的交付物。是不是经常遇到这种场景：“PRD我早就发你们了啊！”“里面都有写，麻烦仔细看。”“为啥还来问？你们没看文档吗？”结果，开发开工前依旧一头雾水，连核心流程都没理清楚，PRD反而成了摆设。✅实战派常见误区：文档堆砌当“交付”，缺乏结构化设计实战派做法潜在问题典型后果追求面面俱到信息冗余，缺乏重点开发找不到关键信息全靠自
VUE实训（三）昨天的牛肉
目标：创建学院管理模块（学院和学校关联起来）一、后台三步骤：1、打开projectName文件，在models目录下创建academy.js文件，接着文件操作：constmongoose=require('mongoose')constSchema=mongoose.Schemaconstfeld={name:String,//人物标签major:String,renshu:Number,scho
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统 2401_89605681 嗖微miui52086 java 小程序开发语言微信小程序 uni-app
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统源码_V_saaskw 嗖微miui52086 java 小程序开发语言 uni-app 微信小程序微信公众平台
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统狂团商城小师妹嗖微miui52086 java 小程序开发语言微信小程序 javascript
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA无人系统台球室源码自助开台约球交友系统源码小程序
全域无人化运营革命：JAVA无人系统台球室源码解析（支持茶室/棋牌/KTV多业态）在共享经济与无人化浪潮的推动下，全球自助娱乐市场规模突破千亿美元，传统台球室、棋牌室面临人力成本高、运营效率低、用户粘性弱等痛点。JAVA无人系统台球室源码以SpringBoot+MyBatisPlus+MySQL为核心技术栈，通过Uni-app跨端开发实现小程序/H5/APP全渠道覆盖，集成AI裁判、社交裂变、多支
穿越小甜文《瞎子女配撩翻派》 chengPurple婷
文案:被精分系统一jio踹进书里的苏悦，内心激动又兴奋。因为这本书里的世界，美男遍地，杰克苏云集。且不说主配角，就连一个店小二也是眉清目秀。弱水三千，且看我一瓢一瓢饮。结果还不到三天，她就瞎了！！雾草——穿成十八线女配也就算了，还是个睁眼瞎！美男当前，要这眼睛何用？！更可怕的是一头撞进十恶不赦的反派怀里，等等，就算是反派，好像也貌美如花啊。只可惜，弱水三千，我竟没有瓢。反派：我这一瓢还不够你喝，嗯
每日一联（7.15）数载风云皆入酒乔平_
每日一联（7.15）出句：数载风云皆入酒对句：1.千重景色尽浮花(梦梓)2.三年断柳尽成吟（钦建军）3.半生往事尽如烟（王凤捷）4.千秋烟雨付东流（海纳）5.一场梦境枕黄粱（常醒公）6.几行韵律自成诗（雪歌）7.三苏盛誉冠文坛（烛焰松）8.如今涕泪总衔杯（王占君）9.一朝水月映于池（水灵）10.三生岁月尽成诗（綦宗平）11.一帘花月俱成诗（户向发）12.半生功过自从天（乔平）13.半生翰墨既缘情
MySql学习(二)日志系统一条SQL更新语句是如何执行的？ lconcise
目录：更新语句执行流程重要日志模块：redolog重要日志模块：binlog两阶段提交小结更新语句执行流程一条更新语句的执行流程是怎样的呢？我们还是从一个表的一条更新语句说起，下面是这个表的创建语句，这个表有一个主键ID和一个整型字段c：mysql>createtableT(IDintprimarykey,cint);如果要将ID=2这一行的值加1，SQL语句就会这么写：mysql>updateT
清明青衿的世界
这几天，一直想谢谢清明，却不知从何下笔。清明，一年当中最美的季节，杏花微雨，桃李纷飞，但却又因为它的到来，有一丝丝悲凉。这注定是一个让你必须直面生死的日子。亲戚或余悲，他人亦已歌。死去何所道，托体同山阿。诗词写得容易，真正了悟却是何等艰难。清明节，一个一个让人在灿烂当中有倍感寂寞的节日。
CSS面试题及详细答案140道之（101-120）还是大剑师兰特前后端面试题 css 大剑师 CSS面试题
《前后端面试题》专栏集合了前后端各个知识模块的面试题，包括html，javascript，css，vue，react，java，Openlayers，leaflet，cesium，mapboxGL，threejs，nodejs，mangoDB，MySQL，Linux…。前后端面试题-专栏总目录文章目录一、本文面试题目录101.解释`text-indent`属性的作用。102.如何在CSS中实现响应
网站前端开发-实训续篇+总结 yue_jia
实训五学生管理篇（可将学校、学院、班级与学生关联起来）一、从后端（projectName）添加学生模块1、在models目录下添加student.js：image.pngprojectName/db/models/student.js：constmongoose=require('mongoose')constSchema=mongoose.Schemaconstfeld={name:String
如何以“语为诗狂”为题写藏头诗？梧桐树边羽
有朋友相邀：以“语为诗狂”为题写藏头诗，五言、七律都可以，怎么写才好？既然提出五言、七律藏头，虽然五言包括古体诗和格律诗两种，七律是格律诗，基本上可以认为朋友要的是藏头格律诗（五绝、五律、七律），我们分析这几个字，看看藏头格律诗有没有可能，会不会出现要拗救的情况。“语为诗狂”的平仄为“仄、仄、平、平”，这里“为”字很明显发仄声，当然如果写到藏头诗里面去，发平声也是可以的。我们看五绝的基本平仄格式：
Filebeat + Logstash + ES进行Nginx日志采集一个只会喊666的菜比
简易架构图service.png架构图比较简单，日志收集大同小异，这次不添加任何中间服务比如：rediskafka后端只是存储进ES使用的版本jdk-8u161-linux-x64.rpmelasticsearch-6.7.2.rpmlogstash-6.7.2.rpmfilebeat-6.7.2-x86_64.rpm安装比较简单，只用进行rpm-ivh即可，接下来直接贴配置文件：Elastics
自动驾驶激光3D点云处理系统性阐述及Open3D库函数应用一碗白开水一 DPL 自动驾驶 3d 人工智能
一、自动驾驶激光3D点云处理的核心挑战与流程自动驾驶系统依赖激光雷达（LiDAR）生成的高精度3D点云数据实现环境感知，其处理流程需解决以下核心问题：数据规模与实时性：现代LiDAR每秒生成数百万点，需在毫秒级完成处理以支持决策。动态环境适应性：需区分静态障碍物（如道路、建筑）与动态目标（如车辆、行人）。多传感器融合：与摄像头、雷达数据时空对齐，构建统一环境模型。典型处理流程分为四个阶段：原始点云
安胎飞语
医院不远，快下车时，穆棱听到水芝微弱的声音：“穆穆，我们现在去哪儿？”穆棱听到这声音，终于明白什么叫做天籁。他愣愣地看着回神的水芝说：“芝芝，你不记得发生了什么吗？”水芝：“我刚才在睡午觉啊，宝宝还跟我玩呢！”穆棱愕然了一下，似乎不知道该怎么描述自己的感受，但是很快就到医院了，他就说：“快到医院了，我们今天再做个产检。”水芝不明就里，但既然穆棱说做个产检，也无所谓了，只是头有点昏昏沉沉的，有点涨疼
头歌实践JAVA项目开发实战入门--第10阶段【Linux操作系统】
开始更新头歌了！！！有需要的小伙伴自取吧；有什么好的建议也可以评论区留言，大家一起共勉！Linux操作系统一、Linux初体验#!/bin/bash#在以下部分写出完成任务的命令#*********begin*********#cd/ls-a#*********end*********#二、Linux常用命令#!/bin/bash#在以下部分写出完成任务的命令#*********begin****
头歌实践Java项目开发入门实战第三阶段【Java高级特性】 Y_03 头歌实践题 java 开发语言
本文来自头歌实践平台的Java项目实战入门【只有编程题】，如需访问其他阶段的文章，请自行阅读主页其他文章制作不易，请留下一个免费的点赞以及关注吧！！！一、Java高级特性-IO流2、字节流-输入输出packagestep2;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileOutputStream;importja
伽卡他卡电子教室：技术原理、功能解析与教育场景实践
一、术语澄清与技术定位“伽卡他卡”（Gakataka）在计算机科学领域的核心实体为伽卡他卡电子教室软件。需注意其与无关技术的区别：❌与分布式流处理平台ApacheKafka无技术关联；❌与AI模型GauGAN、半导体技术GAA等“G”开头术语无关。核心定位：一款专为教育场景设计的局域网教学管理软件，由伽卡他卡公司开发。二、核心功能与应用场景1.核心模块屏幕广播：实时传输教师端操作画面；远程控制：教
激活人体的7个“生阳点”，为身体补充阳气捉刀客王静
《黄帝内经》曰“春夏养阳”，是说春夏季节是阳气升发、长养的季节，在此季节培育、长养人体阳气，不仅可强身健体，还可抵御防范秋冬季节常见病的侵扰。说到补阳气，很多人都知道要常晒太阳，吃些补阳食物，但少有人知人体本身就有7个“生阳点”，激活这7个“生阳点”，就如给人体加油，能源源不断地产生阳气！1.百会生“头阳”人的头阳亏虚时，表现有头沉头重、头痛、眩晕、精神不振、多梦易醒等症状。按揉拍打百会能产生阳气
橙武低代码平台：视频操作说明发布啦
橙武低代码平台：为制造业、零售、政企、CRM打造的高效数字化引擎在数字化浪潮席卷全球的今天，企业对高效、灵活、可扩展的数字化工具的需求愈发强烈。面对多变的市场环境，如何在最短的时间、以最少的成本构建出满足业务需求的系统，成为众多企业数字化转型的痛点。为此，我们基于Amis6.12.0+LogicFlow2.0.13+Pebble3.2.4+MySQL8技术栈，倾力打造了一款面向企业级场景的低代码开
减肥日记第26天毕婉文
早上称空腹体重：113.5斤粑粑次数：2次运动：无早餐：一把坚果，牛奶泡玉米片午餐：三个红烧肉，素炒通菜，芹菜炒肉卷，红萝卜炒肉卷，一拳头米饭晚餐：水煮玉米粒，卤牛肉鸡腿鸡蛋，蒜蓉炒菜心，两块蒸排骨，几块菠萝
Leetcode刷题营第十五题：相交链表科大饭桶 leetcode 算法链表数据结构 c
160.相交链表相关给你两个单链表的头节点headA和headB，请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点，返回null。图示两个链表在节点c1开始相交：题目数据保证整个链式结构中不存在环。注意，函数返回结果后，链表必须保持其原始结构。自定义评测：评测系统的输入如下（你设计的程序不适用此输入）：intersectVal-相交的起始节点的值。如果不存在相交节点，这一值为0l
园丁的实用待办事项清单【百字小贴】 lyn007
今天准备和大家叨叨“事情多没头绪”这件事。工作太多、千头万绪，刚刚接到一个、又马上来一个，尤其是下班时分，正带着愉悦的心情哼着小曲准备离开，“啪！”一叠文件“花落”你家，相信那一个的心情绝对是坐上了世界顶级的“过山车”。但吐槽归吐槽，活路还是要干的，不然只能去喝西北风了。那，如何让千头万绪理出“线头”呢？第一，找到一个“外挂大脑”——待办事项清单。其实，有些人对“待办事项”有一点误解，觉得反正事情
2023-11-11·甜蜜的生日蛋糕香山一墨
“爸爸生日快乐！”说着，女儿把一个紫色折纸做的小盒子递给我。接过盒子，拉着女儿的小手，穿过嘈杂的人流，我不时的躬身听女儿给我分享今天的收获。“这是我花了一节课给爸爸做的生日礼物”女儿像一只欢快的小麻雀，“那你耽误听课怎么办？”我握紧手里的小手问,“没有啊，劳动课可以做手工的”女儿回答,“哦，谢谢我的小宝贝”我拍拍女儿的头说。人到中年，时间像脱弦的箭，一晃就是一年，生日失去了儿时的兴奋期待，多了一份
破坏这小麻雀的队形工藤志保
闲散文/工藤志保天是灰的偶尔有一只麻雀飞过不知去向窗外有人唱起悲伤的歌然后又渐渐走远总坐着看字爬满书本脸颊、窗子看豁口心里惶恐着担心魔鬼的去向有一只黄色的橘子分成八瓣一瓣一瓣地排在桌上我们一起吃着我们正在破坏它们的队伍
父亲你好江上数青峰_
图片发自App零米零点零分那是我们最初的距离那是头与头的距离在您宽大的肩膀上我看见了世界那是手掌与屁股的距离原来那双紧握羊鞭的手不只藏着慈祥五千米十五分钟欢乐的山风从耳边跳过前面是您厚实的脊背后面是那奔驰的沙枣破旧的摩托车哼哧着我贴上您的背做了一个梦梦见做了一个长长的梦七万五千米九十分钟我已不能准确标出您的方向前面是山山后还是山我在清晨向着日出的方向默默着，听见仿佛是羊咩，仿佛是牛哞后来二十一万五
微信小程序网络数据请求難釋懷微信小程序网络小程序
一、前言在网络应用中，获取远程数据是小程序开发中最常见的任务之一。微信小程序提供了强大的网络请求接口——wx.request()，它支持发送HTTP请求，并能处理JSON、文本等多种格式的数据。本文将带你全面了解小程序中网络请求的使用方式，包括：✅wx.request()的基本结构与参数说明✅如何发起GET和POST请求✅设置请求头、传递请求参数✅处理成功和失败回调✅域名白名单配置与HTTPS要求
张艺兴《向往的生活》第六季预告莫叽默迹
特制鲨鱼船奶凶登场，特制沙滩鱼车，开启黄磊和张艺兴“怨种师徒”之旅；更有海上捕捞、水上飞龙等众多体验。念念不忘，终有回响：《向往的生活》第六季海岛篇来啦！预告片里彭彭又是瘦了不少的精神帅小伙，喜欢看他埋头干饭的吃相，又觉得他每逢“复胖”就努力锻炼减肥很励志。张艺兴一头小卷发，真·绵羊范！一旁抢镜的刨冰机，据说是樱桃小丸子同款。果汁冰沙，沙滩休憩，一副想象中特别悠哉的画面有了。众人在预告片里看到大海
汉武帝情史(一)金屋藏娇小二黑以今说古
金屋藏娇的故事在中国流传广泛，可谓家喻户晓，老少皆知。中国的文人骚客对风花雪月之事特别敏感，这一类君王恋佳人的艳事更为他们津津乐道，一个平常的故事常被他们用诗词歌句渲染得曲折离奇，五彩缤纷。唐代的大诗人们自然不会放过对这段艳事的题咏。白居易在《续古诗》中云：“岁暮望汉宫，谁在黄金屋？”李白在《怨情》诗中称：“请看陈后黄金屋，寂寂珠帘生网丝。”李商隐《无题》诗：“黄金堪作屋，何不作重楼？”黄金屋作为
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

【头歌实训】PySpark Streaming 数据源

文章目录

第1关：MySQL 数据源

任务描述

相关知识

PySpark JDBC 概述

PySpark JDBC

PySpark Streaming JDBC

编程要求

测试说明

答案代码

第2关：Kafka 数据源

任务描述

相关知识

Kafka 概述

Kafka 使用基础

PySpark Streaming Kafka

编程要求

测试说明

答案代码

你可能感兴趣的:(【头歌实训】,pyspark,streaming,Kafka,mysql,kafka,头歌实训)