JiajunBernoulli

python爬取视频网站中video标签的m3u8文件与ts文件

文章目录

网站分析
代码

参数配置
下载m3u8文件
下载ts文件

单线程
多线程

解密
合并

转换为MP4

网站分析

许多网站使用的都是video加载的视频，无法获得视频的源地址。

但是通过抓包可以获得两类文件，一类是m3u8，相当于ts文件的索引将不同的ts文件串起来；另一类是很多个ts片段，由这些片段构成我们观看的视频。

上图的m3u8文件显示的ts文件是未加密的，所以下载下来的ts文件可以直接播放；下载的时候还能注意到这两类文件的是源自同一个上级链接比如https://xxx.com/xxx/index.m3u8和5fd27dde545000000.ts。

只要将这些文件按顺序拼接为完整的文件就相当于下载成功了，值得注意的是命名格式为5fd27dde545000{}.ts，{}的数字不足3位3位补齐如5fd27dde545000000.ts，大于3位不用补齐如5fd27dde5450001000.ts。

代码

参数配置

为了方便使用，将一些参数单独拿出来作为配置文件。

# 下载必须的配置
URL_BASE = 'https://xxx.com/xxx/{}'  # m3u8文件的链接
PATTERN = 'xxx(\d+).ts' # 提取ts片段索引号的正则
# 下面是多线程需要配置的
TS_BASE = 'xxx{}.ts'
THREAD_NUM = 15 # 线程数
TS_NUM = 347	# ts文件的个数，在index.m3u8中找到最后一个ts是多少就写多少

下载m3u8文件

只有一个下载，比较简单，主要是根据它判断是否有加密

def download_m3u8(url):
    response = requests.get(url)
    file = "./caches/" + url.split("/")[-1]
    with open(file, "w", encoding="utf8") as f:
        f.write(response.text)

加密的话，会多出一行记录加密方式和密钥，没有这一行就没有加密。

下载ts文件

单线程

有了之前的配置就可以根据我封装的方法下载ts文件了，这里提供两种方式。如果传入ts_list那么下载传入的，否则根据TS_BASE生成ts_list进行下载。

def download_ts(ts_list=None):
    '''
    :param ts_list: [xxx000.ts, ..., xxx999.ts]
    :return:
    '''
    # 如果ts列表为空，那么构造ts列表
    if ts_list is None or len(ts_list) == 0:
        ts_list = []
        for i in range(0, TS_NUM+1):
            idx = str(i) if i > 999 else str(i).zfill(3)
            ts_list.append(TS_BASE.format(idx))
    # 根据ts列表下载文件
    for item in ts_list:
        url = URL_BASE.format(item)
        file="./caches/"+url.split("/")[-1]
        response = my_request(url)
        with open(file, "wb") as f:
            f.write(response.content)
        print(url, file)

其中ts_list可以根据m3u8文件获得，my_request()是我为了实现失败自动重试封装的一个方法https://blog.csdn.net/weixin_44112790/article/details/104197569。

def read_m3u8(file):
    ts_list = []
    with open(file) as f:
        for line in f:
            s = line.strip()
            if s.find(".ts") > -1:
                ts_list.append(s)
    return ts_list
@retry() # 利用retry装饰函数，使得抛出异常的时候自动重试知道成功。
def my_request(url):
    requests.adapters.DEFAULT_RETRIES = 15
    s = requests.session()
    s.keep_alive = False # 关闭之前的连接，避免连接过多
    try:
        response = requests.get(url, timeout=5)
    except BaseException: # 捕获异常的时候，这里粗略的写了BaseException，根据需要可写的更具体。
        print(url, "请求失败，开始重试")
        response = requests.get(url, timeout=5)	
    return response

到这里，应该可以成功将所有的ts文件下载下来。

from config import *
if __name__ == '__main__':
  	download_m3u8(URL_BASE.format("index.m3u8"))
   # download_ts()
    # ts_list = read_m3u8("./caches/index.m3u8")
    # download_ts(ts_list)

多线程

为了提高下载速度，可以配置多线程的一些参数用多线程进行下载。

import requests
import time
import threading
# 使用 threading 模块创建线程
import queue
#优先级队列模块
#线程优先级队列(Queue)
from config import *
from retrying import retry
exitFlag = 0
class MyThread (threading.Thread):
    def __init__(self, threadID, name, q):
        threading.Thread.__init__(self)
        self.threadID = threadID
        self.name = name
        self.q = q
    def run(self):
        print("开启线程：" + self.name+"\n")
        download_data(self.threadID, self.name, self.q)
        print("退出线程：" + self.name+"\n")

def download_data(id,thread_name, q):
    @retry()
    def my_request(url):
        requests.adapters.DEFAULT_RETRIES = 15
        s = requests.session()
        s.keep_alive = False
        try:
            response = requests.get(url, timeout=5)
        except BaseException:
            print(url, "请求失败，开始重试")
            response = requests.get(url, timeout=5)
        return response
    while not exitFlag:
        id += 1
        if id >= THREAD_NUM:
            data = q.get()
            url = URL_BASE.format(data)
            file = "./caches/" + url.split("/")[-1]
            response = my_request(url)
            with open(file, "wb") as f:
                f.write(response.content)
            print(thread_name, url, file)
if __name__ == '__main__':
    work_queue = queue.Queue(TS_NUM+1)
    threads = []
    # 填充队列
    for i in range(0, TS_NUM+1):
        idx = str(i) if i > 999 else str(i).zfill(3)
        work_queue.put(TS_BASE.format(idx))
    # 创建新线程并且启动
    for thread_id in range(0, THREAD_NUM):
        thread = MyThread(thread_id, "Thread-{}".format(thread_id), work_queue)
        thread.start()
        threads.append(thread)
    # 等待队列清空
    while not work_queue.empty():
        pass
    # 通知线程是时候退出
    exitFlag = 1
    # 等待所有线程完成
    for t in threads:
        t.join()
    print("退出主线程")

解密

如果没有加密直接跳过这一步，进入合并即可。

import os
import re
from Crypto.Cipher import AES
from config import PATTERN, TS_NUM

def check_ts(path):
    # 记录已有的片段
    lst = os.listdir(path)
    ts_idx_list = []
    for item in lst:
        if item.find('.ts') > 0:
            idx = int(re.findall(PATTERN, item)[0])
            ts_idx_list.append(idx)
    # 检查缺失了哪些片段
    for idx in range(0, TS_NUM):
        if not idx in ts_idx_list:
            print(idx)
    print("一共缺少{}个".format(TS_NUM+1-len(ts_idx_list)))
def decode_ts(src, key_path, target):
    '''
    :param src: 单个加密后的ts源文件路径 如 './caches/ntROGW6R4598270.ts'
    :param key_path: 解密key的路径 如 './caches/key.key'
    :param target: 解密后的文件名 如 './results/ntROGW6R4598270.ts'
    :return:
    '''
    raw = open(src, 'rb').read()
    iv = raw[0:16]
    data = raw[16:]
    key = open(key_path, 'rb').read()
    plain_data = AES.new(key, AES.MODE_CBC, iv).decrypt(data) # 解密失败的话可以换一种模式看看
    open(target, 'wb').write(plain_data)

if __name__ == '__main__':
    path = './caches/'
    check_ts(path) # 检查有没有缺失片段
    # 读取缓存批量解密
    lst = os.listdir(path)
    for item in lst:
        if item.find('.ts') > 0 and re.findall(PATTERN, item)[0] >="0": # 后面的条件可以更改解密的开始位置
            decode_ts(path+item, path+'key.key', './results/'+item)
            print(item)

目录结构是caches和results的话，就可以直接运行我的代码，否则需要自己改一下目录。

合并

将可播放的ts文件片段按顺序合并成一个文件，一定要按顺序！

import os
import re
from config import PATTERN
output = open('./last_result.ts', 'wb+')
ts_list = os.listdir('./results')
ts_list.sort(key=lambda ts : int(re.findall(PATTERN, ts)[0]))
for ts in ts_list:
    print(ts)
    with open('./results/'+ts, 'rb') as f:
        output.write(f.read())

很简单的文件读写操作即可完成，同样注意目录要和代码中的一致。

转换为MP4

合并完的ts文件，已经可以正常播放了，如果有特殊需求可以用ffmpeg将文件转为MP4或者其他格式。

ffmpeg -i xxx.ts xxx.mp4

去下载相应版本的ffmpeg即可使用https://ffmpeg.zeranoe.com/builds/

你可能感兴趣的:(爬虫,#,实战)

使用SSE流式输出（Javaweb前后端实战）记得开心一点嘛 JavaWeb后端开发技术栈 SSE Java 后端
目录一.什么是SSE？主要特点：二.SSE的实现过程：三.SSE的前端实现：1.创建EventSource对象：2.处理接收到的信息：3.处理特定事件：4.处理连接错误问题：5.关闭连接：四.SSE的后端实现：1.导入web依赖：2.创建Controller类：3.SeeEmitter的介绍以及使用方法：（1）.构造方法（2）.发送数据（3）.关闭连接（4）.连接状态处理（5）.获取超时时间（6）
uniapp中＜map＞地图怎么实现点位聚合？ GoppViper 前端 uni-app uniapp 前端前端框架地图聚合
推荐学习文档golang应用级os框架，欢迎stargolang应用级os框架使用案例，欢迎star案例：基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总想学习更多golang知识，这里有免费的golang学习笔记专栏想学习更多前端知识，这里有免费的前端专栏确定聚合条件定义聚合的距离阈值：根据你的需求确定一个合适的距离阈值，当两个标记点之
知网爬虫，作者、摘要、题目、发表期刊等主要内容的获取大懒猫软件爬虫
爬取知网内容的详细过程爬取知网内容需要考虑多个因素，包括网站的结构、反爬虫机制等。以下是一个详细的步骤和代码实现，帮助你使用Python爬取知网上的论文信息，包括作者、摘要、题目、发表期刊等主要内容。1.数据准备首先，需要准备一些基础数据，如知网的URL、请求头等。2.模型构建使用requests库发送HTTP请求，使用BeautifulSoup库解析HTML内容。如果遇到动态加载的内容，可以使用
Java 多线程精准定位毫秒级分片读取大文件实战寒冰碧海 Java爬坑之路 java 开发语言
一、引言在处理大文件读取任务时，传统的单线程读取方式往往效率低下，无法满足性能要求。本文将深入探讨一种基于Java多线程的分片读取文件方案，并结合实际代码进行详细剖析与性能分析。二、技术背景当文件体积庞大时，一次性读取整个文件会消耗大量内存且耗时较长。采用多线程分片读取策略，能够充分利用多核处理器的优势，将文件划分为多个片段，每个线程负责读取一个片段，最后合并结果，从而显著提升读取效率。三、代码实
java爬虫jsoup_Java爬虫框架Jsoup学习记录 weixin_33638349
Jsoup的作用当你想获得某网页的内容，可以使用此框架做个爬虫程序，爬某图片网站的图片(先获得图片地址，之后再借助其他工具下载图片)或者是小说网站的小说内容我使用Jsoup写出的一款小说下载器，小说下载器Jsoup导入1.使用gradle导入compile'org.jsoup:jsoup:1.11.1'2.第三方包导入Jsoup使用1.获得Document本地html文件或者使用javaIO流，则
第三章：实时流数据处理与分析深度学习客大数据技术进阶 linq c#数据分析
目录3.1流处理框架深入解析与实战Flink与KafkaStreams的性能对比：事件驱动架构的代码实现1.ApacheFlink：流处理的“性能怪兽”2.KafkaStreams：轻量级、低延迟的流式处理框架实时异常检测与报警系统：结合FlinkCEP（ComplexEventProcessing）进行实现3.2低延迟流处理优化数据流式计算中的状态管理与容错机制：FlinkCheckpointi
python爬虫之bs4解析和xpath解析 A.way30 python 爬虫开发语言 xpath
bs4解析原理:1.实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取如何实例化BeautifulSoup对象:frombs4importBeautifulSoupBeautifulSoup(参数一,参数二)参数一为文件描述符，参数二为解析器，一般为’lxml’一对象的实例化:1.将本地的h
LabVIEW实现RFID通信不脱发的程序猿 LabVIEW物联网开发实战 labview
目录1、RFID通信原理2、硬件环境部署3、程序架构4、前面板设计5、程序框图设计6、测试验证本专栏以LabVIEW为开发平台，讲解物联网通信组网原理与开发方法，覆盖RS232、TCP、MQTT、蓝牙、Wi-Fi、NB-IoT等协议。结合实际案例，展示如何利用LabVIEW和常用模块实现物联网系统的快速开发与原型设计，助你从基础到实战，全面掌握物联网开发技能。开源免费LabVIEW学习专栏分享：L
Java简单爬虫 jsoup工具包 ax阿楠 java 爬虫开发语言前端
首先导入一个爬虫的工具包:jsoup-1.13.1.jar//测试爬虫的网址(爬取王者荣耀英雄的网址)staticStringurl="https://pvp.qq.com/web201605/herolist.shtml";//文件存放的地址staticStringpath="D://爬虫测试/";publicstaticvoidgetImgs(Stringurl){//加载对应网址上的Html
Python网页爬虫爬取豆瓣Top250电影数据——Xpath数据解析_爬虫电影(1) 2401_84009626 程序员 python 爬虫开发语言
2.3.2通过xpath方法按层级查找数据定位好之后，我们就可以用etree对象的xpath方法解析xpath表达式，查找到相应的数据。定位到电影的标题所在标签，右键复制它的xpath：//\*[@id="content"]/div/div[1]/ol/li[1]/div/div[2]/div[1]/a/span[1]中文标题就在a标签下的第1个span标签中span[1]，然后我们通过/text
Python网页爬虫爬取豆瓣Top250电影数据——Xpath数据解析_爬虫电影 2401_84009698 程序员 python 爬虫开发语言
#获取中文电影标题title_cn=data.xpath('//\*[@id="content"]/div/div[1]/ol/li[1]/div/div[2]/div[1]/a/span[1]/text()')而在a标签下的第二个span标签中包含的文本内容是电影的英文标题，所以我们只需要将span[1]改成span[2]就可以获取到电影的英文标题。#获取英文电影标题title_en=data.
java爬虫工具Jsoup学习 Future_yzx java 爬虫学习
目录前言一、基本使用二、爬取豆瓣电影的案例三、Jsoup能做什么？四、Jsoup相关概念五、Jsoup获取文档六、定位选择元素七、获取数据八、具体案例前言JSoup是一个用于处理HTML的Java库，它提供了一个非常方便类似于使用DOM，CSS和jquery的方法的API来提取和操作数据。一、基本使用org.jsoupjsoup1.13.1二、爬取豆瓣电影的案例publicclassDouBan{
《机器学习实战》——在python中使用Matplotlib注解绘制树形图哆啦AA梦 python 机器学习 python 机器学习
#encoding=utf-8#使用文本注解绘制树形图importmatplotlib.pyplotaspltdecisionNode=dict(boxstyle="sawtooth",fc="0.8")leafNode=dict(boxstyle="round4",fc="0.8")arrow_args=dict(arrowstyle="<-")#上面三行代码定义文本框和箭头格式#定义决策树决策
MyBatis技术详解与实战小码快撩 mybatis java 开发语言
引言MyBatis是一款优秀的Java持久层框架，它支持定制化SQL、存储过程以及高级映射。MyBatis避免了几乎所有的JDBC代码和手动设置参数以及获取结果集的工作，使开发者能更专注于对业务逻辑的实现。本文将详细介绍MyBatis的核心概念，并通过示例代码进行深入讲解。一、配置文件MyBatis配置文件（通常命名为mybatis-config.xml）是MyBatis框架的核心配置文件，它定义
Mysql学习笔记（一）：Mysql的架构荆州克莱面试题汇总与解析 spring cloud spring boot spring 技术 css3
一、mysql的组成部分下面是来自Mysql实战的图片，该图片很好的表示了mysql的组成mysql架构图我们主要是和server层打交道，该层由连接器，分析器，优化器执行器、（查询缓存）组成二、连接器的作用每个客户端的连接都会有一个线程（在mysql5.5之后,mysql支持线程池插件，使得少数线程可以服务大量的服务的连接）。首先，再进行三次握手之后，建立了网络连接，然校验用户名，原始主机信息和
面试经验分享 | 杭州某安全大厂渗透测试岗黑客老李面试经验分享安全服务器运维职场和发展 python
更多大厂面试经验的视频经验分享看主页目录：所面试的公司：某安全大厂所在城市：杭州面试职位：渗透测试工程师面试过程：面试官的问题：1、面试官开始就问了我，为什么要学网络安全？2、什么是sql注⼊3、关于sql注⼊，都分为那些？4、如果在实战中遇到了防护，⽐如sql注⼊过滤掉了空格怎么办？5、什么是csrf？6、简单讲解下内存⻢？7、讲下内存⻢排查思路？8、平常有对APP、小程序渗透测试吗？9、你是用
鸿蒙开发（OpenHarmony）栅格容器组件-GridRow 你我皆是牛马星人 OpenHarmony 鸿蒙开发 HarmonyOS harmonyos 华为 android 前端鸿蒙 ui OpenHarmony
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）栅格布局可以为布局提供规律性的结构，解决多尺寸多设备的动态布局问题，保证不同
鸿蒙南向（OpenHarmony）调试工具hdc使用指导你我皆是牛马星人鸿蒙开发 HarmonyOS OpenHarmony harmonyos 华为鸿蒙 android ui OpenHarmony 驱动开发
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）hdc（OpenHarmonyDeviceConnector）是OpenHa
AI大模型项目实战：智能校园的秘密——深度剖析AI数字校园架构与解决方案大模型. 人工智能架构开发语言深度学习机器学习产品经理
在这篇文章中，我们将详细解读一幅关于AI数字校园架构的图示，深入剖析其各个功能模块和层级的解决方案，探讨AI技术如何在校园环境中落地实施，以提升教育、管理和决策的智能化水平。文章将逐层分析从用户交互到技术基础设施的架构内容，并针对每个模块给出详细的解决方案，帮助理解该架构如何通过AI技术为师生及管理者提供智能化的服务。一、用户层：多角色智能化交互用户层是AI数字校园的表层，它将直接服务于三类核心用
构建级联下拉列表：AJAX和jQuery实战教程不胖的羊
本文还有配套的精品资源，点击获取简介：级联下拉列表是网页交互中常见的元素，用于根据用户的选择动态更新后续选项。本文通过示例展示如何利用AJAX和jQuery技术实现级联下拉列表，并简单介绍了Prototype框架和jquery.jar文件的可能用途。详细步骤包括HTML结构设置、事件监听、AJAX请求构建、服务器响应处理以及界面更新，同时提供了提高用户体验的额外功能。1.级联下拉列表概念及应用场景
前端开发实战：创建简易HTML计算器不胖的羊
本文还有配套的精品资源，点击获取简介：计算器是执行基本数学运算的应用程序，通常在IT和前端开发领域中通过HTML、CSS和JavaScript实现。HTML定义页面结构和布局，JavaScript赋予计算器动态交互功能，例如监听按钮点击事件、执行计算和更新结果显示。该项目涉及HTML的元素结构、JavaScript的事件处理和DOM操作，是学习Web开发基础的理想练习。1.计算器的基本概念和应用1
A7. Jenkins Pipeline自动化构建过程，可灵活配置多项目、多模块服务实战 smart_ljh AI大模型应用与实战 spring boot 自动化后端自动化构建服务构建 build
服务容器化构建的环境配置构建前需要解决什么下面我们带着问题分析构建的过程：1.如何解决jenkins执行环境与shell脚本执行环境不一致问题？2.构建之前动态修改项目的环境变量3.在通过容器打包时避免不了会产生比较多的不可用的镜像资源，这些资源要是不及时删除掉时会导致服务器磁盘暴满，导致资源浪费。此时我们在构建之前也要执行不可用的镜像清除操作；4.本地LLama大模型服务地址，如何以容器部署时作
Android架构组件中的MVVM 小村学长毕业设计 android 架构
Android架构组件中的MVVM（Model-View-ViewModel）模式是一种广泛应用的设计模式，它通过将应用程序分为三个主要部分（Model、View、ViewModel）来分离用户界面和业务逻辑，从而提高代码的可维护性、可扩展性和可测试性。下面将详细介绍MVVM模式在Android开发中的实战应用，包括基本概念、实现步骤、优势以及一个实际案例。一、MVVM模式基本概念MVVM是Mod
python、JAVA等多种语言演示免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档说明 Eumenides_max python java 数据库股票API接口股票数据接口
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
R 调用 python weixin_33971205 python json java
上一篇说了python使用rpy2调用R，这里介绍R如何调用python。R的强项在于统计方面，尤其是专业的统计分析，统计检验以及作图功能十分强大，但是在通用性方面，就远不如Python了，比如python可以做web，可以开发GUI，可以爬虫，甚至可以开发游戏，这些R其实也不是完全不行，但是在易用性方面实在是难以与Python相匹敌。所以如果要是能将R与Python相结合，充分发挥二者的优势，那
Python 函数魔法书：基础、范例、避坑、测验与项目实战李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享编程技巧编程实战水平考试
Python函数魔法书：基础、范例、避坑、测验与项目实战内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解
Python 网络爬虫进阶：动态网页爬取与反爬机制应对 Milk夜雨 python python 爬虫
在上一篇文章中，我们学习了如何使用Python构建一个基本的网络爬虫。然而，在实际应用中，许多网站使用动态内容加载或实现反爬机制来阻止未经授权的抓取。因此，本篇文章将深入探讨以下进阶主题：如何处理动态加载的网页内容应对常见的反爬机制爬虫性能优化通过具体实例，我们将探讨更复杂的网络爬虫开发技巧。一、动态网页爬取现代网页通常通过JavaScript加载动态内容。直接使用requests获取的HTML可
es6.7.1分词器ik插件安装-和head插件连接es特殊配置运维实战课程 jenkins 运维
es6.7.1分词器ik插件安装-和head插件连接es特殊配置如果对运维课程感兴趣，可以在b站上、A站或csdn上搜索我的账号：运维实战课程，可以关注我，学习更多免费的运维实战技术视频1.查看es6.7.1和es-head安装位置和es插件路径[root@verify-10-100-4-4data]#dockerps|grepes4f0fe4db0ca9elasticsearch-head:6.
超简洁 100行Javascript代码实现2048游戏，浏览器可玩入职啦 100行实战项目 javascript 游戏开发语言
本文发表于入职啦(公众号:ruzhila)大家可以访问入职啦学习更多的编程实战。完全用Javascript的Canvas实现2048游戏，打开浏览器就可以玩项目地址代码已经开源，2048-js欢迎Star代码运行效果：所有的项目都在github上开源：100-line-code欢迎Star用100行代码的不同语言（Java、Python、Go、Javascript、Rust）实现项目，通过讲解项目
Nginx 学习笔记韩某- nginx 学习笔记
目录一、引言二、Nginx概述三、Nginx的作用（一）正向代理（二）反向代理（三）负载均衡策略（四）动静分离四、Nginx安装五、Nginx的常用命令六、Nginx实战及总结一、引言在项目发展初期，并发量和用户量较少时，简单地将一个jar包部署到服务器tomcat上即可满足需求。然而，随着用户数量的不断增长以及并发量的持续增大，单台服务器容易面临性能瓶颈，出现“红温”现象。此时，为了提升系统的处
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他