姚毛毛

python3爬取女神图片，破解盗链问题

title: python3爬取女神图片，破解盗链问题

date: 2018-04-22 08:26:00

tags: [python3,美女,图片抓取，爬虫，盗链]

comments: true

前言

其实，抓取图片和抓取小说内容没有任何本质的区别，步骤都是一样的。

但是图片读取的时候，会遇到一个盗链问题。这个问题是花的解决时间最长的。

环境

语言: python3

操作系统: mac 10.12.16

自定义工具包：soup_tool

其依赖工具如下：
from urllib import request
from urllib.parse import quote
from bs4 import BeautifulSoup
import os
import threading
import re
import ssl

version 0.1 单个网址链接抓取所有特定图片

抓取分析

首先打开单个美女图片集
https://www.nvshens.com/g/24816

可以看到我标注的

使用chrome的检查功能，可以看到当前页有3张我们想要的图片

其中，可以以第二张图片的格式作为模板

只要替换001直到002、003、……、044

再找下图片总共有多少张，看我标注的count就可以了

这样就可以不用分页去抓取了。

至此，基本分析完毕，开始动手吧

动手实战

因为之前爬取小说网站的积累，写了一个工具类，主要就是用了request请求链接，BeautifulSoup解析网页，ssl解决https问题

工具类代码不一一贴出来了，最后会给个本项目github的地址

1.首先是初始化，建立class

class Capture:

引用自定义工具类

from soup_tool import Soup

from soup_tool import MyThread

然后定义初始化的一些参数

def __init__(self):
    self.index_page_url = 'http://www.nvshens.com'
    # 作品内容主页
    self.one_page_url = 'https://www.nvshens.com/g/:key/'
    # root folder
    self.folder_path = 'nvshens/'
    # 每个线程的沉睡时间
    self.sleep_time = 2
    # 后缀
    self.file_hz = '.img'

2.根据key来检索分析图集主页

接着，我们得将本网页的获取做成动态的，将网址

https://www.nvshens.com/g/24816

中的24816作为搜索key

定义一个方法 readPageFromSearch

def readPageFromSearch(self, search_key):
    """
    根据输入key读取搜索页面
    :param search_key:
    :return:
    """

方法里，第一个事，先建立个根目录

     # 创建文件夹 /nvshens/search_key
    path = self.folder_path + search_key
    Soup.create_folder(path)

然后打开美女图集第一页，使用soup解析

     # 打开搜索页面第1页
    page_url = self.one_page_url.replace(':key', search_key)
    print(page_url)
    soup_html = Soup.get_soup(page_url)

从soup中取到id是dinfo的div，然后找到里面的span，获取其中的文本，再处理掉“张照片”几个字，得到最大图片张数

    text_page = soup_html.find("div", {'id': 'dinfo'}).find('span').get_text()
    print('text_page', text_page)
    last = text_page.replace('张照片', '')
    item_size = int(last)

再接着，我们要找到模板，但是第一张照片也不能不管，所以先从第一张获取，我们先看下规律

   # 第1张 
   https://img.onvshen.com:85/gallery/25366/24816/0.jpg
   # 第2张
   https://img.onvshen.com:85/gallery/25366/24816/001.jpg
   # 第3张
   ttps://img.onvshen.com:85/gallery/25366/24816/002.jpg

这样，我们应该就知道怎么办了，取到第一张后，使用soup的find_next_sibling方法获取下一个标签节点

    # 第1张图片
    image_one = soup_html.find("ul", {'id': 'hgallery'}).find('img')
    image_one_url = image_one.get('src')
    print('image_one_url', image_one_url)

    # 第2张图片链接作为模版
    image_two = image_one.find_next_sibling()
    image_two_url = image_two.get('src')
    print('image_two_url', image_two_url)

然后，根据第二章的url，首先用"/"分割，取最右一组数，得到“24816/001.jpg”,在用"."分割，获取后缀，知道是jpg还是png

    # https://img.onvshen.com:85/gallery/25366/24816/001.jpg 
    # 24816/001.jpg
    img_hz = image_two_url.split("/")[-1]
    # jpg
    file_hz = img_hz.split('.')[1]
    # https://img.onvshen.com:85/gallery/25366
    img_mod_url = image_two_url.replace(img_hz, '')

3.多线程读取图片链接

定义readPageByThread 方法
将前面的

最大图片数 item_size
文件存放目录 path
模板url img_mod_url
文件后缀 file_hz

全部作为参数传进来

# 多线程读取，每个图片下载都是一个线程
def readPageByThread(self, item_size, path, img_mod_url, file_hz):
    """
    :param item_size: 最大图片数
    :param path: 文件存放目录
    :param img_mod_url: 模板url 
    :param file_hz: 文件后缀 
    :return:
    """

循环 item_size,使用zfill方法左侧补零

    # 循环打开图片链接
    for item in range(1, item_size):
        # 左侧补零 1->001,2->002,……,114->114
        page = str(item + 1).zfill(3)
        new_page_url = img_mod_url + page + '.' + file_hz
        new_path = path + '/' + page + '.' + file_hz
        print(new_path, '---', new_page_url)

使用自定义的多线程方法，将本次线程收集起来,参数传进 readPagetoTxt 方法中

        t = MyThread(self.readPagetoTxt, (new_page_url, new_path, self.sleep_time), self.readPagetoTxt.__name__)
        threads.append(t)

开启线程，并join阻塞

    for t in threads:
        t.start()
    for t in threads:
        t.join()

    print('all end', ctime())

4.读取图片内容并写入

这是本次图片抓取的重点了，在晚上搜索了很多内容，找到以下方法

urllib.request.urlretrieve

亲测，对于破解盗链没有任何作用

那么，真正的破盗链怎么搞呢？搜到了一个哥们的文章

go语言 grequests+goquery 简单爬虫，使用多协程并发爬取

其中有一段代码是这样的

  Headers:map[string]string{  
                            "Referer":"http://www.zngirls.com",  
                            "User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36"}})

这heads不只设置了User-Agent,还有Referer,艾？这是啥？我试试

将Referer设置为咱们的index_page_url（http://www.nvshens.com），果然可以了。为什么呢？

原来Referer表示一个来源，代表是从哪个网站请求web服务器的，我们将Referer设置为http://www.nvshens.com，代表的其实是从它自身网站请求访问的。

具体请参考这个哥们的文章什么是HTTP Referer？

当然，这也主要是这个网站的开发人员只用了Referer来作为防盗链的判断，如果不是Referer而是换成别的，那就又要重新破解了。

好了，写我们的代码吧，为head添加个Referer的属性，这Soup_tool类中

_HEAD2 = {
    # Referer 抓取哪个网站的图片，添加此头部，可以破解盗链
    "Referer": "",
    'Accept-language': 'zh-CN,zh;q=0.9'
    ,
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'
}

@staticmethod
def open_url(query_url, referer=''):
    Soup._HEAD2['Referer'] = referer
    req = request.Request(quote(query_url, safe='/:?='), headers=Soup._HEAD2)
    webpage = request.urlopen(req)
    html = webpage.read()
    return html
    
@staticmethod
def write_img(query_url, file_name, referer):
    content = Soup.open_url(query_url, referer)
    with open(file_name, 'wb') as f:
        f.write(content)

回到我们的Capture类：

    # 使用Request添加头部的方法，读取图片链接再写入，最重要的是加上Referer
    Soup.write_img(page_url, path, referer=self.index_page_url)

后记

还有v0.2、v0.3版本

这是v0.2的分析截图

https://www.nvshens.com/gallery/

https://www.nvshens.com/gallery/dudou/

分析思路是一样的，就不再细说了，自己看源码

看下下载后呈现的效果

最后放出代码链接

github

https://github.com/kiok1210/nvshens_img

参考文献：

go语言 grequests+goquery 简单爬虫，使用多协程并发爬取

什么是HTTP Referer？

你可能感兴趣的:(python3爬取女神图片，破解盗链问题)

解决Mybatis-Plus分页插件无效，total返回0的问题
问题描述：分页失效，mapper.selectPage返回记录，total还是0，往上大多数问题都是老版本的解决方式，mybatis-plus3.4.x版本无法解决原因：mybatis-plus3.4.x貌似通过拦截器进行分页的，这里没有启用，主要原因是数据库配置没有引入，以下为代码情况：1：xml依赖情况com.baomidoumybatis-plus-boot-starter3.4.32：增加
MybatisPlus操作Oracle日期时间时TO_DATE处理一朵梨花压海棠go java mybatis 开发语言
问题描述：在使用mybatis-plus构建查询语句对oracle数据进行查询时会报错，这是因为在ORACLE涉及日期查询时需要使用TO_DATE，所以，mybatis-plus构建查询语句时需要特别注意。mybatis-plus构建查询语句时，怎么处理oracle的日期呢？QueryWrapperwrapper=newQueryWrapper=TO_DATE({0},'yyyy-MM-dd')"
深度学习流体力学【干货】人工智能交叉前沿技术，人工智能深度学习 python 机器学习
深度学习作为一种新兴的机器学习技术，为流体科学的研究提供了新的思路和方法。通过对大量数据的学习和分析，深度学习模型可以自动提取特征和模式，为流体科学中的复杂问题提供解决方案。然而，深度学习在流体科学中的应用还面临一些挑战，需要进一步研究和探索。未来，深度学习与传统流体力学方法的结合将成为流体科学研究的重要方向，多模态数据的融合、模型的可解释性、实时预测和控制等将是深度学习在流体科学中发展的重点。相
【Linux】写时拷贝——干货解析代码程序猿RIP Linux linux 运维服务器
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、写时拷贝核心概念1.什么是写时拷贝？2.COW解决的问题二、写时拷贝工作原理1.内存管理基础结构2.COW工作流程3.页表状态变化图示初始状态（共享只读）子进程写入后（写时拷贝）三、写时拷贝的优势分析1.性能优势对比2.实际性能数据3.资源利用率提升四、内核实现深度解析1.COW核心代码逻辑2.关键数据结构五、应用场景与最
python键盘输入转换为列表_Python键盘输入转换为列表的实例云云众生w python键盘输入转换为列表
Python键盘输入转换为列表的实例发布时间：2020-08-1912:58:38来源：脚本之家阅读：92作者：清泉影月Python输入字符串转列表是为了方便后续处理，这种操作在考试的时候比较多见。1.在Python3.0以后，键盘输入使用input函数eg1.>>>x=input>>>123123在命令行没有任何显示，输入123后直接赋值给x，并打印。eg2.>>>x=input("请输入...
JSON数据格式的序列化和反序列化jackson针对首字母小学的字段返回序列化后第2个大写字母也变成小写的问题处理会飞的哈士奇 json
SpringBoot类属性”第二个字母大写“反序列化问题。key第二个字母大写会被转成小写,这个为jackson的bug。后台:StringpName;publicStringgetPName(){returnpName;}前台:{pname:'xxx'}解决方案：使用@JsonProperty("pName")注解类属性，指定错误反序列化后的属性名后台:StringpName;@JsonProp
DAY 40 训练和测试的规范写法 acstdm python打卡60天人工智能深度学习机器学习
目录一、单通道图片的规范写法图像任务中的张量形状NLP任务中的张量形状1.Flatten操作2.view/reshape操作总结二、彩色图片的规范写法知识点回顾：彩色和灰度图片测试和训练的规范写法：封装在函数中展平操作：除第一个维度batchsize外全部展平dropout操作：训练阶段随机丢弃神经元，测试阶段eval模式关闭dropout昨天我们介绍了图像数据的格式以及模型定义的过程，发现和之前
Caddy非80443端口反向代理+FRP内网穿透-一个服务器安装了frps，占用了80、443端口，怎么继续使用80、443端口建站呢？木子欢儿服务器数据库 linux 运维
问题：一个服务器安装了frps，占用了80、443端口，怎么继续使用80、443端口建站呢？一个解决办法安装Caddy-Dockerdockerrun-d--namecaddy-p8080:80-p8443:443\-v/etc/caddy/Caddyfile:/etc/caddy/Caddyfile\-v/var/www:/usr/share/caddy\caddy配置FRPserverAddr
跨平台+高颜值+免费，一款牛逼的开源阅读神器！梦玄狸开源
在当今数字阅读时代，许多阅读软件要么功能单一，要么界面复杂，难以满足用户的需求。例如，多设备同步阅读进度时，功能常常不稳定；做笔记和标注时，操作又显得繁琐。此外，平台兼容性差、数据同步困难等问题，也严重影响了阅读体验。今天，我要为大家介绍一款革命性的开源阅读工具——Readest，它不仅提供完整的跨平台支持，还具备强大的功能特性，能够帮助用户轻松实现优质的阅读体验。核心优势全平台覆盖，无缝同步Re
数据恢复软件：Recuva使用全攻略丹力
本文还有配套的精品资源，点击获取简介：在IT领域，误删除重要软件或文件是常见问题。为解决这一难题，Recuva数据恢复软件应运而生，它由Piriform公司开发，支持多种文件类型和文件系统的恢复。其工作原理是利用Windows文件系统的特性，寻找尚未被覆盖的已删除文件。用户可以使用Recuva的标准模式或深度扫描模式进行高效恢复，并将其保存至指定位置。尽管Recuva能有效恢复大部分文件，但定期备
Python 爬虫实战：12306 订单记录爬取（登录态保持 + 订单数据可视化）西攻城狮北 python 爬虫信息可视化
引言在大数据驱动的今天，12306作为国内最重要的铁路出行平台，积累了海量的出行数据。对于广大用户而言，能够方便地查看和分析自己的出行订单记录，不仅有助于行程管理，还能为未来的出行规划提供有力参考。本文将详细讲解如何利用Python爬虫技术实现12306的模拟登录，爬取个人订单记录，并通过数据可视化技术直观展示出行情况。一、环境搭建与准备工作（一）Python环境配置确保本地已安装Python3.
D-FINE使用pth权重批量推理可视化图片悠悠海风代码调试深度学习人工智能 python 目标检测计算机视觉
关于D-FINE相关的内容可参考下面这篇博客：论文解读：ICLR2025|D-FINE_d-fine:redefineregressiontaskindetrsasfine--CSDN博客文章浏览阅读949次，点赞18次，收藏28次。D-FINE是一款功能强大的实时物体检测器，它将DETRs中的边界框回归任务重新定义为细粒度分布细化（FDR），并引入了全局最优定位自蒸馏（GO-LSD），在不引入额
结构光相机：重塑工业自动化的“智慧之眼”，驱动智能制造新未来 lingling009 数码相机
一、迁移科技——3D视觉领域的创新引擎迁移科技成立于2017年，凭借结构光相机核心技术，已成为全球领先的3D工业视觉系统供应商。累计融资数亿元，深耕硬件、算法与软件三位一体技术，打造“稳定、易用、高回报”的AI+3D视觉解决方案，服务新能源、汽车、化工等10+行业，赋能工业自动化转型升级。二、结构光相机如何破解工业四大痛点1：高精度定位——汽车装配的“毫米级守护者”痛点：传统2D视觉无法捕捉曲面零
数据结构day5——队列和树 LZA185 数据结构数据结构
目录一、队列：先进先出的数据缓冲区队列的核心概念队列的典型应用场景队列的基本操作队列的两种C语言实现方式1.顺序队列（基于数组的实现）2.循环队列（解决假溢出问题）二、树：一对多的层次结构树的基本概念树的存储方式二叉树：最常用的树结构二叉树的定义二叉树的特点特殊的二叉树二叉树的重要特性二叉树的C语言实现与遍历三、总结在数据结构的世界里，队列和树是两种截然不同却又同样重要的结构。队列以其"先进先出"
长尾形分布论文速览三十篇【60-89】木木阳 Long-tailed 人工智能
长尾形分布速览（60-89）这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。通过优化和创新，LLMs在这些领域展现了卓越的性能，并为解决长尾问题提供了有效的工具和方法。1.长尾持续学习与对抗学习长尾持续学习(Paper60):通过优化器状态重用来减少遗忘，提高在长尾任务中的持续学
CVPR2024无监督Unsupervised论文17篇速览木木阳 CVPR 无监督 unsupervised
Paper1GuidedSlotAttentionforUnsupervisedVideoObjectSegmentation摘要小结:这段话的中文翻译如下：无监督视频对象分割旨在分割视频序列中最突出的对象。然而，复杂的背景和多个前景对象的存在使这项任务变得具有挑战性。为了解决这一问题，我们提出了一种引导式槽注意力网络，以加强空间结构信息并获得更好的前景-背景分离。初始化时带有查询引导的前景和背景
PHP后台代码解决跨域问题 Happiness&Rich php 跨域
在前端里面，解决跨域的时候总显得那么的恶心，什么jsonp啊，ajax啊，CORS啊什么的，总觉得是在钻空子进行跨域，其实在PHP文件里面只需要加一段代码就可以跨域了，前端你该怎么写还是怎么写，post，get随便用：header("Access-Control-Allow-Origin:*");header('Access-Control-Allow-Methods:POST');header(
sa-token：我将代替你，Spring Security m0_63486540 java spring java 后端
Sa-Token是一个轻量级Java权限认证框架，主要解决：登录认证、权限认证、单点登录、OAuth2.0、分布式Session会话、微服务网关鉴权等一系列权限相关问题。Sa-Token旨在以简单、优雅的方式完成系统的权限认证部分，以登录认证为例，你只需要：//会话登录，参数填登录人的账号idStpUtil.login(10001);无需实现任何接口，无需创建任何配置文件，只需要这一句静态代码的调
Ubuntu下使用ffmpeg封装h264裸流为MP4文件
最近在研究ffmpeg封装h264裸流为MP4相关问题，这里需要解释下为什么要封装h264视频，通过编码器得到的h264视频流仅仅是裸流，只包含一些流的头信息和视频数据，没有时间戳的概念，所以使用播放器播放h264视频时，会出现播放速度不正常的现象（我遇到的是快进现象），所以将h264封装成MP4格式可以添加时间戳的信息进去，即可使用播放器正常播放视频。参考网上的代码（https://blog.c
【LeetCode 热题 100】53. 最大子数组和——（解法二）动态规划 xumistore LeetCode leetcode 动态规划算法 java
Problem:53.最大子数组和题目：给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。LeetCode热题100】53.最大子数组和——（解法一）前缀和文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(N)整体思路这段代码同样旨在解决“最大子数组和”问题。它采用的是一种非常经典且标准的动态规划
【LeetCode 热题 100】76. 最小覆盖子串——（解法一）滑动窗口+数组 xumistore LeetCode leetcode 算法职场和发展 java
Problem:76.最小覆盖子串给你一个字符串s、一个字符串t。返回s中涵盖t所有字符的最小子串。如果s中不存在涵盖t所有字符的子串，则返回空字符串“”。文章目录整体思路完整代码时空复杂度时间复杂度：O(|S|+|t|)空间复杂度：O(k)或O(1)整体思路这段代码旨在解决一个经典的字符串问题：最小窗口子串(MinimumWindowSubstring)。问题要求在主字符串S中，找出一个包含目标
【图像去噪】论文精读：Linear Combinations of Patches Are Unreasonably Effective for Single-Image Denoising 十小大深度学习图像处理计算机视觉图像去噪人工智能
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言AbstractI.INTRODUCTIONII.APARAMETRICVIEWOFTWO-STEPNON-LOCALMETHODSFORSINGLE-IMAGEDE
男模Python 函数命名以及鸡兔同笼函数 pythonyuanke python 开发语言
那么问你一个问题，现在是不是所有的函数都是def开头的？如果def就是函数的名字，那么python怎么区分该调用哪一个函数？名字都一样啊那也就是def后面的是函数名字?def后面，括号前面参数列表，这里的参数指的是形式参数，就是括号里面的部分这里只有一个形式参数，所以没有逗号，如果有多个形式参数，那么用逗号分隔参考我们在world.py里面写的几个函数，比如defadd(a,b)你说一下它的名字和
Python 开发规范：pdb & cProfile：调试 & 性能分析写文章的大米 Python 核心技术 python
↑↑↑欢迎点赞、关注、收藏！！！，10年IT行业老鸟，持续分享更多IT干货文章目录pdb&cProfile：调试&性能分析核心内容1、调试和性能分析的必要性2、pdb调试工具3、cProfile性能分析工具pdb&cProfile：调试&性能分析核心内容1、调试和性能分析的必要性在实际生产环境中，代码调试（找问题根因、修复bug）和性能分析（优化效率、减少latency）是开发关键环节。尤其，面对
数据结构：递归：汉诺塔问题（Tower of Hanoi） 95号闪电麦坤数据结构数据结构
目录问题描述第一性原理分析代码实现第一步：明确函数要干什么第二步：写好递归的“结束条件”第三步：写递归步骤递归调用树问题描述有三个柱子（A,B,C），上面有n个大小不等的圆盘，最开始所有圆盘按从大到小顺序堆在柱子A上。目标：将所有圆盘移动到柱子C，移动时要满足：一次只能移动一个盘子；任何时刻小盘子不能压在大盘子上。❓核心问题：如何将n个盘子从A移动到C，同时只用B做辅助，且不违反约束？第一性原理分
AI人工智能 Agent：在节能减排中的应用 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1全球气候变化与节能减排随着工业化进程的加速和人口的不断增长，全球气候变化问题日益严峻。温室气体排放导致的全球变暖、极端天气事件频发等问题，已经对人类的生存环境和社会经济发展造成了严重威胁。因此，节能减排已成为全球共识，各国政府和企业都在积极探索和实施各种节能减排措施。1.2人工智能技术的兴起近年来，人工智能（AI）技术发展迅猛，并在各个领域取得了显著成果。AI技术具有强大的数据分
扣带回灰质体积：双任务步态与痴呆发病关联的关键中介楚山之石学习图像处理科技人工智能 mr
扣带回灰质体积介导双任务步态与痴呆发病的关联研究背景与核心问题随着全球人口老龄化，痴呆已成为重大公共卫生挑战，而轻度认知障碍（MCI）作为正常认知与痴呆的过渡状态，是早期干预的关键窗口。双任务步态测试（行走时执行认知任务）中出现的高双任务成本（DTC，即步态速度较单任务时减慢≥20%），已被证实与MCI患者进展为痴呆的风险升高相关，但这一关联的神经机制尚不明确。本研究旨在探索脑灰质体积减少和运动皮
【iSAQB软件架构】原型和技术概念验证小马哥编程 ui 系统架构架构开发语言产品经理
在软件开发项目的过程中可能会出现许多不同类型的问题。要么利益相关者难以明确（尤其是完整地）阐述需求，要么系统用户和开发人员之间的合作无法正常进行。通常，合作在分析和设计阶段结束，因为开发人员随后会退出，只有在软件完成时才展示他们的工作成果。如果团队要相互学习，团队之间的协调非常重要。各种解决方案必须与客户进行测试和讨论，并且某些需求无法仅根据其理论描述得到保证（例如，实时需求）。因此，在定义阶段完
github简单入门梦花火开发环境 github ssh
github使用小小总结在这里并不讲述任何关于如何配置github的问题，这些东西，稍微百度一下就有，不具备写的价值。-question1:如何创建一个新项目？1.确认你本地的github已经配置完全（特别是密钥）ps:可以用[email protected]来验证密钥是否配置好。2.在github官网上开启一个新的空白的项目库（可以选择配置readme）3.如果是从头创建版本库，可以采用先克
将实时流的 H.264（视频）与 G.711A（音频）封装成 MP4 文件张海森_168820 将 h264+AAC存为 mp4格式记录音视频
将实时流的H.264（视频）与G.711A（音频）封装成MP4文件✅一、明确的问题目标你有：实时接收到的H.264码流实时接收到的G.711A音频流你想要：把它们同步封装成MP4文件问题挑战MP4不直接支持G.711A编码（PCMA），需要转码为AAC。MP4v2只支持对**已编码的帧（H.264/AAC）**进行封装，不做编码或转码。你需要处理**音视频同步（PTS/DTS）**问题。✅方案一：
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他