通过Jsoup解析器给抖音短视频去水印

通过Jsoup解析器给抖音短视频去水印

步骤一:需要下载相应的jar依赖包:

[下载地址](https://repo1.maven.org/maven2/org/jsoup/jsoup/1.11.3/jsoup-1.11.3.jar)

步骤二:直接上源码:

package cn.oop.pack.test;

import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
import java.util.Date;
import java.util.HashMap;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.jsoup.Jsoup;

/**
 * o 解析短视频水印,给定抖音短视频的链接,例如:#在抖音,记录美好生活#越简单的步伐越需要训练 https://v.douyin.com/CgPrHJ/ 复制此链接,打开【抖音短视频】,直接观看视频!
 * 
 * @author admin
 *
 */
public class Deom01 {

	public static void main(String[] args) throws Exception {

		// ●抖音链接(使用手机分享功能,复制链接)
		String url = "http://v.douyin.com/2MKBC6/";

		String url1 = "#在抖音,记录美好生活#越简单的步伐越需要训练 https://v.douyin.com/CgPrHJ/ 复制此链接,打开【抖音短视频】,直接观看视频!";

		// 过滤链接,获取http连接地址
		String finalUrl = decodeHttpUrl(url1);

		// 1.利用Jsoup抓取抖音链接
		// 抓取抖音网页
		String htmls = Jsoup.connect(finalUrl).ignoreContentType(true).execute().body();
		// System.out.println(htmls); //做测试时使用

		// 2.利用正则匹配可以抖音下载链接
		// playAddr:
		// "https://aweme.snssdk.com/aweme/v1/playwm/?video_id=v0200ffc0000bfil6o4mavffbmroeo80&line=0",
		// 具体匹配内容格式:「https://aweme.snssdk.com/aweme/...line=0」
		Pattern patternCompile = Pattern.compile("(?<=playAddr: \")https?://.+(?=\",)");
		// 利用Pattern.compile("正则条件").matcher("匹配的字符串对象")方法可以将需要匹配的字段进行匹配封装
		// 返回一个封装了匹配的字符串Matcher对象

		// 3.匹配后封装成Matcher对象
		Matcher m = patternCompile.matcher(htmls);

		// 4.①利用Matcher中的group方法获取匹配的特定字符串 ②利用String的replace方法替换特定字符,得到抖音的去水印链接
		String matchUrl = "";
		while (m.find()) {
			matchUrl = m.group(0).replaceAll("playwm", "play");
		}

		// 5.将链接封装成流
		// 注:由于抖音对请求头有限制,只能设置一个伪装手机浏览器请求头才可实现去水印下载
		Map<String, String> headers = new HashMap<>();
		headers.put("Connection", "keep-alive");
		headers.put("Host", "aweme.snssdk.com");
		headers.put("User-Agent",
				"Mozilla/5.0 (iPhone; CPU iPhone OS 12_1_4 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/16D57 Version/12.0 Safari/604.1");

		// 6.利用Joup获取视频对象,并作封装成一个输入流对象
		BufferedInputStream in = Jsoup.connect(matchUrl).headers(headers).timeout(10000).ignoreContentType(true)
				.execute().bodyStream();

		Long timetmp = new Date().getTime();
		String fileAddress = "d:/抖音视频/douyin_" + timetmp + ".mp4";

		// 7.封装一个保存文件的路径对象
		File fileSavePath = new File(fileAddress);

		// 注:如果保存文件夹不存在,那么则创建该文件夹
		File fileParent = fileSavePath.getParentFile();
		if (!fileParent.exists()) {
			fileParent.mkdirs();
		}

		// 8.新建一个输出流对象
		OutputStream out = new BufferedOutputStream(new FileOutputStream(fileSavePath));

		// 9.遍历输出文件
		int b;
		while ((b = in.read()) != -1) {
			out.write(b);
		}

		out.close();// 关闭输出流
		in.close(); // 关闭输入流

		// 注:打印获取的链接
		System.out.println("-----抖音去水印链接-----\n" + matchUrl);
		System.out.println("\n-----视频保存路径-----\n" + fileSavePath.getAbsolutePath());
	}

	public static String decodeHttpUrl(String url) {
		int start = url.indexOf("http");
		int end = url.lastIndexOf("/");
		String decodeurl = url.substring(start, end);
		return decodeurl;
	}

}

本文注意:此文章纯为了博主自己学习使用,如有侵权,请联系我,我会立马下架
联系方式:QQ:1258904360

你可能感兴趣的:(java)