坐吃山猪

2024-12-01百度TTS语音

百度TTS语音

个人尝试代码仓库：https://gitee.com/enzoism/chrome_tampermonkey

鸣谢：感谢每一位无私奉献的传道者，在此不一一具名！

1-学习目标

1）了解百度TTS语音
2）使用百度TTS语音

2-参考网址

个人尝试代码仓库：https://gitee.com/enzoism/chrome_tampermonkey
1-应用列表查看地址：https://console.bce.baidu.com/ai/#/ai/speech/app/list
2-AccessToken接口文档：https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjhhu
3-音频实时接口文档：https://cloud.baidu.com/doc/SPEECH/s/Klbxern8v
4-短语音识别API文档：https://cloud.baidu.com/doc/SPEECH/s/Jlbxdezuf

3-执行过程记录

1-TTS市场现状

2024-12-01 目前应该是ChatTTS的呼声最高，但是为了不引入新的学习成本，暂时不考虑使用ChatTTS，直接使用在线API可以满足我的需求！（百度的TTS有太多的AI味，在这个时间节点上，百度可能还是没有把重心放在这些细节上）

2-Tampermonkey

已经完成整体的功能，可以直接复制当前脚本到Tampermonkey，选中文字即可进行语音播报

// ==UserScript==
// @name         Text to Speech using Baidu API
// @namespace    http://tampermonkey.net/
// @version      0.1
// @description  Convert selected text to speech using Baidu Text-to-Speech API
// @author       Your name
// @match        *://*/*
// @grant        GM_xmlhttpRequest
// @grant        GM_setValue
// @grant        GM_getValue
// ==/UserScript==

(function() {
    'use strict';

    // 配置信息 - 需要替换成你的百度API密钥信息
    const API_KEY = '44kNzmCeZNnLHoUcNiGYnyI7';
    const SECRET_KEY = '7sNV1osooTqJliQB1aHB5lJKEKlLrg5f';
    let access_token = '';

    // 获取access_token的函数
    async function getAccessToken() {
        const url = `https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=${API_KEY}&client_secret=${SECRET_KEY}`;
        
        return new Promise((resolve, reject) => {
            GM_xmlhttpRequest({
                method: 'POST',
                url: url,
                headers: {
                    'Content-Type': 'application/json',
                    'Accept': 'application/json'
                },
                onload: function(response) {
                    if (response.status === 200) {
                        try {
                            const data = JSON.parse(response.responseText);
                            if (data.access_token) {
                                access_token = data.access_token;
                                GM_setValue('access_token', access_token);
                                resolve(access_token);
                            } else {
                                console.error('获取access_token失败: 返回数据格式错误', data);
                                reject(new Error('获取access_token失败: 返回数据格式错误'));
                            }
                        } catch (error) {
                            console.error('解析access_token响应失败:', error);
                            reject(error);
                        }
                    } else {
                        console.error('获取access_token失败:', response.status, response.responseText);
                        reject(new Error(`获取access_token失败: ${response.status}`));
                    }
                },
                onerror: function(error) {
                    console.error('请求access_token失败:', error);
                    reject(error);
                }
            });
        });
    }

    // 文字转语音的函数
    async function textToSpeech(text, params = {}) {
        if (!access_token) {
            access_token = GM_getValue('access_token') || await getAccessToken();
        }

        if (!access_token) {
            alert('无法获取access_token，请检查API配置');
            return;
        }

        const url = `https://tsn.baidu.com/text2audio`;
        const requestParams = new URLSearchParams({
            tex: encodeURIComponent(text),
            tok: access_token,
            cuid: 'tampermonkey_tts',
            ctp: 1,
            lan: 'zh',
            spd: params.spd || 5,
            pit: params.pit || 5,
            vol: params.vol || 5,
            per: params.per || 0,
            aue: 3
        });

        try {
            GM_xmlhttpRequest({
                method: 'GET',
                url: `${url}?${requestParams.toString()}`,
                responseType: 'blob',
                onload: function(response) {
                    if (response.status === 200) {
                        const blob = response.response;
                        const audio = new Audio(URL.createObjectURL(blob));
                        audio.play().catch(error => {
                            console.error('播放音频失败:', error);
                            alert('播放音频失败，请重试');
                        });
                    } else {
                        console.error('语音合成请求失败:', response.status);
                        alert('语音合成失败，请重试');
                    }
                },
                onerror: function(error) {
                    console.error('请求失败:', error);
                    alert('请求失败，请重试');
                }
            });
        } catch (error) {
            console.error('语音合成出错:', error);
            alert('语音合成出错，请重试');
        }
    }

    // 创建控制面板
    function createControlPanel() {
        const panel = document.createElement('div');
        panel.style.position = 'fixed';
        panel.style.bottom = '80px';
        panel.style.right = '20px';
        panel.style.zIndex = '9999';
        panel.style.backgroundColor = 'white';
        panel.style.padding = '10px';
        panel.style.border = '1px solid #ccc';
        panel.style.borderRadius = '5px';
        panel.style.display = 'none';

        // 语速控制
        const speedControl = document.createElement('div');
        speedControl.innerHTML = `
            语速(0-15): 
                
                5
            
        `;
        
        // 音量控制
        const volumeControl = document.createElement('div');
        volumeControl.innerHTML = `
            音量(0-15): 
                
                5
            
        `;

        // 音调控制
        const pitchControl = document.createElement('div');
        pitchControl.innerHTML = `
            音调(0-15): 
                
                5
            
        `;

        // 发音人选择
        const personControl = document.createElement('div');
        personControl.innerHTML = `
            发音人: 
                
            
        `;

        panel.appendChild(speedControl);
        panel.appendChild(volumeControl);
        panel.appendChild(pitchControl);
        panel.appendChild(personControl);

        // 添加事件监听
        ['speed', 'volume', 'pitch'].forEach(param => {
            const input = panel.querySelector(`#tts-${param}`);
            const value = panel.querySelector(`#${param}-value`);
            input.addEventListener('input', () => {
                value.textContent = input.value;
                GM_setValue(`tts-${param}`, input.value);
            });
        });

        panel.querySelector('#tts-person').addEventListener('change', (e) => {
            GM_setValue('tts-person', e.target.value);
        });

        document.body.appendChild(panel);
        return panel;
    }

    // 创建悬浮按钮
    function createFloatingButton() {
        const button = document.createElement('button');
        button.innerHTML = '朗读选中文本';
        button.style.position = 'fixed';
        button.style.bottom = '20px';
        button.style.right = '20px';
        button.style.zIndex = '9999';
        button.style.padding = '10px';
        button.style.backgroundColor = '#4CAF50';
        button.style.color = 'white';
        button.style.border = 'none';
        button.style.borderRadius = '5px';
        button.style.cursor = 'pointer';

        const settingsButton = document.createElement('button');
        settingsButton.innerHTML = '??';
        settingsButton.style.position = 'fixed';
        settingsButton.style.bottom = '20px';
        settingsButton.style.right = '140px';
        settingsButton.style.zIndex = '9999';
        settingsButton.style.padding = '10px';
        settingsButton.style.backgroundColor = '#2196F3';
        settingsButton.style.color = 'white';
        settingsButton.style.border = 'none';
        settingsButton.style.borderRadius = '5px';
        settingsButton.style.cursor = 'pointer';

        const panel = createControlPanel();
        
        settingsButton.addEventListener('click', function() {
            panel.style.display = panel.style.display === 'none' ? 'block' : 'none';
        });

        button.addEventListener('click', function() {
            const selectedText = window.getSelection().toString().trim();
            if (selectedText) {
                const params = {
                    spd: parseInt(GM_getValue('tts-speed', 9)),
                    vol: parseInt(GM_getValue('tts-volume', 5)),
                    pit: parseInt(GM_getValue('tts-pitch', 5)),
                    per: parseInt(GM_getValue('tts-person', 0))
                };
                textToSpeech(selectedText, params);
            } else {
                alert('请先选择要朗读的文本');
            }
        });

        document.body.appendChild(button);
        document.body.appendChild(settingsButton);
    }

    // 初始化
    createFloatingButton();
})();

3-Python版本

Python3.8.5版本可运行

import requests
import json
import base64
from urllib.parse import quote
import os
from playsound import playsound

class BaiduTTS:
    def __init__(self):
        # API配置信息
        self.API_KEY = '44kNzmCeZNnLHoUcNiGYnyI7'
        self.SECRET_KEY = '7sNV1osooTqJliQB1aHB5lJKEKlLrg5f'
        self.access_token = None
        
    def get_access_token(self):
        """获取access_token"""
        url = f"https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={self.API_KEY}&client_secret={self.SECRET_KEY}"
        
        response = requests.post(url)
        if response.status_code == 200:
            result = response.json()
            self.access_token = result['access_token']
            return self.access_token
        else:
            print(f"获取access_token失败: {response.status_code}")
            return None

    def text_to_speech(self, text, params=None):
        """文字转语音"""
        if not self.access_token:
            self.access_token = self.get_access_token()
            
        if not self.access_token:
            print("无法获取access_token")
            return False

        # 默认参数
        default_params = {
            'spd': 9,  # 语速，取值0-15
            'pit': 5,  # 音调，取值0-15
            'vol': 5,  # 音量，取值0-15
            'per': 0,  # 发音人，0为女声，1为男声，3为度逍遥，4为度丫丫
        }

        # 更新参数
        if params:
            default_params.update(params)

        url = "https://tsn.baidu.com/text2audio"
        
        params = {
            'tex': quote(text),
            'tok': self.access_token,
            'cuid': 'python_tts',
            'ctp': 1,
            'lan': 'zh',
            'aue': 3,  # mp3格式
            **default_params
        }
        
        try:
            response = requests.get(url, params=params)
            
            # 检查是否返回音频数据
            if response.headers['Content-Type'].startswith('audio/'):
                # 保存音频文件
                audio_file = "output.mp3"
                with open(audio_file, 'wb') as f:
                    f.write(response.content)
                print(f"已保存音频文件: {audio_file}")
                
                # 播放音频
                playsound(audio_file)
                return True
            else:
                error_msg = response.json()
                print(f"转换失败: {error_msg}")
                return False
                
        except Exception as e:
            print(f"请求失败: {str(e)}")
            return False

def main():
    # 使用示例
    tts = BaiduTTS()
    
    # 要转换的文本
    text = input("请输入要转换的文字: ")
    
    # 可选：自定义参数
    params = {
        'spd': 9,  # 语速
        'pit': 5,  # 音调
        'vol': 5,  # 音量
        'per': 0   # 发音人
    }
    
    # 执行转换
    tts.text_to_speech(text, params)

if __name__ == "__main__":
    main()

4-其他知识补充

1-TTS发展历史

TTS（Text-to-Speech，文本转语音）技术的发展历史可以追溯到20世纪50年代，经历了多个阶段的技术进步和创新。以下是TTS技术发展的主要里程碑：

1. 早期研究（20世纪50年代至70年代）

早期尝试：最早的TTS系统开始于20世纪50年代。研究人员尝试通过机械设备和简单的声音合成器来生成语音。
基础研究：在20世纪60年代和70年代，主要集中在语音合成的基本原理和方法上，如共振峰合成（Formant Synthesis），通过模拟人类声道的共振特性来生成语音。

2. 数字信号处理时代（20世纪80年代至90年代）

数字信号处理技术：随着数字信号处理（DSP）技术的发展，TTS系统开始使用计算机来处理和生成语音。这种方法提高了语音合成的质量和效率。
规则合成器：出现了基于规则的合成器，这些系统通过一系列规则将文本转换为语音。例如，线性预测编码（LPC）技术被广泛应用于语音合成。
有限状态机：有限状态机（FSM）被用于文本分析和语音合成，这种方法简化了复杂文本的处理。

3. 统计方法和数据驱动技术（21世纪初）

统计语音合成：2000年后，统计方法开始主导TTS技术的研究。这些方法依赖于大量的语音数据和文本数据，通过机器学习算法来生成语音。梅尔频率倒谱系数（MFCC）和隐马尔可夫模型（HMM）等技术被广泛应用。
语音库和TTS系统：出现了基于语音库的TTS系统，这些系统使用预先录制的语音片段来生成自然语音。例如，单元选择合成（Unit Selection Synthesis）通过选择和拼接预先录制的语音单元来生成语音。

4. 深度学习和神经网络时代（2010年至今）

神经网络TTS：随着深度学习技术的发展，神经网络在TTS中的应用迅速增长。递归神经网络（RNN）、长短期记忆网络（LSTM）和变分自编码器（VAE）等技术被用于生成更加自然和流畅的语音。
端到端模型：出现了端到端TTS模型，这些模型直接从文本生成语音，简化了处理流程。例如，WaveNet、Tacotron和Transformer等模型显著提高了语音合成的质量。
多语言和个性化TTS：现代TTS系统支持多语言和个性化语音合成。用户可以选择不同的语音风格和角色，甚至可以定制自己的语音模型。

5. 当前趋势和未来展望

低资源语言支持：为了让更多人受益于TTS技术，研究人员正在开发低资源语言的TTS系统，这些系统可以在数据有限的情况下仍然生成高质量的语音。
实时TTS：随着硬件和算法的进步，实时TTS系统的性能不断提升，使得语音合成的延迟大大降低。
多模态TTS：结合其他感知模态（如视觉和触觉）的多模态TTS系统正在研究中，以提供更加丰富的用户体验。

总的来说，TTS技术从早期的简单合成发展到了现在的深度学习驱动的自然语音生成，不断推动着人机交互和无障碍通信的发展。

2-TTS发展历史总结

1-深度学习和神经网络时代（2010年至今）

神经网络TTS
- 技术应用：RNN, LSTM, VAE
- 目标：自然流畅的语音
端到端模型
- 模型：WaveNet, Tacotron, Transformer
- 优势：简化流程，提高质量
多语言和个性化TTS
- 支持：多语言，个性化语音
- 功能：选择语音风格和角色，定制语音模型

2-当前趋势和未来展望

低资源语言支持
- 目标：数据有限下生成高质量语音
实时TTS
- 进展：硬件和算法进步
- 结果：降低延迟
多模态TTS
- 方向：结合视觉和触觉
- 目标：丰富用户体验

Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
ZYNQ无DMA的四路HP总线极限性能探索芯作者 D1：ZYNQ设计 fpga开发硬件工程智能硬件
深入挖掘AXIHP总线的直接传输潜力，突破传统DMA的性能瓶颈一、HP总线：ZYNQ系统的"高速公路"在XilinxZYNQ架构中，HP（HighPerformance）总线是连接PS（处理器系统）和PL（可编程逻辑）的关键通道。传统方案依赖DMA控制器进行数据传输，但当我们需要超低延迟或确定性响应时，无DMA的直接CPU控制成为更优选择。本文将揭示如何通过四路HP总线实现惊人的24GB/s理论带
深度解析JavaScript 闭包 coding随想 JavaScript javascript 开发语言 ecmascript
深度解析JavaScript闭包引言：为什么闭包让人又爱又怕？在JavaScript的学习过程中，闭包（Closure）是一个绕不开的“坎”。很多开发者第一次接触闭包时，会感到一头雾水：“为什么函数能记住外部作用域的变量？”、“为什么闭包会导致内存泄漏？”。但另一方面，闭包又是JavaScript最强大的特性之一，它支撑着模块化开发、数据封装、异步编程等核心场景。本文将通过通俗的语言和生动的案例，
JavaScript中的函数柯里化（Currying）：从概念到实战 coding随想 JavaScript javascript ecmascript 开发语言前端
JavaScript中的函数柯里化（Currying）：从概念到实战在JavaScript开发中，函数式编程（FunctionalProgramming）逐渐成为一种主流思想。而函数柯里化（Currying），正是这一思想中的核心技巧之一。它不仅能提升代码的复用性和灵活性，还能帮助我们构建更优雅、更模块化的解决方案。本文将带你从零开始，深入理解柯里化的原理、实现方式及实际应用场景。一、什么是函数柯
Linux命令行操作基础 EnigmaCoder Linux linux 运维服务器
目录前言目录结构✍️语法格式操作技巧Tab补全光标操作基础命令登录和电源管理命令⚙️login⚙️last⚙️exit⚙️shutdown⚙️halt⚙️reboot文件命令⚙️浏览目录类命令pwdcdls⚙️浏览文件类命令catmorelessheadtail⚙️目录操作类命令mkdirrmdir⚙️文件操作类命令mvrmtouchfindgziptar⚙️cp前言大家好！我是EnigmaCod
Web API 渗透测试指南江左盟宗主 WEB渗透从入门到精通 Web API渗透测试 Web API
概述API（ApplicationProgrammingInterface，应用程序编程接口）是一个允许不同软件应用程序之间进行通信和数据交换的接口。API定义了一组规则和协议，软件开发者可以使用这些规则和协议来访问操作系统、库、服务或其他应用程序的功能。API的基本概念接口（Interface）:API提供了一组公开的方法和端点，供外部系统调用。这些方法和端点通常通过URL、函数名或服务名称来表
Solidity/Rust 实战 —— Web3 开发者免费训练营（第23期） moonshotcommons 共学营 rust web3 开发语言
HackQuest第23期Solidity/Rust共学营即将开营！Solidity/Rust共学营信息清单8月13日-8月22日免费（成功结营的小伙伴还将获得专属周边）全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书主办社区:HackQuestHackQuest是一个充满活力的Web3开发者教育社区，我们的目标是培养下一代Web3开发者。目前，HackQuest组织的共学营已达22
Solidity/Rust 实战 —— Web3 开发者免费训练营（第16期） moonshotcommons 共学营 rust web3 开发语言
HackQuest第16期Solidity/Rust共学营即将开营！Solidity/Rust共学营信息清单6月11日-6月20日免费（成功结营的小伙伴还将获得专属周边）全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书关于HackQuestHackQuest是一个充满活力的Web3开发者教育社区，我们的目标是培养下一代Web3开发者。目前我们的产品仍处于内测阶段，我们计划招募小伙伴们
webpack和vite对比解析（AI）秉承初心 AI创造 webpack 前端 node.js
以下是Webpack和Vite的对比解析，从核心机制、性能、配置扩展性、适用场景等维度进行详细说明：⚙️一、核心机制差异构建模式Webpack：采用打包器模式，启动时需遍历整个模块依赖图，将所有资源打包成Bundle，再启动开发服务器。Vite：基于ESModules原生支持，开发环境跳过打包，按需编译（浏览器请求时实时编译）。生产环境才用Rollup打包。依赖处理Webpack：冷启动时需全量打
51单片机教程（十一）- 单片机定时器 ITB业生 C 单片机 51单片机
11、单片机定时器项目目标通过定时器/计数器实现流水灯控制。知识要点定时器的结构。TMOD和TCON；定时/计数器工作方式；定时/计数器编程步骤；1、项目分析前面的流水灯的时间控制通过空循环语句来实现，定时不是很精确。本章通过用定时器来控制流水灯任务可以实现精确的时间控制。这就需要了解定时器的使用。定时器和计数器实质功能相同，本章利用LED灯二进制计数任务来掌握计数器的使用。2、技术准备1背景从软
GO 语言学习之运算符号唯独不开心学习 go
算术运算符：二元的运算符：+-*/%四则运算没啥好说的，从小就开始学习，最后一个%表示求余数或者取模运算。packagemainimport"fmt"funcmain(){a:=1+2b:=a-1c:=a*bd:=c/ae:=c%3fmt.Println("a:=1+2的结果是：",a)fmt.Println("b:=a-1的结果是：",b)fmt.Println("c:=a*b的结果是：",c)
GO 语言学习之变量和常量唯独不开心 golang 学习开发语言
变量变量顾名思义，存储的内容是不确定，只有在执行赋值后那一刻是确定的，因为你也不知道赋值后会不会被修改。变量定义方式：var:=var(aint,b,c....)示例：packagemainimport"fmt"funcmain(){varaint//定义一个整型变量，默认是零值（整形的零值是0）b:=1//定义一个整型变量，并赋值为1fmt.Printf("a=%db=%d\n",a,b)//定
HarmonyOS Next常用组件 TextInput harmonyos
InputType枚举说明Normal基本输入模式，无特殊限制Password密码输入模式。密码显示小眼睛图标，默认输入文字短暂显示后变成圆点Email邮箱地址输入模式。支持数字、字母、下划线、小数点、!、#、$、%、&、'、"、*、+、-、/、=、?、^、`、{、\、}、~，以及@字符（只能存在一个@字符）Number纯数字输入模式PhoneNumber电话号码输入模式。支持输入数字、空格、+、
c++ io操作（文件的读取与写入） galaxy_strive C++Study c++开发语言
1文件的读取//文件操作模式//ios::app追加模式//ios::ate文件打开后定位到文件末尾//ios::in打开文件用于读取//ios::out打开文件用于写入//ios::trunc如果该文件已经存在，其内容将在打开之前被截断，即把文件长度设置为0//读取文件示例intmain(){fstreamfile("./io.txt",ios::in);//文件是否正常打开if(file.is
深入理解reeze/tipi项目中的词法分析与语法分析技术焦习娜Samantha
深入理解reeze/tipi项目中的词法分析与语法分析技术tipiThinkingInPHPInternals,AnopenbookonPHPInternals项目地址:https://gitcode.com/gh_mirrors/ti/tipi引言在编程语言实现领域，词法分析和语法分析是构建编译器或解释器的关键环节。本文将基于reeze/tipi项目中的相关内容，深入浅出地讲解这些核心技术原理。
【策划所需编程知识】叫我六胖子笔记游戏
1、TCP与UDP名称TCPUDP方式先奏后斩先斩后奏优点防外挂，慢但不出错用户体验好常用游戏MMORPGFPS、MOBA、IO类2、弱联网与实时联网名称弱联网实时联网方式只在必要时链接频率很高特点频率低频率高特点对宽带要求不高对宽带要求高常用游戏卡牌、放置挂机、轻度休闲、SLGFPS、MOBA、IO类
Cursor MySQL MCP 完整操作配置指南 z日火开发分享 mcp cursor mysql
概述本指南帮助您在Windows环境下配置Cursor编辑器的MySQLMCP服务器，实现通过AI助手对数据库进行完整的增删改查操作。功能特性：✅自然语言数据库查询✅智能数据插入和更新✅安全的数据删除操作✅自动数据分析和报告生成快速配置1.环境检查#检查必要组件node--version#Node.js>=16mysql--version#MySQL5.7+cursor--version#Curs
构建四则运算解析器：字符串处理与计算逻辑实战大熊小清新
本文还有配套的精品资源，点击获取简介：四则运算解析器是将包含四则运算符号的字符串表达式转化为可执行计算的程序。它对编程初学者而言是理解编程逻辑和语法分析的基础。通过理解四则运算的优先级规则，实现输入处理、词法分析、语法分析和计算步骤，可以采用递归下降解析或堆栈解析等方法。本解析器的实现涉及字符串处理、数据结构的运用，有助于学习者掌握编程语言的底层工作方式，提升编程技能和问题解决能力。1.四则运算解
提示词编程语言设计艺术探索 AI天才研究院计算 AI人工智能与大数据 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《提示词编程语言设计艺术探索》关键词：提示词编程语言，设计艺术，编程语言设计，核心算法，实例分析，项目实战摘要：本文旨在深入探讨提示词编程语言的设计艺术，从基础概念到核心算法，再到实际应用和未来趋势，全面解析这一领域的关键技术和设计理念。通过具体的实例分析和项目实战，帮助读者更好地理解和掌握提示词编程语言的设计与实现。引言与概述1.1提示词编程语言的背景和重要性提示词编程语言（Prompt-Bas
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
C# 中 EventWaitHandle 实现多进程状态同步的深度解析 Leon@Lee c#开发语言
在现代软件开发中，多进程应用场景日益普遍。无论是分布式系统、微服务架构，还是传统的客户端-服务器模型，进程间的状态同步都是一个关键挑战。C#提供了多种同步原语，其中EventWaitHandle是一个强大的工具，特别适合处理跨进程的同步需求。本文将深入探讨EventWaitHandle的工作原理、使用场景及最佳实践。一、EventWaitHandle基础原理EventWaitHandle是.NET
Linux journal 日志大小限制与管理详解 XMYX-0 linux 运维服务器
文章目录Linuxjournal日志大小限制与管理详解journal日志的默认存储位置journal日志大小限制配置查看当前日志占用情况手动清理日志文件按大小清理日志按时间清理日志按文件数清理日志journald日志机制原理简析（适当加点原理）日志筛选与导出技巧（实用提升）按服务名筛选按时间范围查看日志导出日志为纯文本文件实时查看日志（类似`tail-f`）常见问题与踩坑提醒（经验+防踩坑）问题1
Redis网络通信模块深度解析：单线程Reactor到多线程IO的架构演进
一、核心架构：单线程Reactor模型Redis网络模块采用经典Reactor模式，核心流程如下：voidaeMain(aeEventLoop*eventLoop){while(!eventLoop->stop){//前置钩子（集群心跳/数据持久化）if(eventLoop->beforesleep)eventLoop->beforesleep(eventLoop);//事件分派：I/O复用+定时
力扣网C语言编程题：搜索二维矩阵（右上角-＞左下角解法）魏劭逻辑编程题 C语言算法 leetcode c语言
一.简介上一篇文章关于"在二维数组中查找某个元素"的问题，提供了两种解题思路，文章如下：力扣网C语言编程题：搜索二维矩阵的普通解法与二分查找法-CSDN博客本文提供第三种解题思路：从左下角->右上角，或者右上角->左下角。二.力扣网C语言编程题：搜索二维矩阵（右上角->左下角解法）解题思路三：（换行或换列）因为题目中，数组中元素是每行元素是递增的，同时，每一行的首元素比上一行最后一个元素大，那么，
力扣网C语言编程题：在数组中查找目标值位置魏劭逻辑编程题 C语言算法 c语言 leetcode
一.简介本文记录一下力扣网上涉及数组的问题：排序数组中查找目标值的位置。主要以C语言实现。二.力扣网C语言编程题：在数组中查找目标值位置题目：在排序数组中查找元素的第一个和最后一个位置给你一个按照非递减顺序排列的整数数组nums，和一个目标值target。请你找出给定目标值在数组中的开始位置和结束位置。如果数组中不存在目标值target，返回[-1,-1]。你必须设计并实现时间复杂度为O(logn
力扣网C语言编程题：接雨水（双指针法）魏劭逻辑编程题 C语言 c语言 leetcode 算法
一.简介前面文章是以动态规划方法实现的，文章如下：力扣网C语言编程题：接雨水（动态规划实现）-CSDN博客本文继续针对力扣网的接雨水问题，以另一种解题思路（双指针）以C语言实现和Python实现。二.力扣网C语言编程题：接雨水（双指针法）题目：接雨水给定n个非负整数表示每个宽度为1的柱子的高度图，计算按此排列的柱子，下雨之后能接多少雨水。示例2：输入：height=[4,2,0,3,2,5]输出：
RPC与HTTP API对比漫谈网络 NetDevOps 智联空间 rpc http 网络协议
一、核心流程对比环节RPCHTTPAPI调用方式调用远程函数/方法（如userService.getUser(123)）调用远程端点（如GET/users/123）参数传递通过序列化直接传递编程语言对象通过URL参数、Header或Body传递结构化数据网络传输通常基于TCP/UDP+二进制协议（如gRPC的HTTP/2）基于HTTP/HTTPS文本协议数据封装由框架自动处理序列化/反序列化需手动
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
vue3 使用 Univer Sheets 电子表格组件小云小白 vue3 excel Univer Sheet
背景部门要进行在线数据填报：excel表格样式不限;因为要支持直接从excel直接粘贴，经筛选选择：UniverSheetsUniverSheets官网地址https://docs.univer.ai/zh-CN/guides/sheets1、安装和配置#安装核心包pnpmadd@univerjs/presets正常到这就可以了，但是我这边前台报react版本错误，所以去源码包看了一下版本，单独指
vue+Element 动态表单动态增减表单项疯人院里的疯言风语 vue.js elementui javascript
动态增减表单项也是比较常用的，除了在Form组件上一次性传递所有的验证规则外还可以在单个的表单域上传递属性的验证规则，在一些需求下面很灵活方便。下面来看看怎么样实现动态增加，验证，删除表单项。直接上代码点击打开动态表单1"class="box_threeel-icon-delete"@click="removeDomain(item)">现在有({{quantity||"1"}})个最多45个新增
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

2024-12-01百度TTS语音

百度TTS语音

1-学习目标

2-参考网址

3-执行过程记录

1-TTS市场现状

2-Tampermonkey

3-Python版本

4-其他知识补充

1-TTS发展历史

1. 早期研究（20世纪50年代至70年代）

2. 数字信号处理时代（20世纪80年代至90年代）

3. 统计方法和数据驱动技术（21世纪初）

4. 深度学习和神经网络时代（2010年至今）

5. 当前趋势和未来展望

2-TTS发展历史总结

1-深度学习和神经网络时代（2010年至今）

2-当前趋势和未来展望

你可能感兴趣的:(AI训练,AI编程)