hitsz_syl

语音识别后处理代码

import re
import difflib
import os
from datetime import datetime, timedelta

def extract_snippets_no_duplicates(input_file, output_file, window=150):
    """
    从输入文本文件中提取包含目标字符（A、B、C、D、"开始"、"结束"）前后 `window` 个字符范围的文本。
    提取时扩展到完整的行，并确保每行在输出文件中不会重复，同时保持原始顺序。

    参数：
    input_file (str): 输入文件路径。
    output_file (str): 输出文件路径。
    window (int, optional): 目标字符前后扩展的字符数量，默认值为 150。
    """
    # 读取整个文本内容
    with open(input_file, 'r', encoding='utf-8') as f:
        text = f.read()

    target_chars = {'A', 'B', 'C', 'D'}  # 目标单字符
    target_words = {'开始', '结束'}  # 目标关键词
    intervals = []  # 存储目标字符和关键词的扩展范围

    # 遍历文本，找到目标字符的位置
    for i, char in enumerate(text):
        if char in target_chars:
            start = max(0, i - window)
            end = min(len(text), i + window + 1)
            intervals.append((start, end))

    # 额外查找 "开始" 和 "结束" 关键词
    for word in target_words:
        start_idx = 0
        while (start_idx := text.find(word, start_idx)) != -1:
            start = max(0, start_idx - window)
            end = min(len(text), start_idx + len(word) + window)
            intervals.append((start, end))
            start_idx += len(word)  # 避免重复匹配同一个位置

    # 按起始位置排序
    intervals.sort(key=lambda x: x[0])

    # 合并重叠区间
    merged_intervals = []
    if intervals:
        current_start, current_end = intervals[0]
        for start, end in intervals[1:]:
            if start <= current_end:  # 有重叠则合并
                current_end = max(current_end, end)
            else:
                merged_intervals.append((current_start, current_end))
                current_start, current_end = start, end
        merged_intervals.append((current_start, current_end))

    # 读取所有行，并记录每行的起止位置
    lines = text.splitlines(keepends=True)  # 保留换行符
    line_positions = []
    start_idx = 0
    for line in lines:
        end_idx = start_idx + len(line)
        line_positions.append((start_idx, end_idx, line))
        start_idx = end_idx

    # 计算完整行的提取范围，并去重
    extracted_lines = []
    seen_lines = set()
    for start, end in merged_intervals:
        for line_start, line_end, line in line_positions:
            if line_end > start and line_start < end:  # 判断行是否与区间有重叠
                if line not in seen_lines:
                    extracted_lines.append(line)
                    seen_lines.add(line)

    # 将筛选出的行写入输出文件
    with open(output_file, 'w', encoding='utf-8') as f:
        f.writelines(extracted_lines)

    print("处理完成，结果已保存到", output_file)

def replace_say_and_dianer_in_file(filename):
    """
    读取 txt 文件，将 "SAY" 替换为 "C"，将 "点儿" 替换为 "点"，并直接保存到原文件。

    :param filename: 需要处理的文件路径
    """

    with open(filename, "r", encoding="utf-8") as file:
        text = file.read()

    # 替换文本
    text = text.replace("SAY", "C").replace("点儿", "点")

    # 直接覆盖原文件
    with open(filename, "w", encoding="utf-8") as file:
        file.write(text)

    print(f"替换完成，已保存到 {filename}")

def mark_time_gaps(file_path):
    """
    处理文件内容，如果当前行的结束时间与下一行的开始时间不连续，
    则在当前行末尾添加相应数量的 "|"。
    """
    with open(file_path, 'r', encoding='utf-8') as f:
        lines = f.readlines()

    processed_lines = []
    for i in range(len(lines)):
        line = lines[i].strip()
        if not line:
            processed_lines.append(line + "-")
            continue

        # 解析当前行的时间戳
        start_time, end_time = None, None
        try:
            # 提取时间戳部分
            timestamp_part = line.split(']')[0] + ']'
            start_time_str, end_time_str = timestamp_part.strip('[]').split(' - ')
            # 将时间字符串转换为秒数
            start_time = sum(x * int(t) for x, t in zip([3600, 60, 1], start_time_str.split(':')))
            end_time = sum(x * int(t) for x, t in zip([3600, 60, 1], end_time_str.split(':')))
        except (IndexError, ValueError):
            # 如果时间戳解析失败，直接添加原行
            processed_lines.append(line + "-")
            continue

        # 如果是最后一行，直接添加
        if i == len(lines) - 1:
            processed_lines.append(line + "-")
            continue

        # 解析下一行的时间戳
        next_line = lines[i + 1].strip()
        next_start_time = None
        try:
            next_timestamp_part = next_line.split(']')[0] + ']'
            next_start_time_str, _ = next_timestamp_part.strip('[]').split(' - ')
            next_start_time = sum(x * int(t) for x, t in zip([3600, 60, 1], next_start_time_str.split(':')))
        except (IndexError, ValueError):
            # 如果下一行时间戳解析失败，直接添加原行
            processed_lines.append(line + "-")
            continue

        # 计算时间差
        time_diff = next_start_time - end_time
        if time_diff > 5:
            # 在当前行末尾添加相应数量的 "|"
            line += "|" * (time_diff // 5)

        processed_lines.append(line + "-")

    # 将处理后的内容写回文件
    with open(file_path, 'w', encoding='utf-8') as f:
        f.write('\n'.join(processed_lines))

def correct_yao_in_text(input_text_1, output_filename_1):
    """
    修正文本中的 "yao" 相关汉字，在特定上下文中替换为 "一"。
    :param input_text_1: 需要修正的文本
    :param output_filename_1: 输出文件名（如果保存）
    :return: 修正后的文本
    """

    with open(input_text_1, "r", encoding="utf-8") as file:
        text = file.read()

    # 定义可能被识别成 "yao" 的汉字
    yao_variants = {"幺", "要", "腰", "邀", "瑶", "钥", "谣"}  # 可扩展
    
    # 触发修正的前后文
    context_triggers = {"A", "B", "C", "D", "Y", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十", "零"}
    
    output_filename = output_filename_1

    def replace_yao(match):
        word = match.group(0)
        start, end = match.start(), match.end()
        
        # # 获取前后一个字符
        # before = text[max(0, start - 1)]
        # after = text[min(len(text) - 1, end)]
        
        # # 获取前后文 10 个字符
        # context_before = text[max(0, start - 10):start]
        # context_after = text[end:end + 10]
        
        # # 如果前后存在触发修正的字符，则替换为 "一"
        # if before in context_triggers or after in context_triggers:
        
        # 获取前后三个字符
        before = text[max(0, start - 3):start]
        after = text[end:end + 3]

        # 获取前后文 10 个字符（便于调试）
        context_before = text[max(0, start - 10):start]
        context_after = text[end:end + 10]

        # 仅在前后三个字符中存在触发字符时替换
        if any(char in context_triggers for char in before) or any(char in context_triggers for char in after):
            corrected = "一"
            print(f"修正: {word} -> {corrected}")
            print("修正后上下文:  "  + context_before + " | " + corrected + " | " + context_after)
            return corrected
        
        # 无修正时打印原字及上下文信息
        # print("未修正:  "  + context_before + " | " + word + " | " + context_after)
        return word  # 否则保持原样
    
    # 使用正则找到所有可能的 yao 相关汉字
    pattern = "|".join(yao_variants)
    corrected_text = re.sub(pattern, replace_yao, text)
    
    # 保存修正后的文本
    with open(output_filename, "w", encoding="utf-8") as file:
        file.write(corrected_text)
    print(f"修正完成，已保存到 {output_filename}")
    
    return corrected_text

def replace_ai_with_AI(input_filename, output_filename):
    """
    将 AI 相关的汉字替换为 "AI"，但仅当前后 3 个字符中存在触发字符（C, D, Y, 一, 二, 三...）时才替换。

    :param input_filename: 输入文本文件路径
    :param output_filename: 处理后的文本保存路径
    :return: 处理后的文本
    """

    with open(input_filename, "r", encoding="utf-8") as file:
        text = file.read()

    # 需要替换的 "AI" 相关汉字
    ai_variants = {"哀", "埃", "挨", "癌", "矮", "爱", "碍", "艾", "隘", "蔼", "霭", "嗳", "诶"}

    # 触发替换的前后字符
    context_triggers = {"A", "B", "C", "D", "Y", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十", "零"}

    def replace_ai(match):
        start, end = match.start(), match.end()

        # 获取前后三个字符
        before = text[max(0, start - 3):start]
        after = text[end:end + 3]

        # 获取前后文 10 个字符（便于调试）
        context_before = text[max(0, start - 10):start]
        context_after = text[end:end + 10]

        # 仅在前后三个字符中存在触发字符时替换
        if any(char in context_triggers for char in before) or any(char in context_triggers for char in after):
            print(f"修正前上下文: {context_before} | {match.group(0)} | {context_after}")
            print(f"修正: {match.group(0)} -> A")
            print(f"修正后上下文: {context_before} | A | {context_after}\n")
            return "A"

        return match.group(0)  # 否则保持原样

    # 使用正则替换
    pattern = "|".join(ai_variants)
    corrected_text = re.sub(pattern, replace_ai, text)

    # 保存处理后的文本
    with open(output_filename, "w", encoding="utf-8") as file:
        file.write(corrected_text)

    print(f"修正完成，已保存到 {output_filename}")
    return corrected_text

def replace_bi_with_B(input_filename, output_filename):
    """
    将 "比"、"必"、"笔"、"币"、"闭"、"碧"、"避" 替换为 "B"，
    但仅当前后存在触发字符（A, C, D, Y, 一, 二, 三...）时才替换。

    :param input_filename: 需要处理的文本文件
    :param output_filename: 处理后的文本保存路径
    :return: 处理后的文本
    """

    with open(input_filename, "r", encoding="utf-8") as file:
        text = file.read()

    # 定义需要替换的 "bi" 相关汉字
    bi_variants = {"比", "必", "笔", "币", "闭", "碧", "避"}

    # 触发替换的前后字符
    context_triggers = {"A", "B", "C", "D", "Y", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十", "零"}

    def replace_bi(match):
        start, end = match.start(), match.end()

        # 获取前后三个字符
        before = text[max(0, start - 3):start]
        after = text[end:end + 3]

        # 获取前后文 10 个字符（便于调试）
        context_before = text[max(0, start - 10):start]
        context_after = text[end:end + 10]

        # 仅在前后三个字符中存在触发字符时替换
        if any(char in context_triggers for char in before) or any(char in context_triggers for char in after):
            print(f"修正: {match.group(0)} -> B")
            print("修正后上下文: " + context_before + " | B | " + context_after)
            return "B"

        return match.group(0)  # 否则保持不变

    # 使用正则替换
    pattern = "|".join(bi_variants)
    corrected_text = re.sub(pattern, replace_bi, text)

    # 保存处理后的文本
    with open(output_filename, "w", encoding="utf-8") as file:
        file.write(corrected_text)

    print(f"修正完成，已保存到 {output_filename}")

    return corrected_text

def replace_di_with_D(input_filename, output_filename):
    """
    将 "的"、"地"、"得"、"德"、"底"、"敌"、"蒂"、"第"、"递"、"堤"、"笛"、"狄"、"涤"、"翟"、"帝"、"嫡"、"滴"
    替换为 "D"，但仅当前后存在触发字符（A, B, C, Y, 一, 二, 三...）时才替换。

    :param input_filename: 需要处理的文本文件
    :param output_filename: 处理后的文本保存路径
    :return: 处理后的文本
    """

    with open(input_filename, "r", encoding="utf-8") as file:
        text = file.read()

    # 需要替换的 "D" 相关汉字
    di_variants = {
        "地", "底", "敌", "蒂", "第", "递", "堤", "笛", "狄", "涤", "翟", "帝", 
        "嫡", "滴", "低"
    }

    # 触发替换的前后字符
    context_triggers = {"A", "B", "C", "D", "Y", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十", "零"}

    def replace_di(match):
        start, end = match.start(), match.end()

        # 获取前后三个字符
        before = text[max(0, start - 3):start]
        after = text[end:end + 3]

        # 获取前后文 10 个字符（便于调试）
        context_before = text[max(0, start - 10):start]
        context_after = text[end:end + 10]

        # 仅在前后三个字符中存在触发字符时替换
        if any(char in context_triggers for char in before) or any(char in context_triggers for char in after):
            print(f"修正前上下文: {context_before} | {match.group(0)} | {context_after}")
            print(f"修正: {match.group(0)} -> D")
            print(f"修正后上下文: {context_before} | D | {context_after}\n")
            return "D"

        return match.group(0)  # 否则保持不变

    # 使用正则替换
    pattern = "|".join(di_variants)
    corrected_text = re.sub(pattern, replace_di, text)

    # 保存处理后的文本
    with open(output_filename, "w", encoding="utf-8") as file:
        file.write(corrected_text)

    print(f"修正完成，已保存到 {output_filename}")

    return corrected_text

def replace_ling_with_target(input_filename, output_filename, target="零"):
    """
    将 ling_variants 中的汉字替换为 target（默认 "〇"），
    但仅当前后三个字符中存在触发字符（C, D, Y, 一, 二, 三...）时才替换。

    :param input_filename: 输入文本文件路径
    :param output_filename: 处理后的文本保存路径
    :param target: 替换后的目标字符，默认 "〇"
    :return: 处理后的文本
    """

    with open(input_filename, "r", encoding="utf-8") as file:
        text = file.read()

    # 需要替换的 "ling" 相关汉字（所有拼音 líng 读音）
    ling_variants = {
        "龄", "铃", "凌", "菱", "羚", "翎", "伶", "苓", "泠", "棂", "瓴", "绫"
    }

    # 触发替换的前后字符
    context_triggers = {"A", "B", "C", "D", "Y", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十"}

    def replace_ling(match):
        start, end = match.start(), match.end()

        # 获取前后三个字符
        before = text[max(0, start - 3):start]
        after = text[end:end + 3]

        # 获取前后文 10 个字符（便于调试）
        context_before = text[max(0, start - 10):start]
        context_after = text[end:end + 10]

        # 仅在前后三个字符中存在触发字符时替换
        if any(char in context_triggers for char in before) or any(char in context_triggers for char in after):
            print(f"修正前上下文: {context_before} | {match.group(0)} | {context_after}")
            print(f"修正: {match.group(0)} -> {target}")
            print(f"修正后上下文: {context_before} | {target} | {context_after}\n")
            return target

        return match.group(0)  # 否则保持原样

    # 使用正则替换
    pattern = "|".join(ling_variants)
    corrected_text = re.sub(pattern, replace_ling, text)

    # 保存处理后的文本
    with open(output_filename, "w", encoding="utf-8") as file:
        file.write(corrected_text)

    print(f"修正完成，已保存到 {output_filename}")

    return corrected_text

def replace_shi_with_target(input_filename, output_filename, target="十"):
    """
    将 shi_variants 中的汉字替换为 target（默认 "示"），
    但仅当前后三个字符中存在触发字符（C, D, Y, 一, 二, 三...）时才替换。

    :param input_filename: 输入文本文件路径
    :param output_filename: 处理后的文本保存路径
    :param target: 替换后的目标字符，默认 "示"
    :return: 处理后的文本
    """

    with open(input_filename, "r", encoding="utf-8") as file:
        text = file.read()

    # 需要替换的 "shi" 相关汉字（所有拼音 shi 读音）
    shi_variants = {
        # 一声（shī）
        "诗", "师", "失", "尸", "施", "湿", "狮", "虱", "柿",  
        # 二声（shí）
        "时", "识", "实", "石", "食", "蚀", "拾",  
        # # 三声（shǐ）
        # "史", "使", "始", "驶", "矢", "屎",  
        # # 四声（shì）
        "事", "式", "示", "世", "试", "势", "释", "适", "视", "氏", "室", "侍", "誓", "嗜", "饰"
    }

    # 触发替换的前后字符
    context_triggers = {"A", "B", "C", "D", "Y", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十", "零"}

    def replace_shi(match):
        start, end = match.start(), match.end()

        # 获取前后三个字符
        before = text[max(0, start - 1):start]
        after = text[end:end + 1]

        # 获取前后文 10 个字符（便于调试）
        context_before = text[max(0, start - 10):start]
        context_after = text[end:end + 10]

        # 仅在前后三个字符中存在触发字符时替换
        if any(char in context_triggers for char in before) or any(char in context_triggers for char in after):
            print(f"修正前上下文: {context_before} | {match.group(0)} | {context_after}")
            print(f"修正: {match.group(0)} -> {target}")
            print(f"修正后上下文: {context_before} | {target} | {context_after}\n")
            return target

        return match.group(0)  # 否则保持原样

    # 使用正则替换
    pattern = "|".join(shi_variants)
    corrected_text = re.sub(pattern, replace_shi, text)

    # 保存处理后的文本
    with open(output_filename, "w", encoding="utf-8") as file:
        file.write(corrected_text)

    print(f"修正完成，已保存到 {output_filename}")

    return corrected_text

def replace_ba_with_eight(input_filename, output_filename):
    """
    将 ba_variants 中的汉字替换为 "八"，但仅当前后 3 个字符中存在触发字符（C, D, Y, 一, 二, 三...）时才替换。

    :param input_filename: 输入文本文件路径
    :param output_filename: 处理后的文本保存路径
    :return: 处理后的文本
    """

    with open(input_filename, "r", encoding="utf-8") as file:
        text = file.read()

    # 需要替换的 "ba" 相关汉字（所有拼音 ba 读音）
    ba_variants = {
        "吧", "巴", "叭", "芭", "捌", "笆", "疤", "扒",  # bā
        "拔", "跋", "茇", "菝", "魃", "把",  # bá
        "把", "钯",  # bǎ
        "爸", "罢", "霸", "坝"  # bà
    }

    # 触发替换的前后字符
    context_triggers = {"A", "B", "C", "D", "Y", "一", "二", "三", "四", "五", "六", "七", "八", "九", "十", "零"}

    def replace_ba(match):
        start, end = match.start(), match.end()

        # 获取前后三个字符
        before = text[max(0, start - 3):start]
        after = text[end:end + 3]

        # 获取前后文 10 个字符（便于调试）
        context_before = text[max(0, start - 10):start]
        context_after = text[end:end + 10]

        # 仅在前后三个字符中存在触发字符时替换
        if any(char in context_triggers for char in before) or any(char in context_triggers for char in after):
            print(f"修正前上下文: {context_before} | {match.group(0)} | {context_after}")
            print(f"修正: {match.group(0)} -> 八")
            print(f"修正后上下文: {context_before} | 八 | {context_after}\n")
            return "八"

        return match.group(0)  # 否则保持原样

    # 使用正则替换
    pattern = "|".join(ba_variants)
    corrected_text = re.sub(pattern, replace_ba, text)
    # 保存处理后的文本
    with open(output_filename, "w", encoding="utf-8") as file:
        file.write(corrected_text)
    print(f"修正完成，已保存到 {output_filename}")
    return corrected_text

def process_bd_correction(input_file, output_file, context_print_window=20):
    """
    读取输入文件，修正文本中的 B/D 混淆问题，并将修正后的文本保存到输出文件。
    还会打印所有修正事件的详细信息。
    
    :param input_file: 输入文件路径
    :param output_file: 输出文件路径
    :param context_print_window: 上下文打印窗口大小（默认前后各 20 个字符）
    """
    def correct_bd_mixup(text):
        """
        对文本中的 B 和 D 进行检测与修正：
        (1) 对 B 检查：如果前文中最近的 A/C 为 C 而不是 A，
            且后文中最近的 A/C 为 A 而不是 C，则将 B 修正为 D。
        (2) 对 D 检查：如果前文中最近的 A/C 为 A 而不是 C，
            且后文中最近的 A/C 为 C 而不是 A，则将 D 修正为 B。
        
        返回修正后的文本以及所有修正事件的详细记录。
        每个修正事件记录：(位置, 原字符, 修改后字符, 前最近的 A/C, 后最近的 A/C)。
        """
        text_list = list(text)  # 转换为列表，便于逐字符修改
        corrections = []        # 记录所有修正事件
    
        # 遍历文本中每个字符
        for i, char in enumerate(text_list):
            if char in ('B', 'D'):
                # 向前查找最近的 A 或 C
                prev_char = next((text_list[j] for j in range(i - 1, -1, -1) if text_list[j] in ('A', 'C')), None)
                # 向后查找最近的 A 或 C
                next_char = next((text_list[j] for j in range(i + 1, len(text_list)) if text_list[j] in ('A', 'C')), None)
    
                # 根据规则判断并修正
                if char == 'B' and prev_char == 'C' and next_char == 'A':
                    corrections.append((i, 'B', 'D', prev_char, next_char))
                    text_list[i] = 'D'
                elif char == 'D' and prev_char == 'A' and next_char == 'C':
                    corrections.append((i, 'D', 'B', prev_char, next_char))
                    text_list[i] = 'B'
    
        corrected_text = ''.join(text_list)
        return corrected_text, corrections

    # 读取原始文本
    with open(input_file, 'r', encoding='utf-8') as f:
        original_text = f.read()

    # 进行 B/D 混淆检测与修正
    corrected_text, correction_events = correct_bd_mixup(original_text)

    # 保存修正后的文本到新文件
    with open(output_file, 'w', encoding='utf-8') as f:
        f.write(corrected_text)
    print("已经保存为： " + output_file)

    # 打印修正记录及上下文，便于检查实现的对错
    print("修正记录：")
    for pos, orig_char, new_char, prev_ac, next_ac in correction_events:
        # 定义上下文窗口（前后各 context_print_window 个字符）
        start_context = max(0, pos - context_print_window)
        end_context = min(len(original_text), pos + context_print_window + 1)
        original_context = original_text[start_context:end_context]
        corrected_context = corrected_text[start_context:end_context]

        print(f"位置 {pos}: {orig_char} -> {new_char} (前最近 A/C: {prev_ac}, 后最近 A/C: {next_ac})")
        print("原始上下文:")
        print(original_context)
        print("修正后上下文:")
        print(corrected_context)
        print("-" * 60)


# 关键词列表
keywords = [

    # CPB并行循环模板
    "开始装机",
    "装机开始",
    "开始CPB装机",
    "CPB装机开始",

    "开始预充排气",
    "预充排气开始",

    "开始安全检查",
    "安全检查开始",

    "开始主动脉插管",
    "主动脉插管开始",

    "开始体外循环",
    "体外循环开始",
    "CPB ON",

    "开始双管降温",
    "双管降温开始",

    "停降温",
    "开始停降温",
    "停降温开始",

    "开始复温",
    "复温开始",

    "开始超滤",
    "超滤开始",

    "钳闭下腔静脉",

    "开始减流量",
    "减流量开始",

    "CPB OF",
    "结束体外循环",
    "体外循环结束",


    "开始改良超滤",
    "改良超滤开始",

    "结束改良超滤",
    "改良超滤结束",

    "开始记录参数",
    "记录参数开始",

    "血气分析",
    "ACT",

    # 常规体外循环模板
    "上下腔静脉阻断",

    "升主动脉阻断",

    "心肌保护液", 

    "升主动脉开放",

    "开始复跳",
    "复跳开始",

    "上下腔静脉开放",

    # 选择性脑灌注模板

    "双主动脉灌注",

    "拔出降主动脉插管",

    "脑灌注开始",

    "脑灌开始",

    "降主动脉阻断",

    "降主动脉开放",

    "脑灌注结束",

    "脑灌结束",

    # DHCA模板

    "开始用冰帽",
    "用冰帽",

    "开始停循环",
    "停循环开始",

    "恢复循环",
    "开始恢复循环",
    "恢复循环开始",

    "缓慢复温",
    "开始缓慢复温",

    # 
    "序号一","序号二","序号三","序号四","序号五","序号六","序号七","序号八","序号九",

    # 
    "复方电解质",
    "红细胞悬液",
    "人血白蛋白",
    "碳酸氢钠",
    "甘露醇",
    "乙基淀粉",
    "甲基强的松龙",
    "磷酸肌酸钠",
    "地塞米松",
    "利多卡因",
    "葡萄糖",
    "酚妥拉明",
    "呋塞米注射液",
    "氯化钾",
    "氯化钙",
    "去甲肾上腺素",
    "肝素钠",
    "血液回收血",
    "乌司他丁"
]

def fuzzy_match(text, keyword, replaced_ranges):
    """
    在文本 text 中找到与 keyword 最相似的片段，确保未被替换过。
    """
    max_similarity = 0
    best_match = ""
    best_index = -1
    keyword_length = len(keyword)

    # 采用滑动窗口法遍历 text
    for i in range(len(text) - keyword_length + 1):
        window = text[i:i + keyword_length]  # 取与关键词等长的窗口
        similarity = difflib.SequenceMatcher(None, window, keyword).ratio()

        # **跳过已经被替换的区域**
        if any(start <= i < end for start, end in replaced_ranges):
            continue

        if similarity > max_similarity:
            max_similarity = similarity
            best_match = window
            best_index = i  # 记录最佳匹配的起始索引

    return max_similarity, best_match, best_index

def replace_keywords(text, SIMILARITY_THRESHOLD = 0.6):
    """
    在文本中替换匹配的关键词，并打印调试信息，确保已替换内容不会被重复修改
    """
    matches = []
    replaced_ranges = []  # 记录已替换的索引范围，防止重复替换

    for keyword in keywords:
        similarity, matched_text, index = fuzzy_match(text, keyword, replaced_ranges)

        if similarity >= SIMILARITY_THRESHOLD and index != -1:
            matches.append((similarity, keyword, matched_text, index))

    # 按照相似度从高到低排序
    matches.sort(reverse=True, key=lambda x: x[0])

    # 逐步替换文本（确保不重复替换）
    modified_text = text
    offset = 0  # 记录偏移量，确保替换后索引不乱
    for i, (similarity, keyword, matched_text, index) in enumerate(matches):
        new_text = f"关键词*{keyword}*关键词"
        actual_index = index + offset  # 计算当前索引的偏移量

        # **检查是否重叠已替换区域**
        if any(start <= actual_index < end for start, end in replaced_ranges):
            continue  # 跳过此替换，避免二次修改

        # **打印调试信息**
        print(f"\n **替换详情** ")
        print(f"原始文本片段: {modified_text[max(0, actual_index-10):actual_index+len(matched_text)+10]}")
        print(f"匹配关键词: {keyword}")
        print(f"相似度: {similarity:.2f}")
        print(f"替换前: {matched_text}")
        print(f"替换后: {new_text}")

        # 替换文本
        modified_text = (
            modified_text[:actual_index]
            + new_text
            + modified_text[actual_index + len(matched_text):]
        )

        # **更新替换范围**
        replaced_ranges.append((actual_index, actual_index + len(new_text)))

        # 更新偏移量
        offset += len(new_text) - len(matched_text)

    return modified_text

def process_file_replace_keywords(file_path, output_path):
    """
    处理整个文件，保持原始格式
    """
    with open(file_path, "r", encoding="utf-8") as file:
        lines = file.readlines()

    modified_lines = [replace_keywords(line.strip()) + "\n" for line in lines]

    with open(output_path, "w", encoding="utf-8") as file:
        file.writelines(modified_lines)


def remove_timestamps_and_indexes(input_file, output_file):
    """
    去掉时间戳和序号
    
    1. 逐行读取输入文件内容。
    2. 按 `]` 进行拆分，取 `]` 之后的内容。
    3. 进一步按 `\t`（制表符）拆分，去掉 `chunk_x`，只保留最后一个部分。
    4. 将处理后的内容写入新的文件，保持换行符格式。
    
    参数:
        input_file (str): 输入文件路径，包含原始文本数据。
        output_file (str): 输出文件路径，存储处理后的文本数据。
    
    返回:
        None
    """
    
    # 读取原始文件内容
    with open(input_file, "r", encoding="utf-8") as f:
        lines = f.readlines()  # 按行读取，保持换行符

    cleaned_lines = []  # 存储处理后的文本

    for line in lines:
        parts = line.split("]")  # 以 `]` 分割行内容

        # 确保有 `]` 存在，避免索引错误
        if len(parts) > 1:
            content_parts = parts[1].split("\t")  # 按 `tab` 进一步分割
            last_part = content_parts[-1].strip()  # 取最后部分并去除前后空格
            cleaned_lines.append(last_part + "\n")  # 重新加入换行符，保持原格式

    # 将处理后的内容写入新文件
    with open(output_file, "w", encoding="utf-8") as f:
        f.writelines(cleaned_lines)  # 批量写入所有行

    print(f"✅ 处理完成，结果已保存到 {output_file}")  # 友好的用户提示


def convert_chinese_number_to_arabic(input_file, output_file):
    chinese_numbers = {'零': '0', '一': '1', '二': '2', '三': '3', '四': '4',
                       '五': '5', '六': '6', '七': '7', '八': '8', '九': '9'}
    try:
        with open(input_file, "r", encoding="utf-8") as f:
            content = f.read()
        
        for zh_num, ar_num in chinese_numbers.items():
            content = content.replace(zh_num, ar_num)
        
        # 处理“十”的情况
        content = re.sub(r'(?, '10', content)  # "十" 单独出现时 -> "10"
        content = re.sub(r'(?, '10', content)  # "一十" -> "10"
        content = re.sub(r'(?, r'\g<1>0', content)  # "X十" -> "X0"
        content = re.sub(r'(?, r'1\g<1>', content)  # "十X" -> "1X"
        content = re.sub(r'(?, r'\g<1>\g<2>', content)  # "X十Y" -> "XY"

        with open(output_file, "w", encoding="utf-8") as f:
            f.write(content)
        
        print(f"转换完成！请查看 {output_file}")
    except FileNotFoundError:
        print(f"错误：文件 {input_file} 未找到。")
    except Exception as e:
        print(f"发生错误：{e}")


def replace_act(file_path):
    with open(file_path, "r", encoding="utf-8") as f:
        content = f.read()  # 读取文件内容

    # 替换 ACT 为 激活全血凝固时间
    content = content.replace("ACT", "激活全血凝固时间")

    with open(file_path, "w", encoding="utf-8") as f:
        f.write(content)  # 写回文件

def remove_spaces_from_file(filename):
    with open(filename, 'r', encoding='utf-8') as file:
        lines = file.readlines()
    # 去除每行的空格
    cleaned_lines = [line.replace(" ", "") for line in lines]
    
    with open(filename, 'w', encoding='utf-8') as file:
        file.writelines(cleaned_lines)

def extract_time_from_filename(file_path):
    # 通过 "_" 分割文件名
    parts = file_path.split("_")
    # 确保前两部分是日期和时间
    if len(parts) >= 2 and len(parts[0]) == 8 and len(parts[1]) == 6:
        date_part = parts[0]  # "20250306"
        time_part = parts[1]  # "105401"
        
        # 组合并解析成 datetime 对象
        dt = datetime.strptime(date_part + time_part, "%Y%m%d%H%M%S")
        return dt
    return None

def calculate_current_time(start_time: str, elapsed_time: str) -> str:
    """
    Calculate the current time based on start time and elapsed time.

    :param start_time: Start time in "HH:MM:SS" format.
    :param elapsed_time: Elapsed time in "HH:MM:SS" format.
    :return: Current time in "HH:MM:SS" format.
    """
    # 解析 start_time
    start_dt = datetime.strptime(start_time, "%H:%M:%S")

    # 解析 elapsed_time
    h, m, s = map(int, elapsed_time.split(":"))
    elapsed_td = timedelta(hours=h, minutes=m, seconds=s)

    # 计算当前时间
    current_time = start_dt + elapsed_td

    # 返回计算后的时间字符串
    return current_time.strftime("%H:%M:%S")

def extract_number_after_keys(text):
    '''函数功能：
    该函数 extract_values 用于从输入文本中提取字母键（例如 "A", "B", "C", "D"）后面的数值。
    
    它通过遍历文本并查找这些字母，获取它们后面紧跟的数字（包含点符号和“点”字），最终返回一个字典，其中包含每个字母键及其对应的数值。

    主要步骤：
    初始化一个包含字母键的字典，初始值为 None。
    遍历每个字母键，查找其在文本中的位置。
    如果找到了该字母键，继续向后查找数值，并避免在字母与数值之间出现其他字母或符号。
    提取数值部分，如果找到有效的数值，将其存入字典。
    最终返回包含字母键和对应数值的字典。
    '''
    keys = ["A", "B", "C", "D"]  # 定义待提取的字母键
    result = {key: None for key in keys}  # 初始化结果字典，键的初始值为 None
    
    for key in keys:  # 遍历每一个键
        index = text.find(key)  # 查找键在文本中的第一次出现位置
        while index != -1:  # 如果找到该键，则继续进行提取
            num_start = index + 1  # 数值部分应该从键的下一个位置开始
            
            # 检查字母和数值之间是否有其他字母或符号
            has_other_key = False
            while num_start < len(text) and not (text[num_start].isdigit() or text[num_start] in ["点", "."]):
                if text[num_start] in keys or text[num_start] == "*":  # 遇到其他键或者星号时，标记为有其他字母
                    has_other_key = True
                    break  # 跳出检查循环
                num_start += 1  # 向后移动，检查下一个字符
            
            # 如果字母和数值之间有其他字母，则向下 30 字符内再找
            if has_other_key:
                search_range = text[index + 1 : index + 31]  # 获取当前位置后的 30 个字符范围
                new_index = search_range.find(key)  # 查找这个范围内是否有相同的字母
                if new_index != -1:
                    index += new_index + 1  # 更新索引位置
                    continue  # 重新开始查找该字母对应的数值
            
            # 提取数值部分
            num_str = ""
            while num_start < len(text) and (text[num_start].isdigit() or text[num_start] in ["点", "."]):
                num_str += "." if text[num_start] == "点" else text[num_start]  # 将“点”转换为小数点
                num_start += 1  # 向后移动，继续提取数值
            
            # 存储有效数值
            if num_str:
                result[key] = float(num_str)  # 将提取的数值转换为浮动数并存入结果字典
            break  # 跳出当前字母的查找，继续查找下一个字母
    
    return result  # 返回最终的结果字典

def find_and_extract_contextual_event_info(file_path):
    # 读取文件并合并为一个连续字符串，同时记录每个字符属于的行号
    with open(file_path, "r", encoding="utf-8") as f:
        lines = f.readlines()

    full_text = "".join(lines)  # 连接所有行，形成一个完整的字符串
    line_indices = []  # 记录每个字符属于的行号
    current_line = 1  # 行号计数

    for line in lines:
        line_indices.extend([current_line] * len(line))  # 记录该行的字符索引
        current_line += 1

    results = []
    text_length = len(full_text)
    i = 0  # 遍历整个字符串

    while i < text_length:
        if full_text[i] == 'A':
            # A 后 5 个字符（跨行处理）
            end_index = min(i + 6, text_length)
            next_5_chars = full_text[i + 1:end_index]
            contains_digit = any(char.isdigit() for char in next_5_chars)

            if contains_digit:
                # A 之后的 20 个字符（跨行处理）
                search_range_end = min(i + 21, text_length)
                next_15_chars = full_text[i:search_range_end]

                # 在 15 个字符范围内查找 'C'
                for j in range(i, search_range_end):
                    if full_text[j] == 'C':
                        # C 后 5 个字符（跨行处理）
                        c_end_index = min(j + 6, text_length)
                        c_next_5_chars = full_text[j + 1:c_end_index]
                        if any(char.isdigit() for char in c_next_5_chars):
                            # 获取匹配内容的行号范围
                            start_line = line_indices[i]  # A 所在行
                            end_line = line_indices[min(search_range_end - 1, text_length - 1)]  # 结束位置的行

                            # 获取 A 前 25 个字符的起始索引
                            a_start_index = max(i - 25, 0)
                            a_start_line = line_indices[a_start_index]  # A 前 25 字符的起始行
                            before_a_lines = lines[a_start_line - 1:start_line]  # 避免重复

                            # 获取 C 后 25 个字符的结束索引
                            c_end_index = min(j + 26, text_length)  # 额外 +1，确保包含 C 后 25 字符
                            c_end_line = line_indices[c_end_index - 1]  # C 后 25 字符的结束行
                            after_c_lines = lines[end_line:c_end_line]  # 避免重复

                            # 提取完整的匹配行
                            full_matched_lines = lines[start_line - 1:end_line]  # 避免 `before_a_lines` 里的行重复

                            # 记录匹配结果
                            results.append(
                                # f"匹配内容: {next_15_chars.strip()} (行 {start_line} - {end_line})\n"
                                f"————上文所在行： ({a_start_line} - {start_line - 1}）————\n"
                                f"{''.join(before_a_lines).strip()}\n"
                                f"————匹配所在行：（{start_line} - {end_line}）————\n"
                                f"{''.join(full_matched_lines).strip()}\n"
                                f"————下文所在行：（{end_line + 1} - {c_end_line}）————\n"
                                f"{''.join(after_c_lines).strip()}\n"
                            )
                            break  # 找到符合条件的就跳出内层循环

        i += 1  # 继续遍历文本

    # 输出结果
    if results:
        events_list = []
        event = {}
        for result in results:
            print("\n")
            print("-"*60)
            print(result)
            print("-"*60)
            print("\n")
            result_text = []
            event["line_range"] = None
            event["event"] = None

            for text in result.split("\n"):
                if "———上文所在行" in text:
                    continue
                elif "———下文所在行" in text:
                    continue
                elif "———匹配所在行" in text:
                    # 查找括号的位置
                    start_pos = text.find('（') + 1  # 找到第一个'（'的位置，并加1跳过括号
                    end_pos = text.find('）')        # 找到第一个'）'的位置
                    # 截取括号中的内容
                    line_range = text[start_pos:end_pos]
                    event["line_range"] = line_range
                    # 分割开始行和结束行
                    # start_line, end_line = line_range.split(' - ')
                else:
                    result_text.append(text)
                    if '*' in text:
                        # 查找 * 的位置
                        start_pos = text.find('*') + 1  # 第一个 '*' 后面的字符开始
                        end_pos = text.find('*', start_pos)  # 第二个 '*' 的位置
                        # 提取 * 之间的内容
                        substring = text[start_pos:end_pos]
                        event["event"] = substring

            # 输出结果
            print("".join(result_text))
            parameter_result = extract_number_after_keys("".join(result_text))

            for one_parameter in parameter_result:
                event[one_parameter] = str(parameter_result[one_parameter])
            for one_parameter in event:
                print(one_parameter + " : " + str(event[one_parameter]))
            events_list.append(event.copy())

        return events_list
    else:
        print("未找到符合条件的匹配内容。")

def extract_time_stamps_from_txt(file_path):
    result_dict = {}  # 初始化空字典用于存储行号和时间戳
    with open(file_path, "r", encoding="utf-8") as file:
        for line_number, line in enumerate(file, start=1):
            line = line.strip()  # 去除行两端的空白字符
            if not line:
                continue  # 跳过空行
            # 拆分时间戳部分和文本部分
            parts = line.split("\t", 1)  # 按制表符分割
            if len(parts) < 2:
                parts = line.split("chunk", 1)
            
            time_range = parts[0]  # 例如 [00:00:32 - 00:00:34]
            time = time_range.split("chunk")[0].strip(" ").strip("[").strip("]")  # 提取起始时间 00:00:32

            # 存入字典，key 为行号，value 为起始时间
            result_dict[line_number] = time
    return result_dict  # 返回包含行号和时间戳的字典


print("-"*60)
# 提取目标字符（A、B、C、D）前后 window 个字符范围的文本，但扩展到整行，并保持原始顺序。
input_text_0 = "20250312_104423.txt"
output_filename_1 = input_text_0.split(".")[0] + "_0.txt"
extract_snippets_no_duplicates(input_text_0, output_filename_1)
replace_say_and_dianer_in_file(output_filename_1)
print("已完成精简（保留 A B C D 附近字符）")
print("-"*60)


print("-"*60)
input_text_1 = output_filename_1
output_filename_1 = input_text_1.split(".")[0] + "_1.txt"
corrected_text = correct_yao_in_text(input_text_1, output_filename_1)
print("已完成 yao 修正")
print("-"*60)

print("-"*60)
replace_ai_with_AI(output_filename_1, output_filename_1)
corrected_text = replace_bi_with_B(output_filename_1, output_filename_1)
print("-"*60)

print("-"*60)
corrected_text = replace_di_with_D(output_filename_1, output_filename_1)
print("-"*60)

print("-"*60)
corrected_text = replace_ling_with_target(output_filename_1, output_filename_1)
print("-"*60)

print("-"*60)
corrected_text = replace_shi_with_target(output_filename_1, output_filename_1)
print("-"*60)

print("-"*60)
corrected_text = replace_ba_with_eight(output_filename_1, output_filename_1)
mark_time_gaps(output_filename_1)
print("-"*60)

print("-"*60)
input_file_2 = output_filename_1
output_file_2 = input_file_2.split(".")[0] + "_2.txt"
process_bd_correction(input_file_2, output_file_2, context_print_window=20)
print("已完成 BD混淆 修正")
print("-"*60)


print("-"*60)
input_file_3 = output_file_2  # 你的输入文件
output_file_3 = input_file_3.split(".")[0] + "_3.txt"  # 输出文件
process_file_replace_keywords(input_file_3, output_file_3)
remove_timestamps_and_indexes_before_file = output_file_3
print("\n✅ 处理完成，结果已保存到:", output_file_3)
print("已完成 关键词匹配 修正")
print("-"*60)


print("-"*60)
input_file_4 = output_file_3
output_file_4 = input_file_4.split(".")[0] + "_4.txt"
remove_timestamps_and_indexes(input_file_4, output_file_4)
print("-"*60)

print("-"*60)
corrected_text = correct_yao_in_text(output_file_4, output_file_4)
corrected_text = correct_yao_in_text(output_file_4, output_file_4)
corrected_text = correct_yao_in_text(output_file_4, output_file_4)
print("已完成 yao 修正")
print("-"*60)

print("-"*60)
replace_ai_with_AI(output_file_4, output_file_4)
corrected_text = replace_bi_with_B(output_file_4, output_file_4)
print("-"*60)

print("-"*60)
corrected_text = replace_di_with_D(output_file_4, output_file_4)
print("-"*60)

print("-"*60)
corrected_text = replace_ling_with_target(output_file_4, output_file_4)
corrected_text = replace_ling_with_target(output_file_4, output_file_4)
print("-"*60)

print("-"*60)
corrected_text = replace_shi_with_target(output_file_4, output_file_4)
print("-"*60)

print("-"*60)
corrected_text = replace_ba_with_eight(output_file_4, output_file_4)
corrected_text = replace_ba_with_eight(output_file_4, output_file_4)
corrected_text = replace_ba_with_eight(output_file_4, output_file_4)
print("-"*60)

# print("-"*60)
# process_bd_correction(output_file_4, output_file_4, context_print_window=20)
# print("已完成 BD混淆 修正")
# print("-"*60)


print("-"*60)
# 读取输入文件并转换
input_file_5 = output_file_4
output_file_5 = input_file_5.split(".")[0] + "_5.txt"
convert_chinese_number_to_arabic(input_file_5, output_file_5)
print("阿拉伯转换完成！请查看 " + output_file_5)

print("-"*60)
input_file_5 = output_file_5
replace_act(input_file_5)
remove_spaces_from_file(input_file_5)
print("-"*60)

print("-"*60)
file_path = input_file_5
events_list = find_and_extract_contextual_event_info(file_path)
print("提取关键事件+时间+各个参数完成！")
print("-"*60)

print("-"*60)
file_path = remove_timestamps_and_indexes_before_file  # 你的 TXT 文件路径
time_dict = extract_time_stamps_from_txt(file_path)
file_name = os.path.basename(file_path)
time_in_beijing = extract_time_from_filename(file_name)
start_time = time_in_beijing.strftime("%H:%M:%S")
if time_in_beijing:
    print("录音时间（北京时间）:", start_time)
else:
    print("未找到时间信息")

events_list_1 = []
for event in events_list:
    row_num = int(event['line_range'].split("-")[0])
    elapsed_time = time_dict[row_num].split("-")[0].strip()
    current_time = calculate_current_time(start_time, elapsed_time)
    print("Current time:", current_time)
    event['line_range'] = current_time
    events_list_1.append(event.copy())
print("-"*60)

print("-"*60)
for event in events_list:
    print("-"*60)
    for one_parameter in event:
        if one_parameter == "line_range":
            print("time : " + str(event[one_parameter]))
        else:
            print(one_parameter + " : " + str(event[one_parameter]))
    print("-"*60)
print("-"*60)


output_txt_file = input_text_0.split(".")[0] + "_time_event_ABCD.txt"
with open(output_txt_file, "w", encoding="utf-8") as file:
    file.write("-" * 60 + "\n")
    for index, event in enumerate(events_list, start=1):
        file.write(f"Event {7+index}\n")
        for one_parameter in event:
            if one_parameter == "line_range":
                file.write("time : " + str(event[one_parameter]) + "\n")
            else:
                file.write(one_parameter + " : " + str(event[one_parameter]) + "\n")
        file.write("-" * 60 + "\n")
    file.write("-" * 60 + "\n")

import os
from datetime import datetime, timedelta

keywords_NO_ABCD = [

    # CPB并行循环模板
    "开始装机",
    "装机开始",
    "开始CPB装机",
    "CPB装机开始",

    "开始预充排气",
    "预充排气开始",

    "开始安全检查",
    "安全检查开始",

    "开始主动脉插管",
    "主动脉插管开始",

    "CPB OF",
    "结束体外循环",
    "体外循环结束",


    "开始改良超滤",
    "改良超滤开始",

    "结束改良超滤",
    "改良超滤结束",


    # 常规体外循环模板

    "心肌保护液", 


    # 选择性脑灌注模板


    # DHCA模板


    "开始停循环",
    "停循环开始",

    # 
    "复方电解质",
    "红细胞悬液",
    "人血白蛋白",
    "碳酸氢钠",
    "甘露醇",
    "乙基淀粉",
    "甲基强的松龙",
    "磷酸肌酸钠",
    "地塞米松",
    "利多卡因",
    "葡萄糖",
    "酚妥拉明",
    "呋塞米注射液",
    "氯化钾",
    "氯化钙",
    "去甲肾上腺素",
    "肝素钠",
    "血液回收血",
    "乌司他丁"
]
keyswords_Medication = [
    "复方电解质",
    "红细胞悬液",
    "人血白蛋白",
    "碳酸氢钠",
    "甘露醇",
    "乙基淀粉",
    "甲基强的松龙",
    "磷酸肌酸钠",
    "地塞米松",
    "利多卡因",
    "葡萄糖",
    "酚妥拉明",
    "呋塞米注射液",
    "氯化钾",
    "氯化钙",
    "去甲肾上腺素",
    "肝素钠",
    "血液回收血",
    "乌司他丁"
]
def extract_number_after_keys(text):
    '''函数功能：
    该函数 extract_values 用于从输入文本中提取字母键（例如 "A", "B", "C", "D"）后面的数值。
    
    它通过遍历文本并查找这些字母，获取它们后面紧跟的数字（包含点符号和“点”字），最终返回一个字典，其中包含每个字母键及其对应的数值。

    主要步骤：
    初始化一个包含字母键的字典，初始值为 None。
    遍历每个字母键，查找其在文本中的位置。
    如果找到了该字母键，继续向后查找数值，并避免在字母与数值之间出现其他字母或符号。
    提取数值部分，如果找到有效的数值，将其存入字典。
    最终返回包含字母键和对应数值的字典。
    '''
    keys = ["A", "B", "C", "D", "Y"]  # 定义待提取的字母键
    result = {key: None for key in keys}  # 初始化结果字典，键的初始值为 None
    if "*" in text:
        text = text.split('*', 1)[1]  # 只截取第一个 `*` 之后的部分

    for key in keys:  # 遍历每一个键
        index = text.find(key)  # 查找键在文本中的第一次出现位置
        while index != -1:  # 如果找到该键，则继续进行提取
            num_start = index + 1  # 数值部分应该从键的下一个位置开始
            
            # 检查字母和数值之间是否有其他字母或符号
            has_other_key = False
            while num_start < len(text) and not (text[num_start].isdigit() or text[num_start] in ["点", "."]):
                if text[num_start] in keys or text[num_start] == "*":  # 遇到其他键或者星号时，标记为有其他字母
                    has_other_key = True
                    break  # 跳出检查循环
                num_start += 1  # 向后移动，检查下一个字符
            
            # 如果字母和数值之间有其他字母，则向下 30 字符内再找
            if has_other_key:
                search_range = text[index + 1 : index + 31]  # 获取当前位置后的 30 个字符范围
                new_index = search_range.find(key)  # 查找这个范围内是否有相同的字母
                if new_index != -1:
                    index += new_index + 1  # 更新索引位置
                    continue  # 重新开始查找该字母对应的数值
            else:
                search_range = text[index + 1 : index + 15]  # 获取当前位置后的 30 个字符范围
                new_index = search_range.find(key)  # 查找这个范围内是否有相同的字母
                if new_index != -1:
                    index += new_index + 1  # 更新索引位置
                    continue  # 重新开始查找该字母对应的数值
            
            # 提取数值部分
            num_str = ""
            while num_start < len(text) and (text[num_start].isdigit() or text[num_start] in ["点", "."]):
                num_str += "." if text[num_start] == "点" else text[num_start]  # 将“点”转换为小数点
                num_start += 1  # 向后移动，继续提取数值
            
            # 存储有效数值
            if num_str:
                result[key] = float(num_str)  # 将提取的数值转换为浮动数并存入结果字典
            break  # 跳出当前字母的查找，继续查找下一个字母
    
    return result  # 返回最终的结果字典

def find_time(s):
    for i in range(len(s)-1, -1, -1):
        if s[i] == '点':
            j = i - 1
            while j >= 0 and (s[j].isdigit() or s[j] in '十'):
                j -= 1
            hour_part = s[j+1:i]
            if not hour_part:
                continue
            hour_part = hour_part[-2:]

            k = i + 1
            while k < len(s) and (s[k].isdigit() or s[k] == '刻'):
                k += 1
            minute_part = s[i+1:k]
            time_str = f"{hour_part}点{minute_part}"
            try:
                if s[j] == "A" or s[j] == "B" or s[j] == "C" or s[j] == "D" or s[j] == "Y":
                    return None
                if s[k] == "A" or s[k] == "B" or s[k] == "C" or s[k] == "D" or s[k] == "Y":
                    return None
                if s[j-1] == "A" or s[j-1] == "B" or s[j-1] == "C" or s[j-1] == "D" or s[j-1] == "Y":
                    return None
                if s[k+1] == "A" or s[k+1] == "B" or s[k+1] == "C" or s[k+1] == "D" or s[k+1] == "Y":
                    return None
            except:
                pass

            return {
                'time': time_str,
                'start': j + 1,  # 时间在 pre_info 中的起始位置
                'end': k           # 时间在 pre_info 中的结束位置
            }
    return None

def find_continuous_numbers(text):
    # 遇到 '|' 停止处理
    text = text.split('|')[0]
    
    numbers = []
    current_number = ""
    
    for i, char in enumerate(text):
        if char.isdigit():
            current_number += char
        elif char == '点':
            current_number += "."
        else:
            if current_number:
                numbers.append(current_number)
                current_number = ""
    
    if current_number:
        numbers.append(current_number)
    
    return numbers

def find_and_extract_contextual_event_info(file_path):
    # 读取文件并合并为一个连续字符串，同时记录每个字符属于的行号
    with open(file_path, "r", encoding="utf-8") as f:
        lines = f.readlines()

    full_text = "".join(lines)  # 连接所有行，形成一个完整的字符串
    line_indices = []  # 记录每个字符属于的行号
    current_line = 1  # 行号计数

    for line in lines:
        line_indices.extend([current_line] * len(line))  # 记录该行的字符索引
        current_line += 1

    results = []
    text_length = len(full_text)
    i = 0  # 遍历整个字符串

    while i < text_length:
        if full_text[i] == '*' and full_text[i-3:i] == '关键词':
            start = i + 1
            end = full_text.find('*关键词', start)
            if end == -1:
                continue  # 无闭合的 *，跳过
            event_name = full_text[start:end].strip()

            start_i = start - 4
            end_i = end + 4
            start_line = line_indices[start_i]
            end_line = line_indices[end_i]
            current_line_context = lines[start_line-1:start_line]

            # 获取上文信息，向前倒序寻找10个字符，遇到 * 停止
            pre_info = ""
            search_length = 15
            j = start_i  # 从 '关键词' 之前的位置开始
            while search_length > 0 and j >= 0:
                if full_text[j] == '*':
                    break
                if full_text[j] == '\n':  # 忽略换行符
                    j -= 1
                    continue
                pre_info = full_text[j] + pre_info
                search_length -= 1
                j -= 1

            # 获取下文信息，向后寻找30个有效字符（忽略换行符），遇到 * 停止
            post_info = ""
            search_length = 50
            j = end_i
            while search_length > 0 and j < len(full_text):
                if full_text[j] == '*':
                    break
                if full_text[j] == '\n':  # 忽略换行符
                    j += 1
                    continue
                post_info += full_text[j]
                search_length -= 1
                j += 1
            # 记录匹配结果
            # print(
            #     # f"匹配内容: {next_15_chars.strip()} (行 {start_line} - {end_line})\n"
            #     f"————上文————\n"
            #     f"{pre_info}\n"
            #     f"————匹配所在行：（{start_line} - {end_line}）————\n"
            #     f"{"".join(current_line_context)}\n"
            #     f"————下文————\n"
            #     f"{post_info}\n"
            # )
            results.append(
                # f"匹配内容: {next_15_chars.strip()} (行 {start_line} - {end_line})\n"
                f"————上文———— {pre_info}\n"
                f"————匹配所在行：（{start_line} - {end_line}）匹配所在行———— \
                {"".join(current_line_context)}\n"
                f"————下文———— {post_info}\n"
            )
            i+=1
        else:
            i+=1

    # 输出结果
    if results:
        events_list = []
        event = {}
        for result in results:
            print("#"*60)
            print("\n")
            print("-"*60)
            print(result)
            print("-"*60)
            print("\n")

            result_text = []
            event["line_range"] = None
            event["event"] = None

            for text in result.split("\n"):
                if "———上文" in text:
                    result_text.append(text)
                elif "———下文" in text:
                    result_text.append(text)
                elif "———匹配所在行" in text:
                    # 查找括号的位置
                    start_pos = text.find('（') + 1  # 找到第一个'（'的位置，并加1跳过括号
                    end_pos = text.find('）')        # 找到第一个'）'的位置
                    # 截取括号中的内容
                    line_range = text[start_pos:end_pos]
                    event["line_range"] = line_range
                    # 分割开始行和结束行
                    # start_line, end_line = line_range.split(' - ')
                    result_text.append(text)

            # 输出结果
            result_text_pre_info = result_text[0].split("————上文———— ")[-1].strip()
            current_line_context = result_text[1].split("匹配所在行————")[-1].strip()
            result_text_post_info = result_text[2].split("————下文———— ")[-1].strip()

            # 在 pre_info 中查找时间
            time_info = find_time(result_text_pre_info)
            if time_info == None:
                event["time"] = None
            else:
                event["time"] = time_info["time"]

            start_pos = "".join(current_line_context).find('关键词*') + 1  # 第一个 '*' 后面的字符开始
            end_pos = "".join(current_line_context).find('*关键词', start_pos)  # 第二个 '*' 的位置
            # 提取 * 之间的内容
            substring = "".join(current_line_context)[start_pos:end_pos]
            event["event"] = substring[3:]

            if event["event"] == "激活全血凝固时间" or event["event"] == "心肌保护液":
                num_results_list = find_continuous_numbers(result_text_post_info)
                event["num_results_list"] = num_results_list
            else:
                event["num_results_list"] = None
                # if  "A" not in result_text_post_info and\
                #     "B" not in result_text_post_info and\
                #     "C" not in result_text_post_info and\
                #     "D" not in result_text_post_info and\
                #     "Y" not in result_text_post_info:
                #     continue

            # if event["event"] == "体外循环开始":
            #     event["ACT"] = 480
            # else:
            #     event["ACT"] = None

            parameter_result = extract_number_after_keys(result_text_post_info)

            for one_parameter in parameter_result:
                event[one_parameter] = str(parameter_result[one_parameter])

            for one_parameter in event:
                if one_parameter == "B":
                    if event[one_parameter] == "None":
                        print(one_parameter + " : " + str(event[one_parameter]))
                    elif "00" in str(int(float(event[one_parameter]))):
                        event[one_parameter] = str(int(float(event[one_parameter])))[-3:]
                        print(one_parameter + " : " + str(int(float(event[one_parameter]))[-3:]))
                    else:
                        event[one_parameter] = str(int(float(event[one_parameter])))[-2:]
                        print(one_parameter + " : " + str(int(float(event[one_parameter])))[-2:])

                elif one_parameter == "D":
                    if event[one_parameter] == "None":
                        print(one_parameter + " : " + str(event[one_parameter]))
                    else:    
                        event[one_parameter] = str(int(float(event[one_parameter])))[-3:]
                        print(one_parameter + " : " + str(int(float(event[one_parameter])))[-3:])
                else:
                    print(one_parameter + " : " + str(event[one_parameter]))

            print("-"*60)
            print("-"*60)
            print("#"*60)
            events_list.append(event.copy())
        return events_list
    else:
        print("未找到符合条件的匹配内容。")

def extract_time_stamps_from_txt(file_path):
    result_dict = {}  # 初始化空字典用于存储行号和时间戳
    with open(file_path, "r", encoding="utf-8") as file:
        for line_number, line in enumerate(file, start=1):
            line = line.strip()  # 去除行两端的空白字符
            if not line:
                continue  # 跳过空行
            # 拆分时间戳部分和文本部分
            parts = line.split("\t", 1)  # 按制表符分割
            if len(parts) < 2:
                parts = line.split("chunk", 1)
            
            time_range = parts[0]  # 例如 [00:00:32 - 00:00:34]
            time = time_range.split("chunk")[0].strip(" ").strip("[").strip("]")  # 提取起始时间 00:00:32

            # 存入字典，key 为行号，value 为起始时间
            result_dict[line_number] = time
    return result_dict  # 返回包含行号和时间戳的字典

def extract_time_from_filename(file_path):
    # 通过 "_" 分割文件名
    parts = file_path.split("_")
    # 确保前两部分是日期和时间
    if len(parts) >= 2 and len(parts[0]) == 8 and len(parts[1]) == 6:
        date_part = parts[0]  # "20250306"
        time_part = parts[1]  # "105401"
        
        # 组合并解析成 datetime 对象
        dt = datetime.strptime(date_part + time_part, "%Y%m%d%H%M%S")
        return dt
    return None

def calculate_current_time(start_time: str, elapsed_time: str) -> str:
    """
    Calculate the current time based on start time and elapsed time.

    :param start_time: Start time in "HH:MM:SS" format.
    :param elapsed_time: Elapsed time in "HH:MM:SS" format.
    :return: Current time in "HH:MM:SS" format.
    """
    # 解析 start_time
    start_dt = datetime.strptime(start_time, "%H:%M:%S")

    # 解析 elapsed_time
    h, m, s = map(int, elapsed_time.split(":"))
    elapsed_td = timedelta(hours=h, minutes=m, seconds=s)

    # 计算当前时间
    current_time = start_dt + elapsed_td

    # 返回计算后的时间字符串
    return current_time.strftime("%H:%M:%S")

def convert_time(time_str):
    time_str = time_str.replace('点', ':')\
                        .replace('1刻', '15')\
                        .replace('2刻', '30')\
                        .replace('3刻', '40')\
                        .replace('半', '30')
    
    # If the time string ends with a colon, it means minutes are missing, so set to '00'
    if time_str.endswith(':'):
        time_str += '00'

    # Ensure two-digit format for hours, minutes, and seconds
    # Add seconds if necessary
    if len(time_str.split(':')) == 2:  # e.g., '9点' becomes '09:00'
        time_str += ':00'
    
    # Format as two digits for each component
    time_str = ':'.join(f'{int(x):02d}' for x in time_str.split(':'))
    
    return time_str

print("-"*60)
file_path = "20250312_104423_0_1_2_3_4_5.txt"
events_list = find_and_extract_contextual_event_info(file_path)
print("提取关键事件+时间+各个参数完成！")
print("-"*60)



print("-"*60)
file_path = "20250312_104423_0_1_2_3.txt"  # 你的 TXT 文件路径
time_dict = extract_time_stamps_from_txt(file_path)
file_name = os.path.basename(file_path)
time_in_beijing = extract_time_from_filename(file_name)
start_time = time_in_beijing.strftime("%H:%M:%S")
if time_in_beijing:
    print("录音时间（北京时间）:", start_time)
else:
    print("未找到时间信息")

events_list_1 = []
for event in events_list:
    row_num = int(event['line_range'].split("-")[0])
    elapsed_time = time_dict[row_num].split("-")[0].strip()
    current_time = calculate_current_time(start_time, elapsed_time)
    print("Current time:", current_time)
    event['line_range'] = current_time
    events_list_1.append(event.copy())
print("-"*60)


for i in range(len(events_list_1)):
    event = events_list_1[i]
    print("-"*60)
    if event["time"] == "None" or event["time"] == None:
        event["time"] = event['line_range']
    if i >= 1:
        if event["A"] == "None" or event["A"] == None:
            event["A"] = events_list_1[i-1]["A"]
        if event["B"] == "None" or event["B"] == None:
            event["B"] = events_list_1[i-1]["B"]
        if event["C"] == "None" or event["C"] == None:
            event["C"] = events_list_1[i-1]["C"]
        if event["D"] == "None" or event["D"] == None:
            event["D"] = events_list_1[i-1]["D"]
        if event["Y"] == "None" or event["Y"] == None:
            event["Y"] = events_list_1[i-1]["Y"]


# Add the converted time to each event
for event in events_list_1:
    event['time'] = convert_time(event['time'])
# Sort the events based on the converted time
sorted_events = sorted(events_list_1, key=lambda x: x['time'])
# Print the sorted events
for event in sorted_events:
    print(event)

# print("-"*60)
# for event in sorted_events:
#     print("-"*60)
#     if event["event"] == "激活全血凝固时间" or event["event"] == "心肌保护液":
#         continue
#     if "序号" in event["event"]:
#         continue
#     if event["time"] == "None" or event["time"] == None:
#         event["time"] = event['line_range']
#     for one_parameter in event:
#         if one_parameter == "line_range":
#             print("line_range_time(Record time) : " + str(event[one_parameter]))
#         else:
#             print(one_parameter + " : " + str(event[one_parameter]))
#     print("-"*60)
# print("-"*60)


sorted_events_1 = []
for event in sorted_events:
    if event["event"] == "激活全血凝固时间" or event["event"] == "心肌保护液":
        continue
    else:
        sorted_events_1.append(event)


output_txt_file = file_path.split(".")[0] + "_time_event_ABCD.txt"
with open(output_txt_file, "w", encoding="utf-8") as file:
    file.write("-" * 60 + "\n")
    index_num = 1
    for index, event in enumerate(sorted_events_1, start=1):
        if "序号" in event["event"]:
            continue
        file.write(f"Event {index_num}\n")
        index_num +=1
        for one_parameter in event:
            if one_parameter == "line_range":
                file.write("line_range_time : " + str(event[one_parameter]) + "\n")
            else:
                file.write(one_parameter + " : " + str(event[one_parameter]) + "\n")
        file.write("-" * 60 + "\n")
    file.write("-" * 60 + "\n")

你可能感兴趣的:(语音识别后处理)

如何构建FunASR的本地语音识别服务
FunASR简介FunASR是阿里巴巴达摩院开源的高性能语音识别工具包，支持离线识别和实时流式识别两种模式。其核心特点包括：支持多种语音任务：ASR（自动语音识别）、VAD（语音活动检测）、标点恢复、关键词检测等。提供预训练模型：覆盖中文、英文等多语言，支持不同场景（通用、会议、直播等）。支持多种部署方式：本地Python、Docker容器、ONNX推理优化等。开源地址：GitHub-FunASR
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
YOLO目标检测模型优化技术全景解析
YOLO目标检测模型优化技术全景解析作为实时目标检测领域的标杆算法，YOLO系列模型通过持续的技术革新不断提升性能边界。本文将从模型架构设计、数据优化、注意力机制融合、后处理策略及训练方法等维度，系统剖析YOLO优化领域的关键技术与最新进展。一、模型架构优化：突破性能瓶颈的核心路径多尺度检测层增强针对小目标检测难题，主流方案通过增加浅层检测通道优化特征提取。例如在YOLOv5中引入160×160特
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
从0构建 HarmonyOS 本地语音识别项目：Whisper 完整落地教程观熵国产大模型部署实战全流程指南 harmonyos 语音识别 whisper 深度学习机器学习
第一章：鸿蒙手机语音识别项目实战（基于Whisper本地推理）项目目标：构建一个可以在鸿蒙系统手机本地运行的语音识别应用，使用Whisper模型识别用户语音为文字，全程无需联网。1.为什么要在鸿蒙手机本地部署语音识别？在很多移动场景下（驾驶、弱网环境、隐私敏感场景等），云端语音识别存在如下痛点：⏳网络延迟高、体验割裂⚠️数据隐私风险大网络依赖强，弱网/无网直接无法使用而将语音识别模型部署在鸿蒙设备
网页语音识别demo zy_qqqqqq 语音识别 css html
语音demo*{box-sizing:border-box;margin:0;padding:0;font-family:'PingFangSC','MicrosoftYaHei',sans-serif;}body{display:flex;flex-direction:column;align-items:center;padding:20px;background-color:#f7f9fc;
VUE如何设置语音穆罕周 vue.js 前端 javascript
在Vue项目中设置语音功能可以通过1、使用WebSpeechAPI和2、集成第三方语音合成库来实现。WebSpeechAPI是一种浏览器内置的API，它提供了语音识别和语音合成功能，而第三方语音合成库则提供了更加丰富和灵活的功能。一、使用WebSpeechAPIWebSpeechAPI是一种原生浏览器API，它包括了语音识别和语音合成两部分。以下是如何在Vue项目中使用WebSpeechAPI设置
webkitSpeechRecognitionHTML5语音识别文字（直接运行） AIGC创想家 html5 语音识别前端
前端想要实现语音转文字，其实不需要任何云服务，浏览器自带的api就能搞定。下面是已经封装好的代码，复制之后可以在控制台只接运行。classSpeechRecognitionManager{??tempTranscript=''??isRecording=false;??timeoutid=0;??exitKeywors=['stop','exit','quit','退出','停止识别','说完了'
语音识别文字
记录项目中的语音识别文字功能是怎么做的，有需要的可以借鉴一下，都是干货，简单实用。实现原理：调用浏览器的API监听用户语音，浏览器监听到语音后，就会转成文字。测试环境：Edge--免费(国内可用)Safari--免费(国内可用)Chorme--免费(需要科学上网)FireFox--不支持下面是代码函数干货：注意我用的vue2写的，所以有一些语音展示的动画控制按钮和文本显示的代码。复制代码后，根据你
动态分析软件：LS-DYNA_（16）.LS-DYNA在爆炸与冲击分析中的应用 kkchenjj 结构力学结构力学
LS-DYNA在爆炸与冲击分析中的应用引言爆炸与冲击分析是动态分析软件LS-DYNA中的一个重要应用领域。这些分析通常用于军事、航空航天、汽车安全和土木工程等多个行业，以评估结构在极端动态载荷下的响应。本节将详细介绍如何使用LS-DYNA进行爆炸与冲击分析，包括模型的建立、加载条件的设置、材料模型的选择以及结果的后处理。模型建立几何模型在LS-DYNA中，几何模型的建立是仿真的第一步。可以使用多种
开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界开源技术探险家开源模型-实际应用落地开源音视频 AIGC agi
一、前言在AI技术持续突破的2025年，音频交互正从单一任务处理迈向全场景融合的新阶段。4月27日，月之暗面（MoonshotAI）开源的Kimi-Audio-7B-Instruct，以“全能音频通才”之姿，为这一进程树立了里程碑式标杆。这款基于70亿参数架构的模型，首次在单一框架内整合语音识别（ASR）、情感分析（SER）、跨语言对话、语音生成（TTS）等十余项任务，并通过12.5Hz混合标记器
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
FunASR Paraformer-zh：高效中文端到端语音识别方案全解
项目简介FunASR是阿里巴巴达摩院开源的端到端语音识别工具箱，集成了多种语音识别、语音活动检测（VAD）、说话人识别等模块。其中paraformer-zh和paraformer-zh-streaming是针对中文语音识别任务优化的端到端模型，分别适用于离线和流式场景。Paraformer采用并行Transformer架构，兼具高精度和低延迟，广泛应用于智能客服、会议转写、语音助手等场景。主要特点
【DICOM后处理】qt+vs 实现DICOM数据四视图显示 leafpipi 实战练习 qt c++算法图像处理 DICOM 学习
目录1、DICOM四视图2、vtkImageViewer2实现二维平面图显示3、vtkVolume实现三维体数据显示4、实现界面图1、DICOM四视图DICOM四视图通常指同时显示医学影像的四个不同平面或视角，用于全面分析三维数据（如CT、MRI等）。标准四视图布局：横截面（Axial）水平切面，从上向下观察（类似传统CT/MRI的横断面切片）。显示解剖结构的横向分布，常用于定位病变。矢状面（Sa
Spring AI 项目实战（十八）：Spring Boot + AI + Vue3 + OSS + DashScope 实现高效语音识别系统（附完整源码）程序员岳彬 SpringAI spring 人工智能 spring boot 语音识别后端 ai java
系列文章序号文章名称1SpringAI项目实战（一）：SpringAI核心模块入门2SpringAI项目实战（二）：SpringBoot+AI+DeepSeek深度实战（附完整源码）3SpringAI项目实战（三）：SpringBoot+AI+DeepSeek打造智能客服系统（附完整源码）4
AI数字人系统开发上线全攻略：从0到1全流程解析 v_qutudy 人工智能 AI系统开发 AI数字人开发
一、需求分析：定义数字人核心能力1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/语音输入AR/VR空间交互1.2非功能性指标实时性：唇形同步延迟B[语音识别]A-->C[姿态检测]A-->D[文本理解]B-->E[NLP引擎]C-->F[动作解析
深入解析Battelle/movfuscator项目的后处理技术邹滢朦
深入解析Battelle/movfuscator项目的后处理技术项目概述Battelle/movfuscator是一个独特的编译器项目，它能够将C代码转换为仅使用MOV指令的汇编代码。而其后处理器(post-processor)组件则提供了更多强大的功能扩展，可以将这些汇编代码进一步转换为使用特定指令集的版本，实现更深层次的代码混淆和优化。后处理器工作原理后处理器的工作流程分为以下几个关键步骤：首
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
UDP并发服务器之多进程并发
一、常见的服务器类型在网络程序里面，通常都是一个服务器处理多个客户端。为了处理多个客户端的请求,服务器端程序有不同的处理方式。1.迭代服务器大多数UDP都是迭代运行，服务器等待客户端的数据，收到数据后处理该数据，送回其应答，在等待下一个客户端请求。2.并发服务器并发服务器是指在同一个时刻可以响应多个客户端的请求本质是创建多进程/多线程，对多数用户的信息进行处理UDP协议一般默认是不支持多线程并发的
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
基于 esp32-s3，结合私有化大模型，集asr语音识别、llm大模型、tts语音合成，设计一个技术方案，要求用websocket保持长链接，
以下方案演示了如何基于ESP32-S3，通过私有化大模型组合ASR（语音识别）、LLM（语言大模型）和TTS（语音合成）来构建一个语音交互系统，并且通过WebSocket保持与服务器的长连接通讯。整体方案分为以下几个部分：系统整体架构与数据流协议设计与消息格式服务器端实现示例ESP32-S3端实现示例运行流程与示例下面将对各部分进行详细说明。ESP32-S3没想到私有化大模型速度也能这么快ESP3
Python 语音识别系列-实战学习-语音识别特征提取
Python语音识别系列-实战学习-语音识别特征提取前言1.预加重、分帧和加窗2.提取特征3.可视化特征4.总结前言语音识别特征提取是语音处理中的一个重要环节，其主要任务是将连续的时域语音信号转换为连续的特征向量，以便于后续的语音识别和语音处理任务。在特征提取阶段，这些特征向量能够捕捉到语音信号中的关键信息，如音调、音色和音节等。特征提取主要可以分为以下几个方面：时域特征提取：包括自相关函数、方差
如何获取微信公众号用户的个人信息（包括OpenId）一杯冰美式_丶 Java相关知识
最近，对微信公众号有点兴趣，就自己研究了研究里面的一些内容，发现还挺有意思的，而且通过微信公众号可以调用一些比较有意思的接口，就比如百度开发服务平台点击进入里面的很有接口，就比较常见的翻译，语音识别，地理位置等等，都挺好的。好了，不多说，进入正题好了。我想，做微信公众号开发的，对于想获取关注了公众号的用户信息，或者说是当前与后台服务器进行交互的当前用户信息，这个功能是很重要的吧。因为，通过这个，可
AI技术正在深度重构全球产业格局，其影响已超越工具属性，演变为推动行业变革的核心引擎。
一、AI如何重塑AI的工作与行业（AI助手领域）能力升级理解与生成：基于LLM（大语言模型），AI能处理开放式问题、撰写报告、翻译代码，替代部分人类知识工作。个性化交互：通过用户历史对话分析，提供定制化建议（如学习计划、投资策略）。多模态扩展：结合图像/语音识别（如GPT-4V），实现图文分析、医学影像解读等跨模态任务。行业变革客服行业：AI客服处理70%+常规咨询（如阿里小蜜），人力转向复杂问题
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
手机通话语音离线ASR识别商用和优化方向 limingade 本地AI电话机器人手机提取电话的信令和声音智能手机 FunASR离线识别 Android做ASR 手机断网离线ASR ASR语音转文字识别语音识别
手机通话语音离线ASR识别商用和优化方向--本地AI电话机器人上一篇：手机FunASR识别SIM卡通话占用内存和运行性能分析下一篇：编写中。一、前言前面的篇章中，我们尝试了将FunASR的ONNX模型文件加载到Android应用中，实现手机本地不依赖服务器和网络的离线ASR语音识别。并将这个ASR能力应用到了手机麦克风、手机本地的历史通话录音、手机实时的SIM卡电话通话内容的解析上。在实践中，我们
鸟类识别与分类相关数据集 Bryan Ding 分类数据挖掘人工智能
随着深度学习技术的快速发展，其在图像识别、语音识别等领域取得了显著的成果。鸟类识别作为生态学研究的重要内容，对于物种多样性保护、生态环境监测等领域具有深远的影响。将深度学习技术应用于鸟类识别，有望提高识别的准确性和效率，为鸟类学研究提供有力支持。本文综述了近年来深度学习在鸟类识别中的应用进展，包括基于图像和声音的鸟类识别系统，分析了其技术框架、实现方法以及在实际应用中的效果。通过对相关文献的梳理，
AI技术通过多模态应用（即融合文本、图像、语音、视频、传感器数据等多维度信息）正在深刻重塑工作模式、行业生态和人类创造力边界。 zzywxc787 人工智能音视频大数据 java spring 开发语言
AI技术通过多模态应用（即融合文本、图像、语音、视频、传感器数据等多维度信息）正在深刻重塑工作模式、行业生态和人类创造力边界。以下从技术融合、行业变革、职业重构三个维度展开分析，并附具体案例：一、技术融合：多模态AI的核心突破跨模态理解引擎案例：Meta的AudiovisualNeuralNetwork（AV-Wav2Vec）实现语音-唇形-场景的联合建模，语音识别错误率降低40%技术指标：跨模态
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro