黄昏中起飞的猫头鹰

如何增加ai虚拟聊天伴侣趣味性——OpenCV识别大量真实聊天图片采集高质量语料

图像转文字

代码一：(文件run_batch.py)

批量读取多个目录下的所有pdf多分页图片和jpg图片，并实现OCR识别图片文字，分别保存到多个json文件中

import os
import json
import base64, re
from tqdm import tqdm
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models
import fitz  # PyMuPDF
import numpy as np

secret_id = "" #腾讯云OCR服务密钥，开通服务可以免费使用1000次
secret_key = ""

def get_imges(pdf_path):
    if pdf_path.endswith('pdf'):
        pdf_document = fitz.open(pdf_path)
        page_count = pdf_document.page_count
        # pdf_writer = fitz.open()

        for page_num in range(pdf_document.page_count):
            page = pdf_document[page_num]
            pix = page.get_pixmap().tobytes('png',jpg_quality=1680)
            base64_str = base64.b64encode(pix).decode()
            # return pix
            yield base64_str
        # pdf_writer.save(output_path, deflate=True, jpg_quality=30)
        pdf_document.close()
        print("page_count",page_count)
        return page_count
    else:
        with open(pdf_path, 'rb') as i_file:
            base64_str = base64.b64encode(i_file.read()).decode()
            yield base64_str
        


def make_api_call(jpg_fpath, jsn_fpath, json_data):
    for base64_str in get_imges(jpg_fpath):
        try:
            cred = credential.Credential(secret_id, secret_key)
            httpProfile = HttpProfile()
            httpProfile.endpoint = "ocr.tencentcloudapi.com"
            clientProfile = ClientProfile()
            clientProfile.httpProfile = httpProfile
            client = ocr_client.OcrClient(cred, "ap-guangzhou", clientProfile)
            req = models.GeneralAccurateOCRRequest()
            params = {
                'LanguageType': 'zh',
                'IsPdf': True,
                "PdfPageNumber": 5,
                'ImageBase64': f'data:image/jpeg;base64,{base64_str}',
                # 'EnableDetectText': True
            }
            req.from_json_string(json.dumps(params))
            resp = client.GeneralBasicOCR(req)
            res = json.loads(resp.to_json_string()).get('TextDetections')
            print("res lenght:",len(res))
            json_data['TextDetections'].append(res)
            # break
        except TencentCloudSDKException as err:
            print(err)
    if json_data:
        print("len(json_data['TextDetections']):",len(json_data['TextDetections']))
        os.makedirs(os.path.dirname(os.path.realpath(jsn_fpath)), exist_ok=True)
        with open(jsn_fpath, 'w', encoding='UTF-8') as o_file:
            o_file.write(json.dumps(json_data, ensure_ascii=False))

def ocr_api_json(jpg_dpath):

    curr_dir = os.path.dirname(os.path.realpath(__file__))
    image_path = os.path.join(curr_dir, 'raw.images', jpg_dpath)  
    jsn_dpath = os.path.join(curr_dir, 'api.results')
    print("jpg_dpath",jpg_dpath)

    regex = re.compile(r'[0-9]+')
    json_data = {"TextDetections":[]}
    files = os.listdir(image_path)
    files.sort(key=lambda x: int(re.search(regex, x).group()))

    for jpg_fname in files:
        jpg_fpath = os.path.join(image_path, jpg_fname)
        print("jpg_fpath", jpg_fpath)
        type_ = jpg_fpath.split(r'.')[-1]
        print("type_",type_)
        jsn_fpath = os.path.join(jsn_dpath, f'{jpg_dpath}.json')
        print("jsn_fpath", jsn_fpath)
        make_api_call(jpg_fpath, jsn_fpath, json_data)

if __name__ == '__main__':
    
    jpg_dpath = '19岁的矜持女孩'
    ocr_api_json(jpg_dpath)

代码二：（文件名：get_text_boxes.py）

图像处理与轮廓识别

这段代码通过对图像进行腐蚀和膨胀等操作，成功提取出图像中的主要轮廓。

import numpy as np
import cv2

def dilate_line(binary, type='vertical', x_scale=10, y_scale=5):
    '''
    获取竖线/横线腐蚀后的二值图
    '''
    rows_z, cols_z = binary.shape
    if type == 'horizontal':
        size = (cols_z // x_scale, 1)
    else:
        size = (1, rows_z // y_scale)
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, size) 
    eroded = cv2.erode(binary, kernel, iterations=1)  # 腐蚀
    dilated = cv2.dilate(eroded, kernel, iterations=1)  # 膨胀 
    return dilated

def get_contours(image):
    srcPic = image
    # Apply thresholding to replace black pixels with white pixels
    hsv = cv2.cvtColor(srcPic, cv2.COLOR_BGR2HSV)

    # Define the lower and upper bounds for black color in HSV
    lower_black = np.array([0, 0, 0], dtype=np.uint8)
    upper_black = np.array([180, 255, 86], dtype=np.uint8)

    # Create a binary mask for black pixels
    black_mask = cv2.inRange(hsv, lower_black, upper_black)
    # Replace black pixels with white pixels
    srcPic[black_mask > 0] = [255, 255, 255]
    gray = cv2.cvtColor(srcPic, cv2.COLOR_BGR2GRAY)
    # 二值化
    # _, binPic = cv2.threshold(greyPic, 229, 255, cv2.THRESH_BINARY)
    binPic = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
    kernel = np.ones((6, 6), np.uint8)
    binPic = cv2.morphologyEx(binPic, cv2.MORPH_OPEN, kernel, iterations=3)
    border_size = 12
    pattern = np.array([0, 255] * (border_size // 2), dtype=np.uint8)
    # Apply the dashed line pattern to the right side of the image
    binPic[:, -border_size:] = pattern[:binPic.shape[0]]
    # binPic[:, :border_size] = pattern[:binPic.shape[0]]
    # binPic = cv2.copyMakeBorder(binPic, top=0, bottom=0, left=0, right=border_size, borderType=cv2.BORDER_CONSTANT, value=0)
    binPic = dilate_line(binPic, 'horizontal', 120, 900) #vertical
    # 中值滤波
    median = cv2.medianBlur(binPic, 5)

    # 边缘检测
    cannyPic = cv2.Canny(median, 10, 200)

    # 找出轮廓
    contours, hierarchy = cv2.findContours(cannyPic, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    # contours, hierarchy = cv2.findContours(cannyPic, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
    # 根据轮廓面积排序
    contours = sorted(contours, key=cv2.contourArea, reverse=True) #[:10]
    min_contour_area = 500  # Set your desired area threshold
    contours = [cnt for cnt in contours if cv2.contourArea(cnt) > min_contour_area]

    # 画出所有轮廓并返回矩形坐标
    rectangles = []
    for i in range(min(26, len(contours))):
        x, y, w, h = cv2.boundingRect(contours[i])
        # cv2.imshow(srcPic)
        cv2.rectangle(srcPic, (x, y), (x + w, y + h), (0, 255, 0), 2)
        rectangles.append(((x, y), (x + w, y + h)))
        roi = srcPic[y:y+h, x:x+w]
    #     if i == 5:
    #         # 显示图像
    #         cv2.namedWindow(str("D"), cv2.WINDOW_NORMAL)
    #         cv2.resizeWindow(str("D"), 800, 2000) 
    #         cv2.imshow("D", roi)
    #         cv2.waitKey(0)
    #         cv2.destroyAllWindows()
    #         break
    # return roi
    #cv2.namedWindow(str("C"), cv2.WINDOW_NORMAL)
    #cv2.resizeWindow(str("C"), 800, 1000) 
    #cv2.namedWindow(str("M"), cv2.WINDOW_NORMAL)
    #cv2.resizeWindow(str("M"), 800, 1000) 
    #cv2.imshow('C', srcPic) 
    #cv2.imshow('M', median) #srcPic
    #cv2.waitKey(0)
    #cv2.destroyAllWindows()
    return rectangles

def get_color(img):
    if img.shape[0] == 0 or img.shape[1] == 0:
        return "UNK"
    #颜色提取
    hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)  # 色彩空间转换为hsv，便于分离
    average_hue = np.median(hsv[:,:,0])  #色相
    average_saturation = np.median(hsv[:,:,1])  #饱和度
    average_value = np.median(hsv[:,:,2])   #亮度
    print('RBG--hsv:',average_hue, average_saturation, average_value)
    green_min = [35, 43, 46]
    green_max = [77, 255, 255]
    back_min = [0,0,40]
    back_max = [180,43,220]
    white_min = [0,0,239]
    white_max = [180,30,255]
    if average_hue >= green_min[0]  and average_hue <= green_max[0] and average_saturation >= green_min[1]  and \
    average_saturation <= green_max[1] and average_value >= green_min[2] and average_value <= green_max[2]:
        print("color is green")
        return  'RIGHT'
    elif average_hue >= white_min[0]  and average_hue <= white_max[0] and average_saturation >= white_min[1]  and \
    average_saturation <= white_max[1] and average_value >= white_min[2] and average_value <= white_max[2]:
        print("color is white")
        return "LEFT"
    elif average_hue >= back_min[0]  and average_hue <= back_max[0] and average_saturation >= back_min[1]  and \
    average_saturation <= back_max[1] and average_value >= back_min[2] and average_value <= back_max[2]:
        print("color is gray")
        return "LEFT"
    else:
        print("not white and green",average_hue,average_saturation, average_value )
        return "UNK"

if __name__ == "__main__":
    img = cv2.imread('123.jpg') #20 31 64
    img = get_contours(img)
    # img_separate = get_color(img) #设置get_color 返回roi后，判断轮廓所在的颜色区域

代码三：（主入口）

这段代码将OCR识别的文字信息转化为有趣的对话，通过颜色和位置信息，判断文字所在的位置（左侧/右侧）

import os
import re
import json
import fitz 
import cv2
import numpy as np
from run_batch import ocr_api_json
from get_text_boxes import get_contours, get_color

CONF_THRES = 95  # OCR confidence threshold

def get_pdf_page_count(pdf_paths):
    for pdf_path in pdf_paths:
        pdf_path = f'{pdf_path}'
        print("pdf_path:",pdf_path)
        if pdf_path.endswith('pdf'):
            pdf_document = fitz.open(pdf_path)
            page_count = pdf_document.page_count

            for page_num in range(pdf_document.page_count):
                page = pdf_document[page_num]
                pix = page.get_pixmap().tobytes('png',jpg_quality=1680)
                # return pix
                yield pix
            # pdf_writer.save(output_path, deflate=True, jpg_quality=30)
            pdf_document.close()
        else:
            with open(pdf_path, 'rb') as i_file:
                pix = i_file.read()
                yield pix
    

def get_bbox_bounds(bbox):
    x_min = min([x['X'] for x in bbox])
    x_max = max([x['X'] for x in bbox])
    y_min = min([x['Y'] for x in bbox])
    y_max = max([x['Y'] for x in bbox])
    return x_min, x_max, y_min, y_max


def judge_side(img, bbox, rectangles, detectedtext):
    """Judge the left/right side based on the occurance of white/green pixels."""

    x_min, x_max, y_min, y_max = get_bbox_bounds(bbox)
    side = None
    for rect in rectangles:
        if rect[0][0] -50 <= x_min <= rect[1][0] + 50 and rect[0][1] -50 <= y_min <= rect[1][1] + 50 \
                and rect[0][0] -50 <= x_max <= rect[1][0] + 50 and rect[0][1] -50 <= y_max <= rect[1][1] + 50:
            side = rect

    if side or (detectedtext and len(detectedtext) >= 3):
        side = get_color(img[x_min-60:x_max+60,y_min-60:y_max+60])
    return side

def generate_page(jpg_fpath):
    return get_pdf_page_count(jpg_fpath)

def extract_conv(jpg_fnames, jsn_fpath): 
    """Extract conversations from OCR raw results."""
    print(jpg_fnames)
    gen = generate_page(jpg_fnames)
    with open(jsn_fpath, 'r', encoding='UTF-8') as i_file:
        jsn_data = json.load(i_file)

    # filter out irrelevant hits
    conv_list = []
    regex = re.compile(r'[0-9]+:[0-9]+$|中国移动|输入聊天')
    print(len(jsn_data['TextDetections']), '-------------------')
    for hits in jsn_data['TextDetections']:
        pix = next(gen)
        pix = np.frombuffer(pix, np.uint8)
        img = cv2.imdecode(pix, cv2.IMREAD_COLOR)
        rectangles  = get_contours(img)
        for hit in hits:
            y_list = [y for y in hit.get('Polygon')]  #获取句子y轴坐标
            text = hit["DetectedText"]
            #根据y轴坐标，使用极差计算句子高度：如果句子水平方向，高度在一个字的高度左右，如果是水印则会异常高
            ptp = np.ptp(np.array([i.get('Y') for i in y_list]))  
            #过滤异常高度、异常字体大小和时间文本
            if hit['Confidence'] <= CONF_THRES or ptp > ptp_max or ptp <= ptp_min or re.search(regex, text):  
                print("pass -----")
                continue
            print("text:",text)
            side = judge_side(img, hit['Polygon'], rectangles,hit["DetectedText"])
            if side == 'UNK' or not side:
                # print("side:", hit["DetectedText"])
                continue
            else:
                conv_list.append(f'{side}: {text}')

    return conv_list


def main_start(jpg_dpath):
    """Main entry."""

    curr_dir = os.path.dirname(os.path.realpath(__file__))
    image_path = os.path.join(curr_dir, 'raw.images', jpg_dpath)
    jsn_dpath = os.path.join(curr_dir, 'api.results')
    txt_fpath = os.path.join(jsn_dpath, f'{jpg_dpath}.txt')
    
    # extract conversations from OCR raw results
    conv_list = []
    regex = re.compile(r'[0-9]+')
    jpg_fnames = list(os.listdir(image_path))
    jpg_fnames.sort(key=lambda x: int(re.search(regex, x).group()))
    jpg_fnames = [os.path.join(curr_dir, 'raw.images',jpg_dpath, i) for i in jpg_fnames]
    # print('当前目录图片列表:', jpg_fnames)
    
    jsn_fpath = os.path.join(jsn_dpath, f'{jpg_dpath}.json')
    print("jsn_fpath:", jsn_fpath)
    conv_list_addi = extract_conv(jpg_fnames, jsn_fpath)
    conv_list.extend(conv_list_addi)
        
    print('保存路径:',txt_fpath)
    with open(txt_fpath, 'w', encoding='UTF-8') as o_file:
        o_file.write('\n'.join(conv_list) + '\n')

if __name__ == '__main__':
    curr_dir = os.path.dirname(os.path.realpath(__file__))
    paths = os.listdir(os.path.join(curr_dir, 'raw.images')) #图片目录raw.images
    ptp_max = 500 #水印异常高度
    ptp_min = 16  #异常小字体高度 如时间 电量等
    for jpg_dpath in paths:
        print(jpg_dpath)  #子目录，存放图片
        ocr_api_json(jpg_dpath) 
        main_start(jpg_dpath)
        
    # test
    # jpg_dpath = ' 女生主动买好小雨伞'
    # ocr_api_json(jpg_dpath)
    # main_start(jpg_dpath)

代码详细讲解可以观看我另一篇博客：https://blog.csdn.net/qq_20163065/article/details/135048872

运行代码三后将输出到txt文件，结果如下：

left为左侧角色的文本，right为右侧角色的文本

LEFT: 我通过了你的朋友验证请求，现在
LEFT: 我们可以开始聊天了
RIGHT: 你好呀
LEFT: 你好呀，
LEFT: 朋友
LEFT: 备注祁晶
RIGHT: 好嘞
RIGHT: 我叫刘晓宇

非常感谢大家的热情收看！希望在这次的分享中，你们能够从中汲取到有趣的知识和灵感。如果在这个过程中，你们有任何关于AI虚拟角色、图像识别或其他技术问题的疑问，都欢迎随时提问哦！。

目前已经成功收集了上万个角色的聊天内容相关语料，感兴趣的朋友可以私聊我。

海外社媒营销：实现多账号矩阵与精准触达
在全球社交媒体用户突破50亿的当下，TikTok、Instagram、Facebook等平台已成为品牌触达海外消费者的核心战场。然而，随着平台风控升级与用户需求分化，海外社媒营销正面临两大核心挑战：多账号矩阵运营易被封禁（TikTok单月封禁超200万账号）、内容触达缺乏精准度（全球用户语言/文化/兴趣差异超300种）。亚矩阵云手机通过虚拟化环境隔离、AI行为模拟引擎、动态内容适配系统三大核心技术
80亿美元押注Agent！全球第一CRM收购Informatica
昨晚，全球第一CRM平台Salesforce在官网宣布，以80亿美元全资收购企业级AI驱动云数据管理领导者Informatica。根据收购协议条款，Informatica的A股和B-1类普通股持有者将每股获得25美元现金。本次收购将增强Salesforce的数据基础，这对部署强大且负责任的AIAgent至关重要。Informatica丰富的数据目录、数据集成、治理、质量与隐私保护、元数据管理和主数
AGI面临突破需要清除这两朵乌云：解码智能鸿沟的终极密码
1.物理学史的镜鉴：科学革命的预兆1900年英国物理学家开尔文勋爵宣称"物理学大厦已告完成"，却未料及那两朵"光速悖论"与"紫外灾难"的乌云，最终催生了相对论与量子力学。这段历史在AI领域重现：当算力呈指数级增长，模型参数突破万亿级，我们依然无法教会AI"水杯会掉落"的常识。这种历史重演揭示着深刻规律——任何科学体系的突破往往始于对既有范式的质疑。正如爱因斯坦推翻绝对时空观，当前AI研究需要重新审
Python包版本分析工具开发：从PyPI私有源快速提取元数据 YoungHong1992 python windows 开发语言
importsubprocessimportreimportosimportsysimporttempfileimportzipfilefromemail.parserimportParserfromtypingimportList,Dict,Optional,Anyfromjinja2importEnvironmentfrompackaging.versionimportparseasparse
AI 的出现，是否能替代 IT 从业者？敲代码的苦13 人工智能
在科技浪潮奔涌向前的时代，AI正以惊人的速度渗透进各个领域，IT行业首当其冲。当AI编写代码的效率不断提升，当智能算法能够快速完成系统故障诊断，当自动化工具可以处理大量数据运维工作，IT从业者们不禁心生疑虑：AI真的会成为“职业终结者”，将自己从岗位上彻底替代吗？这场关于AI与IT从业者未来的讨论，充满了争议与悬念，也关乎着无数人的职业命运。一、AI在IT领域的应用现状编程开发中的AIAI在编程开
AIGC领域AI作画：在数字雕塑中的应用实践 AI原生应用开发 AI 原生应用开发 AIGC AI作画 ai
AIGC领域AI作画：在数字雕塑中的应用实践关键词：AIGC、AI作画、数字雕塑、生成对抗网络、3D建模、艺术创作、深度学习摘要：本文深入探讨了AIGC(人工智能生成内容)技术在数字雕塑领域的创新应用。我们将从技术原理、算法实现到实际案例，全面解析AI如何赋能传统数字雕塑创作流程。文章首先介绍AIGC在艺术创作中的背景和发展现状，然后详细讲解核心算法原理和数学模型，接着通过实际项目案例展示AI作画
如何在 Android Framework层面控制高通（Qualcomm）芯片的 CPU 和 GPU。 YoungHong1992 android 高通芯片 CPU GPU
如何在AndroidFramework层面控制高通（Qualcomm）芯片的CPU和GPU。参考：https://blog.csdn.net/YoungHong1992/article/details/117047839?utm_source%20=%20uc_fansmsg作为一名Framework开发者，您拥有系统级的权限，可以直接与底层硬件接口交互。但这通常不被推荐，因为现代Android系
Python项目如何读取nacos配置 Tizzy JJ 服务器 python pycharm
目录一、nacos配置示例二、python读取nacos配置一、nacos配置示例在Nacos中创建yaml格式配置（DataID:your-data-id）#Nacos配置文件(your-data-id.yaml)app:env:productionversion:1.2.3apis:deepseek:api_key:"sk-your-deepseek-key-here"timeout:30da
PromptX 架构演进深度解析：从理念到实践的完整工程化之路步子哥智能涌现架构人工智能
核心理念：AIuseCLIgetpromptforAI-一场关于AI认知架构的全方位革命引言：当理想遇见现实的工程挑战当我们深入研究PromptX项目的完整文档体系时，会发现这不仅仅是一个技术项目，而是一个从哲学思考到工程实践的完整演进过程。今天，让我们通过这些核心文档，深度解析PromptX如何从革命性理念发展为可落地的工程架构。这些文档记录了一个真实的技术演进过程：从最初的理想化设计，到遇到实
SpringAIAlibaba正式版发布！小付爱coding ai
SpringAIAlibaba正式版发布！SpringAIAlibaba到底是个啥？没错！它还是以SpringAI为基础，深度集成阿里自己的百炼平台：支持ChatBot、工作流、多智能体应用开发模式的AI框架。简单来说就是将调用大模型抽象成一个API，可以直接调用来实现，只不过可选参数更多它的核心能力：抽象+简化+扩展SpringAIAlibaba最大的价值在于：它把调用大模型这件事，抽象成了一个
[ruby on rails] ActiveJob中 discard_on，retry_on和 rescue_from的应用微信-yangfansky ruby on rails 前端 javascript
job中discard_on，retry_on和rescue_from的应用#frozen_string_literal:trueclassOrdersRefundJob
阿里也出手了！十分钟接入Spring Cloud Alibaba AI 体验JAVA微服务AI人工智能，可接通义千问等模型， Java斌十分钟学会Java AI 人工智能 java 微服务
什么是SpringAISpringAI是从著名的Python项目LangChain和LlamaIndex中汲取灵感，它不是这些项目的直接移植，它的成立信念是，「下一波生成式人工智能应用程序将不仅适用于Python开发人员，而且将在许多编程语言中无处不在」。我们可以从SpringAI的官网描述中，总结出SpringAI的几个核心的关键词：提供抽象能力简化AI应用的开发模型与向量支持AI集成与自动配置
Raiden Network（一）—— Overview YzYzYzzzzz Raiden Network 区块链 Raiden Network
RaidenNetwork的优点：可扩展性：当前大多数区块链的容量都有固定或半固定的限制，而雷电网络的容量与参与者数量成正比快速地：可以在亚秒内确认转移私人的：个人转账不会出现在全球共享账本中可互操作：适用于任何遵循以太坊标准化令牌API(ERC20)的令牌低费用：转账费用可能比区块链低几个数量级小额付款：低交易费用允许有效地转移微小的价值RaidenNetwork的各种资料网址：RaidenNe
解密企业级大模型智能体Agentic AI 关键技术：MCP、A2A、Reasoning LLMs- GPT源代码解析大模型与Agent智能体 A2A MCP DeepSeek A2A MCP Manus ADK
解密企业级大模型智能体AgenticAI关键技术：MCP、A2A、ReasoningLLMs-GPT源代码解析我们可以稍微看一下，这是我们GPT的基于它的源代码产生的可视化的内容。这边是model，我们在谈这个sampling的时候，本身首先就是说它这个probabilitydistribution，会有很多的参数对它进行影响。例如temperature，如果你是hightemperature的话
【零基础学AI】第33讲：强化学习基础 - 游戏AI智能体 1989 0基础学AI 人工智能游戏 transformer 分类深度学习神经网络
本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI训练能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium(原OpenAIGym)NumPyMatplotlib推荐使用JupyterNotebook进行实验前置知识Python基础编程（第1-8讲）基本数学概念（函数、导数）神经网络基础（第23讲
【AI与数据管理】基于AI大模型的企业元数据管理方案暴躁小师兄数据学院人工智能 ai 语言模型
基于AI大模型的元数据关键解决方案元数据（metadata）是描述数据的数据，例如数据的来源、结构、类型和质量信息。它在数据管理、分析和应用中至关重要。随着人工智能（AI）大模型（如基于Transformer的模型）的发展，这些模型凭借其强大的自然语言处理、模式识别和生成能力，为元数据处理提供了高效、自动化的解决方案。下面，我将逐步解释基于AI大模型的元数据关键解决方案，帮助您理解核心方法、挑战和
【unity游戏开发入门到精通——通用篇】在 Unity 6 中轻松实现播放随机游戏音效——AudioRandomContainer音频随机容器的使用向宇it ##推荐100个unity插件 unity 游戏音视频游戏引擎 c#
考虑到每个人基础可能不一样，且并不是所有人都有同时做2D、3D开发的需求，所以我把【零基础入门unity游戏开发】分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。【C#篇】：主要讲解C#的基础语法，包括变量、数据类型、运算符、流程控制、面向对象等，适合没有编程基础的同学入门。【unity通用篇】：主要讲解unity的基础通用的知识，包括unity界面、unity脚本、unit
【人工智能之大模型】思维链（Chain of Thought，CoT）在大模型中是如何引导模型逐步推理的？ 985小水博一枚呀人工智能 pytorch 语言模型大模型
【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？文章目录【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？前言思维链（CoT）在大模型中的应用示例示例任务：应用思维链提示：模型输出：分析：思维
一张表就是一个智能业务系统，钉钉全新发布“AI表格” CSDN资讯钉钉人工智能
7月8日，钉钉全新发布AI表格，面向AI时代打造新应用的入口。在钉钉AI表格里，AI已成为原生能力，每一个单元格都是AI的入口，也是一个智能工作流。所有企业、用户都可以基于钉钉AI表格构建自己的业务系统，批量处理任务，让业务数据真正流动并产生价值。同时，钉钉AI表格创新推出“表格即文档”功能，首次将文档融入数据表。这意味着，表格每一行记录都是一个独立的文档，用户可以像平时写文档一样自由输入，查看信
一文读懂 AI 模型训练流程 AI赋能人工智能人工智能
一文读懂AI模型训练流程在当今数字化时代，AI技术发展得如火如荼，广泛应用于各个领域，而这背后离不开AI模型的训练。AI模型训练流程就像是一场精心策划的“智慧锻造之旅”，每一步都至关重要。今天，咱们就来深入了解一下这个神秘的过程。数据准备：夯实基础数据，堪称AI模型训练的“原材料”，其质量直接决定了最终模型的性能。这就好比建造一座高楼，只有用优质的砖块、钢筋等材料，才能让大楼稳固结实。数据收集我们
Android补全计划 TextView添加删除线、下划线、更新字体等效果 Greenland_12 Android补全计划 android
1可在布局中直接更新可在布局中直接更新的：加粗、斜体、字体;其中字体文件需要放在res/font/your_font.ttf下2java动态设置需动态设置的:删除线、下划线，加粗和字体也可动态设置，且需要放于app/src/main/assets/fonts/xxx.ttf下java中txt1=((TextView)findViewById(R.id.txt1));txt2=((TextView)
CosyVoice2.0整合包：免费一键启动，释放语音克隆的创意潜能 VXHAruanjian888 人工智能
引言语音克隆技术正在重塑内容创作与技术开发的边界，而CosyVoice2.0整合包以其简单易用和强大功能，成为语音合成领域的耀眼新星。无论你是短视频制作者、程序员，还是对AI语音技术感兴趣的探索者，这款完全免费的整合包都能让你轻松上手，体验专业级语音克隆的无限魅力。本文将详细介绍CosyVoice2.0整合包的特色、使用方法以及如何通过超链接免费下载，助你快速开启语音克隆的创意之旅！立即点击以下链
什么是智能体（Agent）？用什么都重名大模型相关人工智能 Agent 大模型
目录前言一、大语言模型1.什么是大语言模型？2.应用领域二、什么是Agent三、Agent核心特点1.感知能力2.规划能力3.行动能力4.记忆能力总结前言目前智能体市场正处于快速发展阶段，呈现出市场规模增长迅猛、应用领域广泛、竞争格局多元化等特点。基于此，让我们一起来学习一下何为智能体。一、大语言模型1.什么是大语言模型？大语言模型是一种采用大量数据进行训练的人工智能模型，主要用于理解和生成自然语
金山wps支持java接口开发吗_金山wps开放平台使用踩坑实录
使用接口/v1/3rd/file/info获取excel文件信息时，发生获取文件信息失败错误GetFileInfoFailed原因排查：一、开放平台没有回调到接口，原因是回调接口url被对接项目的登录过滤器拦截到，没有登录对接项目不让访问接口，但是对接项目返回的提示登录信息在wps平台没有显示，解决：将回调接口的url前缀添加到对接项目过滤器的例外url前缀配置列表中，不让登录过滤器拦截到，这样，
Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
【AI论文】Skywork-Reward-V2：通过人机协同实现偏好数据整理的规模化扩展
摘要：尽管奖励模型（RewardModels，RMs）在基于人类反馈的强化学习（ReinforcementLearningfromHumanFeedback，RLHF）中发挥着关键作用，但当前最先进的开源奖励模型在大多数现有评估基准上表现欠佳，无法捕捉人类复杂且微妙的偏好谱系。即便采用先进训练技术的方法也未能显著提升性能。我们推测，这种脆弱性主要源于偏好数据集的局限性——这些数据集往往范围狭窄、标
Springboot整合邮件发送（163邮箱为例）
一、添加spring-boot-starter-mailorg.springframework.bootspring-boot-starter-mail二、添加yml配置spring:mail:host:smtp.163.compassword:邮箱授权码不是密码username:163邮箱port:default-encoding:UTF-8protocol:smtpproperties:mai
数据库左连接、右连接、内连接、全连接 872792silence 数据库 mysql
在数据库增删改查中，数据通常不在同一张表中，涉及多表数据查询就需要表之间的连接方式，常用的数据库表连接方式有；1）内连接：innerjoin2）全连接：union3）右连接（右外连接）：rightjoin4）左连接（左外连接）：leftjoin例子：一、内连接内连接查询的是两张表（多表）的交集sql语句：select*fromAinnerjoinBonA.id=B.id也可以写成：select*f
数据标注问题【附解决方案】【持久更新】
视频转化错误对抽烟检测的数据准备标注，首先将视频进行转化，但是报错，尝试视频修复。1️⃣MP4Repair0.9.0FreeDownloadforWindowsDownloadMP4Repair0.9.0:ThisisawrapperorGUIarounduntrunc-w,theWindowsversionofuntrunc.UntruncisautilityforMP4videorepair.
Sider多模型AI助手平台深度评测：开发者高效编程的秘密武器梦玄海人工智能 copilot 自动化运维开源
一、为什么开发者需要多模型平台？当技术决策面临关键选择时：核心价值：避免被单一模型局限思维，通过横向对比获得最佳解决方案二、Sider核心功能全景图模块支持能力开发场景示例模型库GPT-4/Claude/Gemini/本地模型等`gitdiff智能编程实时补全/调试/注释生成VSCode中自动生成JSDoc文档处理PDF/Word/网页解析技术白皮书关键信息提取自动化定时任务+API集成每日自动生
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

如何增加ai虚拟聊天伴侣趣味性——OpenCV识别大量真实聊天图片采集高质量语料

你可能感兴趣的:(ai语料采集,人工智能)