iccool-cc

Python3 图片文字识别翻译——调用百度AI、百度翻译和有道翻译的API

文章目录

Python3 图片文字识别翻译——调用百度AI、百度翻译和有道翻译的API

一、演示
二、 API准备
三、图片文字识别——调用百度AI文字识别API
四、文字翻译

1. 百度翻译

请求
解析返回数据

2. 有道翻译(与百度翻译类似)

请求
解析返回数据

五、获取剪贴板的图片
六、程序界面设计
七、功能实现

1. 按照设计图填充控件

（1）窗体初始化
（2）主体框架
（3）左边Frame填充
（4）中间Frame填充
（5）右边Frame填充
（6）底部Frame填充

2. 补充——设置代理（存在问题）

（1）新建agent.py文件
（2）主窗体调用设置代理弹窗
（3）修改网络调用的函数（添加代理）

八、未解决的问题

如何保存代理配置？
界面控件问题
界面美化

参考

Python3 图片文字识别翻译——调用百度AI、百度翻译和有道翻译的API

一、演示

二、 API准备

百度AI
- 文字识别API
  
  获取文字识别应用的AppID、API KEY、Secret Key
百度翻译开放平台
- 百度翻译API
  
  加入百度翻译开放平台，获取百度翻译应用的APP ID、密钥
有道智云
- 有道翻译API
  
  获取有道翻译应用的APP ID、密钥

三、图片文字识别——调用百度AI文字识别API

阅读百度官方提供的API文档，图片的文字识别需要安装百度ai的包，pip install baidu-aip

获取连接client
读取图片
调用通用识别方法
接收返回结果
结果解析

# -*- coding: utf-8 -*-
__author__ = 'iccool'

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

""" 如果有可选参数 """
ai_options = {}
ai_options["language_type"] = "CHN_ENG"
ai_options["detect_direction"] = "true"
ai_options["detect_language"] = "true"
ai_options["probability"] = "true"

''' 获取百度api连接 '''
def getConnect(APP_ID, API_KEY, SECRET_KEY):
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    # client.setProxies(proxies)
    return client

''' 读取图片 '''
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()


""" 调用通用文字识别, 图片参数为本地图片 """
def ocr_image(client, image):
    message = client.basicGeneral(image, ai_options)
    return message

image = 'example.jpg'
client = getConnect(APP_ID, API_KEY, SECRET_KEY)
message = ocr_image(client, image)

""" 调用通用文字识别, 图片参数为本地图片 """
# client.basicGeneral(image)

""" 带参数调用通用文字识别, 图片参数为本地图片 """
# client.basicGeneral(image, options)

返回结果示例

{
"log_id": 2471272194,
"words_result_num": 2,
"words_result":
    [
        {"words": " TSINGTAO"},
        {"words": "青島睥酒"}
    ]
}

至此，简单版图片文字识别已完成，详细阅读官方文档

四、文字翻译

1. 百度翻译

百度翻译API

请求

通用翻译API HTTP地址：http://api.fanyi.baidu.com/api/trans/vip/translate

通用翻译API HTTPS地址：https://fanyi-api.baidu.com/api/trans/vip/translate

完整请求示例为：http://api.fanyi.baidu.com/api/trans/vip/translate?q=apple&from=en&to=zh&appid=2015063000000001&salt=1435660288&sign=f89f9594663708c1605f3d736d01d2d4

下面我们需要拼接这个url请求，官方解释如下：

q：请求翻译query，例如文字识别出的文字

注：若翻译多个单词或者多段文本，需要发送请求之前对q字段做URL encode，urllib.parse.quote(q)
from：翻译源语言，语言选择代码见官方文档，常见的有：auto-自动检测，zh-中文，en-英文
to：译文语言注：不可设置为auto
appid： APP ID
salt：随机数例如 salt = random.randint(1, 65536)

sign：签名 appid+q+salt+密钥的MD5值

def get_md5(data):
    sign = hashlib.md5(data.encode(encoding='UTF-8')).hexdigest()
    return sign
data = appID + q + str(salt) + secretKEY
sign = get_md5(data)

解析返回数据

返回示例

{
  "from": "en",
  "to": "zh",
  "trans_result": [
    {
      "src": "apple",
      "dst": "苹果"
    }
  ]
}

from	TEXT	翻译源语言
to	TEXT	译文语言
trans_result	MIXED LIST	翻译结果
src	TEXT	原文
dst	TEXT	译文

注：若返回的是response.text，在解析时，需要将字符串转化为json，json_result = json.loads(result)

至此，百度通用翻译已完成，详细阅读官方文档

2. 有道翻译(与百度翻译类似)

有道翻译API

请求

有道翻译API HTTP地址：http://openapi.youdao.com/api

有道翻译API HTTPS地址：https://openapi.youdao.com/api

完整请求示例为：http://openapi.youdao.com/api?q=good&from=EN&to=zh_CHS&appKey=ff889495-4b45-46d9-8f48-946554334f2a&salt=2&sign=1995882C5064805BC30A39829B779D7B

字段名	类型	含义	必填	备注
q	text	要翻译的文本	True	必须是UTF-8编码
from	text	源语言	True	语言列表 (可设置为auto)
to	text	目标语言	True	语言列表 (可设置为auto)
appKey	text	应用 ID	True	可在应用管理查看
salt	text	随机数	True
sign	text	签名，通过md5(appKey+q+salt+应用密钥)生成	True	appKey+q+salt+应用密钥的MD5值
ext	翻译结果音频格式，支持mp3	false	mp3
voice	翻译结果发音选择，0为女声，1为男声，默认为女声	false	0

* 来自官方文档

中英文语言代码：zh-CHS-中文，EN-英文，更多见支持语言表

具体请求操作与百度翻译类似，就不赘述了。

解析返回数据

官方示例如下：

{
  "errorCode":"0",
  "query":"good", //查询正确时，一定存在
  "translation": [ //查询正确时一定存在
      "好"
  ],
  "basic":{ // 有道词典-基本词典,查词时才有
      "phonetic":"gʊd"
      "uk-phonetic":"gʊd" //英式音标
      "us-phonetic":"ɡʊd" //美式音标
      "uk-speech": "XXXX",//英式发音
      "us-speech": "XXXX",//美式发音
      "explains":[
          "好处",
          "好的"
          "好"
      ]
  },
  "web":[ // 有道词典-网络释义，该结果不一定存在
      {
          "key":"good",
          "value":["良好","善","美好"]
      },
      {...}
  ]
  ],
  "dict":{
      "url":"yddict://m.youdao.com/dict?le=eng&q=good"
  },
  "webdict":{
      "url":"http://m.youdao.com/dict?le=eng&q=good"
  },
  "l":"EN2zh-CHS",
  "tSpeakUrl":"XXX",//翻译后的发音地址
  "speakUrl": "XXX" //查询文本的发音地址
}

与百度翻译类似，若返回的是response.text，需要将字符串转化为json

接下来就是根据需要，解析json从而获得想要的结果。

至此，有道通用翻译已完成，详细阅读官方文档

五、获取剪贴板的图片

from PIL import Image,ImageGrab

im = ImageGrab.grabclipboard()
if isinstance(im,Image.Image):
    pass

ImageGrab.grabclipboard() 获取剪贴板的快照对象，调用isinstance() 判断是否为图片。

如何将剪贴板的图片对象传入到百度文字识别函数中？

将读到的图片对象写入到内存字节缓冲区中，然后百度文字识别函数从内存字节缓冲区中读取到图片进行识别

# 获取剪贴板中的图片
def ocr_clipboard():
    # 获取剪切板对象
    im = ImageGrab.grabclipboard()
    # 如果是 Image对象
    if isinstance(im, Image.Image):
        # 写入到内存中
        mf = io.BytesIO()
        # 临时保存
        im.save(mf, 'PNG')
        # 将流位置初始化到0
        mf.seek(0)

以上，将mf对象传给百度文字识别函数

# 读取图片
def ocr(imagePath):
    # 如果读取的是截图 内存字节流
    if isinstance(imagePath,io.BytesIO):
        # 将流位置初识化到0
        imagePath.seek(0)
        # 读取图片内容
        image = imagePath.read()
    else:
        # 如果读到的本地图片地址 调用文件读取函数
        image = get_file_content(imagePath)

六、程序界面设计

感觉整个项目过程中，属图形界面最花时间，也是最让我烦恼的。不过说到底还是对tkinter不熟悉，需要用的时候都是现查。虽然之前做过一个小demo–天气查询，基础功能已实现，看起来很low。

初始设计图如下：

效果图如下(还存在一些问题)：

七、功能实现

1. 按照设计图填充控件

（1）窗体初始化

root = tk.Tk()
# 获取窗体大小
# root.winfo_height()
# root.winfo_width()
# 设置窗口标题 	TITLE	
root.title(TITLE)
# 获取屏幕分辨率
cx_screen = GetSystemMetrics(0)
cy_screen = GetSystemMetrics(1)
# 设置 窗口大小
window_width = cx_screen * 0.8
window_height = cy_screen * 0.7
# 设置窗口起始位置
window_start_x, window_start_y = 20, 20

root.geometry('%dx%d+%d+%d' % (window_width, window_height, window_start_x, window_start_y))
# 设置图标
root.iconbitmap('trans.ico')

（2）主体框架

'''
    左边的Frame  图片
    中间的Frame  控制区域    粘贴 浏览 识别  下拉列表  翻译按钮
    右边的Frame  上 显示识别出的文字  下 显示翻译出的结果
    底部的Frame  版权信息
'''
frm = tk.Frame(root)
frm_L = tk.Frame(frm)
frm_M = tk.Frame(frm)
frm_R = tk.Frame(frm)
frm_B = tk.Frame(frm)

frm_L.grid(column=0, row=0)
frm_M.grid(column=1, row=0)
frm_R.grid(column=2, row=0)

frm_B.grid(column=0, row=1,columnspan=3)

（3）左边Frame填充

# 左 Frame
# 默认的图片控件的长宽
w_box = window_width * 0.5
h_box = w_box


lef = tk.Label(frm_L, width=30, height=30,text='')
lef.grid(column=0, row=0, padx=10)

（4）中间Frame填充

# 中 Frame
# 按钮 粘贴
b_paste = ttk.Button(frm_M, text='粘贴', width=12, command=lambda: ocr_clipboard(frm_L, w_box, h_box))
b_paste.grid(column=0, row=0, pady=15)

# 按钮 浏览
b_scan = ttk.Button(frm_M, text='浏览', width=12, command=lambda: scan_image(frm_L, w_box, h_box))
b_scan.grid(column=0, row=1, pady=15)

# 按钮 识别  传入图片的地址
b_ocr = ttk.Button(frm_M, text="识别", width=12, command=lambda: ocr_image(imagePath))
b_ocr.grid(column=0, row=2, pady=15)

# 下拉选择  翻译软件
soft_str = tk.StringVar()
soft_chosen = ttk.Combobox(frm_M, width=10, textvariable=soft_str)
soft_chosen['value'] = ('百度翻译', '有道翻译')
soft_chosen.grid(column=0, row=3, pady=2)  # 设置其在界面中出现的位置  column代表列   row 代表行
soft_chosen.current(0)
soft_chosen.bind("<>", show_msg(soft_str))

# 下拉选择  互译
lang_str = tk.StringVar()
lang_chosen = ttk.Combobox(frm_M, width=10, textvariable=lang_str)
lang_chosen['value'] = ('英译中', '中译英')
lang_chosen.grid(column=0, row=4, pady=2)
lang_chosen.current(0)
lang_chosen.bind("<>", show_msg(lang_str))

# 按钮 翻译
b_trans = ttk.Button(frm_M, text='翻译', width=12, command=lambda: trans(soft_chosen.get(),lang_chosen.get(), label_ocr))
b_trans.grid(column=0, row=5, pady=15)

以上控件会涉及到一些函数

ocr_clipboard()

从剪贴板获取图片，第四章已经提到了，补充 图片自适应窗体大小

# 打开 内存字节流文件 图片
im_obj = Image.open(mf)
# 图片自适应
pil_image_resized = resize(w_box, h_box, im_obj)
# 将 缩放后的图片 传递给ImageTk
tkImage = ImageTk.PhotoImage(image=pil_image_resized, size=30)
# label显示图片
lb_image = tk.Label(frm_L, width=w_box, height=h_box, image=tkImage)
lb_image.grid(column=0, row=0, padx=10)

resize()

# 缩放图片
# 传入 图片控件的长宽和图片文件
def resize(w_box, h_box, pil_image):
    '''
    resize a pil_image object so it will fit into
    a box of size w_box times h_box, but retain aspect ratio
    对一个pil_image对象进行缩放，让它在一个矩形框内，还能保持比例
    '''
    # 获取图片的长宽
    w, h = pil_image.size
    # 获取 图片控件与原始图片的缩放比例
    f1 = 1.0 * w_box / w
    f2 = 1.0 * h_box / h
    # 比较 长宽  获取较小的值
    factor = min([f1, f2])
    # print(f1, f2, factor) # test
    # use best down-sizing filter
    width = int(w * factor)
    height = int(h * factor)
    # print(width,height)
    return pil_image.resize((width, height), Image.ANTIALIAS)

scan_image()

# 调用浏览文件函数
def scan_image(frm_L, w_box, h_box):
    # 打开文件
    imagePath = filedialog.askopenfilename()

    if imagePath.endswith(('.png', 'jpg', 'jpeg', '.bmp')):
        pilImage = Image.open(imagePath)
        # 图片自适应
        pil_image_resized = resize(w_box, h_box, pilImage)
        # 将 缩放后的图片 传递给tk
        tkImage = ImageTk.PhotoImage(image=pil_image_resized, size=30)
        # label显示图片
        lb_image = tk.Label(frm_L, width=w_box, height=h_box, image=tkImage)
        print(w_box,h_box)
        lb_image.grid(column=0, row=0, padx=10)
    else:
        # 注如果打开文件时  点击'取消'，返回 ''
        messagebox.showinfo(title='警告', message='请重新选择图片文件')

ocr_image()

# 调用识别图片函数
def ocr_image(imagePath):
    text = ocr.ocr(imagePath)
    label_ocr.delete(1.0, tk.END)
    label_ocr.insert(1.0, text)

ocr()

调用第二章中的百度图片文字识别

show_msg()

# 调用下拉框 返回下拉框选择值
def show_msg(obj):
    return obj.get()

trans()

# 调用翻译函数
def trans(soft,lang, label_ocr):
    text = ocr.translate(soft, lang, label_ocr.get('1.0', tk.END))
    label_trans.delete(1.0, tk.END)
    label_trans.insert('1.0', text)

translate()

调用第三章中的文字翻译函数

（5）右边Frame填充

# 右 Frame
global label_ocr
label_ocr = tk.Text(frm_R, width=60, height=8, state='normal')
label_ocr.grid(row=0, pady=10, padx=10)

global label_trans
label_trans = tk.Text(frm_R, width=60, height=8, state='normal')
label_trans.grid(row=1, pady=10, padx=10)

（6）底部Frame填充

# 底部 版权  COPYRIGHT
copy_right = tk.Label(frm_B,width=20,height=2,text=COPYRIGHT)
copy_right.grid(row=0,column=0)

2. 补充——设置代理（存在问题）

在调用识别、翻译时都是需要网络的，在特殊情况下，本地网络需要走代理，这时需要灵活地设置代理功能。想法是设计一个类似微信客户端的代理设置界面(弹窗设置)。

整体效果：

（1）新建agent.py文件

import tkinter as tk
from tkinter import ttk

# 设置代理 弹窗
class MyAgentDialog(tk.Toplevel):
    def __init__(self):
        super().__init__()
        self.title('设置代理信息')
        # 弹窗界面
        self.setup_UI()
        self.agent_info = None

    def setup_UI(self):
        # 顶部 Frame
        frm_T = tk.Frame(self)
        frm_T.grid(column=0,row=0,padx=10)

        ttk.Label(frm_T, text='使用代理').grid(column=0, row=0, pady=15)
        self.radVar = tk.IntVar()
        r_no_use = tk.Radiobutton(frm_T, text='关闭', variable=self.radVar, value=0, command=lambda: self.close_agent())
        r_no_use.grid(column=1, row=0)
        r_use = tk.Radiobutton(frm_T, text='启用', variable=self.radVar, value=1, command=lambda: self.open_agent())
        r_use.grid(column=2, row=0)

        # 中部 Frame
        frm_M = tk.Frame(self)
        frm_M.grid(column=0, row=1, columnspan=3)

        ttk.Label(frm_M, text='地址 *').grid(column=0, row=0, pady=5, padx=10, sticky='W')
        self.s_addr = tk.StringVar()
        self.e_addr = tk.Entry(frm_M, textvariable=self.s_addr, state='disabled')
        self.e_addr.grid(column=1, row=0, columnspan=2, sticky='W,E')

        ttk.Label(frm_M, text='端口 *').grid(column=0, row=1, pady=5)
        self.s_port = tk.StringVar()
        self.e_port = tk.Entry(frm_M, textvariable=self.s_port, state='disabled')
        self.e_port.grid(column=1, row=1, columnspan=2)

        ttk.Label(frm_M, text='用户').grid(column=0, row=2, pady=5)
        self.s_user = tk.StringVar()
        self.e_user = tk.Entry(frm_M, textvariable=self.s_user, state='disabled')
        self.e_user.grid(column=1, row=2, columnspan=2)

        ttk.Label(frm_M, text='密码').grid(column=0, row=3, pady=5)
        self.s_passwd = tk.StringVar()
        self.e_passwd = tk.Entry(frm_M, show='*', textvariable=self.s_passwd, state='disabled')
        self.e_passwd.grid(column=1, row=3, columnspan=2)

        # 底部Frame
        frm_B = tk.Frame(self)
        frm_B.grid(column=0, row=5, columnspan=3)
        b_ok = ttk.Button(frm_B, text='确定', command=lambda: self.ok())
        b_ok.grid(column=0, row=0, pady=15, padx=30)
        b_cancel = ttk.Button(frm_B, text='取消', command=lambda: self.cancel())
        b_cancel.grid(column=1, row=0, pady=15, padx=10)

	# 关闭代理 Entry 不可编辑状态
    def close_agent(self):
        self.e_addr.config(state='disabled')
        self.e_port.config(state='disabled')
        self.e_user.config(state='disabled')
        self.e_passwd.config(state='disabled')
	# 开启代理 Entry 可编辑
    def open_agent(self):
        self.e_addr.config(state='normal')
        self.e_port.config(state='normal')
        self.e_user.config(state='normal')
        self.e_passwd.config(state='normal')
	# 确定按钮 Entry中的值
    def ok(self):
        self.agent_info = [self.s_addr.get(),self.s_port.get(),self.s_user.get(),self.s_passwd.get()]
        self.destroy()  # 销毁窗口

    def cancel(self):
        self.agent_info = None
        self.destroy()

（2）主窗体调用设置代理弹窗

主窗体添加设置代理按钮

# 底部 设置代理
b_proxy = ttk.Button(frm_M,text="设置代理", width=12, command=lambda: self.set_proxy())
b_proxy.grid(column=0,row=6)

set_proxy()

def set_proxy():
    # 接收返回数据
    agent = get_info()

get_info()

import agent
def get_info(self):
    # 导入agent.py中的类 MyAgentDialog
    inputDialog = agent.MyAgentDialog()
    inputDialog.setup_UI()
    # 等待窗口 destroy  返回数据
    inputDialog.wait_window()
    # 返回 agent数据
    return inputDialog.agent_info

（3）修改网络调用的函数（添加代理）

在百度识图和翻译调用函数中，需要传输代理参数。具体如何添加就不多讲了，

# proxies = set_proxy(agent)
# 调用百度文字识别client
# client.setProxies(proxies)
# 翻译调用请求
# response = requests.get(myurl, headers=headers, proxies=proxies)

set_proxy()

解析agent，获取addr,port,user,passwd即可，注proxies是字典类型

八、未解决的问题

如何保存代理配置？

重新打开程序的时候，代理设置就会被初始化（初始化代理状态是关闭）。

如果是读取配置文件，那么程序运行后会生成一个config文件；但初衷是只打包成一个exe文件，双击即可运行。

界面控件问题

程序初始运行，窗体如上图所示，左侧图片控件内容为空时，未加载指定大小，若插入图片后，左侧Frame会扩展为指定大小，中部和右侧Frame会向右移动，见第五章的程序界面设计效果图；而且底部Frame未显示，需要手动向下放大才能显示Label（Copyright）。不知如何解决，tkinter的窗口调试太麻烦了。

界面美化

界面如同90年代的Windows 98风格（笑哭），太丑了（无力吐槽）。

以上问题欢迎提供解决方案

参考

Python图像处理库PIL的ImageGrab模块介绍

python界面上的图片缩放，根据窗口大小

tkinter Combobox组件

获取屏幕及桌面大小

Python tkinter模块弹出窗口及传值回到主窗口操作详解

你可能感兴趣的:(Python)

【bug】 jetson上opencv无法录制h264本地视频 lxmyzzs bug opencv 音视频
在JetsonOrinNX上无法使用opencv直接录制h264/h265视频流（h264格式的视频流才能在浏览器播放）解决：软件编码：需要源码编译opencv1.环境准备pipuninstallopencv-pythonsudoaptinstallbuild-essentialcmakegitpython3-devpython3-numpy\libavcodec-devlibavformat-d
【详细解析！】Python语法基础小新在学习 python python 开发语言
python基础语法1.优先级：在运算代码的时候，我们优先级是先乘除后加减注意：1.1：在python中，2/3=0.666666而不是0；在python里面的相除就是数学意义上的相除1.2：某一个结果为1.666666666665，而不是667，是因为我们在编程里面是一般是没有四舍五入的概念的；这个结果我们在代码里面称之为浮点数.IEE745标准，在这套规则下，我们在内存中表示浮点数的时候，可能
Python 大数据分析（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/5058e6970bd2a8d818ecc1f7f8fef74a译者：飞龙协议：CCBY-NC-SA4.0第六章：第五章处理缺失值和相关性分析学习目标到本章结束时，你将能够：使用PySpark检测和处理数据中的缺失值描述变量之间的相关性计算PySpark中两个或多个变量之间的相关性使用PySpark创建相关矩阵在本章中，我们将使用Iris数据集处理
Python机器学习：从零基础到项目实战 Yuner2000 Python 机器学习人工智能
目录第一部分：思想与基石——万法归宗，筑基问道第1章：初探智慧之境——机器学习世界观1.1何为学习？从人类学习到机器智能1.2机器学习的“前世今生”：一部思想与技术的演进史1.3为何是Python？——数据科学的“通用语”1.4破除迷思：AI是“神”还是“器”？第2章：工欲善其事——Python环境与核心工具链2.1“乾坤在握”：Anaconda与JupyterNotebook的安装与配置2.2“
python里class转换_python实现class对象转换成json/字典的方法八决子 python里class转换
python实现class对象转换成json/字典的方法发布于2016-03-2808:05:44|153次阅读|评论:0|来源:网友投递Python编程语言Python是一种面向对象、解释型计算机程序设计语言，由GuidovanRossum于1989年底发明，第一个公开发行版发行于1991年。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，它能够把用其他语言制作的各种模块
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
【Python篇】Python基础——04day.Python中运算（简单部分，如果会的可以直接跳过）
文章目录前言一.运算符1.1算术运算符1.2比较运算符1.3逻辑运算符1.4赋值运算符1.5位运算符1.6身份运算符1.7成员运算符1.8三目运算符1.9优先级二.表达式2.1算术表达式2.2比较表达式2.3逻辑表达式2.4赋值表达式2.5成员表达式2.6身份表达式2.7三元表达式2.8函数调用表达式三.推导式3.1列表推导式3.2字典推导式3.3集合推导式总结前言这一章写的是在python中会用
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
OpenCV稠密光流法可直接运行的例程（python） indrrra opencv python 人工智能
#dense_optical_flow.pyimportcv2importnumpyasnpimportargparsedefdense_optical_flow(method,video_path,params=[],to_gray=False):#读取视频cap=cv2.VideoCapture(video_path)#读取第一帧ret,old_frame=cap.read()#创建HSV并使
分布式锁特点、以及用python3实现redis分布式锁数据知道 python3案例和总结分布式 redis 数据库 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录一、Redis分布式锁核心原理1.1Redis锁机制1.2锁释放二、基础实现代码2.1使用`redis-py`客户端2.2分布式锁类三、使用示例3.1基础锁操作3.2装饰器模式四、高级特性实现4.1Redlock算法（高可用方案）五、生产环境最佳实践5.1锁粒度控制5.2异常处理5.3监控与调试5.4重试机制六、测试代码6.1并发测试6
php、go、python后端接口签名实现奇华智能后台开发 linux 签名接口安全
1.php实现/**生成签名，$args为请求参数，$key为私钥*/functionmakeSignature($args,$key){if(isset($args['sign'])){$oldSign=$args['sign'];unset($args['sign']);}else{$oldSign='';}ksort($args);$requestString='';foreach($arg
python第一次作业
1.技术面试题（1）TCP与UDP的区别是什么？**答：1.TCP是面向连接的协议，而UDP是元连接的协议2.TCP协议传输是可靠的，而UDP协议的传输是“尽力而为3.TCP是可以实现流控，而UDP不行4.TCP可以实现分段，而UDP不行5.TCP的传输速率较慢，占用资源较大，UDP传输速率快，占用资源小。TCP/UDP的应用场景不同TCP适合可靠性高的效率要求低的，UDP可靠性低，效率高。（2）
python www_hhhhhhh python java 面试
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程：是操作系统进行资源分配的基本单位，拥有独立的地址空间、进程控制块，每个进程之间相互隔离。例如，打开一个终端窗口会启动一个bash进程。线程：是操作系统调度的基本单位，隶属于进程，共享进程的资源，但有独立的线程控制块和栈。线程切换开销远小于进程。例如，一个Web服务器的单个进程中，多个线程可同时处理不同客户
Python lambda表达式：匿名函数的适用场景与限制梦幻南瓜 python python 服务器 linux
目录1.Lambda表达式概述1.1Lambda表达式的基本语法1.2简单示例2.Lambda表达式的核心特点2.1匿名性2.2简洁性2.3即时性2.4函数式编程特性3.Lambda表达式的适用场景3.1作为高阶函数的参数3.2简单的数据转换3.3条件筛选3.4GUI编程中的回调函数3.5Pandas数据处理4.Lambda表达式的限制4.1只能包含单个表达式4.2没有语句4.3缺乏文档字符串4.
【python】 www_hhhhhhh python 面试职场和发展
1.技术面试题（1）TCP与UDP的区别是什么？答：TCP（传输控制协议）和UDP（用户数据报协议）是两种常见的传输层协议，主要区别在于连接方式和可靠性。TCP是面向连接的协议，传输数据前需建立连接，通过三次握手确保连接可靠，传输过程中有确认、重传和顺序控制机制，保证数据完整、按序到达，适用于网页浏览、文件传输等对可靠性要求高的场景。UDP是无连接的协议，无需建立连接即可发送数据，不保证数据可靠传
Python函数的返回值
1.返回值定义及案例：2.返回值与print的区别：print仅仅是打印在控制台，而return则是将return后面的部分作为返回值作为函数的输出，可以用变量接走，继续使用该返回值做其它事。3.保存函数的返回值如果一个函数return返回了一个数据，那么想要用这个数据，那么就需要保存.#定义函数defadd2num(a,b): returna+b#调用函数，顺便保存函数的返回值result=
python怎么把函数返回值_python函数怎么返回值
python函数使用return语句返回“返回值”，可以将其赋给其它变量作其它的用处。所有函数都有返回值，如果没有return语句，会隐式地调用returnNone作为返回值。python函数使用return语句返回"返回值"，可以将其赋给其它变量作其它的用处。所有函数都有返回值，如果没有return语句，会隐式地调用returnNone作为返回值。一个函数可以存在多条return语句，但只有一条
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

Python3 图片文字识别翻译——调用百度AI、百度翻译和有道翻译的API

文章目录

Python3 图片文字识别翻译——调用百度AI、百度翻译和有道翻译的API

一、演示

二、 API准备

三、 图片文字识别——调用百度AI文字识别API

四、 文字翻译

1. 百度翻译

请求

解析返回数据

2. 有道翻译(与百度翻译类似)

请求

解析返回数据

五、 获取剪贴板的图片

六、程序界面设计

七、功能实现

1. 按照设计图填充控件

（1）窗体初始化

（2）主体框架

（3）左边Frame填充

（4）中间Frame填充

（5）右边Frame填充

（6）底部Frame填充

2. 补充——设置代理（存在问题）

（1）新建agent.py文件

（2）主窗体调用设置代理弹窗

（3）修改网络调用的函数（添加代理）

八、未解决的问题

如何保存代理配置？

界面控件问题

界面美化

参考

你可能感兴趣的:(Python)

三、图片文字识别——调用百度AI文字识别API

四、文字翻译

五、获取剪贴板的图片