baiyu33

小游戏和GUI编程(7) | SimpleNN 界面源码解析

0. 简介

SimpleNN 是 AdamYuan 在高中一年级时用 1 天时间写出来的简易 CNN, 使用 SFML 做 UI, 用于交互式输入手写数字，这个数字被训练好的 CNN 网络执行推理得到识别结果, 它的运行效果如下：

这一篇我们来分析 UI 界面的代码, 规划如下:

完成本地构建 (预计5分钟)
确定和粗读 UI 代码 (预计30分钟)
拆解 UI 部件和自行重新实现 (预计2小时)

实际用时: 10:40~14:30

1. 完成本地构建: 添加 CMakeLists.txt

原版代码使用 Makefile，其中添加了 -std=c++11, 换了 g++ 为 clang++，我是在 macOS 下:

all: MnistTrainer MnistUI MnistTest
MnistTrainer: mnist_trainer.cpp */*.hpp */*.cpp
	clang++ -std=c++11 mnist_trainer.cpp */*.cpp -Ofast -o MnistTrainer -lm -lpthread
MnistUI: mnist_ui.cpp NN/NN.* NN/Util.hpp MNIST/Util.hpp
	clang++ -std=c++11 mnist_ui.cpp NN/NN.cpp -Ofast -o MnistUI -lm -lsfml-system -lsfml-window -lsfml-graphics
MnistTest: mnist_test.cpp NN/NN.* MNIST/Loader.* NN/Util.hpp MNIST/Util.hpp
	clang++ -std=c++11 mnist_test.cpp NN/NN.cpp MNIST/Loader.cpp -Ofast -o MnistTest -lm

为什么不用 Makefile: 因为 makefile 没有内置的包管理器， pkg-config 配置多个包的话感觉很麻烦. 使用 CMake 稍微缓解一些。

找到了 3 个 main( 函数，和 makefile 里的 3 个 target 对应：

➜  SimpleNN git:(master) ✗ ag 'main\(' --ignore-dir build
mnist_ui.cpp
113:int main(int argc, char **argv)

mnist_test.cpp
6:int main(int argc, char **argv)

mnist_trainer.cpp
7:int main(int argc, char **argv)

对于 UI 界面显示，不需要 mnist_trainer.cpp 和 mnist_test.cpp, 因此写出 CMakeLists.txt:

cmake_minimum_required(VERSION 3.20)
project(SimpleNN)

set(CMAKE_CXX_STANDARD 11)

add_executable(MnistUI
    mnist_ui.cpp
    MNIST/Loader.cpp
    NN/NN.cpp
    NN/Trainer.cpp
)
find_package(SFML 2.6 COMPONENTS system window graphics REQUIRED)
target_link_libraries(MnistUI PRIVATE
    pthread
    sfml-system
    sfml-window
    sfml-graphics
)

为了后续源码分析和测试方便，再增加一个 MnistUI_my 的可执行文件目标:

add_executable(MnistUI_my
    mnist_ui_my.cpp
    MNIST/Loader.cpp
    NN/NN.cpp
    NN/Trainer.cpp
)
target_link_libraries(MnistUI_my PRIVATE
    pthread
    sfml-system
    sfml-window
    sfml-graphics
)

2. 确定和粗读 UI 代码

拆解为：确定 UI 相关的代码文件；粗略分析 UI 代码组成部分.

涉及的文件:

mnist_ui.cpp : UI 代码, 170 行
ui/VCR_OSD_MONO_1.001.ttf : 字体文件

下面是 mnist_ui.cpp 的简单解读：

2.1 通过命令行参数传入网络文件

使用了全局变量 snn，从传入的参数表示的文件来加载 cnn 网络相关的内容：

SimpleNN snn;

int main(int argc, char **argv)
{
	if(argc != 2)
	{
		printf("Usage: ./MnistUI [snn filename]\n");
		return EXIT_FAILURE;
	}

	snn.Load(argv[1]);
    ...
}

2.2 UI 整体代码逻辑

	InitWindow(); // 窗口部件的创建、 布局的设定
	Clear(); // 设定鼠标绘制区域的颜色

    while(window.isOpen())
    {
        while(window.pollEvent(event))
        {
            // 事件处理
        }

        // 如果鼠标左键按下了， 那么渲染鼠标的轨迹
		if(mouse_down)
			Paint();
        
        window.draw(paint_sprite);

        // 渲染输入纹理
        window.draw(input_sprite);

        // 渲染输出纹理
        window.draw(output_sprite);

        // 渲染输出数字纹理
        window.draw(output_digits_sprite);

        // 渲染鼠标为圆形
        Cursor();

        window.display(); // 绘制
    }

3. 详细解读

这一节是通过拆解 UI 代码的部件，对每个部件进行代码粗略分析，并摘录出用到的代码到单独的文件 Mnist_UI_my.cpp 中验证效果.

3.1 窗口部件、布局

整体布局

这一小节，需要看的是 InitWindow() 函数，以及 main() 函数里 window.draw() 相关的几句调用。

在 InitWindow() 里, 设置了各个部件的大小：

paint_tex: 560x560的方格, main()中创建了它的匿名 Sprite 并且没设置位置，因此位置是默认的 (0,0)，也就是整个窗口左边一半

window.draw(sf::Sprite(paint_tex.getTexture()));

input_tex: 和 paint_tex 大小一致，结合 main() 里的代码，是位于窗口右侧

sf::Sprite input_sprite{input_tex.getTexture()};
input_sprite.setPosition(kSize, 0);
window.draw(input_sprite);

output_tex: 56x560的竖条，结合 main() 里的代码，是位于整个窗口最右侧

sf::Sprite output_sprite{output_tex.getTexture()};
output_sprite.setPosition(kSize*2, 0);
window.draw(output_sprite);

InitWindow() 详细注释

void InitWindow()
{
	window.create(sf::VideoMode(kSize*2 + kOutSize, kSize), "Mnist Demo", sf::Style::Titlebar | sf::Style::Close);
	paint_tex.create(kSize, kSize); // kSize=20*28, 这是560x560方形纹理
	input_tex.create(kSize, kSize);
	output_tex.create(kOutSize, kSize); // kOutSize=kSize/10=2*28=56, 56x560的大小
	output_digits_tex.create(kOutSize, kSize); // 56x560的大小， 是一个竖条形状

	sf::Font font; font.loadFromFile("./ui/VCR_OSD_MONO_1.001.ttf");
	sf::Text text; 
	text.setFont(font); text.setCharacterSize(kOutSize);
	text.setFillColor(sf::Color(0, 0, 0, 255));
    // 竖条分成 10 部分， 每个部分是 56x56 的方格， 每个方格绘制一个数字
	for(unsigned i = 0; i < 10; ++i)
	{
		text.setPosition(0, i * kOutSize);
		text.setString(std::to_string(i));
		output_digits_tex.draw(text);
	}
	output_digits_tex.display();

    // sf::CircleShape brush_circle, cursor_circle; 这里猜测是鼠标绘制时， 鼠标自身 以及 刷子 的形状
	brush_circle.setFillColor(sf::Color(0, 0, 0));
	cursor_circle.setFillColor(sf::Color(0, 0, 0, 100));
	brush_circle.setRadius(radius);
	cursor_circle.setRadius(radius);

    // sf::RectangleShape input_rect, output_rect;  这里暂时没看出来用途。
	input_rect.setSize(sf::Vector2f(kGridSize, kGridSize)); //20x20
	output_rect.setSize(sf::Vector2f(kOutSize, kOutSize)); //56x56
}

Clear()函数

void Clear()
{
	paint_tex.clear(sf::Color(255, 255, 255));
}

Clear() 把屏幕左侧的 paint_tex 区域背景颜色设定为白色.

完整代码

这里说的完整代码，是把刚刚分析的代码摘录出来，放到 Mnist_UI_my.cpp 里，并编译运行

#include 

sf::RenderWindow window;
sf::Event event;

constexpr int kGridSize = 20, kSize = 28*kGridSize, kOutSize = kSize / 10;
constexpr float kMinRadius = 8.0, kMaxRadius = 30.0, kRadiusStep = 1.0;

sf::RenderTexture paint_tex, input_tex, output_tex, output_digits_tex;
float radius{(kMinRadius + kMaxRadius) * 0.5f};
sf::CircleShape brush_circle, cursor_circle;
sf::RectangleShape input_rect, output_rect;

void InitWindow()
{
	window.create(sf::VideoMode(kSize*2 + kOutSize, kSize), "Mnist Demo", sf::Style::Titlebar | sf::Style::Close);
	paint_tex.create(kSize, kSize);
	input_tex.create(kSize, kSize);
	output_tex.create(kOutSize, kSize);
	output_digits_tex.create(kOutSize, kSize);

    const std::string asset_dir = "../";
	sf::Font font; font.loadFromFile(asset_dir+"/ui/VCR_OSD_MONO_1.001.ttf");
	sf::Text text; 
	text.setFont(font); text.setCharacterSize(kOutSize);
	text.setFillColor(sf::Color(0, 0, 0, 255));
	for(unsigned i = 0; i < 10; ++i)
	{
		text.setPosition(0, i * kOutSize);
		text.setString(std::to_string(i));
		output_digits_tex.draw(text);
	}
	output_digits_tex.display();

	brush_circle.setFillColor(sf::Color(0, 0, 0));
	cursor_circle.setFillColor(sf::Color(0, 0, 0, 100));
	brush_circle.setRadius(radius);
	cursor_circle.setRadius(radius);

	input_rect.setSize(sf::Vector2f(kGridSize, kGridSize));
	output_rect.setSize(sf::Vector2f(kOutSize, kOutSize));
}

void Clear()
{
	paint_tex.clear(sf::Color(255, 255, 255));
}

int main()
{
    InitWindow();
    Clear();
    while(window.isOpen())
    {
        while(window.pollEvent(event))
        {
            if(event.type == sf::Event::EventType::Closed)
            {
                window.close();
            }
        }

        sf::Sprite paint_sprite{paint_tex.getTexture()};
        auto paint_sprite_position = paint_sprite.getPosition();
        printf("paint_sprite_position: %f, %f\n", paint_sprite_position.x, paint_sprite_position.y);
        window.draw(sf::Sprite(paint_tex.getTexture()));

		sf::Sprite input_sprite{input_tex.getTexture()};
		input_sprite.setPosition(kSize, 0);
		window.draw(input_sprite);

		sf::Sprite output_sprite{output_tex.getTexture()};
		output_sprite.setPosition(kSize*2, 0);
		window.draw(output_sprite);

		sf::Sprite output_digits_sprite{output_digits_tex.getTexture()};
		output_digits_sprite.setPosition(kSize*2, 0);
		window.draw(output_digits_sprite);

        window.display();
    }

    return 0;
}

由于省略了 event 的处理，鼠标事件自然是没有响应的，界面非常枯燥，看起来只有左右的白色、黑色两个部分：

3.2 paint 区域的显示和清理

需要先开启鼠标和键盘事件的处理，然后再启用 paint_tex 的绘制。

处理鼠标事件

main() 函数里处理鼠标事件：

while(window.pollEvent(event))
{
    ...
    if(event.type == sf::Event::EventType::MouseButtonPressed)
        mouse_down = true;
    if(event.type == sf::Event::EventType::MouseButtonReleased)
        mouse_down = false;
}
if(mouse_down)
    Paint();

处理键盘事件

main() 函数中处理键盘事件：如果用户按下了空格键，那么调用 Clear() 函数来把左侧输入区域显示的内容清空：

while(window.pollEvent(event))
{
    ...
    if(event.type == sf::Event::EventType::KeyReleased 
            && event.key.code == sf::Keyboard::Space)
    {
        // window.setTitle("Recognize: " + std::to_string(Recognize())); 目前不需要调用 Recognize函数，先注释掉
        Clear();
    }
}

由于 Clear() 本身是一个不复杂的函数调用，仅仅是把 input_tex 这个纹理的颜色设定为白色。如果是稍微耗时一些的任务，通常是在事件处理函数的地方做判断，在外部处理。

void Clear()
{
	paint_tex.clear(sf::Color(255, 255, 255));
}

绘制 paint 区域

调用的 Paint() 函数是本小节的关键

void Paint()
{
    // 获取鼠标在窗口 window 内的位置
	sf::Vector2i xy = sf::Mouse::getPosition(window);
    // 如果鼠标坐标在窗口内部
	if(xy.x >= 0 && xy.x < kSize && xy.y >= 0 && xy.y < kSize)
	{
        // 如果鼠标不在左侧的 input_tex 范围， 那么就做 clip
		int x = std::max(0, std::min(xy.x, kSize)) - radius;
        // 在纵向方向上， 也做了 clip， 因此如果打算在界面布局上再增加底栏，也是能处理鼠标在 input_tex 的显示的
        int y = std::max(0, std::min(xy.y, kSize)) - radius;
        // 设置笔刷的坐标
		brush_circle.setPosition(x, y);
        // 在 paint_tex 上绘制笔刷
		paint_tex.draw(brush_circle);
	}
	paint_tex.display();
}

其中存在 sf::CirleShape -> sf::Texture 的对象“存放”关系：把一个 shape 存放到一个 texture 中。
而在 main() 中则进一步做了 sf::Texture -> sf::Sprite 的处理：

window.draw(sf::Sprite(paint_tex.getTexture()));

在官方教程 https://www.sfml-dev.org/tutorials/2.6/graphics-sprite.php 里给出了解释：

Most (if not all) of you are already familiar with these two very common objects, so let’s define them very briefly.

A texture is an image. But we call it “texture” because it has a very specific role: being mapped to a 2D entity.

A sprite is nothing more than a textured rectangle.

纹理(texture)是一幅图像(image)。但我们称它为 texture，因为它有一个非常具体的作用：被映射到一个2D实体上。

精灵(sprite)只不过是一个带有纹理的矩形.

为什么使用 texture + sprite，而不是 RectangleShape?

从 SFML 的代码层更容易理解： window.draw() 我们目前写过的代码，主要是绘制形状，也绘制过顶点 sf::Vertex. 对于绘制形状：

class Window
{
public:
    ...
    void draw(const Drawable& drawable, const RenderStates& states = RenderStates::Default);
};

因此，如果要绘制 texture，就需要让 texture 继承自 sf::Drawable. 但是 sf::Texture 和 sf::RenderTexture 都没有继承自 sf::Drawable:

class SFML_GRAPHICS_API Texture : GlResource
{
    ...
};
class SFML_GRAPHICS_API RenderTexture : public RenderTarget
{
    ...
};

而 sf::Sprite 则是继承了 sf::Drawable, 并且能从 sf::Texture 创建对象：

class SFML_GRAPHICS_API Sprite : public Drawable, public Transformable
{
public:
    explicit Sprite(const Texture& texture); // 从整个 texture 创建 sprite
    Sprite(const Texture& texture, const IntRect& rectangle); // 从 ROI 创建 sprite
    ...
};

因此，目前遇到的三种绘制方式：

sf::CircleShape -> window.draw(circle)
sf::Vertex -> window.draw(vertex, 2, sf::Lines)
sf::CirleShape -> sf::Texture -> sf::Sprite -> window.draw(sprite)

第三种方式中的 Sprite 是为了承载 Texture, 那么 Texture 是为了什么呢？准确的说，是 sf::RenderTexture 对象的 .getTexture() 方法返回的 sf::Texture 对象：

sf::RenderTexture paint_tex, input_tex, output_tex, output_digits_tex;

...

sf::Sprite input_sprite{input_tex.getTexture()};
input_sprite.setPosition(kSize, 0);
window.draw(input_sprite);

而 sf::RenderTexture 和 sf::Texture 没有直接的继承关系:

class SFML_GRAPHICS_API RenderTexture : public RenderTarget
{
    ...
};

对于 input_tex 这个 sf::RenderTexture 来说，它仅仅是被创建 (.create()), 然后就没有主动调用什么方法了； input_sprite 则是对它设定了位置：

input_tex.create(kSize, kSize);

sf::Sprite input_sprite{input_tex.getTexture()};
input_sprite.setPosition(kSize, 0);
window.draw(input_sprite);

为什么能设定位置？因为 sf::Sprite 继承了 Transformable 类:

class SFML_GRAPHICS_API Sprite : public Drawable, public Transformable

看起来好像用 sf::RectangleShape 也能完成同样功能， GPT4 给的解释是：

复杂度增加：与直接使用sf::RectangleShape相比，从 texture 到 sprite 的方法在实现上更加复杂。你需要处理纹理的加载和管理，以及精灵的创建和属性设置。
资源管理：使用 texture 和 sprite 可能需要更多的注意力来管理资源，比如确保纹理在使用前已经正确加载，以及在不再需要时释放资源。

sf::Texture 这个纹理数据是被上传到 GPU 显存中， GPU 处理的速度快；如果有多个 sf::Sprite 实例共享使用同一个 texture，那么不需要重新上传，只需要上传一次，减少了显存使用和数据传输的开销。

完整的代码

把用到的代码抽取出来，放到 Mnist_UI_my.cpp 中，本节的代码能够在左侧区域中，使用鼠标绘制，使用空格键清理:

#include 

sf::RenderWindow window;
sf::Event event;

constexpr int kGridSize = 20, kSize = 28*kGridSize, kOutSize = kSize / 10;
constexpr float kMinRadius = 8.0, kMaxRadius = 30.0, kRadiusStep = 1.0;

sf::RenderTexture paint_tex, input_tex, output_tex, output_digits_tex;
float radius{(kMinRadius + kMaxRadius) * 0.5f};
sf::CircleShape brush_circle, cursor_circle;
sf::RectangleShape input_rect, output_rect;

void InitWindow()
{
	window.create(sf::VideoMode(kSize*2 + kOutSize, kSize), "Mnist Demo", sf::Style::Titlebar | sf::Style::Close);
	paint_tex.create(kSize, kSize);
	input_tex.create(kSize, kSize);
	output_tex.create(kOutSize, kSize);
	output_digits_tex.create(kOutSize, kSize);

    const std::string asset_dir = "../";
	sf::Font font; font.loadFromFile(asset_dir+"/ui/VCR_OSD_MONO_1.001.ttf");
	sf::Text text; 
	text.setFont(font); text.setCharacterSize(kOutSize);
	text.setFillColor(sf::Color(0, 0, 0, 255));
	for(unsigned i = 0; i < 10; ++i)
	{
		text.setPosition(0, i * kOutSize);
		text.setString(std::to_string(i));
		output_digits_tex.draw(text);
	}
	output_digits_tex.display();

	brush_circle.setFillColor(sf::Color(0, 0, 0));
	cursor_circle.setFillColor(sf::Color(0, 0, 0, 100));
	brush_circle.setRadius(radius);
	cursor_circle.setRadius(radius);

	input_rect.setSize(sf::Vector2f(kGridSize, kGridSize));
	output_rect.setSize(sf::Vector2f(kOutSize, kOutSize));
}

void Clear()
{
	paint_tex.clear(sf::Color(255, 255, 255));
}

void Paint()
{
	sf::Vector2i xy = sf::Mouse::getPosition(window);
	if(xy.x >= 0 && xy.x < kSize && xy.y >= 0 && xy.y < kSize)
	{
		int x = std::max(0, std::min(xy.x, kSize)) - radius, y = std::max(0, std::min(xy.y, kSize)) - radius;
		brush_circle.setPosition(x, y);
		paint_tex.draw(brush_circle);
	}
	paint_tex.display();
}

int main()
{
    InitWindow();
    Clear();

    bool mouse_down = false;
    while(window.isOpen())
    {
        while(window.pollEvent(event))
        {
            if(event.type == sf::Event::EventType::Closed)
            {
                window.close();
            }
			if(event.type == sf::Event::EventType::KeyReleased 
					&& event.key.code == sf::Keyboard::Space)
			{
				//window.setTitle("Recognize: " + std::to_string(Recognize()));
				Clear();
			}
			if(event.type == sf::Event::EventType::MouseButtonPressed)
				mouse_down = true;
			if(event.type == sf::Event::EventType::MouseButtonReleased)
				mouse_down = false;
        }
		if(mouse_down)
			Paint();

        sf::Sprite paint_sprite{paint_tex.getTexture()};
        auto paint_sprite_position = paint_sprite.getPosition();
        printf("paint_sprite_position: %f, %f\n", paint_sprite_position.x, paint_sprite_position.y);
        window.draw(sf::Sprite(paint_tex.getTexture()));

		sf::Sprite input_sprite{input_tex.getTexture()};
		input_sprite.setPosition(kSize, 0);
		window.draw(input_sprite);

		sf::Sprite output_sprite{output_tex.getTexture()};
		output_sprite.setPosition(kSize*2, 0);
		window.draw(output_sprite);

		sf::Sprite output_digits_sprite{output_digits_tex.getTexture()};
		output_digits_sprite.setPosition(kSize*2, 0);
		window.draw(output_digits_sprite);

        window.display();
    }

    return 0;
}

3.3 显示 input 纹理

所谓 input 纹理，说的是把窗口左侧的 paint 区域得到的内容，做处理后，能够作为 cnn 网络输入的时候（或者之前一点点），这个处理过的输入是什么样子。换言之，是 CNN 网络看到的图像对应的纹理，我们对它做一个可视化。可视化的时候，为了看的清楚，肯定不是 28x28 那么小的输入，但是 cnn 网络的输入大概是 28x28 的大小。

本小节我们只关注 input 区域的显示，不关注 cnn 网络的推理，因此需要展开 Recognize() 函数的大部分，但也略去其中 snn 对象的 evaluate() 等方法的调用，也就省略了最终预测结果中的数字的显示。

从键盘事件到Recognize

回顾 main() 中的键盘处理：

			if(event.type == sf::Event::EventType::KeyReleased 
					&& event.key.code == sf::Keyboard::Space)
			{
				window.setTitle("Recognize: " + std::to_string(Recognize()));
				Clear();
			}

按下空格键后会执行 Recognize()

Recognize()浅析

Recognize() 函数，将 paint_tex 区域手绘的内容，拷贝一份独立的图像，并将每个 20x20 大小的网格“捏成一个像素”，捏的手法类似于 area resize / average pooling, 但是原始像素被 0/1 二值化处理了，因此相当于先做阈值为 1 的二值化，然后做 area resize，得到了 28x28=764 大小的一维数组 nn_input，每个元素是 [0, 1] 范围的浮点数。

对于 nn_input 每个元素，为了在 input_tex 显示，让每个像素映射到 [0, 255] 范围整数，并且 ”填充“ 到 20x20 的区域，这和原本的 "捏” 动作相反，但是由于“捏”的过程中已经做了二值化处理，因此现在 “填充” 回去的时候，效果是 “像素化” 的。

width_normalize() 函数意义不明，先注释掉。

至于 snn 网络的推理，现在先把代码注释掉。

unsigned Recognize()
{
    // 根据 paint 区域绘制的纹理， 创建独立的图像拷贝
	sf::Image img{paint_tex.getTexture().copyToImage()};
    // 获取图像像素的 raw buffer
	const sf::Uint8 *ptr = img.getPixelsPtr();
    // 网络输入是 28x28=784 大小，float 类型
	std::vector<float> nn_input(784);
    // 将每个 grid 区域(kGridSize x kGridSize, 20x20) 捏成一个像素
	for(unsigned i = 0; i < 784; ++i)
	{
		float v = 0.0;
		unsigned gx = i % 28;
        unsigned gy = i / 28;
		unsigned px = gx * (kGridSize << 2);
        unsigned py = gy * kGridSize;
        // 对于每个 20x20 大小的方格， 如果不是 0，那么计数器加 1， 如果是 0 则计数器不变
		for(unsigned y = py; y < py + kGridSize; ++y)
        {
			for(unsigned x = px; x < px + (kGridSize << 2); x += 4)
            {
				v += float(ptr[y * (kSize << 2) + x] == 0);
            }
        }
        // 统计了 20x20 方格区域内非 0 元素数量 v， 数量 v 除以总数 20x20, 这个比值作为 28x28 网络输入的一个元素。
		nn_input[i] = v / float(kGridSize * kGridSize);
	}
	// width_normalize(&nn_input); 先不调用它，看是什么效果
	for(unsigned i = 0; i < 784; ++i)
	{
        // 把 nn_input[i], 从 [0, 1] 范围的浮点数转到 [0, 255] 范围的整数 c
        unsigned c = 255 * nn_input[i];
		c = std::min(c, 255u);

        // 在 20x20 的区域内， 绘制相同的颜色 c
		unsigned gx = i % 28;
        unsigned gy = i / 28;
		input_rect.setPosition(gx * kGridSize, gy * kGridSize);
		input_rect.setFillColor(sf::Color(c, c, c, 255));
		input_tex.draw(input_rect); // 在一个 texture 的 ROI 区域上进行绘制
		//putchar(nn_input[i] >= 0.25 ? (nn_input[i] >= 0.5 ? (nn_input[i] >= 0.75 ? '@' : '?') : '.') : ' ');
		//if(i % 28 == 27) putchar('\n');
	}
	input_tex.display(); // 更新 target texture 内容。 如果不调用，我观察到的是上下颠倒的内容

    // 先不看 output 的处理
#if 0
    {
        snn.Evaluate(nn_input);
        unsigned res = std::max_element(snn.GetOutput(), snn.GetOutput() + 10) - snn.GetOutput();
        for(unsigned i = 0; i < 10; ++i)
        {
            unsigned c = 255 * snn.GetOutput()[i];
            c = std::min(c, 255u);
            output_rect.setPosition(0, i * kOutSize);
            output_rect.setFillColor(sf::Color(c, c, c, 255));
            output_tex.draw(output_rect);
        }
        output_tex.display();
    }
#endif

	return 0;
}

补充说明 input_tex.display() 的调用：它是更新纹理绘制的内容，如果不调用，那么内容是 “垃圾值”，我在 M1 mac-mini 上的结果是，不调用它会得到上下颠倒的内容。

效果和代码

#include 

sf::RenderWindow window;
sf::Event event;

constexpr int kGridSize = 20, kSize = 28*kGridSize, kOutSize = kSize / 10;
constexpr float kMinRadius = 8.0, kMaxRadius = 30.0, kRadiusStep = 1.0;

sf::RenderTexture paint_tex, input_tex, output_tex, output_digits_tex;
float radius{(kMinRadius + kMaxRadius) * 0.5f};
sf::CircleShape brush_circle, cursor_circle;
sf::RectangleShape input_rect, output_rect;

void InitWindow()
{
	window.create(sf::VideoMode(kSize*2 + kOutSize, kSize), "Mnist Demo", sf::Style::Titlebar | sf::Style::Close);
	paint_tex.create(kSize, kSize);
	input_tex.create(kSize, kSize);
	output_tex.create(kOutSize, kSize);
	output_digits_tex.create(kOutSize, kSize);

    const std::string asset_dir = "../";
	sf::Font font; font.loadFromFile(asset_dir+"/ui/VCR_OSD_MONO_1.001.ttf");
	sf::Text text; 
	text.setFont(font); text.setCharacterSize(kOutSize);
	text.setFillColor(sf::Color(0, 0, 0, 255));
	for(unsigned i = 0; i < 10; ++i)
	{
		text.setPosition(0, i * kOutSize);
		text.setString(std::to_string(i));
		output_digits_tex.draw(text);
	}
	output_digits_tex.display();

	brush_circle.setFillColor(sf::Color(0, 0, 0));
	cursor_circle.setFillColor(sf::Color(0, 0, 0, 100));
	brush_circle.setRadius(radius);
	cursor_circle.setRadius(radius);

	input_rect.setSize(sf::Vector2f(kGridSize, kGridSize));
	output_rect.setSize(sf::Vector2f(kOutSize, kOutSize));
}

void Clear()
{
	paint_tex.clear(sf::Color(255, 255, 255));
}

void Paint()
{
	sf::Vector2i xy = sf::Mouse::getPosition(window);
	if(xy.x >= 0 && xy.x < kSize && xy.y >= 0 && xy.y < kSize)
	{
		int x = std::max(0, std::min(xy.x, kSize)) - radius, y = std::max(0, std::min(xy.y, kSize)) - radius;
		brush_circle.setPosition(x, y);
		paint_tex.draw(brush_circle);
	}
	paint_tex.display();
}

unsigned Recognize()
{
	sf::Image img{paint_tex.getTexture().copyToImage()};
	const sf::Uint8 *ptr = img.getPixelsPtr();
	std::vector<float> nn_input(784);
	for(unsigned i = 0; i < 784; ++i)
	{
		float v = 0.0;
		unsigned gx = i % 28, gy = i / 28;
		unsigned px = gx * (kGridSize << 2), py = gy * kGridSize;
		for(unsigned y = py; y < py + kGridSize; ++y)
			for(unsigned x = px; x < px + (kGridSize << 2); x += 4)
				v += float(ptr[y * (kSize << 2) + x] == 0);
		nn_input[i] = v / float(kGridSize * kGridSize);
	}
	// width_normalize(&nn_input);
	for(unsigned i = 0; i < 784; ++i)
	{
		unsigned gx = i % 28, gy = i / 28, c = 255 * nn_input[i];
		c = std::min(c, 255u);
		input_rect.setPosition(gx * kGridSize, gy * kGridSize);
		input_rect.setFillColor(sf::Color(c, c, c, 255));
		input_tex.draw(input_rect);
		//putchar(nn_input[i] >= 0.25 ? (nn_input[i] >= 0.5 ? (nn_input[i] >= 0.75 ? '@' : '?') : '.') : ' ');
		//if(i % 28 == 27) putchar('\n');
	}
	input_tex.display(); // 更新 target texture 内容。 如果不调用，我观察到的是上下颠倒的内容

#if 0
    {
        snn.Evaluate(nn_input);
        unsigned res = std::max_element(snn.GetOutput(), snn.GetOutput() + 10) - snn.GetOutput();
        for(unsigned i = 0; i < 10; ++i)
        {
            unsigned c = 255 * snn.GetOutput()[i];
            c = std::min(c, 255u);
            output_rect.setPosition(0, i * kOutSize);
            output_rect.setFillColor(sf::Color(c, c, c, 255));
            output_tex.draw(output_rect);
        }
        output_tex.display();
    }
#endif

	return 0;
}

int main()
{
    InitWindow();
    Clear();

    bool mouse_down = false;
    while(window.isOpen())
    {
        while(window.pollEvent(event))
        {
            if(event.type == sf::Event::EventType::Closed)
            {
                window.close();
            }
			if(event.type == sf::Event::EventType::KeyReleased 
					&& event.key.code == sf::Keyboard::Space)
			{
				window.setTitle("Recognize: " + std::to_string(Recognize()));
				Clear();
			}
			if(event.type == sf::Event::EventType::MouseButtonPressed)
				mouse_down = true;
			if(event.type == sf::Event::EventType::MouseButtonReleased)
				mouse_down = false;
        }
		if(mouse_down)
			Paint();

        sf::Sprite paint_sprite{paint_tex.getTexture()};
        auto paint_sprite_position = paint_sprite.getPosition();
        printf("paint_sprite_position: %f, %f\n", paint_sprite_position.x, paint_sprite_position.y);
        window.draw(sf::Sprite(paint_tex.getTexture()));

		sf::Sprite input_sprite{input_tex.getTexture()};
		input_sprite.setPosition(kSize, 0);
		window.draw(input_sprite);

		sf::Sprite output_sprite{output_tex.getTexture()};
		output_sprite.setPosition(kSize*2, 0);
		window.draw(output_sprite);

		sf::Sprite output_digits_sprite{output_digits_tex.getTexture()};
		output_digits_sprite.setPosition(kSize*2, 0);
		window.draw(output_digits_sprite);

        window.display();
    }

    return 0;
}

3.4 执行网络推理

加载网络文件

int main(int argc, char **argv)
{
	if(argc != 2)
	{
		printf("Usage: ./MnistUI [snn filename]\n");
		return EXIT_FAILURE;
	}
    snn.Load(argv[1]);
    ...
}

width_normalize(): 裁剪掉无效图像区域

没调用 width_normalize() 时， input_tex 里存在大量空白区域（黑色），数字大小和绘制大小一样的；

调用 width_normalize() 后，相当于获取了 bounding box, 并将 bounding box 外部的区域建材掉，将剩余的有效区域像素放大到了 28x28 大小; 识别准确率也上来了：

关于 width_normalize() 的源码，本篇不做分析，下一篇剖析 SimpleNN 实现的代码时再分析。

3.5 美化: 绘制 cursor

鼠标滚轮控制 cursor 大小

	while(window.isOpen())
	{
		while(window.pollEvent(event))
        {
            ...
            if(event.type == sf::Event::EventType::MouseWheelScrolled)
            {
                radius += kRadiusStep * (event.mouseWheel.x > 0 ? -1 : 1);
                radius = std::min(std::max(kMinRadius, radius), kMaxRadius);
                brush_circle.setRadius(radius);
                cursor_circle.setRadius(radius);
            }
        }
    }

把鼠标形状改为圆球: Cursor()

实际上是鼠标周围一圈有一个圆形，就像是拖着一个墨球:

int main()
{
    while() {
        while() {
            ...
            sf::Sprite output_digits_sprite{output_digits_tex.getTexture()};
            output_digits_sprite.setPosition(kSize*2, 0);
            window.draw(output_digits_sprite);
            Cursor(); /// 此处修改鼠标形状
            window.display();
    }
}

void Cursor()
{
	sf::Vector2i xy = sf::Mouse::getPosition(window);
	if(xy.x >= 0 && xy.x < kSize && xy.y >= 0 && xy.y < kSize)
	{
		int x = std::max(0, std::min(xy.x, kSize)) - radius, y = std::max(0, std::min(xy.y, kSize)) - radius;
		cursor_circle.setPosition(x, y);
		window.draw(cursor_circle);
	}
}

4. 最终代码

这里贴出我做测试、添加了一些注释的 Mnist_UI_my.cpp 代码，大部分是本篇解读过的， SimpleNN snn 对应的 NN.hpp，以及 width_normalize() 对应的 MNIST/Util.hpp 则不在这个文件里，使用原版的。

#include 
#include "NN/NN.hpp"
#include "MNIST/Util.hpp"

sf::RenderWindow window;
sf::Event event;

constexpr int kGridSize = 20, kSize = 28*kGridSize, kOutSize = kSize / 10;
constexpr float kMinRadius = 8.0, kMaxRadius = 30.0, kRadiusStep = 1.0;

sf::RenderTexture paint_tex, input_tex, output_tex, output_digits_tex;
float radius{(kMinRadius + kMaxRadius) * 0.5f};
sf::CircleShape brush_circle, cursor_circle;
sf::RectangleShape input_rect, output_rect;

SimpleNN snn;

void InitWindow()
{
	window.create(sf::VideoMode(kSize*2 + kOutSize, kSize), "Mnist Demo", sf::Style::Titlebar | sf::Style::Close);
	paint_tex.create(kSize, kSize);
	input_tex.create(kSize, kSize);
	output_tex.create(kOutSize, kSize);
	output_digits_tex.create(kOutSize, kSize);

    const std::string asset_dir = "../";
	sf::Font font; font.loadFromFile(asset_dir+"/ui/VCR_OSD_MONO_1.001.ttf");
	sf::Text text; 
	text.setFont(font); text.setCharacterSize(kOutSize);
	text.setFillColor(sf::Color(0, 0, 0, 255));
	for(unsigned i = 0; i < 10; ++i)
	{
		text.setPosition(0, i * kOutSize);
		text.setString(std::to_string(i));
		output_digits_tex.draw(text);
	}
	output_digits_tex.display();

	brush_circle.setFillColor(sf::Color(0, 0, 0));
	cursor_circle.setFillColor(sf::Color(0, 0, 0, 100));
	brush_circle.setRadius(radius);
	cursor_circle.setRadius(radius);

	input_rect.setSize(sf::Vector2f(kGridSize, kGridSize));
	output_rect.setSize(sf::Vector2f(kOutSize, kOutSize));
}

void Clear()
{
	paint_tex.clear(sf::Color(255, 255, 255));
}

void Cursor()
{
	sf::Vector2i xy = sf::Mouse::getPosition(window);
	if(xy.x >= 0 && xy.x < kSize && xy.y >= 0 && xy.y < kSize)
	{
		int x = std::max(0, std::min(xy.x, kSize)) - radius, y = std::max(0, std::min(xy.y, kSize)) - radius;
		cursor_circle.setPosition(x, y);
		window.draw(cursor_circle);
	}
}

void Paint()
{
	sf::Vector2i xy = sf::Mouse::getPosition(window);
	if(xy.x >= 0 && xy.x < kSize && xy.y >= 0 && xy.y < kSize)
	{
		int x = std::max(0, std::min(xy.x, kSize)) - radius, y = std::max(0, std::min(xy.y, kSize)) - radius;
		brush_circle.setPosition(x, y);
		paint_tex.draw(brush_circle);
	}
	paint_tex.display();
}

unsigned Recognize()
{
    // 根据 paint 区域绘制的纹理， 创建独立的图像拷贝
	sf::Image img{paint_tex.getTexture().copyToImage()};
    // 获取图像像素的 raw buffer
	const sf::Uint8 *ptr = img.getPixelsPtr();
    // 网络输入是 28x28=784 大小，float 类型
	std::vector<float> nn_input(784);
    // 将每个 grid 区域(kGridSize x kGridSize, 20x20) 捏成一个像素
	for(unsigned i = 0; i < 784; ++i)
	{
		float v = 0.0;
		unsigned gx = i % 28;
        unsigned gy = i / 28;
		unsigned px = gx * (kGridSize << 2);
        unsigned py = gy * kGridSize;
        // 对于每个 20x20 大小的方格， 如果不是 0，那么计数器加 1， 如果是 0 则计数器不变
		for(unsigned y = py; y < py + kGridSize; ++y)
        {
			for(unsigned x = px; x < px + (kGridSize << 2); x += 4)
            {
				v += float(ptr[y * (kSize << 2) + x] == 0);
            }
        }
        // 统计了 20x20 方格区域内非 0 元素数量 v， 数量 v 除以总数 20x20, 这个比值作为 28x28 网络输入的一个元素。
		nn_input[i] = v / float(kGridSize * kGridSize);
	}
	width_normalize(&nn_input); // 负责砍掉图像周围的空白区域
	for(unsigned i = 0; i < 784; ++i)
	{
        // 把 nn_input[i], 从 [0, 1] 范围的浮点数转到 [0, 255] 范围的整数 c
        unsigned c = 255 * nn_input[i];
		c = std::min(c, 255u);

        // 在 20x20 的区域内， 绘制相同的颜色 c
		unsigned gx = i % 28;
        unsigned gy = i / 28;
		input_rect.setPosition(gx * kGridSize, gy * kGridSize);
		input_rect.setFillColor(sf::Color(c, c, c, 255));
		input_tex.draw(input_rect); // 在一个 texture 的 ROI 区域上进行绘制
		//putchar(nn_input[i] >= 0.25 ? (nn_input[i] >= 0.5 ? (nn_input[i] >= 0.75 ? '@' : '?') : '.') : ' ');
		//if(i % 28 == 27) putchar('\n');
	}
	input_tex.display(); // 更新 target texture 内容。 如果不调用，我观察到的是上下颠倒的内容

#if 1
    {
        snn.Evaluate(nn_input);
        unsigned res = std::max_element(snn.GetOutput(), snn.GetOutput() + 10) - snn.GetOutput();
        for(unsigned i = 0; i < 10; ++i)
        {
            unsigned c = 255 * snn.GetOutput()[i];
            c = std::min(c, 255u);
            output_rect.setPosition(0, i * kOutSize);
            output_rect.setFillColor(sf::Color(c, c, c, 255));
            output_tex.draw(output_rect);
        }
        output_tex.display();

        return res;
    }
#endif

	return 0;
}

int main(int argc, char **argv)
{
	if(argc != 2)
	{
		printf("Usage: ./MnistUI [snn filename]\n");
		return EXIT_FAILURE;
	}
    snn.Load(argv[1]);

    InitWindow();
    Clear();

    bool mouse_down = false;
    while(window.isOpen())
    {
        while(window.pollEvent(event))
        {
            if(event.type == sf::Event::EventType::Closed)
            {
                window.close();
            }
			if(event.type == sf::Event::EventType::KeyReleased 
					&& event.key.code == sf::Keyboard::Space)
			{
				window.setTitle("Recognize: " + std::to_string(Recognize()));
				Clear();
			}
			if(event.type == sf::Event::EventType::MouseButtonPressed)
				mouse_down = true;
			if(event.type == sf::Event::EventType::MouseButtonReleased)
				mouse_down = false;
        }
		if(mouse_down)
			Paint();

        sf::Sprite paint_sprite{paint_tex.getTexture()};
        auto paint_sprite_position = paint_sprite.getPosition();
        printf("paint_sprite_position: %f, %f\n", paint_sprite_position.x, paint_sprite_position.y);
        window.draw(sf::Sprite(paint_tex.getTexture()));

		sf::Sprite input_sprite{input_tex.getTexture()};
		input_sprite.setPosition(kSize, 0);
		window.draw(input_sprite);

		sf::Sprite output_sprite{output_tex.getTexture()};
		output_sprite.setPosition(kSize*2, 0);
		window.draw(output_sprite);

		sf::Sprite output_digits_sprite{output_digits_tex.getTexture()};
		output_digits_sprite.setPosition(kSize*2, 0);
		window.draw(output_digits_sprite);
        Cursor();
        window.display();
    }

    return 0;
}

总结

本篇分析了 SimpleNN 的 UI 部分，它是基于 SFML 实现的交互式手写数字识别程序，提供了鼠标绘制手写数字，空格键触发输入的处理和显示、网络的推理和结果显示，即使不会写代码也能使用它执行手写数字识别。

具体的代码分析中，先从界面布局的划分（paint region, input region, output region) 入手，然后对 paint, input 两个区域的内容的绘制、鼠标键盘的交互，做了比较详细的分析。而输入数据的归一化，网络的推理，分析的稍微粗糙一些，主要是因为相关图像处理内容比较熟悉，不是 UI 界面的重点。

对于 Texture 的使用，增加了一些经验, 目前遇到过的处理方式有这几种:

sf::CircleShape -> window.draw(circle)
sf::Vertex -> window.draw(vertex, 2, sf::Lines)
sf::CirleShape -> sf::Texture -> sf::Sprite -> window.draw(sprite)
其中最后一种方式，能够方便的对一个 ROI 区域进行绘制, 比手动重新绘制独立的 RectangleShape 要更方便，运行效率也更高:

sf::RectangleShape input_rect;
input_rect.setSize(sf::Vector2f(kGridSize, kGridSize));
input_rect.setPosition(gx * kGridSize, gy * kGridSize);

sf::RenderTexture input_tex;
input_tex.create(kSize, kSize);
input_tex.draw(input_rect); // 区域渲染

input_tex.display(); // update content

这也让我想到前一篇基于 SFML 实现的 tic-tac-toe 井字棋游戏，渲染的代码写的不太好，是对 3x3 每个区域分别绘制纹理，其实可以制作一个整个的纹理，然后更新每个 grid 区域。

因此后续的方向有这几个：

基于 texture 更新 ROI 区域的思路，重构 tic-tac-toe 的实现
进一步分析 SimpleNN 的源码，包括推理和训练两个部分

References

https://github.com/AdamYuan/SimpleNN
SFML Tutorial - Sprites and textures

你可能感兴趣的:(SFML,GUI,CNN,MNIST,LeNet,手写数字识别)

javaweb调用pyhton face_recognition传参和参数的返回（包含第三方库） mrhao61 python
fromPILimportImageimportface_recognitionimportcv2importmatplotlib.pyplotaspltfilename="3.jpg"#将jpg文件加载到numpy数组中image=face_recognition.load_image_file(filename)#使用CNN模型#face_locations=face_recognition.
PyQt-QtGui-QCursor 木心心以向荣 pyqt python
文章目录一、鼠标1.自定义鼠标一、鼠标1.自定义鼠标fromPyQt5.QtWidgetsimportQApplication,QWidget,QLabel,QPushButtonimportsysfromPyQt5.QtGuiimportQCursorfromPyQt5.QtGuiimportQPixmapclasswin(QWidget):#创建一个类，为了集成控件def__init__(se
Transformer模型结构分析：Encoder、Decoder以及注意力机制详解 AI天才研究院 Python实战大数据AI人工智能自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Transformer模型由论文[1]提出，其基本思想是使用注意力机制代替循环神经网络(RNN)或卷积神经网络(CNN)，是一种基于序列到序列(Seq2seq)的机器翻译、文本摘要、对话系统等任务的成功范例。Transformer模型使用全连接层代替RNN和CNN的门控结构，并用多头注意力机制进行了改进，能够在捕捉全局上下文信息的同时，还保持输入输出序列之间的独
基于深度学习的行人检测识别系统：YOLOv8 + UI界面 + 数据集完整实现 2025年数学建模美赛深度学习 YOLO ui 人工智能分类
1.引言行人检测与识别是计算机视觉中的一个重要领域，广泛应用于安防监控、智能交通、自动驾驶等多个领域。传统的行人检测方法面临着许多挑战，如低光照、复杂背景、遮挡等问题。随着深度学习技术的迅猛发展，基于卷积神经网络（CNN）的方法，尤其是YOLO（YouOnlyLookOnce）系列算法，在行人检测中取得了显著的效果。YOLOv8作为YOLO系列的最新版本，继承了YOLO一贯的高效性和准确性，在速度
使用大语言模型在表格化网络安全数据中进行高效异常检测 C7211BA 语言模型 web安全人工智能
论文链接Efficientanomalydetectionintabularcybersecuritydatausinglargelanguagemodels论文主要内容这篇论文介绍了一种基于大语言模型（LLMs）的创新方法，用于表格网络安全数据中的异常检测，称为“基于引导式提示的表格异常检测”（TabularAnomalyDetectionviaGuidedPrompts，简称TAD-GP）。该
Python-基于mediapipe,pyautogui,cv2和numpy的电脑手势截屏工具（进阶版）闪云-微星计算机视觉 python 开发语言 opencv pycharm 计算机视觉 windows numpy
前言：在我们的日常生活中，手机已经成为我们每天工作，学习，生活的一个不可或缺的部分。众所周知：为了我们的使用方便，手机里面的很多功能非常人性化，既便捷又高效，其中就有手机的截屏方式，它们花样繁多，如三指截屏，手势截屏等。那么怎么在电脑里面也实现这个功能呢？（虽然我们知到电脑也有快捷的截屏方式-Ctrl+Shift+S。但是很明显，这依然不够快捷，因为这至少需要用户的两次手动操作）。那么废话不多说，
『OpenCV-Python』Trackbar控件的用法
点赞+关注+收藏=学会了推荐关注《OpenCV-Python专栏》在OpenCV中，Trackbar控件（滑块）是一个非常常用的GUI组件，用于在图像处理和计算机视觉任务中进行交互式调整参数。比如说，加载一个图片，通过一个滑块调整图片的亮度，这样便于我们用肉眼观察图片的变化。Trackbar允许用户通过拖动滑块来调整参数的值，并且会实时更新显示结果。比如上图这个例子，创建了3个Trackbar控件
python tkinter计算器实例_可能是最有颜值的Python Tkinter计算器 weixin_39611043 python tkinter计算器实例
上机实践课程开始了,嗯，老师来了之后念了下PPT，然后说:开始做吧.........然后就开始了Python的GUI之路，以前没接触过PYthon的可视化界面(虽然这样很不明智)但是现在做起来感觉写小工具还挺方便的，当时搜到的第一个库便是Tkinter就直接开始写了后来发现QT很不错的样子，下个实验就用QT吧.然后关于Tkinter(python3.6)计算器源码ennn.....有的命名不规范.
pyqt5界面切换 weixin_30954265 c/c++
#主要的思路就是创建两个frame（如果有两个以上同理）使用setVisible()函数显示或者隐藏frame参数是bool值importsysfromPyQt5.QtWidgetsimport*fromPyQt5.QtCoreimport*fromPyQt5.QtGuiimport*classlogindialog(QDialog):def__init__(self,*args,**kwargs
导入PyQt5的各个模块夏尔Gaesar 笔记 qt python 深度学习
importosimportstringimportsys##添加需要自动提示的模块importPyQt5.QtWidgetsimportPyQt5.QtCoreimportPyQt5.QtGuiimportPyQt5.QtSqlimportPyQt5.QtMultimediaimportPyQt5.QtMultimediaWidgetsimportPyQt5.QtChartimportPyQt5
【升级！解锁 27 种文件格式，处理效率狂飙】努力的小好 python 音视频
升级！解锁27种文件格式，处理效率狂飙前言新增与优化功能详解代码深度解析GUI界面构建与交互逻辑多线程处理与消息队列机制文件处理核心逻辑如图所示注意事项前言这一版本的升级力度堪称全面且深入，在文件格式支持上，从原先有限的几种格式拓展到了涵盖图片、文档、视频在内的27种常见格式，无论是日常办公文档，还是珍藏的高清视频，都能精准识别处理。大文件处理方面，通过增大读取缓冲区和添加哈希计算进度日志，大幅提
Python 中PyQt5 多界面切换纵码奔腾 python
Python中PyQt5多界面切换在进行大项目开发时，经常出现页面切换的实际应用，在Python中,如何实现界面切换，切换时不卡顿，体验丝滑，我尝试用几次篇幅来进行演示。首先是主界面的实现，以企业进销存项目为例：fromPyQt5importQtCore,QtGui,QtWidgetsclassUi_MainWindow(object):defsetupUi(self,MainWindow):Ma
探索PySide6：一个全面的Qt绑定库，助您构建华丽的Python应用黎情卉Desired
探索PySide6：一个全面的Qt绑定库，助您构建华丽的Python应用去发现同类优质开源项目:https://gitcode.com/在Python世界中，开发图形用户界面（GUI）的应用程序时，PySide6是一个不可或缺的名字。它是Qt库的一个官方、稳定且全功能的Python绑定，由Digia（现为TheQtCompany）维护。本文将深入探讨PySide6的特性、用途及其背后的技术，帮助您
Kivy基础教程 PoolPoolIsTryingHard python 开发语言
文章目录一、Kivy是什么？二、安装kivy1.安装kivy2.第一个kivy界面hello，kivy!二，Label三，Button四，Spinbox五，TextInput一、Kivy是什么？Tkinter是Python的图形用户界面(GUI)模块，您可以使用Python制作桌面应用程序。您可以制作窗口、按钮、显示文本和图像等。你也可以用kivy开发Android应用，或者用于iOS开发。二、安
创建Vue3.0工程和常用 Composition API 黎明之道 VUE 1024程序员节
一、创建Vue3.0工程1.使用vue-cli创建官方文档：https://cli.vuejs.org/zh/guide/creating-a-project.html#vue-create##查看@vue/cli版本，确保@vue/cli版本在4.5.0以上vue--version##安装或者升级你的@vue/clinpminstall-g@vue/cli##创建vuecreatevue_tes
推荐使用：Node.js 参考架构解然嫚Keegan
推荐使用：Node.js参考架构nodejs-reference-architectureTheRedHatandIBMNode.jsReferencearchitecture.Theteams'opinion'onwhatcomponentsourcustomersandinternalteamsshouldusewhenbuildingNode.jsapplicationsandguidanc
推荐项目：Node.js参考架构卢千怡
推荐项目：Node.js参考架构nodejs-reference-architectureTheRedHatandIBMNode.jsReferencearchitecture.Theteams'opinion'onwhatcomponentsourcustomersandinternalteamsshouldusewhenbuildingNode.jsapplicationsandguidanc
深入探索Qt绘图：利用QPainter轻松绘制精美图形威哥说编程 qt
Qt作为一个跨平台的应用开发框架，不仅提供了强大的GUI功能，还拥有丰富的图形绘制功能。无论是开发图形用户界面（GUI）应用程序，还是进行数据可视化，Qt都能为开发者提供便捷的图形绘制工具。QPainter是Qt中最常用的图形绘制工具，它可以让开发者在窗口、图像或者打印机上绘制各种形状、文本及图像。本文将深入探讨如何利用QPainter在Qt中绘制图形，展示如何通过它实现各种图形绘制需求。一、QP
PDF转换成word zhou_388 pdf word python c语言 c++php java
#-*-coding:utf-8-*-#指定文件编码格式，支持中文#导入需要的标准库importos#操作系统接口模块，用于文件路径处理importthreading#多线程支持模块fromqueueimportQueue#线程安全队列，用于任务管理fromtkinterimportTk#GUI基础库fromtkinter.filedialogimportaskopenfilenames#文件选择
用Python制作无法拒绝的表白界面 SuRuiYuan1 python 前端 json
创建一个无法拒绝的表白界面可以是一个有趣的小项目，它不仅能够展示你的编程技能，还能让你以一种创意和个性化的方式表达感情。下面我将为你提供一个使用`tkinter`库创建简单但吸引人的表白界面的例子。`tkinter`是Python的标准GUI库，适合快速构建桌面应用。首先确保你有Python环境安装好了。接下来我们将编写代码来创建一个简单的表白界面。importtkinterastkfromtki
Github 2025-01-28 Python开源项目日报 Top9 老孙正经胡说 github python 开发语言 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-01-28统计)共有9个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目9Rust项目1ComfyUI：强大而模块化的稳定扩散GUI创建周期：399天开发语言：Python,JavaScript协议类型：GNUGeneralPublicLicensev3.0Star数量：25663个Fork数量：2741次
2025年美赛数学建模2025 MCM Problem A: Testing Time: The Constant Wear On Stairs A题测试时间：楼梯上的持续磨损代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 2025年数学建模美赛 2025数学建模美赛 A题 2025 楼梯上的持续磨损 matlab代码
目录Python1.数据预处理与特征工程数据标准化与特征构建2.行进方向偏好分析深度神经网络（DNN）用于方向性分析3.多人同时使用分析卷积神经网络（CNN）用于磨损模式识别4.时间序列分析LSTM模型用于时间序列预测matlab代码Python我们将采用更多的机器学习和深度学习技术，例如图像处理、深度神经网络（DNN）、卷积神经网络（CNN）等，并结合不同的算法进行更深入的分析。1.数据预处理与
Laravel 上传文件报找不到临时文件的问题 yyueshen Laravel
最近在尝试用lavarel做上传文件，但遇到了奇怪的问题，下面是代码：if(Input::hasFile("audio")){$file=Input::file("audio");$fileName=$this->guid();//$extensionName=$file->guessExtension();$fullFileName=$fileName.".".$file->guessExten
零碎的知识点（十二）：卷积神经网络CNN通道数的理解！墨绿色的摆渡人零碎知识点 cnn 深度学习神经网络
卷积神经网络CNN通道数的理解！通道数的核心概念解析1.通道数的本质2.单张灰度图的处理示例：3.批量输入的处理通道与批次的关系：4.RGB三通道输入的处理计算过程：示例：5.通道数的实际意义6.可视化理解(1)单通道输入（灰度图）的过滤器(2)三通道输入（RGB）的过滤器总结通道数的核心概念解析1.通道数的本质在卷积神经网络中，通道数（Channels）表示不同过滤器的数量。每个通道对应一个独立
斯坦福吴恩达-深度学习和机器学习全套视频+课件！ Alexquyun 人工智能机器学习深度学习 python
这些课程专为已有一定基础（基本的编程知识，熟悉Python、对机器学习有基本了解），想要尝试进入人工智能领域的计算机专业人士准备。介绍显示：“深度学习是科技业最热门的技能之一，本课程将帮你掌握深度学习。”学生将可以学习到深度学习的基础，学会构建神经网络，并用在包括吴恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。DeepLearningSpecialization对卷积神经网络(CNN
Lite.Ai.ToolKit - 一个轻量级的 C++ 工具包小众AI AI开源开源人工智能 AI编程算法
**Lite.Ai.ToolKit**：一个轻量级的C++工具包，包含100+个很棒的AI模型，例如对象检测、人脸检测、人脸识别、分割、遮罩等。请参阅ModelZoo和ONNXHub、MNNHub、TNNHub、NCNNHub。3700Stars711Forks0Issues6贡献者GPL-3.0LicenseC语言代码:https://github.com/DefTruth/lite.ai.to
【Python入门基础】——第1篇：从入门到精通：Python简介与环境搭建详解猿享天开 python从入门到精通 python 开发语言
第1篇：Python简介与环境搭建目录什么是Python？Python的历史与特点安装Python解释器配置开发环境选择合适的集成开发环境（IDE）使用文本编辑器运行第一个Python程序常见问题及解决方法总结什么是Python？Python是一种高级、通用、解释型的编程语言，由GuidovanRossum于1991年首次发布。Python以其简洁易读的语法、广泛的应用领域和强大的社区支持，成为全
RK3568中使用QT opencv（显示基础图像）花落已飘 qt opencv 开发语言
文章目录一、查看对应的开发环境是否有opencv的库二、QT使用opencv一、查看对应的开发环境是否有opencv的库在开发板中的/usr/lib目录下查看是否有opencv的库：这里使用的是正点原子的ubuntu虚拟机，在他的虚拟机里面已经安装好了opencv的库。二、QT使用opencv在QTpro文件中添加opencv的支持：QT+=coreguiCONFIG+=c++11#添加OpenC
基于CNN-GRU-Attention混合神经网络的负荷预测方法（Python代码实现）宇哥预测优化代码学习神经网络 cnn gru
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、引言二、模型结构三、数据预处理四、模型训练与评估五、实验结果与分析六、结论与展望2运行结果3参考文献4Python代码实现及数据1概述基于CNN-GRU(convolutionalneuralnetworks-gaterecurrentunit)神经网络的电
Linux gdisk 命令使用详解 linux
简介gdisk命令是Linux上管理GPT（GUID分区表）分区的强大工具。它可替代仅支持MBR（主引导记录）分区的fdisk。安装Debian/UbuntusudoaptinstallgdiskRHEL/CentOSsudoyuminstallgdisk检查分区类型sudogdisk-l/dev/sdXGPT磁盘：显示带有GUID代码的分区MBR磁盘：gdisk发出警告并询问是否要转换为GPT运
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在