VintaSoft Imaging .NET使用教程:如何将OCR设置为只识别数字

VintaSoftImaging.NET SDK是一个为.NET开发人员开发的,强大而易于使用的图像工具包。它可以让你加载、查看、处理、打印和保存数字图像,可将它们转换为不同的图像格式,可用多种TIFF和动态GIF文件提高您的工作效率。

并且该产品还可以添加多个模块:图片注释模块、PDF模块、JBIG2模块、JPEG2000模块、文档清洁模块、DICOM模块、OCR模块和表单处理模块,结合这些模块开发人员可以开发出现代化的商业应用程序 这篇文章主要介绍VintaSoft Imaging .NET怎么和OCR模块结合,OCR识别模块识别率高,支持多国语言包含中文,并且可以自定义多种功能,下面的代码主要讲述了怎么设置OCR只对图片中的数字进行识别,具体如下:

using System;
using Vintasoft.Imaging;
using Vintasoft.Imaging.Ocr;
using Vintasoft.Imaging.Ocr.Results;
using Vintasoft.Imaging.Ocr.Tesseract;
 
class TesseractOcrSetVariableExample
{
    // Required assemblies to run this code:
    // Vintasoft.Imaging.dll, Vintasoft.Imaging.Ocr.dll, Vintasoft.Imaging.Ocr.Tesseract.dll
    public static void OcrImageWithDigits(string filename)
    {
        // load image(s)
        ImageCollection images = new ImageCollection();
        images.Add(filename);
 
        Console.WriteLine("Create Tesseract OCR engine...");
        using (TesseractOcr tesseractOcr = new TesseractOcr())
        {
            Console.WriteLine("Initialize OCR engine...");
            tesseractOcr.Init(new OcrEngineSettings(OcrLanguage.English));
 
            // set white list
            tesseractOcr.SetVariable(
                "tessedit_char_whitelist", "01234567890");
 
            // foreach image
            foreach (VintasoftImage image in images)
            {
                Console.WriteLine("Recognize the image...");
                OcrPage page = tesseractOcr.Recognize(image);
 
                Console.WriteLine("Page Text:");
                Console.WriteLine(page.GetText());
                Console.WriteLine();
            }
 
            // shutdown OCR engine
            tesseractOcr.Shutdown();
        }
 
        // free resources
        images.ClearAndDisposeItems();
        images.Dispose();
    }
}

本文转自VintaSoft Imaging .NET

查看产品详情evget.com/product/1750

 

你可能感兴趣的:(VintaSoft Imaging .NET使用教程:如何将OCR设置为只识别数字)