无水先生

拼写检查应用程序：基于词典编辑的解释

一、说明

拼写检查器项目涉及创建一个可以自动检测并纠正给定文本中的拼写错误的程序。此类项目在各种应用程序中非常有用，例如文字处理器、电子邮件客户端和网络浏览器，可确保用户生成的文本没有拼写错误。

您可以找到我创建的拼写检查器应用程序： https: //spellchecker-xr26zeryecn4cugmwrvgje.streamlit.app/

二、拼写检查应用程序创建方法：

可以使用多种方法创建拼写检查器应用程序：

基于字典的算法：

基于查找：该算法使用预先构建的正确单词词典。它会根据字典检查输入文本中的每个单词，并针对未找到的单词提出更正建议。
编辑距离：该算法计算将一个单词转换为另一个单词所需的编辑（插入、删除、替换）次数。然后根据编辑距离最小的单词提出建议。在这篇文章中，我们将详细讨论这个主题。

2. N-gram 模型： N-gram 是相邻单词或字母的序列。N-gram 模型使用特定单词序列一起出现的可能性的统计分析。建议基于相邻单词组合的概率。

3. 概率方法：

贝叶斯方法：这些方法使用贝叶斯概率来估计句子中某个单词在给定上下文的情况下正确的可能性。
上下文信息：拼写检查器可以考虑单词的周围上下文来改进纠正建议。例如，一个单词的正确拼写可能取决于它周围的单词。

4. 机器学习方法：

监督学习：使用正确和错误拼写的标记数据集，可以训练机器学习算法来预测拼写错误单词的更正。
神经网络：深度学习模型，例如循环神经网络 (RNN) 或 Transformer，可用于拼写检查任务。这些模型可以捕获语言中的复杂模式和依赖性。

5. 基于规则的系统：

形态分析：分析单词的结构并应用语言规则来生成建议。这对于具有复杂形态的语言特别有用。
基于语法的方法：根据语法规则检查输入文本，以识别并纠正潜在的拼写错误。

6. 混合方法：将多种技术（例如基于字典的方法与机器学习模型）相结合，以提高拼写检查的准确性和覆盖范围。

三、拼写检查器中的错误检查指标

A. 非单词错误 ：当单词拼写错误或形成不正确时，就会发生非单词错误，从而导致字母序列与任何有效单词都不对应。

B. 真实单词错误：另一方面，真实单词错误涉及将一个单词转换为另一个有效单词的拼写错误，从而可能改变其含义。

在今天的课程中，我们将研究基于字典的编辑距离算法。

在接下来的文章中，我们将详细介绍更多算法。

1.小写和标记化

# Function to tokenize words
def words(document):
    "Convert text to lower case and tokenize the document"
    return re.findall(r'\w+', document.lower())

此函数将 big.txt 文档作为输入，将文本转换为小写，并将文档标记为单词列表。它使用正则表达式r'\w+'查找文档中的所有单词字符（字母、数字和下划线）序列。

2.读取文档中的每个单词，传入word函数，统计每个单词的个数

all_words = Counter(words(open('big.txt').read()))

打开名为“big.txt”的文件并读取其内容。然后对文本文件中的每个单词调用words(document)函数。

是Counter一个 Python 类，用于计算集合中元素的出现次数。在本例中，它获取生成的单词列表words(document)并创建一个类似字典的对象，其中键是唯一单词，值是文档中每个单词的计数。

例如：

all_words=Counter({'the': 79809, 'of': 40024, 'and': 38312, 'to': 28765, 'in': 22023, 'a': 21124.....})

3.生成与输入单词相距一次编辑的所有可能单词

我。splits：创建单词所有可能拆分的列表。

splits = [(word[:i], word[i:]) for i in range(len(word) + 1)]

单词“THANKSGIPNG”的示例：

word='THANKSGIPNG'
splits = [(word[:i], word[i:]) for i in range(len(word) + 1)]
splits

[('', 'THANKSGIPNG'),
 ('T', 'HANKSGIPNG'),
 ('TH', 'ANKSGIPNG'),
 ('THA', 'NKSGIPNG'),
 ('THAN', 'KSGIPNG'),
 ('THANK', 'SGIPNG'),
 ('THANKS', 'GIPNG'),
 ('THANKSG', 'IPNG'),
 ('THANKSGI', 'PNG'),
 ('THANKSGIP', 'NG'),
 ('THANKSGIPN', 'G'),
 ('THANKSGIPNG', '')]

A. 删除：C通过从原始单词中删除一个字符来创建拆分内的单词列表。

deletes = [left + right[1:] for left, right in splits if right]

对于上面的例子：

deletes = [left + right[1:] for left, right in splits if right]
deletes

['HANKSGIPNG',
 'TANKSGIPNG',
 'THNKSGIPNG',
 'THAKSGIPNG',
 'THANSGIPNG',
 'THANKGIPNG',
 'THANKSIPNG',
 'THANKSGPNG',
 'THANKSGING',
 'THANKSGIPG',
 'THANKSGIPN']

B. 插入：通过在原始单词中每个可能的位置插入每个字母，从拆分列表中创建单词列表。

inserts = [left + c + right for left, right in splits for c in alphabets]

['aTHANKSGIPNG', 'bTHANKSGIPNG', 'cTHANKSGIPNG', 'dTHANKSGIPNG', 'eTHANKSGIPNG', 'fTHANKSGIPNG', 'gTHANKSGIPNG', 'hTHANKSGIPNG', .....]

C. 替换：通过用每个字母替换拆分列表单词中的每个字符来创建单词列表。

replaces = [left + c + right[1:] for left, right in splits if right for c in alphabets]

['aHANKSGIPNG',
 'bHANKSGIPNG',
 'cHANKSGIPNG',
 'dHANKSGIPNG',
 'eHANKSGIPNG',
 'fHANKSGIPNG',
 'gHANKSGIPNG',
 'hHANKSGIPNG',
 'iHANKSGIPNG',
 'jHANKSGIPNG',
 'kHANKSGIPNG',
 'lHANKSGIPNG',
 'mHANKSGIPNG',...
..........
..........
..........
'THANKSGIPNv',
 'THANKSGIPNw',
 'THANKSGIPNx',
 'THANKSGIPNy',
 'THANKSGIPNz']]

D. transposes：此行通过转置（交换）分割列表单词中的相邻字符来创建单词列表。

transposes = [left + right[1] + right[0] + right[2:] for left, right in splits if len(right) > 1]

['HTANKSGIPNG',
 'TAHNKSGIPNG',
 'THNAKSGIPNG',
 'THAKNSGIPNG',
 'THANSKGIPNG',
 'THANKGSIPNG',
 'THANKSIGPNG',
 'THANKSGPING',
 'THANKSGINPG',
 'THANKSGIPGN']

二. 合并删除、插入、替换和传输以获得所有可能的单词

合并完成后，我们需要获取该集合，因为我们不希望重复任何单词。

set(deletes + inserts + replaces + transposes)

因此我们的最终函数是：

def edits_one(word):
    "Create all edits that are one edit away from `word`."
    alphabets = 'abcdefghijklmnopqrstuvwxyz'
    splits = [(word[:i], word[i:]) for i in range(len(word) + 1)]
    deletes = [left + right[1:] for left, right in splits if right]
    inserts = [left + c + right for left, right in splits for c in alphabets]
    replaces = [left + c + right[1:] for left, right in splits if right for c in alphabets]
    transposes = [left + right[1] + right[0] + right[2:] for left, right in splits if len(right) > 1]
    return set(deletes + inserts + replaces + transposes)

4.生成距输入单词两次编辑的所有可能编辑

def edits_two(word):
    # Generate all possible edits one edit away from the original word
    one_edit_away = edits_one(word)

    # Generate all possible edits two edits away by applying edits_one to each one-edit-away edit
    two_edits_away = (e2 for e1 in one_edit_away for e2 in edits_one(e1))

    return two_edits_away

它需要一个单词，找到所有可能的一次编辑修正 ( one_edit_away)，然后通过应用到每个一次编辑修正来生成两次编辑修正 ( two_edits_away) 。edits_one

5. 创建一组新的已知单词

我们获取一组单词 ( words) 并检查每个单词是否出现在全局all_words计数器中。存在的单词all_words被添加到一个名为known_words

def known(words):
    
    known_words = set()
    for word in words:
        if word in all_words:
            known_words.add(word)

    return known_words

6. 检查该单词是否存在于创建的known_words列表、一个编辑列表或两个编辑列表中

我们创建更正，以检查单词本身是否已知，或者是否存在经过一两次编辑后的已知更正。如果没有找到更正，那么我们将原始单词包含在结果中

def possible_corrections(word):

    corrections = known([word]) or known(edits_one(word)) or known(edits_two(word))
    corrections = corrections or [word]

    return corrections

7. 求给定单词的概率

我们计算给定单词的概率。我们通过将单词出现的次数（由计数all_words[word]）除以标记总数（N）来做到这一点。

def prob(word, N=sum(all_words.values())): 
    return all_words[word] / N

8. 在可能的校正集中找到最高概率的元素

更正存储输入单词的一组可能的拼写更正，例如：“THANKSGIPNG”。我们使用该max函数来查找可能的校正集中概率最高的元素。

注意：该key参数指定比较应基于函数计算的概率prob。

def spell_check(word):
    corrections = possible_corrections(word)
    most_probable = max(corrections, key=prob)
    
    return "Did you mean {}?".format(most_probable) if most_probable != word else "Correct spelling."

如果最可能的更正与原始单词不同，它会返回一个字符串，使用将该单词format插入most_probable字符串的方法来建议正确的拼写。如果更正与原始单词相同，则返回一个字符串，表明拼写正确。

9. 输入用户的单词并使用单词和拼写检查功能进行分析

首先，我们使用该函数将用户输入标记为单词列表words。然后，我们使用该函数为输入文本中的每个标记生成拼写建议spell_check。

然后，我们将显示拼写检查结果的降价标题。

这将显示令牌、其索引以及我们使用 Streamlit 应用程序中的pell_check 获得的建议更正。

def main():
    st.title("Aneesha's Spell Checker App")
    st.text("Happy to have you here!")

    user_input = st.text_area("Enter your text for spell checking:", "")
    
    if st.button("Check Spelling"):
        tokens = words(user_input)
        suggestions = [spell_check(token) for token in tokens]
        st.markdown("### Spell Check Results:")
        for i, (token, suggestion) in enumerate(zip(tokens, suggestions)):
            st.text(f"{i + 1}. {token}: {suggestion}")

四、后记

本文首先介绍拼写检查方法，然后简单介绍一些用法。对于工作人员来说，虽然可能不从事具体技术，但是抛砖引玉可以获得启发，再说行业发展趋势还是需要了解的。

检查部署的此应用程序：https://spellchecker-xr26zeryecn4cugmwrvgje.streamlit.app/

欲了解更多此类内容，请订阅！

你可能感兴趣的:(NLP高级和ChatGPT,人工智能,人工智能)

RTX50系显卡+CUDA+torch+python对应关系
前言本人的显卡是RTX5070，使用时发现它对CUDA、torch和python版本有要求，试图按照老项目的依赖文件进行安装发现安不了，因此记录一下（截至2025年6月）。提示：以下是本篇文章正文内容，下面案例可供参考一、RTX50系显卡只能使用CUDA12.8二、目前只支持torch2.7.0和2.7.11.去pytorch官网的https://download.pytorch.org/whl/
Llama改进之——分组查询注意力愤怒的可乐 #NLP项目实战自然语言处理 llama 深度学习人工智能分组查询注意力旋转位置编码
引言今天介绍LLAMA2模型引入的关于注意力的改进——分组查询注意力(Grouped-queryattention,GQA)1。Transformer中的多头注意力在解码阶段来说是一个性能瓶颈。多查询注意力2通过共享单个key和value头，同时不减少query头来提升性能。多查询注意力可能导致质量下降和训练不稳定，因此常用的是分组查询注意力。然后我们结合上篇文章3探讨的旋转位置编码，将选择位置编
Llama改进之——SwiGLU激活函数愤怒的可乐 #自然语言处理 NLP项目实战 llama
引言今天介绍LLAMA模型引入的关于激活函数的改进——SwiGLU1，该激活函数取得了不错的效果，得到了广泛地应用。SwiGLU是GLU的一种变体，其中包含了GLU和Swish激活函数。GLUGLU(GatedLinearUnits,门控线性单元)2引入了两个不同的线性层，其中一个首先经过sigmoid函数，其结果将和另一个线性层的输出进行逐元素相乘作为最终的输出：GLU(x,
ATmega16微控制器编程与应用实践 love彤彤
本文还有配套的精品资源，点击获取简介：ATmega16是一个基于AVR架构的8位微控制器，广泛用于嵌入式系统控制应用。本文将详细介绍如何在ATmega16上实现1602液晶显示、独立键盘操作、数码管扫描、蜂鸣器控制和流水灯设计等常用功能。通过这些功能的实践项目，读者可以掌握C语言在嵌入式系统开发中的应用，包括I/O口编程、定时器设置、中断处理和串行通信等关键技术。1.ATmega16微控制器简介A
强人工智能是否会诞生于现在的AI之中一花·一叶人工智能语言模型
为什么我认为当前AI方法无法实现真正的人工智能？随着大模型的发展日新月异，越来越多的人开始相信我们正在接近通用人工智能（AGI）。然而，作为一名人工智能领域的算法工程师，我反而越来越确信：现有的技术路径——以Transformer为核心的深度神经网络，可能已经达到了它的能力上限。我们或许正站在一个新时代的门槛上：真正的强人工智能将不会诞生于现有的范式中，而需要一条全新的算法路径。Transform
手把手从零打造 Llama3：解锁下一代预训练模型会飞的Anthony 信息系统人工智能 AIGC 自然语言处理人工智能 llama3 AIGC
引言Llama3相较于Llama2，不仅在模型架构上做了显著优化，尤其是全局查询注意力机制（GQA）的引入，使得模型在大规模数据处理上表现更加出色。同时，Llama3采用了与GPT一致的tiktoken分词器，大幅提升了分词效率。本篇文章将带你从头构建Llama3预训练流程，深入了解其关键细节和实现方式，让你掌握这一下一代模型的核心技术。1.启动训练脚本在这一步中，我们将实现Llama3的预训练框
音视频会议服务搭建(设计方案)-01 卜锦元音视频webrtc golang 流媒体websocket 音视频
前言最近在做音视频会议系统服务搭建的工作任务，因为内容过多，我会逐篇分享相关的设计方案、开发思路、编程语言、使用的组件集合等等。如果你也有大型音视频会议系统搭建架构的需求，希望这些可以对你有所帮助。EchoMeet音视频会议系统架构设计项目概述EchoMeet是基于WebRTC技术的企业级音视频会议解决方案，采用三层音视频架构和Go+Node.js双后端微服务设计，实现了高并发、低延迟、可扩展的视
抗辐照芯片在核电厂火灾探测器中的应用优势与性能解析国科安芯科普网络人工智能运维自动化
一、引言核电厂作为能源供应的关键设施，其安全性备受关注。火灾是威胁核电厂安全运行的重要风险因素之一。在核电厂的特殊环境下，火灾探测器肩负着及时发现火情、保障核电厂安全运行的重任。然而，核电厂存在高能辐射等复杂环境因素，这对火灾探测器中的芯片性能提出了极为严苛的要求。传统芯片在辐射环境下易出现性能退化、功能异常等问题，导致火灾探测器无法准确工作。因此，研发和应用抗辐照芯片成为解决这一问题的关键。抗辐
Boost.Asio 的 TCP 通信教程 FHKHH 网络编程 tcp/ip 网络协议网络
一、引言本教程将详细介绍如何使用Boost.Asio库实现一个简单的TCP通信示例，包括服务器端和客户端的代码编写、编译以及运行流程。同时，我们会对通信过程中的各个关键步骤进行详细讲解，帮助读者理解TCP通信在Boost.Asio中的实现方式。后续如果需要扩展功能，例如并发处理多个客户端连接或使用异步通信等，可以在此基础上进行修改。二、准备工作确保系统中已安装Boost库。确保编译器（如g++）能
Boost.Asio 同步读写操作详解
Boost.Asio同步读写操作详解Boost.Asio是一个高效的C++网络和底层I/O库，提供了多种API用于同步和异步数据传输。本文将详细介绍同步操作及其具体实现，包括write_some、send、write、read_some、receive、read和read_until等。1.同步写：write_some功能:将指定数量的字节写入到套接字。如果发送缓冲区已满，则只写入一部分数据并返回
c++中类的前置声明 2301_80355452 c++java 开发语言
前置声明（forwarddeclaration）和包含头文件（includeheaderfile）是C/C++程序设计中经常遇到的两个基础概念。它们都和“让编译器知道有哪些类型、函数”等信息相关，但本质和作用是完全不同的。下面我会详细、通俗地讲解二者的区别，以及什么情况下选用哪一种。1.前置声明是什么？前置声明（forwarddeclaration）就是提前告诉编译器“小样，后面我会实现/定义一个
音视频会议服务搭建(设计方案-两种集成方案对比)-03 卜锦元流媒体websocket 音视频webrtc golang 音视频 go node.js webrtc c++redis mysql
前言在开始计划之前，查阅了不少资料。一种方案是Go层做信令业务，nodejs层来管理和mediasoup的底层交互，通过客户端去调用Go层；第二种方案是客户端直接调用nodejs层来跟mediasoup去交互；最终，当然不出意料的选择了项目复杂的构建方案，为性能去考虑。EchoMeet架构方案对比分析1.两种架构方案概览方案A：Go+Node.js双系统架构（当前方案）前端Vue3+mediaso
Github 2025-07-03Go开源项目日报Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-07-03统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Go项目10JavaScript项目2Go编程语言：构建简单、可靠和高效的软件创建周期：3474天开发语言：Go协议类型：BSD3-Clause“New”or“Revised”LicenseStar数量：117964个Fork数量：16989次关注人
【Rust日报】2025年全球有哪些Rust大会
vekos-又一个Rust写的实验性OSVEKOS是一个用Rust语言编写的实验性操作系统,目前处于0.0.1的alpha版本。它专注于在内核中引入验证和安全性。主要特性包括:使用加密证明系统验证所有文件系统和内存操作。使用伙伴分配器及Copy-on-Write支持的安全内存管理。实现了基本的shell,支持命令历史和行编辑。使用Merkle树进行验证的文件系统(VKFS)。基本的进程管理、调度和
【Rust日报】Rust稳定2024版本将于 2025年2月20日发布
fastembed-rs-AI嵌入库FastEmbed的Rust实现,提供了快速的文本嵌入、图像嵌入和候选项重新排序功能。它具有以下主要特性:支持同步使用,无需依赖Tokio。使用@pykeio/ort进行高性能的ONNX推理。使用@huggingface/tokenizers进行快速编码。支持使用@rayon-rs/rayon进行批量嵌入生成和并行计算。默认模型是FlagEmbedding,在M
【Rust日报】2024年Rust回顾：接下来是什么？ Rust语言中文社区 rust 开发语言后端
Avian-一个基于ECS（实体组件系统）的2D和3D物理引擎Avian是一个基于ECS（实体组件系统）的2D和3D物理引擎，专为Bevy设计，Bevy是一个在Rust中构建的，非常简洁的数据驱动游戏引擎。Avian注重人体工程学和模块化设计，重点提供一种原生的、由ECS驱动的用户体验。https://joonaa.dev/blog/07/avian-0-22024年Rust回顾：接下来是什么？本
我的所有的浏览器被hao123 挟持了，终极解决方案
参考https://www.cnblogs.com/BensonLaur/p/13731310.html解决最近我给我的老电脑安装系统在我这台电脑做了启动盘，之后我的每个浏览器点开就是hao123的主页，而后我用了360和腾讯杀毒我发现都不好使于是乎，我研究了一下我的浏览器启动执行命令chrome://version/。我发现在在执行命令行中多了一句这样的代码.于是乎我判断我的浏览器真的被挟持了。
Qt 使用QAxObject 快速写入execl失败问题 HL_风神 QT
最近工作开发需要写一个读翻译ts文件，ts文件实际上就是xml文件，数据量比较大所以写一个工具将ts文件中的原文和译文提取到execl中给翻译人员翻译，我用的是QAxObject，按范围写入数据：使用函数setProperty(“Value”,value)，函数返回总是false咨询别人才知道office支持的是setProperty(“Value”,value)电脑装的是wps的话，写入成功就需
C++标准库大全(STL)
C++标准库大全(STL)1.容器（Containers）*问题类型：序列容器（std::vector,std::deque,std::list,std::forward_list,std::array,std::string）：各自的特点、底层实现、优缺点和适用场景？容器特点底层实现优点缺点适用场景std::vector动态数组，支持快速随机访问连续内存+三指针（数据头/尾/容量尾）随机访问O(
JDK 25 功能预览：Java 生态的重大升级深盾科技 java 开发语言
JDK25计划于2025年9月发布，作为长期支持版本（LTS），它将为Java生态带来多项重要的语言增强、性能优化、安全改进以及体验优化，以下是对JDK25主要预期功能的详细介绍。一、语言特性增强1.基本类型模式匹配（JEP507）在Java的模式匹配框架instanceof和switch中，现在可以直接支持原始类型（如int、boolean）。这一特性使得表达式更加简洁，减少了样板代码。示例代码
全方位守护代码安全：一款高效自动化工具的深度解析深盾科技安全自动化运维
在当今数字化时代，软件安全问题日益凸显，代码被反编译、反调试、篡改和窃取的风险无处不在。对于开发者来说，如何有效保护自己的软件成果，防止其被恶意利用，成为了亟待解决的问题。今天，就让我们来深入了解一下VirboxProtector这款强大的软件保护工具，看看它是如何为代码安全保驾护航的。一、关于VirboxProtectorVirboxProtector是北京深盾科技股份有限公司经过多年技术深耕开
【unitrix】 4.13 类型级加一计算(add1.rs） liuyuan77 我的unitrix库 rust
一、源码这段代码实现了一个类型系统中的"加一"操作，通过Rust的特性(trait)和泛型编程来实现。//!类型级别的加一实现//!编制人:$ource//!修改版次:0版完成版//!本版次创建时间:2025年7月2日//!最后修改时间:无//!待完善问题：Float+1未实现//!实现规则：//!1.基础类型：Z0(0)→P1(1),P1(1)→B0(2),N1(-1)→Z0(0)//!2.B0
Linux 系统管理：高效运维与性能优化代码老y 运维 linux 性能优化
一、Linux系统管理基础（一）用户与权限管理用户和权限管理是Linux系统管理的基础。通过合理配置用户和权限，可以确保系统的安全性和稳定性。用户管理使用useradd、usermod和userdel命令管理用户账户。使用passwd命令设置用户密码。使用groups和gpasswd命令管理用户组。权限管理使用chmod命令设置文件和目录的权限。使用chown和chgrp命令更改文件和目录的所有者
调和函数积分等式证明 weixin_30777913 算法
题目第一部分：证明积分等式设uuu在Ω⊂Rn\Omega\subset\mathbb{R}^nΩ⊂Rn内调和，且B(x0,c)⊂⊂ΩB(x_0,c)\subset\subset\OmegaB(x0,c)⊂⊂Ω，满足a≤b≤ca\leqb\leqca≤b≤c和b2=acb^2=acb2=ac。需证：∫∣ω∣=1u(x0+aω)u(x0+cω)dω=∫∣ω∣=1u2(x0+bω)dω.\int_{|\
NUMA 架构科普：双路 CPU 系统是如何构建的？
NUMA（Non-UniformMemoryAccess，非一致性内存访问）是一种用于多处理器系统的内存架构设计，主要应用于服务器、工作站和高性能计算（HPC）领域。它的核心特点是不同CPU访问不同内存区域的速度不一致，这与传统的UMA（UniformMemoryAccess，一致性内存访问）架构不同。1.NUMA的物理结构（1）双路CPU系统的硬件组成在典型的双路（2P）服务器主板上，会有：2颗
昇腾NPU节点软件版本检查与升级方法
一、问题背景当我们需要在节点部署DeepSeek大模型时，需要检查昇腾云配套的版本驱动和固件版本，如果发现节点版本不配套建议升级到配套版本。检查方法：npu-smiinfo-tboard-i1|egrep-i"software|firmware"二、升级方法需要注意的是，一定要先升级固件，再升级驱动；如果需要降级版本，流程与升级一样。一般而言，固件包是带有firmware关键字，驱动包带有dirv
[学习]M-QAM的数学原理与调制解调原理详解（仿真示例）
M-QAM的数学原理与调制解调原理详解QAM（正交幅度调制）作为现代数字通信的核心技术，其数学原理和实现方法值得深入探讨。本文将分为数学原理、调制解调原理和实现要点三个部分进行系统阐述。文章目录M-QAM的数学原理与调制解调原理详解一、数学原理二、调制原理三、解调原理四、实现要点五、16QAM的Python仿真实现5.1完整仿真代码5.2关键代码解析5.3仿真结果分析六、性能优化方向七、MATLA
解锁数据潜能——亮数据Web数据集，精准、全面、即时程序猿追其他领域嵌入式效率性能优化科技计算机外设
解锁数据潜能——亮数据Web数据集，精准、全面、即时在数据驱动的时代，获取高质量的网络数据成为许多企业与研究机构的核心需求。亮数据推出的Web数据集产品，试图通过技术手段解决传统数据采集中的痛点，为使用者提供更高效的数据支持方案。该数据集的核心优势体现在三个维度：数据精准度、覆盖全面性和更新即时性。在精准度方面，通过动态IP网络与智能解析算法的结合，有效降低了传统爬虫常遇到的反爬干扰，使获取的数据
利用人名语言分类案例演示RNN、LSTM和GRU的区别（基于PyTorch） .30-06Springfield rnn lstm gru 分类人工智能 python pytorch
文章目录一、程序结构1.1程序整体结构1.2各模块功能关系流程图二、数据预处理模块详解2.1定义字符集和语言类别2.2读取数据2.3人名转换为one-hot编码张量2.4自定义数据集类2.5数据加载器三、模型定义模块详解3.1RNN模型3.2LSTM模型3.3GRU模型四、模型训练与测试模块详解4.1测试模型基本功能4.2模型训练主函数五、结果可视化与对比模块详解六、模型预测模块详解七、案例结果分
YOLOv8 轴承缺陷检测使用YOLOv8进行训练、评估和可视化预测结果包含1440张图片的轴承缺陷检测数据集 YOLO格式或XML格式 OICQQ67658008 YOLO xml 深度学习轴承缺陷数据检测算法人工智能
轴承缺陷检测4类1440张names:[‘aocao’,‘aoxian’,‘cashang’,‘huahen’]名称：：[‘凹槽’，‘凹陷’,‘卡伤’,‘划痕’]共1440张，8:1:1比例划分train：1152张，val：144张，test：144张标注文件为YOLO适用的txt格式或xml格式。可以直接用于模型训练。YOLOv8轴承缺陷检测importosimporttorchfromIPy
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他