innerVoi

【IUI 2020】人在回路机器学习——Human-in-the-Loop AI in Government: A Case Study

文章目录

摘要
1 引言
2 背景
3 设计与实施
- 3.1 收据扫描
- 3.2 图像处理
- 3.3 光学字符识别（OCR）
- 3.4 自然语言处理
- 3.5 机器学习分类
用户接口
总结
主要参考文献

摘要

文章展示了一种人机交互遇见人工智能的新应用，并讨论了从研究到生产的漫长过程中需要解决的问题。与学术界和工业界一直在自动化前沿不同，政府是该领域的新的参与者，但是是一个重要的参与者。我们建立大规模系统，为政策决策者采集信息。以家庭预算调查为例，我们演示了政府机构如何使用人在回路机器学习自动生成官方统计数据。目的是节省时间和资源重复，机器擅长劳动密集型任务，让人类关注需要自由性和智慧的增值任务。一个主要的挑战是人类因素。习惯于手工任务的用户，如何适应AI的复杂性？如何设计用户接口提供给他们一个好的用户体验？我们如何衡量成功？事实上，走向生产的一个关键步骤是确保资金，这需要以涉众能够理解的方式展示潜在的成功。我们强调从实际的商业角度制定问题的重要性，希望能够弥合沟通鸿沟，帮助研究界接触到更多潜在用户，帮助解决更多新奇的现实问题。

1 引言

不是每个自动化问题都需要“人在回路”，但是需要高精度的应用肯定需要。生成官方统计数据是处理时间和精度至关重要的另一个案例。为了演示政府机构如何应用HuIL（“人在回路”，Human-in-the-Loop）替代原先的系统，文章为家庭预算调查（Household Budget Survey, HBS）提出了一种自动化管道。目的是开发出能够被任何政府机构推广和使用的方法。文章的组织结构如下：

背景：描述了典型HBS数据收集过程，强调了现代化需求。讨论了机构系统如何能够被自动化管道替代及哪些领域能够做出改进。提出了衡量成功的指标。
设计与实施：描述了管道中每个模块的实现，在不可能自动化的情景中，我们在人与机器之间的任务划分中探索HuIL策略，并设计了它们的交互。重点在机器将任务移交给人类的任务上，反之亦然。
用户接口：使业务流程现代化不仅仅是改变软件，人类因素是关键的挑战。如何提供良好的用户体验以赢得用户信赖？人机交互研究通常为普通用户设计面向公众的应用，他们是否经过了面向任务的系统训练？
结论和未来工作：规划下一步计划，并强调了超越技术考虑之外的其他挑战。

2 背景

家庭预算调查手机家庭收入和开支模式的数据，这为计算国内生产总值提供了重要信息。通常情况下，手工处理一个日志需要花费4-5个小时，并且需要一个庞大的编码团队来完成任务。人们可以清楚地看到用自动化取代人工操作的潜力，但这提出了一个重要的问题:如何衡量成功?
机器学习领域，有很多评价指标如准确度、精确度、召回率等。然而，从业务角度来看，这些数值不是那么有意义。例如，对于投资更换旧系统的企业来说，潜在收益通常是根据效率节省、生产成本、处理时间、数据质量来衡量的，在官方统计的背景下，是受访者负担。通常需要关于找到这些变量之间的权衡。因此，本文中将使用两组质量度量，并将解释如何在当前环境中将模型性能分数转换为业务性能。

3 设计与实施

观察编码团队的任务，设计了一个高级的自动化管道如图1。

扫描：购物收据可通过办公室平板扫描仪或手机APP扫描；
图片处理：收据被扫描分割并应用图像增强；
OCR光学字符识别：OCR通常并不完美，影响分类错误字符和缩写必须要解决；
机器学习分类：使用不同的特征提取方法和机器学习模型，使它们组合在一起以提高性能。当自动化失败时，使用人在回路的主动学习作为解决方案；

3.1 收据扫描

对于数据捕捉，至少有两种可能的情景：

情景1：收集回答者的纸质收据，并在我们的办公室用平板扫描仪扫描。
情景2：作者开发了一个手机应用程序，允许受访者捕捉收据的图像，并直接上传到政府机构的云存储。

两种方案的优缺点评估如表2：

由于上述考虑，首选方案是风险更小的情景1。因为从研究角度更好的方案并不总是从商业角度更好的选择。

3.2 图像处理

典型的，一个好的OCR，x的字符高度大约需要20像素。大多收据的文本大小为10pt，一个300dpi的分辨率大约产生20像素。因此，用于收据扫描的OCR通常设置为300dpi。
图像处理模块是用Python实现的。收据是从原始扫描中裁剪出来的。通过应用阈值算法、形态学变换、去噪、平滑边缘等方法来提高图像质量。处理一张收据的时间约在6-10秒。由于我们控制了扫描过程中的许多参数，图像增强通常不是必要的，除非用例的质量很低（褪色，有折痕）。

3.3 光学字符识别（OCR）

OCR是定位图像中的文本并将其提取为可编辑格式的过程。早期的OCR算法依赖于模式识别和基于规则的特征检测来识别字符。最近的算法引入了最先进的数据科学技术，例如长短期记忆(LSTM)等循环神经网络。LSTM模型在各种字体、类型(正常、粗体、斜体等)和图像质量的字符图像上进行训练。由于特殊字符，同样也因为LSTM模型学习不同语言的特征序列，因此这些模型是语言依赖的。
本文使用了最初由谷歌开发的开源Tesseract软件包，用于训练LSTM网络的数据包括大量由相机产生的降级图像。如果LSTM在特定的字符序列上失败，它可以退回到它的遗留识别器来做出决定。对于给定的文档，Tesseract输出文本块及其边界框的坐标。
格式良好的文件知道文本的位置足以抽取想要的信息，因此，几十年来，政府机构一直在使用OCR处理调查表格。然而，对于目前处理各种收据的应用程序来说，仅知道文本位置不足以定位有用的信息。图3是一张加拿大超市的收据，图4展示了有效信息如何被抽取并格式化到python的dataframe中。在macbook pro上，OCR需要约4秒，数据解析需要2-3秒。而人工处理通常需要5-10分钟，条形码是最难转录的。

为了解析并抽取有用的信息，我们使用模糊匹配和正则表达式。模糊匹配主要用于匹配商店名称，价格、条形码和日期使用正则抽取。为了衡量OCR的准确性，计算手工描述和OCR输出之间的Levenshtein距离。由于文本解析可能会错误地删除相关行或忽略删除不相关行，我们还计算每个收据的额外和缺失行数，作为衡量OCR正确性的一种手段。
使用字典识别商店，但是没有一个字典能够穷尽所有店名，因为新店总在开张。在人在回路系统中，机器将标记这些商店为“Unkown”来提示人类去更新字典。即使有人工干预来纠正OCR错误，与人工输入相同数量的信息相比，也可以预测在效率节约和处理速度方面的潜在收益。另一方面，人在回路确保数据质量维持在期望的水平上。

3.4 自然语言处理

有些情况下，即使是最好的OCR引擎也会失败。例如，在Costco，检查购物车并划掉收据是一种常见的做法。笔触导致一些字符很难识别，从而拼错单词。自然语言处理提供了很多检查拼写和错误纠正的算法。在这个应用程序中，由于收据描述包含许多特定于商店的缩写，我们将Tesseract默认的英语字典替换为根据购买商品描述的历史记录构建的用户定义字典。我们目前的NLP自动校正无法很好的实现期望的数据质量，因此我们让人工介入进来纠正错误。

3.5 机器学习分类

目的在于自动将购买物品的类别分到对应的个人消费用途分类，这可以通过监督机器学习实现。生产一个带标签的数据集来训练模型是人类最消耗资源的任务之一。生成一个有标签的数据集来训练模型是人类最消耗资源的人物之一。本文使用了一个389,432个条目的数据集，这些条目都是由经验丰富的HBS编码员标记。该数据涵盖了2017年、2018年和2019年的同一时期，以考虑季节性影响。这是一个多分类问题。COICOP（个人消费用途分类）包含约375类食品。这是一个概率过程，模型识别物品的类别，其置信度分数可用于接受或拒绝。从数据的性质来看，有可能存在类别不平衡的风险，而这在多分类任务中可能被放大。该模型可能在占主导地位的类上表现良好，但在训练集中代表不足的类上表现糟糕，因此仅使用准确性作为性能度量可能会产生误导。本研究使用加权指标(准确性、精密度、f分、回忆率)来捕捉更真实情况，同时作者定义了一个定制的性能指标，与业务角度更加贴合。如下图所示。

定义定制的性能指标：假设以8：2划分数据集，文章使用分层采样来应对类别不平衡的问题。因为事先有基本答案，因此可以识别正确分类和错误分类。绘制模型置信度的直方图如图5。给定置信度的切断，称其为阈值=x%。
- 接受：具有高置信度、大于等于阈值的物品；
- 拒绝：置信度小于阈值的物品；

一旦知道了临界值，落在阈值左侧的物品要么被发送给人类编码员，要么在字典中查找。
作者使用了通过scikit-learn Python包实现的三种特征抽取方法：Countvectorizer(CV), 词级和字符级的Term Frequency-Inverse Document Frequency(TF-IDF-w, TF-IDF-c)，以及流行的监督奇迹学习模型如偶素贝叶斯、逻辑回归、随机森林等。也测试了先进的词嵌入方法Embeddings from Language Models (ELMo)和FastText。FastText被作为监督模型和迁移学习的预训练模型。
在所有测试模型中，公认的LR和RF模型表现最好。使用逻辑回归的FastText嵌入仅产生接近68%的准确性。ELMo词嵌入显示了有希望的初步结果，但计算成本较高。一般来说，最先进的模型似乎更需要数据，所以在等待收集更多数据的同时，我们专注于在较小的数据集上表现更好的传统模型。为了平衡每个模型各自的弱点，作者使用集成学习架构，该架构应用软投票概念，根据平均预测概率选择最可能的预测。
最佳模型的拟合结果如表3所示，样例模型的特征绘制如图6。

表4显示了各种ML分类器在错误阈值范围内的业务性能指标。

正如预期的那样，自动化的百分比随错误阈值的增加而单调增加。最大的自动化率在错误率为5%时达到，自动化率为71%。使用LR或RF与Countvectorise特征提取结合的方式。
然而收据中的信息有时过于简洁，从而导致无法细致的分到具体类别，如鲜奶是简略的，但具体类别是全脂牛奶、脱脂牛奶还是半脱脂牛奶。对于这一类情况，预计它们的TF-IDF得分非常低，因此模型应该做出低置信度的预测。如果阈值正确设置，它们的置信度会小于阈值，从而被标记和发送给人类做进一步的判断，流程如图7所示。

一个罕见的产品或者新产品出现，机器的预测性能可能会不好。这种情况下，机器会给一个较低的置信度把它们标记出来，编码员进而手动对他们进行分类，分类结果被加进标签数据集用于模型的再训练。这是人在回路机器学习中的主动学习原则。当一个系统无法百分百的完成自动化时，允许人类参与到其中来保持更新。

用户接口

虽然HCI文献中有很多很棒的UI示例，但大多数都是针对普通用户设计面向公众的应用程序。本研究中的接口设计是面向生产系统的，对于经过高度训练的调查编码员来说，约束条件应当是不同的，因此一般的用户体验(UX)最佳实践可能不适用。另一个区别在于接受程度。一个用户会在电影评分网站上可能是热情的，但员工对于人工智能技术是严肃的，他们害怕失业，所以会更挑剔。
为了设计一个适合于目的的系统，我们相信第一步是了解用户并采用以人为本的设计方法。为此，我们访问了编码团队，观察他们的日常工作，了解当前的业务流程。我们就他们喜欢什么和不喜欢什么进行了采访，并指出了需要改进的地方，得到结果如下：

编码员不是技术通：他们习惯手工处理数据，而不太适应AI系统。使用者需要舒适感和低认知的负担，来维持熟悉感。
他们经验丰富，在判断软件的可用性和亲和力方面非常迅速。UI将建立第一印象，隐藏复杂乏味的AI机制极为重要。
当我们一起草拟新功能时，他们通常试图在遗留系统中复制功能，并总是以当前系统为基准来衡量新想法。
他们的工作任务非常重复。
数据收集是一个连续过程。改变可能会导致服务中断，所以最好逐步调整。
人们普遍对AI的引入具有担忧。人在循环中”可能是一种很好的传递信息的方法，即编码人员在新的工作流中扮演着积极的角色。

针对上述问题，文章设计了如图8的UI。设计决策是与构建遗留系统的程序员和软件开发人员一致做出的，尽可能地再现原来界面的外观和感觉。

然而，这种UI设计并不意味着要按原样实现。事实上，虽然短收据看起来可以接受，但对于超过30件商品的长收据就不一定了。如果屏幕看起来太忙，可能会导致混乱和沮丧。因此，我们的目的是在第二阶段重新设计UI，在屏幕上一次显示一个项目，如图9所示。控制可以通过键盘和鼠标访问，因此用户可以切换，从而防止重复性劳损。

总结

本文演示了政府机构如何用自动化取代其原始的手工流程。设计并实现端到端自动化管道，并讨论成功措施。为了避免重复工作，使用开源软件来利用公共知识，只有在找不到已知解决方案时才开发方法。文章使方法和代码公开可用，这样任何人都可以重用它们。
虽然我们强烈主张将自动化作为一种节省效率和加快处理时间的手段，但我们也承认，在某些情况下，我们需要人工干预来维持数据质量。因此，我们提出了一个人在循环的解决方案，采用以人为中心的方法设计用户界面，使人机交互在过程的每一步都紧密交织在一起。
在我们继续改进我们的方法的同时，我们还计划在后勤部门对更多的数据和在不同国家进行进一步的测试。主要目的是收集证据并进行成本效益分析，以支持投入生产的业务案例。这项工作将在建立能力的同时进行，以便将来用户能够操作和维护新系统。

主要参考文献

[1] Benedikt L, Joshi C, Nolan L, et al. Human-in-the-loop AI in government: a case study[C]//Proceedings of the 25th International Conference on Intelligent User Interfaces. 2020: 488-497.

Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
Python 编程基础作业总结
本周主要围绕Python基础编程展开了学习，通过一系列的作业题来巩固所学知识。这些题目涵盖了输入输出、条件判断、循环结构等多个基础知识点，下面将对每道作业题进行详细分析。1.计算指定月份第一天是星期几题目描述编写一个程序，接受用户输入的一个年份和一个月份，输出该月份的第一天是星期几。使用蔡乐公式计算星期。提示：使用蔡乐公式计算星期。W=((26*M-2)/10+D+Y+Y/4+C/4-2*C)%7
star31.6k，Aider：让代码编写如虎添翼的终端神器
ider是一款运行在终端中的AI结对编程工具，它能与大型语言模型（LLM）无缝协作，直接在您的本地Git仓库中编辑代码。无论是启动新项目，还是优化现有代码库，Aider都能成为您最得力的助手。它支持Claude3.5Sonnet、DeepSeekV3、GPT-4o等顶级AI模型，几乎可以连接任何LLM，让编程体验如虎添翼。Stars数35,188Forks数3,230主要特点Git操作：Aider
交叉编译Python-3.6.0到aarch64/aarch32 —— 支持sqlite3
参考https://datko.net/2013/05/10/cross-compiling-python-3-3-1-for-beaglebone-arm-angstrom/平台主机：ubuntu14.0464bit开发板：qemu+aarch64（参考：http://www.cnblogs.com/pengdonglin137/p/6442583.html）工具链：aarch64-linux-
python# python:3.5 aarch64构建镜像 Ling丶落 centos
构建失败从ubuntu中尝试构建FROMpython:3.5-slimLABELMAINTAINER="[email protected]"#installrelatedpackagesENVENVIRONMENTDOCKER_PRODWORKDIR/workCOPY./dataset.py/work/dataset.pyCOPY./model.py/work/model.pyCOPY./PyA
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分蚝油菜花每日 AI 项目与应用实例 AI编程 git 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！AI在线答疑->智能检索历史文章和开源项目->尽在微信公众号->搜一搜：蚝油菜花⌨️“每个CLI爱好者都该试试的AI编程革命：对着终端说话自动生成Gitcommit是怎样的体验？”大家好，我是蚝油菜花。如果你也经历过——在vim里卡了半小时，只为给函
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
DeepSeek在智能教育评估中的应用：试题检索 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 easyui 前端 javascript ai
DeepSeek在智能教育评估中的应用：试题检索关键词：DeepSeek、智能教育、试题检索、自然语言处理、知识图谱、个性化学习、评估系统摘要：本文探讨了DeepSeek大模型在智能教育评估系统中的试题检索应用。我们将深入分析如何利用先进的自然语言处理技术和知识图谱构建高效的试题检索系统，实现个性化学习路径推荐和精准评估。文章将从核心概念、技术原理到实际应用场景，全面解析这一创新教育技术解决方案。
两步移动搜索法（2SFCA）python 我在北京coding python python 开发语言
实现两步移动搜索法（Two-StepFloatingCatchmentAreaMethod,2SFCA）是一种广泛应用于地理信息系统（GIS）领域的方法，用于评估设施的空间可达性。以下是基于Python和GeoPandas的一种实现方式。准备工作为了实现2SFCA方法，需要准备以下数据集：供给点：表示服务提供方的位置及其服务能力。需求点：表示潜在使用者的位置及其需求量。距离矩阵：描述供给点与需求点
Java、python中高级开发工程师岗位框架要求统计爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ java python 开发语言
一、主流框架使用频率框架/技术出现频率说明SpringBoot89%几乎成为Java后端开发的标配，用于快速构建微服务和独立应用。SpringCloud76%微服务架构必备，提供服务发现、配置管理、网关等核心组件。MyBatis/MyBatis-Plus72%最流行的ORM框架，MyBatis-Plus进一步简化开发。Spring68%基础框架，中高级岗位要求深入理解IoC、AOP原理。Hiber
PPOCRLabel 环境配置教程 ysh9888 人工智能算法计算机视觉 opencv
PPOCRLabel环境配置教程_哔哩哔哩_bilibili1安装conda2新建环境condacreate--nameppocrpython=3.8--channelhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/condaactivateppocrpipinstall-rrequirements.txt-ihttps://pypi
response.split(“\n“)[0].strip() 是什么 ZhangJiQun&MXP 教学 2021 AI python python 机器学习人工智能语言模型自然语言处理
response.split(“\n”)[0].strip()是什么returnresponse.split("\n")[0].strip()这行代码在Python中通常用于对字符串进行处理并返回处理后的结果response.split("\n")：split()是Python字符串对象的一个方法，用于根据指定的分隔符将字符串拆分成一个列表。在这行代码中，"\n"作为分隔符，表示按照换行符来拆分字
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
Python函数 python知识
1文档字符串函数定义下的第一个字符串是文档字符串，用于解释函数。可以通过help(function_name)或function_name.__doc__来查看。2函数返回单个返回值：return一个值无返回值：函数执行完毕没有return语句，或者return后面没有值，会隐式地返回None返回多个值：实际上是返回一个包含所有值的元组(tuple)3参数函数声明：使用def关键字来创建函数默认参
Python-selenium爬取藏在歌词里 python selenium 开发语言
selenium前言使用python的requests模块还是存在很大的局限性，例如：只发一次请求；针对ajax动态加载的网页则无法获取数据等等问题。特此，本章节将通过selenium模拟浏览器来完成更高级的爬虫抓取任务。什么是seleniumSelenium是一个用于自动化Web应用程序测试的开源工具集。它提供了一组API和工具，可以与多种编程语言一起使用，如Java、Python、C#等，用于
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
vllm推理实践 try2find java 前端服务器
1.vllm推理demo实验fromvllmimportLLM,SamplingParams#定义生成参数sampling_params=SamplingParams(temperature=0.7,top_p=0.9,max_tokens=100,)#加载DeepSeek模型（以deepseek-llm-7b为例）#model_name="deepseek-ai/deepseek-llm-7b"
llama-cpp-python使用教程 try2find llama python 开发语言
以下是llama-cpp-python的完整使用教程，涵盖安装、基础用法、高级功能（如GPU加速、多模态等）和常见问题解决。1.安装1.1基础安装（CPU版）pipinstallllama-cpp-python-ihttps://pypi.tuna.tsinghua.edu.cn/simple1.2启用GPU加速（CUDA）CMAKE_ARGS="-DGGML_CUDA=ON"pipinstall
【Python】列表嵌套字典多规则排序魔都吴所谓 Python 算法工具 python 服务器 java
数据a=[{"project":"pro_613","branchList":[]},{"project":"pro_614","branchList":[]},{"project":"pro_612","branchList":[]},{"project":"pro_631","branchList":[]},{"project":"pro_617","branchList":[]},{"pro
Redis存储Cookie实现爬虫保持登录 requests | selenium
前言前面已经介绍了requests和selenium这两种方式的基础知识和模拟登录,但是我们需要每次都进行登录,这明显是很麻烦并且不合理的,所以这次我分享一下怎么可以让我们的程序进行一次登录之后,和普通浏览器一样下次不进行登录直接进行对网站数据的爬取下面的我分享的内容需要前置知识,如果同志有知识不理解,可以查看我以前写的文章Python爬虫request三方库实战-CSDN博客Python爬虫XP
Requestium - 将Requests和Selenium合并在一起的自动化测试工具测试界晓晓软件测试测试工具 selenium 自动化软件测试功能测试自动化测试程序人生
Requests是Python的第三方库，主要用于发送http请求，常用于接口自动化测试等。Selenium是一个用于Web应用程序的自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。本篇介绍一款将Requests和Selenium结合在一起的自动化测试工具-Requestium简介Requestium是一个Python库，它将Requests、Selenium和P
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
深度解析：venv和conda如何解决依赖冲突难题咕咕日志 conda python
文章目录前言一、虚拟环境的核心价值1.1依赖冲突的典型场景1.2隔离机制实现原理二、venv与conda的架构对比2.1工具定位差异2.2性能基准测试（以创建环境+安装numpy为例）三、venv的配置与最佳实践3.1基础工作流3.2多版本Python管理四、conda的进阶应用4.1环境创建与通道配置4.2混合使用conda与pip的风险控制4.3跨平台环境导出五、工具选型决策树5.1场景化推荐
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p