风度78

【NLP】NLP，能辅助法官判案吗？ | CCF C³

Alex 发自凹非寺
量子位 | 公众号 QbitAI

自然语言处理（简称NLP）被誉为“人工智能皇冠上的明珠”、“实现通用人工智能（AGI）的钥匙”。

当自然语言处理技术遇到司法系统，会擦出怎样的火花？

在这里先跟大家分享一个“常识”：

据我国的法律，给出的量刑大都是一个区间，而不是具体值，比如判刑3年到5年。

那么究竟是3年、4年还是5年，需要法官对具体问题进行具体分析。

其出发点是好的，但实际却让一些经验欠缺的法官左右为难：判久了对被告不利，判的时间不足对受害者又不够公平。

不过现在嘛，法官的这个烦恼可以先放放了，因为有一项AI前来“搭把手”。

这个AI背后的主要技术，其实就是自然语言处理，它可以提取出当前案件中的诸多要素，将其和其他类似案件的要素作对比，最终分析得出具体建议值。

NLP技术在司法领域的应用

事实上，除了能够辅助法官量刑外，现在“NLP+司法”的应用已不胜枚举。

因为司法系统的构造可不简单：它包括公安、检察院、法院、司法局、律师，当然还有民众。

对于不同的群体和场景，需要采用不同的方案和技术。

例如，在庭审场景下，有AI帮忙做笔录那就省事儿多了，还可以大幅提升庭审效率。

于是“语音识别自动生成庭审笔录”不就来了吗？

目前，科大讯飞的语音识别自动生成庭审笔录已经覆盖了29个省份的法庭，平均使庭审时长缩短了30%，为复杂庭审缩短时长还达到了50%。

此外，对公安、检察院、法院比较熟悉的朋友可能知道，很多案件都有厚厚一叠卷宗，手动编目、分类费时费力，现在这种活儿也可以交给AI来处理了，文字OCR技术在这里大显身手。

编目完成后，还有重头戏：阅卷。当然，AI又被派上了用场，它可以辅助办案人员阅读卷宗，例如：要素索取、结果呈现。

然后到了案件中至关重要的一部分：证据。

事实上，证词和线索往往都来自不同的个体，很多时候都会不出现证据不一致等情况，为此让人工分析推理，是件非常淘神费力的事情。

而AI现在可以辅助办案人员校验证据了，具体来说，就是AI单个人提供的笔录等进行校验，并且对不同人给出的信息进行对比、矛盾审查。

这背后涉及到实体识别、指代消解、语义角色和依存关系分析等NLP技术延伸出来的方法。

对于上述提到的卷宗、笔录等法律文本，AI还能自动发现文本中的错别字词和语法错误。

为实现这样的效果，讯飞采用了BERT中文全词Mask（BERT-Chinese-wwm）模型，这是一个哈工大和讯飞联合发布的全词覆盖中文BERT预训练模型。

除此之外，面向普通大众，讯飞还发布了法律自动问答AI助手“法小飞”；还有基于案情的律师推荐AI等。

以上，都是科大讯飞副总裁、AI研究院副院长，北京研究院院长王士进分享的讯飞“NLP+司法”案例。

NLP的进展与挑战

前文展示了“NLP+司法”的应用，下面就NLP这项技术展开谈谈。

在本部分正式开始前，先来看一段有趣的对话吧（据说这是道外国人中文语言水平考试题）：

A：你这是什么意思？
B：没什么意思，意思意思。
A：你这样就没意思了。
B：哎呀，小意思，小意思。
A：你这人可真有意思。
B：哎呀，其实也没有别的意思。
A：那我就不好意思了。
B：是我不好意思。

请问这里的“意思”都是什么意思？（Doge）

其实，这里的“意思”二字可以看作一个符号，这个符号背后承载的信息非常丰富。

一词多义、多词一义等问题，本质上是形式和背后含义之间存在多对多的映射关系的问题，或者可以理解成在一个广阔空间内进行搜索的问题。

我们认为，怎么处理好这些关系，是自然语言处理的最核心的困难。

哈尔滨工业大学教授、人工智能研究院副院长车万翔如是说道。

但如果没有任何限制，在一个非常大的空间内进行搜索，其复杂性相当高。这个该怎么解决？

车教授介绍称，一般是用“知识”进行约束，这里打双引号的原因是：提到知识，一般会认为是某些规则、逻辑、符号知识；而这里指的是更广义的知识。

广义的知识有多种分类法，这里主要将其分为3种来源。

其一，就是狭义的知识，包括语言、常识（很难从文本中挖到）和世界知识（可以从文本中挖到），世界知识可以拿知识图谱等来表示。

其二，是算法，包括浅层学习、深度学习和NLP算法。

其三，是数据，包括有标注的、无标注的数据和伪数据。当下爆火的预训练模型就使用了大量的未标注数据。

首先可通过未标注数据预训练一个模型；接着用语料库去精调这个模型，从而使目标模型变得更强大。

当下普遍认为，对于几乎所有AI系统，如果没有新的知识、算法或数据输入，这个系统本身很难提高。

当然也有人提出，怎么感觉有例外——比如DeepMind的AI棋手AlphaZero，就是通过自我博弈来学习精进的。

对此，车教授解释道，这种游戏场景比较特殊，因为它本身是一个封闭的系统，能够下棋的位置毕竟有限，且还有人为制定的胜负标准，所以在条条框框之下，机器自由发挥的空间并不算特别大。

但像NLP就不一样了，哪句话说得好，哪句话说得不好，其实没有一个明确的判定标准，这种情况下，左右博弈就没有奇效了。

说到这里，现在 NLP用到了知识、算法和数据，那NLP之后还会朝哪个方向发展？或者说，NLP下一步还会用到什么？

要回答这个问题，不妨先纵观一下人工智能自1956年诞生以来的发展简史。（你就会发现一些有意思的规律）

上世纪50年代至上世纪90年代期间，主要关注的是小规模专家知识；从上世纪90年代到2011年前后，更关注的是算法设计；从2010年到2017年，迎来了深度学习的热潮，数据的重要性愈发凸显。

而自2018年谷歌推出BERT至今，大规模预训练模型成了当下热词。

不难发现，此前，后一个阶段的时间几乎是前一阶段的一半，所以……（手动狗头）

说回大规模预训练模型，车教授指出，当前大模型的“同质化”趋势越来越明显，当然这可不是什么不好的事，我们可以用“通用性”来理解。

无论是 NLP 任务还是CV任务等，现在都有一套“万金油”模型：Transformer，基本可以统一解决很多问题。
此外，现在模型的规模越来越大，而且模型的表现和其规模确实呈正相关。所有有观点认为，随着模型规模的增大，还可能会涌现出令人惊讶的AI。正如俗话所说：量变引起质变。

车教授表示，模型的“同质化”和“规模化”趋势是不可逆转的，未来还会继续这样走下去。

至于NLP目前遇到的问题，其实也算是人工智能发展过程中的问题，比如说易用性、高效性、鲁棒性、可解释性、推理能力等。（篇幅有限，这里就先不展开了）

车教授提出，未来可能除了数据外，还会使用更广泛的“知识”，而这种“知识”的来源可以被概括成“体验”，体验来自于人机交互等场景。

NLP相关问题更多探讨

围绕自然语言处理的机遇和挑战，几位学界和企业界的大佬展开了一场主题Panel。

△左起依次为：王士进，车万翔，刘康，刘知远，吴友政，刘聪

大模型的工业实用前景

首先，纵观前沿科技和当今的工业界不难发现，虽然自2020年GPT-3诞生以来，大模型的参数已达千亿级别；但在工业实操中，尚未看到超大模型的广范应用。

其中一个重要的原因是，大模型的训练数据和一些工业领域的真实数据差别明显。

大模型的实用前景到底如何目前十分具有争议——有乐观者认为：未来大模型也能成为NLP 的基础模型；也有消极的观点表示：这更像各巨头集合算法算力、大数据等优势搞的一个军备竞赛而已。

现场的几位专家对大模型的实用前景都未持消极态度，不过他们的具体想法也不尽相同。

学术界这边，中国科学院自动化研究所的刘康研究员发言称：

大模型确实是个好东西，但与其把大模型看成一种资源，不如把它看成一种技术规范、一种工具。

比如，在一些小数据场景下，能够快速把已有的一些知识经验迁移到新的任务。就像人拿到一个不会用新产品时，通过阅读产品说明书，然后就很快学会使用该产品了。

清华大学副教授刘知远的研究方向之一就是大模型。他指出，一方面，在实践中发现，中文的数据质量比英文的差太多。

这不仅是规模问题，数据质量也不太行。最终效果就是，在实际训练过程中，对中文素材去完重、去完垃圾后，所剩的数据非常有限。

所以，如何为模型训练收集更多高质量的中文数据，是个重要议题，也是一件任重道远的事儿。

另一方面，刘知远教授认为，要提升大模型的实用性，下一代大模型必须具备这样的特性：

随着模型的规模的增长，其计算量要呈现一个亚线性的增长趋势，否则系统很难承受。就像我们的人脑也学习了很多东西，但在回忆具体某概念时，脑子一般不用把很多知识点都过一遍。

企业界这边，京东科技语音语义创新算法负责人、高级总监吴友政提到，当下大伙儿热议的大模型并不一定要参数量达到千亿级才算。

除了“大”之外，Transformer和自监督也是大模型的两个核心概念。更重要的是，Transformer和自监督在工业界已有广泛应用，很多企业的线上系统虽然没有千亿参数，但参数量也能达到亿级了。

当然，百亿、千亿级模型的工业应用场景，还需要漫长的探索。

举个例子，在实际应用中，可控性往往也是一个重要指标。虽然像GPT-3这样的模型在生成开放故事方面表现很好，但怎么基于现有的知识生成更加可控的文本依然值得研究。

对千亿大模型的工业应用，科大讯飞研究院执行院长刘聪干脆直言道：

对企业来说，投产比太高。（即性价比太低）

他认同“超大模型可以提高相关技术领域天花板”的观点，就像前面提到的，把它作为一种范式是OK的。

刘聪还补充道，在教育、医疗、司法等场景下（这很讯飞），模型的可解释性是至关重要的。

用大白话讲，就是要说清楚模型内部到底发生了什么，才产生出这样的结果，否则计算机通过模型给出的判定很难让人信服。

然而，现在很多千亿模型内部还处于“黑盒”状态，有些原理不仅是现在看不透，而且由于其庞大的体量和错综复杂的结构，以后也很难解释清楚。

大模型处理多模态数据的前景

除了大模型的工业应用外，大模型处理多模态数据的前景也是个有意思的议题。

大家应该知道（至少能意会到），人脑可以轻松处理多模态的数据，从中学习和解耦各种复杂信息，并且让各种模态的数据高度协同作用。

说人话，比如当俩人交谈时，除了说出来的言语，还有语气、语速、神态、肢体语言等也在传递着不同维度信息，就像有人说“好好好”可能是在真心夸赞，也可能是——

读取并处理各种信息，对咱们聪明的大脑来说一般没啥问题，但是对于计算机，是否也能轻松解决？

哈工大车万翔教授表示，这应该没有些人想象的那么困难。

前面他用“同质化”一词形容了当今各个大模型的发展趋势，再说一次，这里的“同质化”不是贬义词——

现在，文本、语音、图像都可以用Transformer这套东西来表示；反之，用Transformer能更容易地整合不同模态信息。所以，像“语音+文本+图像”这样的多模态预训练模型其实已经数不胜数了。

此外，例如DeepMind的Gato，足足在604个不同的任务上进行了训练，训练数据还包括游戏里的建模动画、模拟的机器人运用场景等。最终，这个“全才”AI不仅可以看图写话、和人类聊天，还可以把雅达利游戏玩得飞起，并且能操控机械臂。

清华刘知远教授补充道，他认为多模态模型的“模态”可以更加多样化，例如用户行为就是一种值得大模型学习的数据。

他提到OpenAI今年发布的网页版GPT（WebGPT），可以把用户通过搜索引擎来回答问题的行为序列作为Transformer的输入，并对其训练，然后模型就学到了一个新技能——根据问题去网上搜索答案。

企业界这边，科大讯飞的刘聪指出，在应用场景中有刚需的多模态模型，公司会优先投入研发。

刘聪以语音交互问题举例：虽然在常规场景下，语音交互的技术已经相当成熟了；但是在车载、鸡尾酒会等嘈杂环境中，怎么判断某人正在对A还是B，在对人还是对机器说话？

在这种复杂的交互场景下，语音和视觉信息等结合，可以显著提升模型的准确性。

在大伙儿对多模态大模型积极表态之时，刘康研究员则提出了在科研过程中遇到的一个问题：

用Transformer这个万金油来建立各个模态之间的关联，看似是个近乎完美的方案，但实际极大的依赖于背后数据之间的关系。

举个简单的例子，数据之间是对应关系还是互补关系？比如，给出一段新闻数据，里面的图片可能是上下文讲述的内容，也可能是对文字的补充（就像上面那个表情包）。

所以，刘康研究员认为，除了模态种类还需多样化外，不同模态之间的逻辑关系也是未来值得研究的方向之一。他建议，把采集的数据映射到背后的知识库上，通过知识来处理各种模态的关系。

大模型的可解释性

前文提到，模型的可解释性在一些特定场景下非常重要，而且打破砂锅问到底是一众科研人的求知态度。

所以尽管前路渺茫，许多人仍在虔诚地探索着，希望有朝一日能解释清楚超大模型运行过程中的各种原理。

不过，“深度学习大模型天然就不具有可解释性。”哈工大车万翔教授分享了他之前看到的这种观点。他提到，机器并不像人的思维那样运行。

想追求可解释性，在浅层模型上更容易找到。当然，浅层模型的精度一般比深度学习模型差远了。

车教授认为，高精度和可解释性本身就是矛盾的。所以根据具体场景和需要选择不同模型就好了。

比如，让机器给学生作文打分，总得说清楚为什么得出这个分数吧。也就是要讲明白为模型设置了多少feature，如：典故、排比、修辞方式、逻辑性等。这里浅层模型就更适用。

刘康研究员也认为，要去搞清楚深度学习模型黑盒部分的原理，宛如走进一条死胡同。

现在的研究者主要采用两种手段试图解释深度学习模型黑盒内发生了什么：

一种是观察分析输入哪些内容或获得更多权重；另一种是用可解释的浅层模型无限逼近黑盒模型，然后用浅层模型的结果来近似解释黑盒模型。

然而这两种方法本本质上也只是模拟，还是没解释黑盒模型的机制到底是怎么样的。此外还有个重大问题：即使做了解释，也几乎是不可验证的，这样就没法判断解释是否真的靠谱。

也有人对此观点持不同态度——清华刘知远教授就认为，深度学习模型还是具有可解释性的，只不过别之前的浅层模型复杂多了，需要用到更复杂的模型和机制。这些东西还需探索，但非完全不可逾越的。

从产业角看来看大模型的可解释性问题，京东吴友政和科大讯飞刘聪都表示：

要结合各行业场景的需求来分层看待可解释性，部分简单场景其实不太需要深度可解释性，而教育、医疗等用户关切过程的重大社会场景则会对可解释性提出更高的要求。

对于那些对可解释性有特别需求之处，先弄清楚到底需要对哪些点进行“解释”，除了用大模型之外，还可以结合其他知识运用类的技术。

刘聪还补充道，人机协同也是很重要的一种方式。当机器不能独立Perfect时，那就先与人合作呗，用户的行为或许也能为模型可解释性提供一定帮助。

关于CCF C³

以上的内容，全部出自CCF C³的第14期活动，主题为“自然语言处理”，由科大讯飞股份有限公司承办。

2020年，中国计算机学会CCF成立了一个专为企业技术领军人物打造的交流平台：CCF CTO Club，简称C³。

C³活动旨在联结企业CTO和高级技术人才以及资深学者，每次以一个技术话题为核心，走进一家技术领先企业。

目前为止，CCF C³的活动已经举办了14期，先后已经走过京东、小米、搜狗、百度、亚马逊、阿里巴巴等企业。

— 完 —

往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419，加入微信群请扫码

mavlink python 彩云的笔记 linux 无人驾驶 mavlink
frompymavlinkimportmavutil#Createtheconnectionm=mavutil.mavlink_connection('udpin:0.0.0.0:14550')dir(m.mav)['_MAVLink__callbacks','_MAVLink__parse_char_legacy','_MAVLink__parse_char_native','__class__
《用上位机控制无人机：Python+MAVLink协议飞行实验》欧振芳 python
1.实验目标-通过Python编写的上位机程序，基于MAVLink协议控制无人机（如PX4/ArduPilot固件的无人机）。-实现基础飞行指令：解锁、起飞、悬停、降落。-探索MAVLink消息的构造与解析机制。2.实验环境准备硬件-无人机硬件：支持MAVLink协议的飞控（如Pixhawk系列）。-通信链路：USB直连、数传电台（3DRRadio）或WiFi（如通过UDP）。-安全环境：空旷无干
一次Python与STK12.2联合仿真
（一）软件准备：STK12.2是在某宝上花钱买的。我个人在安装软件上，更偏向于能用钱解决的就用钱解决，无论是商家远程安装还是自己按照商家的步骤安装，效率都更高，而自己从网上找免费的渠道安装软件费时费力还不一定能成功。Python是自己按照版本对应关系下载的，我使用的Python版本是3.10.9。我是在PycharmCommunityEdition2023.1.1上进行编程。（二）STK12与Py
《Python 项目 CI/CD 实战指南：从零构建自动化部署流水线》清水白石008 课程教程学习笔记开发语言 python ci/cd 自动化
《Python项目CI/CD实战指南：从零构建自动化部署流水线》一、引言：为什么Python项目需要CI/CD？在现代软件开发中，CI/CD（持续集成/持续部署）已成为不可或缺的工程实践。它不仅提升了开发效率，还显著降低了部署风险。对于Python项目而言，CI/CD的价值尤为突出：✅自动化测试确保代码质量✅快速部署加速产品迭代✅与云平台、容器技术无缝集成✅支持多版本、多环境的灵活发布Python
使用python调用STK12.2并实现霍曼转移 AndyVictory python 开发语言
使用STK的PythonAPI和Astrogator模块来创建一个简单的霍曼转移轨道场景（从近地轨道转移到地球同步轨道）:1、创建一个新的场景并添加一个卫星。2、定义卫星的初始状态（近地轨道的参数）。3、传播近地轨道。4、使用目标序列和DV1机动将卫星转移到转移椭圆轨道。5、传播转移椭圆轨道到远地点。6、使用目标序列和DV2机动将卫星转移到外部轨道（地球同步轨道）。7、传播外部轨道。8、运行任务控
对话新希望CDO李旭昶：立足核心诉求，积极拥抱人工智能
“转型焕新，希望无限。”整理|王娴编辑|云舒出品｜极新4月12日，在「2024飞书先进生产力峰会|成都站」活动中，新希望首席数字官李旭昶先生做了主题为“转型焕新，希望无限”的分享。上次见他是4个月前，当时我们聊了1个多小时，内容涉及数字化转型、人工智能、管理、技术商业等话题。今天顺着他分享的内容，将这篇对话分享出来。随着信息科技的发展，我国传统企业在过去几年中逐步进行数字化转型，利用先进的科学技术
python坦克大战名难取aaa python pygame 开发语言贴图
文章目录前言资源获取一、项目介绍1.pygame是什么？2.操作指南3.项目演示二、项目实现1.安装库2.引入库3.项目代码3.1主逻辑类3.2背景类3.3基类3.4坦克类3.5MyTank类3.6EnemyTank类3.7子弹类3.8爆炸类3.9墙壁类3.10水晶类3.11音乐类4.项目打包参考文档总结前言《坦克大战》，1985年由日本开发商南梦宫（Namco）开发，是第一款可以双打的红白机游戏
Python批量爬取谷歌原图，2021年最新可用版
文章目录前言一、环境配置1.安装selenium2.使用正确的谷歌浏览器驱动二、使用步骤1.加载chromedriver.exe2.设置是否开启可视化界面3.输入关键词、下载图片数、图片保存路径三、爬取效果四、完整代码前言作为一名CVer，数据集获取少不了用到数据、图片爬虫技术，谷歌作为全球最大的数据搜索网站，如何从中快速获取大量有用图片数据尤为重要，但是技术更新，很多代码大多就会失效，爬与反爬永
【Pycharm虚拟环境下载模块】阿斯达使 python
Pycharm虚拟环境下载模块优点步骤优点模块安装在虚拟环境中，不会污染全局Python，并且不同项目可以使用不同版本的模块。步骤使用cmd打开命令提示符，进入项目路径。·C:\\>D:·D:>cd\Pycharm\Rician\venv\Scriptsactivate进行激活使用pipinstall下载需要的模块通过piplist查看当前环境中已安装的模块使用deactivate退出虚拟环境
python基础项目实战-PyQt5制作俄罗斯方块春风抚微霞 python项目实战 python pygame 开发语言
之前已经使用pygame制作了一款简易的俄罗斯方块，最近学习了python的GUI编程，也就进行了实操了一下，用PyQt5制作了一下。1.俄罗斯方块的形状：S、Z、T、L、反向L、直线、方块，每个形状都由4个方块组成，方块最终都会落到屏幕底部。2.操作:左键:左移右键:右移上键:向左旋转下键:向右旋转D键:加速下落空格键:直接掉落到底部P键:暂停3.完整代码如下:#!/usr/bin/python
飞算科技：以创新科技引领数字化变革，旗下飞算 JavaAI 成开发利器飞算JavaAI开发助手科技
作为国家级高新技术企业，飞算科技专注于自主创新，在数字科技领域持续深耕，用前沿技术为各行业客户赋能，助力其实现数字化转型升级的飞跃。飞算科技凭借深厚的技术积累，将互联网科技、大数据、人工智能等技术与实际应用紧密融合。公司组建了一支由行业资深专家和技术精英构成的团队，他们在相关领域积累了多年实践经验，深刻理解不同行业客户在数字化进程中面临的痛点与挑战。基于这些洞察，飞算科技推出了一系列具有创新性和实
Python爬虫实战：批量下载小红书笔记图片的全流程技术解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫笔记开发语言音视频 github
1.引言：为什么要爬取小红书笔记图片小红书作为新兴的生活方式分享平台，聚集了大量高质量原创笔记内容，涵盖时尚、美妆、旅游、美食等多领域。笔记中的图片往往是内容的核心，批量下载小红书笔记图片，有助于：内容归档与备份数据分析与用户行为研究图像识别与机器学习训练电商推广及内容再加工但小红书对内容保护做得较好，爬取难度较高，需要结合多技术手段突破。2.小红书平台特点与爬取难点动态加载与API接口多变：页面
基于Python的Google Patents专利数据爬取实战：从入门到精通 Python爬虫项目 2025年爬虫实战项目 python 开发语言爬虫 scrapy selenium
摘要本文将详细介绍如何使用Python构建一个高效的GooglePatents专利爬虫，涵盖最新技术如Playwright浏览器自动化、异步请求处理、反反爬策略等。文章包含完整的代码实现、性能优化技巧以及数据处理方法，帮助读者全面掌握专利数据采集技术。1.引言在当今知识经济时代，专利数据已成为企业技术研发、市场竞争分析的重要资源。GooglePatents作为全球最大的专利数据库之一，收录了来自全
Python游戏开发实战：打造高仿俄罗斯方块掌机坦克大战
引言在那个电子游戏刚刚兴起的年代，俄罗斯方块掌机上的坦克大战承载着无数玩家的童年记忆。简单的像素画面、紧张刺激的战斗、精准的操作反馈，这些元素构成了一个经典的游戏体验。今天，我们将用Python和pygame库来重新诠释这个经典游戏，不仅要还原其精髓，更要在技术实现上进行创新和优化。这个项目不仅仅是一个简单的游戏复刻，更是一次完整的游戏开发实践。从游戏架构设计到用户体验优化，从碰撞检测算法到动态难
Python 代码生成 LaTeX 数学公式：latexify 示例 examples
文中内容仅限技术学习与代码实践参考，市场存在不确定性，技术分析需谨慎验证，不构成任何投资建议。latexify示例本notebook提供了多个使用latexify的示例。更多细节请参阅官方文档。如有任何疑问，请在issuetracker中提出。安装latexify#运行下方示例前请先重启运行时。%pipinstalllatexify-pyCollectinglatexify-pyDownloadi
fdata = fp.read()ValueError: read of closed file 什么意思 whale fall python进阶 python
这个错误提示ValueError:readofclosedfile意味着你尝试从一个已经关闭的文件对象中读取数据。在Python中，当你打开一个文件后，文件需要保持打开状态才能进行读取或者写入操作。如果你关闭了文件（例如使用file.close()或者文件对象自动关闭），再尝试读取就会触发这个错误。要避免这个错误，可以确保在文件关闭之前读取文件，或者使用with语句来自动管理文件的打开和关闭。例如
Zephyr开发指南——编程语言支持（Minimal libc） wayne2018 Zephyr jvm
Minimallibc最基本的C库，被称为“最小libc”，是Zephyr代码库的一部分，并提供了标准C库的最小子集，以满足Zephyr及其子系统的需求，主要是在字符串操作和显示领域。它的占用空间非常低，适用于不依赖于ISOC标准库中较少使用的部分的项目。它还可以与许多不同的工具链一起使用。最小的libc实现可以在主Ziphyr树中的lib/libc/minimal实现中找到。动态内存管理通过选择
【华为od刷题（C++）】HJ89 24点运算 m0_64866459 华为od c++开发语言
我的代码：#include//包含了如排序、排列等常用算法#include//用于输入输出操作#include//无序映射，用于将扑克牌的字符映射到对应的数字#include//动态数组，用于存储输入的扑克牌usingnamespacestd;charops[4]={'+','-','*','/'};//这是一个操作符数组，包含了四个基本的数学运算符：加、减、乘、除unordered_mapmap
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
22、Python 多线程编程与GIL锁机制深度解析 wolf犭良 python python 开发语言
Python多线程编程与GIL锁机制深度解析引言：多线程的意义与挑战在Python并发编程领域，多线程技术因其轻量级和易用性广受欢迎。然而全球解释器锁（GIL）的存在使得Python多线程在CPU密集型任务中表现特殊。本文将通过理论解析、代码实战和性能测试，带你全面掌握线程同步机制，深入理解GIL的工作机制，并提供绕过性能瓶颈的解决方案。一、多线程编程基础1.1线程创建方式Python通过thre
揭秘FloodFill算法：图像填充利器 KENYCHEN奉孝 python实践大全算法 python 开发工具
FloodFill算法概述FloodFill是一种用于填充连通区域的算法，常用于图像处理、绘图工具（如“油漆桶”工具）和迷宫求解等场景。其核心思想是从一个起始点出发，向四周（四邻域或八邻域）扩展，直到遇到边界或满足停止条件。算法原理连通性定义：根据需求选择四邻域（上、下、左、右）或八邻域（包含对角线方向）作为填充方向。边界条件：填充需在指定区域内进行，遇到边界颜色或特定标记时停止。实现方法递归实现
Rust+ChatBoxAI：实战
ChatboxAIChatboxAI是一款基于人工智能技术的智能助手工具，旨在通过自然语言交互帮助用户完成多种任务。以下是其核心功能与特点：功能概述多模型支持：可连接OpenAI、Claude、Gemini等主流大语言模型，用户能自由切换不同AI服务。本地运行：支持离线使用，数据隐私性较强，适合敏感信息处理场景。跨平台兼容：提供Windows、macOS和Linux客户端，同步支持移动端应用。核心
【算法300题】：双指针
双指针板块925.长按键入leetcode链接你的朋友正在使用键盘输入他的名字name。偶尔，在键入字符c时，按键可能会被长按，而字符可能被输入1次或多次。你将会检查键盘输入的字符typed。如果它对应的可能是你的朋友的名字（其中一些字符可能被长按），那么就返回True。思路这道题目只要是末尾的边界条件比较恶心一点classSolution{public:boolisLongPressedName
基于R、Python的Copula变量相关性分析及AI大语言模型应用阁楼里的小花儿 R语言 Python Copula变量相关性分析 AI大语言模型结构方程模型贝叶斯网络统计学
前言：在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果，但这些系数都存在着无法克服的困难。例如，皮尔逊相关系数只能反映变量间的线性相关，而秩相关则更多的适用于等级变量。大多数情况下变量间的相关性非常复杂，而且随着变量取值的变化而变化，而这些相关系数都是全局性的，因此无法提供
轻松入门学python（四）python类的继承、添加与覆盖 Sunhen_Qiletian python 开发语言
Python类的继承、添加与覆盖：从语法到设计思想的完整指南————————————————————（全文约2000字，示例基于Python3.11）一、为什么要继承1.代码复用：子类自动拥有父类的属性与方法，减少重复。2.扩展与特化：在父类基础上增加新功能（添加），或改写已有实现（覆盖），使类型体系更符合领域模型。3.多态：通过继承+方法覆盖，实现“一个接口，多种实现”，让高层代码只依赖父类接口
【Java架构师的未来与趋势】架构学院 Java成神之路-架构师进阶 java 开发语言
Java架构师的未来与趋势引言Java作为企业级应用开发的主力军，已经走过了25年的历程。在这四分之一个世纪中，Java生态系统经历了从Applet到企业级应用，从单体架构到微服务，从本地部署到云原生的巨大转变。今天，Java架构师正站在新一轮技术变革的十字路口——人工智能、云计算、低代码、边缘计算等新兴技术正深刻重塑软件架构的形态和架构师的角色。据JetBrains《2023Java开发者调查》
Python练习（6）Python面向对象编程三大特性：封装、继承与多态的15道实战练习题（含答案与深度解析）一个天蝎座白勺程序猿 python 开发语言
目录引言封装篇（5题）练习1：银行账户安全封装练习2：属性装饰器控制练习3：私有方法调用练习4：受保护属性继承练习5：类属性封装继承篇（5题）练习6：单继承与方法重写练习7：多继承与MRO练习8：抽象基类实现练习9：Mixin模式练习10：super()函数应用多态篇（5题）练习11：接口多态练习12：鸭子类型练习13：多态与异常处理练习14：多态与类型检查练习15：多态与装饰器总结Python爬
【案例教程】基于R、Python的Copula变量相关性分析及AI大模型应用 AAIshangyanxiu 编程算法统计语言农林生态遥感生态环境 r语言 python 人工智能 copula函数变量相关性分析贝叶斯统计学
查看原文>>>https://mp.weixin.qq.com/s?__biz=MzAxNzcxMzc5MQ==&mid=2247726953&idx=6&sn=7ebd9948d54bbce401efdc908dbf67e2&scene=21#wechat_redirect在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相
算法：floyd和高精度洛谷最短路 P1037 [NOIP 2002 普及组] 产生数健仙算法算法数据结构 c++
思路：因为某个数变成另一个数是单向的，并且一个数变成另一个数后还可以变，让我联想到图论的内容，一个数变成其他数就相当于这个数与另一个数有单向边，而且边之间的线路可以让一个数可能变成很多数，因为数据量很小，我就想到了floyd，就是我们用floyd做传递闭包，得出一个数可以变成哪些数，然后将每个位看一遍，乘起来就是答案，不过这里有个小坑，答案超过了2的64次方，所以还要高精度算法处理一下。代码：#i
算法：动态规划洛谷 P8776 [蓝桥杯 2022 省 A] 最长不下降子序列健仙算法动态规划蓝桥杯
思路：首先，这题你得先会（nlogn）复杂度的求最长不下降子序列方法。我们可以直接让k个数从下标为1开始，滑动到末端，这k个数就不用看它，因为我们把他设置成k个数后面的数，所以答案先加上k，然后我们看预处理每一个数从他开始（包括这个数）后面的最长不下降子序列，把长度放入b数组中，这样我们答案就是k加上b【k+1】，然后我们看k前面的数，k前面的数不是让答案加上前面的最长不下降子序列，因为此时我们有
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option