白水baishui

合合信息——用智能文字识别技术赋能古彝文原籍数字化

文章目录

1. 背景介绍：古彝文是什么？为什么要保护它？如何保护它？
2. 传统方法保护古彝文：原籍难获、翻译困难
- 2.1. 古彝文原籍的破损与古法保存
- 2.2 古彝文原籍的保护与翻译
- - 2.2.1 获取古彝文原籍
  - 2.2.2 修复古彝文原籍
  - 2.2.3 翻译古彝文原籍
  - 2.2.4 出版古彝文译著
3. 人工智能保护古彝文：AI技术助力彝文古籍传承
- 3.1 彝文古籍的数字化道路
- 3.2 古彝文识别的全新挑战
- 3.3 古彝文数字化的关键技术
4. AI让中华文化多彩的底色绚烂绽放
- 4.1 新活力：彝文古籍保护焕发古文化新活力
- 4.2 新生命：彝文古籍数字化与上海研究者的渊源
- 4.3 新技术：合合信息识别技术赋能古彝文数字化

1. 背景介绍：古彝文是什么？为什么要保护它？如何保护它？

现今我们所谓的“古彝文”指的是在民间流通使用的原生态彝文，据《滇川黔桂彝文字集》显示，这种文字多达87046字；在国家图书馆珍藏中，由这些文字书写的古彝文典籍共有592册（件），可见其蕴含着巨大的文化价值和实用价值。

在当代，彝文依然拥有广泛的受用人群。四川省曾在1980年发布规范彝文共819字，截止2012年，滇川黔桂发布的通用彝文有5598字。这两种彝文常用于仪式、节庆、旅游景点等场合——彰显彝族非物质文化遗产的传承；同时也用于民族地区相关政策与宣传文件的翻译，以及文学创作。值得一提的是彝文的使用同样受到了国家层面上的重视，中央民族语文翻译局设有彝语文室，负责每年全国、省两会文件的翻译和同声传译等。

然而，一些自然与人为的影响长期严重制约、威胁着彝文古籍的保存、流通与使用，这使得抢救与保护现有的彝文古籍文献迫在眉睫，其中，数字化技术是重要手段之一，也是现如今梳理和保护古彝文最有希望的路线。

在这一技术可行性的驱动下，2022年12月21日，合合信息与上海大学社会学院正式签署校企合作协议，旨在完成以国家珍贵古籍《西南彝志》为中心的“贵州古彝文图像识别及数字化校对项目”。双方探索用智能文字识别技术来对彝文古籍进行研究，同时结合现有的彝文信息化技术以促进并实现古彝文原籍的信息化建设、数字化保护乃至传承，这一工作在民族传统文化日渐濒危的当下有着独特的意义。

图1. 古彝文与其他古文字中可能存在某些相似关联（网络资料、邵文苑供图）

2. 传统方法保护古彝文：原籍难获、翻译困难

2.1. 古彝文原籍的破损与古法保存

彝文古籍文献的载体形式是多样化的，有纸质书籍、文书档案、碑刻、竹简、金属载体，以及一些口耳相传的口述史料。当下彝文古籍文献传世较多，但保留下来的许多文献破损情况十分严重，如传抄本经时间的推移，部分出现了人为的破损及潮湿、虫咬、发黄、酸化、腐损等诸多情况。

图2. 破损的彝文古籍（图源中国文化书院）

过去的彝族人民发明了一种巧妙的“封底裹卷装”的方式来保存古籍。其具体装订方法：用一块幅面长度、宽度都超于纸张的皮革或布料作封底，将印写好的书叶以数叶为一叠放置在封底上，对齐边沿，在余幅处打眼用线装订，在封底末端中间订上一根细绳，不用时将书倒卷，以绳束紧，成卷存放。然而这种方法只适用于小型的纸质书籍，并且保护效果不佳，无法有效防范水渍、油渍、絮化、霉变、烟熏、脆化和后世的破坏性修复。

图3. 西南民族大学陈列封底裹卷装保护形式（邵文苑供图）

2.2 古彝文原籍的保护与翻译

不仅仅是保存，翻译古彝文原籍更是一件难事。当前，专家学者对于滇川黔桂四省区的原生态彝文古籍的保护与翻译流程如下：

2.2.1 获取古彝文原籍

第一步就是要获取古彝文原籍，然而这些原籍并不容易获得。研究者要向持有经书的布摩（彝族祭司）购买某本祖传书籍，但受民族文化的影响，布摩们通常以出卖古籍为耻，甚至有的人在入葬时要求与自己手中的经书一同火化，这导致了不少古籍的消失。
在政府专员的反复动员和劝说下，偶尔会有布摩愿意转让部分典籍，也有一些致力于推广传统文化、不被禁忌理念束缚的进步人士愿意转让经书，这才使得研究古彝文原籍有了现实可能。为了获取古彝文原籍，彝文研究者们必须长期驻扎当地，协助当地机构的各项工作，与古彝文传承人建立良好的关系，最终才能取得对方的信任与支持。

2.2.2 修复古彝文原籍

拿到古籍后不能贸然翻动书籍，若其中页面有残缺、粘滞，则需要小心翼翼地分开，然后分页粘贴至更大幅的纸张上，以便翻检查阅。一些古籍因年代久远出现脆化导致纸片破碎，还需重新拼接，例如：

图4. 毕节市彝文文献翻译研究中心展示古籍修复原件（陈宗玉供图）

2.2.3 翻译古彝文原籍

完成了一系列的工作之后，最后才是对这些古籍进行断句和翻译。为了保护古籍，翻译家通常依照复印件来完成日常的翻译工作。如果彝语是译者的母语，那么他就可以自己将语句分开，加上国际音标；母语不是彝语的译者还需要在母语者的帮助下记音，再用汉语逐字直译，最后用流畅的汉语对整句话进行意译，这种方法称之为“四行法”，是丁文江和罗文笔翻译《爨文丛刻》时开创的。

图5. 毕节市彝文文献翻译研究中心展示汉译书稿（邵文苑供图）

但是，彝文字目前还没有被数字化，因此没有预留的Unicode编码区段，所以在印刷出版时需要由一位彝文缮写员先将彝文字和国际编码抄写在书页的左侧，再将已输入电脑的汉文译文打印、剪切后粘贴在相应彝文字的右侧，最终形成如图看到的四行体彝汉文对译。

2.2.4 出版古彝文译著

遵循以上三个步骤，速度快的译者一两年就可以出版一本译著，慢的需要好几年，具体情况视原稿本身的长度而定。合合信息与上海大学本次数字化合作的研究对象《西南彝志》一共26卷，建国初首先由罗国义、王兴友两位先生进行汉译，用了10年时间。但这个开创性的译本由于诸多限制存在一定纰漏，所以毕节地区的第二代彝文翻译家王运权、王仕举等先生从上世纪八十年代开始主持修订校正工作，一共用了17年时间完成再版。

图6. 中国民族图书馆馆藏彝文古籍《西南彝志》（局部），书长49.1cm，宽31cm，每页14行，每行38个字，全书共26卷，计37万余字，列有400多个标题。2008年，由中国民族图书馆申报入选第一批国家珍贵古籍名录，编号02349。

3. 人工智能保护古彝文：AI技术助力彝文古籍传承

3.1 彝文古籍的数字化道路

为了应对古籍难以获取的现实困境，彝文古籍文献必须走出传统图书馆、文献馆、博物馆、私人留存等传承制约，开发出数字化的数据库和翻译系统。利用古彝文电子数据库，多维度数字化博物馆的形式，让彝文古籍文献得以在信息化时代重新焕发生机。不同于现今各大研究机构和大学对规范和通用彝文的数字化工作，上海大学携手合合信息推进的“原生态古彝文”研究项目根据四字节编码系统标注异体字、变体字、误用字和混用字，并由此精确建立彝文古籍电子数据库的做法，在古彝文研究领域属于首创。

图7. 上海大学社会学院院长黄晓春、合合信息智能技术平台事业部副总经理郭丰俊共同出席签约仪式（图源合合信息）

古籍数字化已经成为文化保护和发展的新方向和新趋势，其尤其强调对古籍文本进行数字化处理，例如数字化输入技术、智能化处理技术、古籍自动句读与标点、古籍词语自动切分、古籍命名实体识别、计算机图像识别等。同时，学界和业界的联合也使古籍焕发全新生命力，如北京大学携手字节跳动推动中华古籍数字化平台建设，将推出结合OCR、句读、实体识别和知识图谱等技术构建的一站式自动古籍智能化整理平台;阿里巴巴与四川大学、美国加州大学伯克利分校、中国国家图书馆、浙江图书馆跨界协作，发起“汉典重光”项目，致力于寻觅海外流散的中国古籍，推动其以数字化方式“回归”。可见，本次的古籍数字化项目合作在技术是成熟的、可行的。

3.2 古彝文识别的全新挑战

但现阶段的大部分古籍识别项目专注于对汉字的识别。在合合信息与上海大学的古彝文识别项目的难度是汉文古籍的许多倍，因为彝文古籍具备几项汉文古籍所没有的挑战。因此，亟需出台新的策略解决彝文古籍文献传承和保护面临的困境。合合信息行业领先的智能文字识别技术、上海大学古彝文研究员的丰富经验将有助于应对这些挑战。具体来说，总共有五大全新的挑战：

版式多样。
汉文与彝文古籍的各类原稿的排版风格都不统一，字符间距和行距有密有疏，彝文古籍虽然没有大小字混排、双列夹字的校注传统，但也时常出现加字、替字、整句倒置和文字方向不统一等现象，这样会给文字定位造成挑战。在过去的十几年中，合合信息以智能文字识别技术为核心，在图像的复杂版式识别、结构化智能理解层面做了大量的研究，并取得优秀的应用效果，为古彝文识别提供了技术支持。
手写识别困难。
和汉文古籍一样，不同的彝文缮写员之间手写风格差异很大，这就需要大量的数据库来建立识别模型。古彝文目前没有公开数据集，而通晓此种文字的人越来越少，导致标注工作量大而人手少，数据量严重不足，亟须引入AI技术构建模型，以弥补本项目训练样本不足。
图像质量差。
汉文和彝文古籍都经历了数代传承、战火与自然风蚀的洗礼，难免出现页面残缺、霉斑污渍等影响图像质量问题。此外，由于彝文古籍的保存环境更为艰苦，文本还呈现墨色深浅不一、字符间距和行距大小不一的情况。合合信息智能文字识别技术可对图像质量进行增强，提升文字识别效率与准确性。
笔画相近。
彝文字从来没有统一过，不仅异体字（两个或多个视觉上完全不同的字）很多，还存在大量的“变体字”，也即各个地方的布摩为防止敌方破译其经书而故意在现有字形上增加或减少一两个笔画产生的。比如：

图8. 表示“种类”的彝文字[ $mo^{21}$ ]/[ $m\omega^{33}$ ]的四个变体（邵文苑供图）

这样的变体字大量存在，在彝文已经相对规范的汉译本中就有15％的变体字，原稿中就更多了。除此以外，彝文还存在一些汉文所没有的笔画，比如“横飘”、“横回交”等。对于不熟悉这种文字的人来说，有些字在视觉上无甚差异，但实际上却是意义读音完全不同的两个字。比如：

图9. 两个形似、但音义完全不同的彝文字（分别为“酒”、“仪礼”，邵文苑供图）

这些笔画相近的字符不仅给识别模型的建立造成困难，而对于参与校注的初学者来说也是一大阻碍。对此，上海大学的古彝文研究员设计了一套四字节的编码，可较好描述每个变体和形近字符之间的细微差别，由此建立便于机器学习的数据样本。

异体众多。
古彝文每个字的异体写法甚至多达几十种，前文已提及未经整理规范的古彝文字符数高达了87000余个，比康熙字典的字数还多，给识别带来极大困难。除此以外，彝文古籍还存在“同音字混用”的现象：为了不使某些字的写法失传，布摩会在抄写两句重复经文时，会故意让第一句话采用本字，而在第二句中的相同位置用同音字来替换，合合信息智能文字识别技术将有助于应对文字识别中“理解、认知”层面的难题。

3.3 古彝文数字化的关键技术

此次，合合信息与上海大学联合开启的“ 贵州古彝文图像识别及数字化校对项目 ”校企合作，也成为合合信息智能文字识别技术赋能小语种保护及古文化传承的重要里程碑事件。虽然古彝文的识别研究尚处于起步阶段，但合合信息拥有强大的智能图像处理、基于深度学习的复杂场景文字识别，自然语言处理（NLP）等关键技术积累，其中智能图像处理技术可对曲面、阴影、摩尔纹等文档图像进行精准的矫正处理，为接下来的文字信息提取、识别创造了良好的条件；复杂场景文字识别技术可适应多语言、多版式、多样式等复杂场景，以进行文字提取，并结合领先的NLP技术，对识别出的结果进行语义理解。

在引入先进的AI技术来建立统一的数据库以后，对于增强古彝文研究的连续性、降低繁琐的检索工作无疑有极大帮助。与古彝文数字化相关的研究目前还相对稀少，本项目将填补当前国内外研究的空白。

4. AI让中华文化多彩的底色绚烂绽放

随着数字化技术的运用范围的愈加广阔，我国已经启动了一批古籍数字化项目，中国早在2007年就实施中华古籍保护专项计划，但因经费和人员的缺失，无法满足古籍保护的需求，仅按照现有古籍专业修复队伍的情况，需要1500年才能完成古籍修复。但是随着AI时代的到来，新技术必将以指数级的速度改善这一现状。

图10. 彝文古籍的修复过程（图源中国新闻社）

4.1 新活力：彝文古籍保护焕发古文化新活力

随着国学和非遗越来越热，更多人愿意去了解古彝文献和口传史诗所记载的那个的世界，无论是南诏古国、夜郎古国还是巴蜀古国，他们文化的神秘和丰富都令人向往。文化的精神内核就在于文化古籍之中，只有更好地保护和发掘古籍中的内容，才能进一步通过传统媒体（诗朗诵、电影、音乐剧）和新兴媒体（元宇宙、IP主题乐园、浸入式戏剧）拓展文化体验的维度，将文字记载的历史用更富有魅力的方式呈现。

4.2 新生命：彝文古籍数字化与上海研究者的渊源

上海大学社会学院人类学民俗学研究所的邵文苑博士学习和研究彝文古籍已逾10年，在国外重要期刊和出版物上发表了文章和译文。邵博士的研究起源于国家级重点学科上海师范大学比较文学与世界文学研究中心、上海交通大学人文学院、贵州大学人文学院于2011年10月联合筹办的“贵州多民族文化复合和谐模式及其与东盟国家关系”项目培训会。她在会上结识了彝文研究领域的大家——王继超、王明贵两位老师，并决心从事彝文古籍研究。

图11. 2013年邵文苑在毕节彝文翻译与研究中心向王继超先生请教

毕业回国后，邵博士开始在上海大学任博士后/讲师职位，得到“泮池计划”的资助，进一步推进彝文古籍的翻译、研究、数字化与产业化。上海大学是地方政府重点扶持的高水平大学，以具有竞争力的薪资待遇吸引国内外顶尖大学博士毕业生加盟，并以与国际接轨的治校理念、完善的基础研究设施协助其研究成果的孵化。邵博士所在的上海大学社会学院长期设有费孝通田野调查项目资助计划，其丰富的田野工作与基层实习经验，为此类项目的推进营造出良好氛围。

入职之后，邵博士受到前辈们的启发和激励，又因着汉字与彝文的亲近关系，邵博士将能够体现造字规律的五笔编码应用于古彝文，又为少数民族文字的数字化贡献了一份力量。

刚开始进行研究工作的时候，邵博士要花一整个工作日的时间才能找到某个字在某本书里的全部样例。在汉字OCR技术成熟后，她选择用汉字反查彝文，再用Adobe之类的工具书签做标记，效率提高很多，但如果换了一本书，同样的过程（反查＋标记）还要再来一遍。现在用机器来辅助识字后，平均差不多20个有代表性的样例，就可以达到较高的识别率，所以整个过程的人工付出只要30分钟就可以了。从一整个工作日到30分钟，效率有显著提高。

邵教授提到：民俗学有个理论叫传统的生命周期（life cycle of a tradition），意思是传统也和人一样有生老病死的过程，并和人一样有通过后代延续“生命”的能力。在世界人工智能大会上，邵教授发现合合信息展示的“钟鼎文识别”成果与自己的项目十分相关，自此有了合作的意愿，邵教授认为与合合信息的合作可能就是彝文古籍的“传统的新生命周期”的开始。

4.3 新技术：合合信息识别技术赋能古彝文数字化

上海合合信息科技股份有限公司是行业领先的人工智能及大数据科技企业，致力于通过智能文字识别及商业大数据领域的核心技术、C端和B端产品以及行业解决方案为全球企业和个人用户提供创新的数字化、智能化服务。16年来深耕智能文字识别+商业大数据领域，在C端推出了多款深受全球用户喜爱的效率产品，例如：名片全能王、扫描全能王、启信宝等。在B端积极服务于AI+大数据赋能数字化转型，服务了超过30+个行业和2000+全球企业。近三年来，合合信息智能文字识别技术先后在ICDAR、ICPR等人工智能国际竞赛中斩获15项冠军，学术成果在CVPR、AAAI、ACL等顶会上发表，相关项目获中国图象图形学学会（CSIG）科技进步奖二等奖。

图12. 合合信息

合合信息在古文字识别领域已有了一定的积累和成果。在2021年、2022年的世界人工智能大会上，合合信息展现了智能文字识别技术在甲骨文、西周钟鼎文（金文）中的应用，获得了包括央视、人民日报、新华社等上百家主流媒体的关注。

图13. 合合信息通过智能文字识别技术，识别出复刻在龟甲上的甲骨文（图源2021世界人工智能大会）

合合信息前期在甲骨文、金文中所作的研究让他们有了足够的技术积累，这使得古彝文识别成为一件“水到渠成”的事情。

三大师传 beca酱
巴尔扎克的作品被誉为“法国社会的一面镜子”。文学大师维克多·雨果对巴尔扎克的评价是：“在最伟大的人物中间，巴尔扎克是名列前茅者；在最优秀的人物中间，巴尔扎克是佼佼者之一。”一个原本寂寂无名的小人物，从地中海的某个海岛上，只身一人来到巴黎，没有朋友，也没有名望。作为一个一文不名的外乡人，凭着赤手空拳赢得了巴黎，征服了整个法兰西，并且赢得了世界。这个人就是十九世纪法国伟大的军事家、政治家，法兰西第一帝
《小满细雨轻湿尘》快乐的人ZZM
图片发自App《小满细雨轻湿尘》文/快乐的人zzm小满细雨轻湿尘石榴花开落纷纷落红不是无情物坠入泥土育养根2018-5-23
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
谁家酒器最绝唱，藏在酒厂人未知？景阳冈酒厂先秦藏品大揭秘李虓酒评论
文/王赛时中国的酒器酒具历史久远，举世闻名。从北京的故宫博物院、中国国家博物馆，到世界各国的大型博物馆，都以能够收藏中国古代酒具而夸耀。但很少有人知道，在山东阳谷景阳冈酒厂，默默地收藏了两千件中国酒器。这些酒器，就封藏在景阳冈的酒道馆里。其中有一些青铜酒器，一睡就是三、四千年，堪称无声国宝，堪作无字史书！今天，我将引领诸位首先窥视一下景阳冈酒道馆的9件先秦藏品，你自己来说震撼不震撼。提示：这只是景
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
《人世间》南询yi
今日分享十点推文，《人世间》有感苏格拉底说：“天地只有三尺，而人在五尺开外，所以人人都要懂得低头。”深以为然。懂得低头，不是认输。而是于人世间找寻温存的成熟，于困境中寻觅柳暗花明的智慧，于争执中展示屈伸自如的格局。正如仰头不是骄傲，是要看见自己的天空；低头也不是认输，而是要看清自己的路。成大事者，不仅要抬头挺胸，还得低头看路。懂得低头，进退有度，不是认输，而是竭尽全力过好这一生。宫崎骏说过：“所有
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
梁文道《尽头:怎样是好的阅读和书写》片段白夜书摘
1、写小说的人，有时会强烈地感到一种现实的召唤，想去面对和回应现实。这时他们会觉得自己正站在时代中心，就像黑格尔说的，要把时代精神掌握在自己的小说（不是哲学）里面。但是这也很危险，当一个作家像一个时代那样书写，可能就会出现问题了。2、文字是远比语言大块而且湿冷的木头，又距离我们内心的火花稍远，不容易瞬间点燃起来，这处隙缝，给了我们回身的余地，可以再多看一下想一下设身处地一下；人类过往这最后五千年，
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
锁之缘尘缘诗词原创作品
是谁追寻梦的足迹，是谁在偷偷的哭泣，日月隔离在黑白天地情感在心中蔓延的痕迹天与地的距离有多远流失的星晨落入哪片空间不要让泪水模糊双眼心牢中一样充满温暖谁说爱情没有永远白娘子又为何爱许仙蝴蝶墓地展翅翩翩轻歌慢舞袖卷人间传奇千古留爱万年…………月落星飞徘徊是选择不去问自已为合舍不得寂寞本就是痛苦的不在追寻梦中的痕迹才不会失去真实的自已
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
舜公郑金锋书辛丑自剪扇面书法作品（四O六）舜公郑金锋
辛丑小阳春，新自剪扇面400品，大多为各色撒金、撒银、描金、描银、水印、彩绘、荧光等亚粉、色宣纸，以及域外包装填充纸等；王一品长锋羊毫秃笔；一得阁云头艳墨、宿墨、水等。书体有甲骨文，金文(商周金文、春秋战国金文、中山王厝器金文、汉金文……)，楚简帛书，侯马盟书，温县盟书，小篆，果蝙书等，隶书(秦简、汉简帛书、汉碑……)，草书(章草、小草、大草……)，行书(行楷、行草)，楷书(魏碑及北朝墓志、隋朝墓
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人北京大数据苏焕之
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人原创——莫转载粘贴有人选择昙花一现，如大理的花海，有人选择细水长流，如雨夜的浪漫。都说，五分喜欢的人恨不得将他挂在嘴边，十分喜欢的人却只舍得放在心里边了，在爱情眼里，对方说的每一句话都在乎你的感受，TA的眼里也只有你，我想也是这样！说起我的爱情，我也喜欢过一个忧郁的女孩，她喜欢的男孩不喜欢她，于是我成了她倾诉的朋友＋备胎，一年来我们互相推荐伤感的歌曲
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
C语言判断回文数 Y雨何时停T c语言学习
一，回文数概念“回文”是指正读反读都能读通的句子，它是古今中外都有的一种修辞方式和文字游戏，如“我为人人，人人为我”等。在数学中也有这样一类数字有这样的特征，成为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数。二，判断回文数实现思路一：数组与字符串将数字每一位按顺序放
2023-08-08 2023梦启支教团张牧泽
学汉字历史，行传统书法——中国矿业大学梦启支教团梦启三班开展书法文化课7月20日上午8时，中国矿业大学梦启支教团在贵州省金沙县西洛街道彩虹小学开展了“书法文化”课程。该课程意在向孩子们传授汉字演变的相关知识，围绕书法发展历史讲解不同时期的字形字体特点。此课程由梦启支教团成员王耀民讲授，梦启三班全体成员参加。中国文字的发展有数千年的历史，从早期雏形的象形文字到殷商时期的甲骨文、金文，再到西周、秦朝的
祭坛随笔阿门不热
街角右拐，便是北宋的祠堂。平日里冉冉的佛香被雨水打湿了，一地枯黄的银杏显得平静哀伤，如同一地被踩碎的阳光。我喜欢在这样的阴暗里吞噬古代的讯息，那遥远的来自过去的历史风潮。谢却茶扉，轻轻地抚上墙壁，寒风不御，无数深浅的纹路交织在心底，如同一把古琴不堪重负的尾音。寂寞锁朱门，香客们已是三三两两，巨大的雨帘让天空失掉了颜色，灰蒙蒙掉在阁楼一角，沉稳不惊地暗下去，再暗下去......古树上红色的挂牌像一块
好习惯和坏习惯炫舞阳光
好习惯和坏习惯文/炫舞阳光生活中有很多细节，可以体现出一个人的习惯。好的习惯让人保持清晰的头脑，坏的习惯常常让人丢东忘西，头脑混沌。生活中，我喜欢整理东西。厨房里，锅碗瓢盆各样东西我习惯各就其位。案板、勺子、铲子和刀具我习惯性的挂起来。大大小小的碗和盘子，我习惯性的立在收纳柜里。每次轮到我在家做饭时，我习惯于一边使用，一边收拾和擦拭归位。做好饭时，台面干干净净。我想把这种习惯影响和传递给家人。然而
《前夫如龙》王昊江琼（独家小说）精彩TXT阅读海边书楼
《前夫如龙》王昊江琼（独家小说）精彩TXT阅读主角：王昊江琼简介：离婚那天，她视他如泥土。谁曾想，消息一出，天下震动！可关注微信公众号【风车文楼】去回个书号【203】，即可免费阅读【前夫如龙】全文！江芸并未听出华少龙声音里的冷漠，依旧一脸笑容道：“是啊，那个废物哪儿配得上我姐？这些年，我姐对他仁至义尽了。以后，华少爷可以多跟我姐接触接触，只有华少爷这样的人，才配得上我姐啊！”江琼低着头，微微有些娇
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分