是渔火了

2023年美赛C题思路复盘

论文标题：
Riddle of Wordle: Mining the Secret of Number Scores & Solution Words
Wordle之谜：挖掘数字得分和解字词的秘密

文章目录

前言
一、题目重述
- 拟解决的问题
我们的工作：
二、模型和计算
- 1.数据预处理
- 2.报告数量区间预测模型
- 3.猜词结果分布预测模型
- 3.词汇难度分类模型
碎碎念

前言

从论文浅整理一下思路，纯在想到什么说什么。没见过文章可能会有点懵。论文的原文大概在O奖论文集里能翻到。
老规矩我依旧是队伍中的编程手，比赛时候没怎么碰过文章。
我们是中文写完后整体翻译的英文，以下部分内容来自论文中文版的ctrl+cv。
排版很乱。

一、题目重述

Homer是棒球运动中的术语，是非正式的美式英语单词。令人惊讶的是，Homer（本垒打）在剑桥词典网站的搜索次数超过79000次，在5月5日这一天内被搜索65401次。就这样，Homer成为《剑桥词典》的2022年度词汇。可能你会好奇其中的原因，这就要从海外非常火的一款猜词游戏Wordle说起了。在2022年，在线益智游戏Wordle在社交媒体刷屏。而Wordle那天的答案是Homer，这难倒了不熟悉这个单词的非美国用户。
Wordle是目前《纽约时报》每日提供的一个热门谜题。Wordle的受欢迎程度不断提高，目前已有60多种语言版本。玩家可以选择的模式有“常规模式”或"困难模式"。玩家试图在六次或更少的尝试中猜测一个五字词来解决这个难题，每次猜测都会得到反馈，方块的颜色会发生变化（绿色、黄色、灰色）。注意：每个猜测都必须是英语中的一个实词。不被比赛认可为文字的猜测是不被允许的。

拟解决的问题

开发一个模型来解释报道结果的数量变化，并创建2023年3月1日报告结果的数量预测区间。分析单词的属性对玩家的模式选择的影响程度。
开发一个模型来预测报告结果的分布。分析模型和预测存在的不确定性因素。
开发一个模型来分类解答词难度。识别与每个分类相关联单词的属性。
描述数据集的其他有趣特征。

（大致能看出来，三个问题，最后一个语文建模。后来我们发现把前三个问踩过的坑扔到第四问，就够了。）

我们的工作：

我们共提出了三个模型来挖掘报告结果数据的信息。
本文的其余部分组织如下。第二部分介绍了本文的前提假设与合理解释。第三节提及了文中使用的公式中的常用变量。第四节进行了建模前对的数据预处理工作。第五节建立了报告数量区间预测模型，并探索了单词属性与模式选择的关系。第六节建立了报告结果分布预测模型。第七节建立了词汇难度分类模型。第八节继续探索数据集的有趣特征。第九节和第十节分别对模型的灵敏度进行分析，进一步评估模型的优缺点。最后，第十一节给出了结论。

二、模型和计算

1.数据预处理

这套数据有几个词不是五个字母，但因为都是发生过的统计，我们直接翻到了过去这些期词汇的统计修改了一下。还有529号study的结果目测就有问题，我们取前后几天的均值修正了一下。这里怎么处理问题都不大。

2.报告数量区间预测模型

**我们希望在已有数据的基础上建立一种数学模型，用于描述Twitter上报告结果数量随时间变化的过程和预测未来一定时间内的热度，且模型对于变化过程具有解释性。该问题是近年来常受到讨论的热度预测问题。
通过查阅文献[4]，我们得知业界目前两类常用的热度预测算法，包括基于节点行为动力学的时序模型和深度学习类方法。但是它们并不适用于本文所研究的情形。主要因为如下两个原因：

现有数据集中并不包含报告人是谁、所有时间内总共有多少人等具体信息，基于该数据集无法建立节点模型；
深度学习等技术不具有良好的可解释性，并且大都需要更多的训练数据才能达到较好的预测效果。
因此，我们从统计学角度出发，基于非齐次泊松过程和3阶高斯回归（3rd-order gaussian regression）建立了wordle报告数量预测模型。**

（这一问从建立模型到计算求解我几乎全程没参与，因为我没学过信息论，从这个模型提出开始我就不懂了。我贴一些原文的内容和记忆中当时的一些处理办法。）

一眼需要时间预测模型。当时建模队友恰好在复习信息论（和开学考期末和解），这个趋势画出来特别像对数正态分布的曲线。刚开始的时候上涨很快，后期逐渐下降，最后能剩下的都是坚持在玩的老玩家。当时建模哥觉得这个很符合实际，并且会挺新颖的，就顺着这个研究下去了。后来发现有地方解释不了，报告数量的分布在时间上并非均匀的，而对数正态分布没有考虑时间因素。卡在这里很久，一度考虑过要不要换一个预测模型。后来还是顺着拟合的路走下去了。

基于高斯回归的趋势预测模型
在本数据集中，报告数量的时间序列存在明显的趋势迹象。我们尝试了多种回归算法对报告数量随时间的变化趋势进行拟合，其中效果最好的是3阶高斯回归。

（如果我没记错，这个是从matlab的cftool里挨个试出来的。就是简单的拟合了一下，我们也没有做过多的说明）

然后考虑预测区间，也就是每天的随机波动。
基于非齐次泊松过程的报告数量预测模型
泊松分布描述了在事件发生速率为常数的条件下，一段时间内一定数量事件发生的概率，因此可以描述一天内上传的一定数量的报告的概率。我们假设每一天的报告数量均服从于泊松分布，则这些泊松分布在时间上组成了一个非齐次泊松过程，即到达强度随时间变化的泊松过程。

真的按照这个公式来计算区间，会发现预测的效果没有那么理想。后期较为平稳的部分有一些地方反倒波动比较大，出现非常离谱的尖刺。为了消掉后期区间的尖刺，需要进行一定的比例放缩，也就是基于热度松弛函数的随机过程修正部分。这部分先找到了一个可以消掉尖刺的函数，然后根据这个函数去找适合它的定义，还真找到了这个热度松弛现象。

（我个人觉得这一问模型套模型的解法，整个论文写下来，松弛函数这里显得很秀。其实只是为了得到一个比较好看的预测结果凑出来的罢了）

最后我们预测出来的大致是这样。上面松弛函数乘进去直接让前面的预测区间更大，后面的更小。看起来就跟实际比较像了。
（其实这个结果得出来的特别波折，但是论文写出来的逻辑相当流畅，把解释不了的地方避重就轻的一带而过，能解释出来的部分狠狠夸了一波。展现出来的就是这种，很厉害但又有点云里雾里的感觉。）

分析单词的属性对玩家困难模式选择的影响程度这里，我们把能想到的所有属性都列了一遍。画出来散点图发现除了时间以外都没什么关系。然后就大胆写上了，也没去刻意寻找什么关系。

3.猜词结果分布预测模型

为了预测未来报告结果的分布，我们首先对数据特征进行了提取与构建。接着，我们搭建BP神经网络模型，将7个数据特征作为输入，输出7种猜词结果的分布。最后，采取Bagging算法对多个BP神经网络进行集成，通过硬投票机制得出最终预测结果，降低预测结果的泛化误差。

（第一问的模型还没建的时候，建模哥就跟我说，这个数据量太适合BP神经网络了。于是他在那边想办法搞定上一问，我在这边炼丹。）
后来引入背包算法的原因是不管怎么调，单个神经网络输出的准确率，都只有40%不到。看起来很离谱，于是我们抓出来几次跑出来的结果，发现预测不准的词汇相对来说并不固定，也就是说纯纯是这个词本身的问题，而不是变量抓的不准。
于是建模哥提出来投票，一个网络预测不准就让一堆网络一起预测。

让100个神经网络投票以后，误差依旧不太小，但没之前那么离谱了。
还有一个小细节就是，我们的训练集和测试集不是纯随机选的，而是固定的前85%的数据作为总训练集。相当于用完全相同的数据训练出不同的网络。这样比随机抽的训练集误差更小一些。
其实最后结果也不是相当理想，所以我们把每一个词汇的每一个猜词次数预测误差的分布具体拆开统计，大部分误差其实都不大。最后得出来的结论是”我们对预测结果绝对误差不超过5%有80%以上的信心”。这写完以后我们仨都乐了，确实不太像人话。但要是直接说绝对误差不超过20%那也显得我们做的太拉胯了。

最后这个ERRIE的结果分布，我们仗着神经网络不可能完全复现，预测了10次左右，找最接近的几个值取了个平均。按照误差的统计分布来看，这样基本拿到的结果就是准的了。

3.词汇难度分类模型

为了能对solution words进行合理的分类，我们首先根据用户的猜词次数分布并基于K-Means聚类算法对难度进行划分。接着，我们基于Pearson相关系数来探索单词属性与难度划分的关联，构建了单词难度分类模型。最后，按照此关联性对新的单词进行难度分类。

我们做到这一问的时候，已经是最后一个中午了，而且深度学习的结果刚出来，还没有写文章。前面做的确实慢了一些。
刚开始我们也受了网上各种言论和b站那个大神的信息熵预测视频的影响，本来打算用信息熵。当时我还开玩笑说，这题纯纯给你们通信人出的。最开始我们捋出来一套解法，拿动态规划进行的步骤模拟。
单词的不确定度来自于字母的不确定度和位置的不确定度。如果我们拿到绿色方框，就可以一次性消除掉该位置和该字母的所有不确定性；如果拿到黄色方框，可以消除掉字母的不确定性，只剩位置的不确定性；如果拿到灰色方框，则某个字母一定不会存在，也可以消除掉一些不确定性。用动态规划的思想迭代，最后拿到每次预测的难度。
大概是这么个想法，后来没用这个的原因，一个是太难了，最后一个晚上了，程序都不一定能写完，更别说论文；另一个原因是建模哥说的，他说始终感觉，C题是对数据的处理，而不是对过程的追踪（大概是这个意思）。动态规划这种解法不像是用在这道题的。
其实当时我们觉得前两问的模型都很low，一心想在第三问整个花活。确实也纠结了一下要不要用聚类分类，总感觉太平庸了。最后还是选择了相信建模哥的直觉，用的最简单的kmeans。

难度直接反映在猜词次数上，于是我们通过猜词次数得到了四个聚类。聚类这样做没问题，分类用什么向量的问题上我们也纠结过。我倾向于直接使用上一问预测的分布次数进行分类，还能反过来证明第二问算出来的结果是对的；建模哥觉得这个不是单词的本质属性，只是外部表现而已，应该用单词的属性来分类。

最后听建模哥的意见，用相关系数把属性和猜词次数联系起来，然后用属性分类。
对于未来的solution word而言，我们可以通过计算它与各个典型样本的相似度判断其难度。由于我们在第6.2节中建立了对未来日期给定solution word的猜词次数分布预测模型，所以我们对于词汇难度有两种判断依据。一种是基于预测的猜词次数分布，一种是基于solution word的属性向量。

（其实单纯从得到的结果看，直接用猜词次数分类的结果比这个要好一些，但少一个Pearson系数模型，而且变量不是单词本身属性这一点，大概可能描述起来会有逻辑上的漏洞。）

碎碎念

在组队找人，以及和朋友们唠到哪个位置最容易的时候，很多人跟我说，论文是最难的，因为最后的结果就是论文展示的。而建模位置是最好划水的，只需要给出一个模型就好。

但其实我感觉，建模位置是最后决定获奖高度的因素。对文章中用到的模型，优点缺点适用范围这些细节全部了解。并且有一定的数学敏感度，知道什么情况下是模型整个有问题，什么情况下微调就可以。以及可以对自己建立的一切模型作出合理的数学解释而不是套教程的话。建模手有这种功底的话，我觉得拿到满意的成绩只是时间问题。

很佩服我队伍中的建模手。我是半程加入这个队伍的，建模哥应该是已经打了很多年的数模了。我的数模水平可能也只够在编程位上，常用的模型大部分都只听过个名字，优缺点和使用场景一概不知。甚至编程语言也只会matlab一种，python还是编程哥教我的。

建模哥非常包容我的无知，不管是训练时候还是正式比赛的时候，所有的模型都是他建的，一部分论文也是他写的，并且能把握着整道题的时间。比赛时，我的工作只负责，听懂，实现，出数出图，就可以。听不懂的地方建模哥就会直接动手写程序了。我没有凭空想出模型的本事，最多只是在建模提出的模型基础上凭我的感觉进行一些优化。

这种情况下，在建模哥拿到第二个国赛省一的时候也没有打算放弃，也没有产生过优化掉队伍中什么人的想法。很佩服这份坚持，时间会证明一切不是假的。

我的思路中始终没有论文姐姐的影子，不是因为划水，是因为她几乎从头忙到尾，和我基本上没有交流。（指思路上，不是整个比赛期间。论文姐姐平时温柔极了。）我和建模哥研究结果拉胯怎么补救，她帮我们找相关的论文；我们拖到晚上才把模型中文版敲定，她默默熬夜翻译排版；还有帮我们找得到的数据画什么图效果好看。细节拉满。

ok，谨以此篇记录我本科期间最大的奖。

机器学习在智能仓储中的应用：库存管理与物流优化 Blossom.118 机器学习与人工智能机器学习人工智能深度学习机器人 sklearn tensorflow cnn
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。随着电子商务的蓬勃发展，仓储和物流行业面临着前所未有的挑战和机遇。智能仓储通过整合先进的信息技术，如物联网（IoT）、大数据和机器学习，能够实现从货物入库到出库的全流程
使用matplotlib绘制散点图、柱状图和饼状图-学习篇 Zorione Python matplotlib 学习 python
一、散点图Python代码如下：num_points=100x=np.random.rand(num_points)#x点位随机y=np.random.rand(num_points)#y点位随机colors=np.random.rand(num_points)#颜色随机sizes=1000*np.random.rand(num_points)#大小随机alphas=np.random.rand(
【自然语言处理-NLP】文本预处理技术云博士的AI课堂哈佛博后带你玩转机器学习深度学习自然语言处理人工智能 NLP 深度学习数据预处理 NLP数据预处理机器学习
以下内容将从基本概念到实用代码分步骤、分场景地详细介绍NLP常见文本预处理方法及其背后的思想。如果无法从外部导入数据，我们会模拟一份简易文本数据（如字符串列表），并在此基础上演示预处理代码及详细解释，确保在常规Python环境下可以运行。一、文本预处理的常见需求和作用在自然语言处理（NLP）任务（如机器学习、深度学习、大模型开发）中，原始文本数据通常会包含各种噪声，例如：多余的空格、换行符、特殊符
java数组解析_实例讲解Java数组解构关然 java数组解析
数组是在程序设计中，为了处理方便，把具有相同类型的若干元素按有序的形式组织起来的一种形式。我们可以把数组看成是用于储存多个相同类型数据的集合，我们在需要用到数组中的一部分数据时，就需要用到数组解构，获得相应的数据。本文我们就一起来学习Java数组解构的相关知识。1.简单解构constnumbers=['a','b','c'];//获取前两项const[n1,n2]=numbers;console.
深度学习之基于Pytorch卷积神经网络人民币面值识别 Q1744828575 python pytorch plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景在日常生活和商业活动中，人民币面值识别技术具有重要的应用价值。传统的面值识别方法，如基于模板匹配或特征工程的方法，在面对复杂多变的图像环境时，往往难以达到理想的识别效果。随着深度学习技术的兴起，特别是卷积神经网络（ConvolutionalNeuralNetwo
行为正则化与顺序策略优化结合的离线多智能体学习算法
离线多智能体强化学习（MARL）是一个新兴领域，目标是在从预先收集的数据集中学习最佳的多智能体策略。随着人工智能技术的发展，多智能体系统在诸如自动驾驶、智能家居、机器人协作以及智能调度决策等方面展现了巨大的应用潜力。但现有的离线MARL方法也面临很多挑战，仍存在不协调行为和分布外联合动作的问题。为了应对这些挑战，中山大学计算机学院、美团履约平台技术部开展了学术合作项目，并取得了一些的成果，希望分享
《三生原理》如何改进阴阳参数冷启动？葫三生三生学派人工智能平面线性代数概率论算法
AI辅助创作：《三生原理》通过‌动态参数耦合‌与‌跨域迁移学习‌优化阴阳参数冷启动问题，显著降低15%的初始化成本并提升收敛效率，具体技术路径如下：一、动态参数化生成引擎‌‌阴阳本体的递归约束‌基于素数基底（阴元=2，阳元=3）构建参数化公式：p=3(2n+1)+2(2n+m+1)(m∈{0,1,2,3,4})通过约束参数mm的取值空间（对应五行属性），压缩冷启动搜索范围在华为高斯实验室的量子加密
利用视觉-语言模型搭建机器人灵巧操作的支架三谷秋水智能体大模型计算机视觉语言模型机器人人工智能计算机视觉机器学习
25年6月来自斯坦福和德国卡尔斯鲁厄理工的论文“ScaffoldingDexterousManipulationwithVision-LanguageModels”。灵巧机械手对于执行复杂的操作任务至关重要，但由于演示收集和高维控制的挑战，其训练仍然困难重重。虽然强化学习(RL)可以通过在模拟中积累经验来缓解数据瓶颈，但它通常依赖于精心设计的、针对特定任务的奖励函数，这阻碍了其可扩展性和泛化能力。
手机射频功放测试学习（二）——手机线性功放的静态电流和小信号(S-Parameter)测试零壹电子手机射频功放测试合集学习 S参数读取
目录一、概要二、LPA的电流测试1、LPA的泄漏电流测试手动测试步骤如下：自动化测试：2、LPA的静态电流测试手动测试步骤如下：自动化测试：三、LPA的S-Parameter测试1、矢量网络分析仪校准2、LPA的S参数手动测试步骤：3、LPA的S参数自动测试步骤：四、结语一、概要诚如上文介绍，实验室中进行手机线性功放测试，第一步是看静态电流，第二步再测试小信号(S-Parameter)特性；步骤是
Linux——搭建嵌入式Linux开发环境步骤总结（虚拟机、Ubuntu、JDK、库文件、GCC） Winter_world 搭建嵌入式Linux开发环境虚拟机Ubuntu 安装JDK 安装库文件 GCC版本更新
目录0前言1主机软件环境2Linux系统下安装编译组件3Linux系统下安装库文件和JDK0前言回顾一直以来做的嵌入式项目方向，从如ST的单片机裸机开发，SOC开发，到STM32裸机开发，基于uCOSII的开发，基于freeRTOS的开发等，在实时操作系统层面的应用开发停留了一段时间了，一直想再突破下自我，去年做了一个基于工控机方案的Linux系统应用开发项目，对于Linux一直没有系统性的学习整
【机器学习第四期（Python）】LightGBM 方法原理详解 WW、forever 机器学习原理及代码实现机器学习 python 人工智能
LightGBM概述一、LightGBM简介二、LightGBM原理详解⚙️核心原理LightGBM的主要特点三、LightGBM实现步骤（Python）可调参数推荐完整案例代码（回归任务+可视化）参考LightGBM是由微软开源的基于梯度提升框架（GBDT）的机器学习算法，专为高性能、高效率设计，适用于大规模数据处理任务。它在准确率、训练速度和资源使用上都优于传统GBDT实现（如XGBoost）
华为HDC 2025：一场开发者的技术盛宴与灵感之旅
前言作为一名开发者，参加华为HDC大会就像是一场朝圣之旅。每年这个时候，全球的开发者们都会汇聚一堂，分享最新的技术成果，探讨未来的趋势，而今年的HDC2025更是让我期待已久。这次大会不仅有华为最新技术的展示，还有各种实战案例和深度分享，对我来说，这是一次难得的学习和交流机会，更是面基各位好友的最佳机会。那么接下来就来分享一下三掌柜参加2025华为HDC大会的所见所感吧。初到会场：满满的科技感当我
【机器学习】机器学习的基本分类-监督学习-线性回归（Linear Regression） IT古董人工智能机器学习机器学习分类学习人工智能线性回归
线性回归是监督学习中的一种基础算法，用于解决回归问题。它通过拟合一条直线（或平面、高维超平面），来预测输出与输入变量之间的关系。1.线性回归的基本概念目标给定输入和对应的输出y，找到一个线性函数：其中：是权重（回归系数）。b是偏置（截距）。y是预测值。损失函数为了找到最佳的w和b，需要最小化预测值和真实值
pytest学习和使用-pytest如何进行分布式测试？（pytest-xdist）测试界晓晓软件测试 pytest 学习分布式软件测试功能测试自动化测试程序人生
1什么是分布式测试？在进行本文之前，先了解些基础知识，什么是分布式测试？分布式测试：是指通过局域网和Internet，把分布于不同地点、独立完成特定功能的测试计算机连接起来，以达到测试资源共享、分散操作、集中管理、协同工作、负载均衡、测试过程监控等目的的计算机网络测试。通俗的讲：分布式测试就是活太多，一个人干费时间，那就让多个人一起干，节省了资源和时间。2为什么要进行分布式测试？2.1场景1：自动
day45-Django RestFramework（drf）实战案例生而自由爱而无畏 Python django python 后端开发语言
1.6DjangoRestFramework（drf）实战案例1.需求请结合上述学习的drf知识开发简易版《抽屉新热榜》。其中包含的功能如下：注册输入：手机号、用户名、密码、确认密码。登录输入：手机号或用户名+密码注意：登录成功后给用户返回token，后续请求需要在url中携带token（有效期2周）我的话题-我的话题列表-创建话题-修改话题-删除话题（逻辑删除）我的资讯-创建资讯（5分钟创建一个
为什么要学习 next.js 框架 + Vercel 部署平台，因为我想把自己的 app 分享给别人。 waterHBO 学习 javascript 开发语言
前端开发太卷？不如给你的React换个“豪华座驾”和“F1赛道”**如果你像我一样，从create-react-app的时代一路走来，你一定经历过那种“甜蜜的烦恼”：React给了你一个超强的V8引擎，但造车剩下的所有事——从方向盘(路由)、底盘(项目结构)到导航系统(数据管理)——都得你自己撸。结果就是，每个项目开始前，你都在重复发明轮子，在Webpack的配置地狱里苦苦挣扎。好消息是，时代变了
提升AI产品竞争力：可用性评估的10个核心维度 AGI大模型与大数据研究院人工智能 ai
提升AI产品竞争力：可用性评估的10个核心维度关键词：AI产品、可用性评估、用户体验、人机交互、产品竞争力、评估维度、人工智能摘要：本文深入探讨了提升AI产品竞争力的10个核心可用性评估维度。我们将从用户角度出发，系统性地分析如何评估和优化AI产品的可用性，包括易用性、效率、可学习性、容错性等关键指标。通过详细的案例分析和实用建议，帮助产品团队打造更具竞争力的AI解决方案。背景介绍目的和范围本文旨
Python 数据分析与机器学习入门 (一)：环境搭建与核心库概览程序员阿超的博客 Python python 数据分析机器学习入门教程环境搭建 Anaconda JupyterNotebook
Python数据分析与机器学习入门(一)：环境搭建与核心库概览本文摘要本文是Python数据分析与机器学习入门系列的第一篇，专为初学者设计。文章首先阐明了Python在数据科学领域的优势，然后手把手指导读者如何使用Anaconda搭建一个无痛、专业的开发环境，并介绍了强大的交互式工具JupyterNotebook的基本操作。最后，简要概览了NumPy、Pandas、Scikit-learn等核心库
Python 数据分析与机器学习入门 (三)：Pandas 数据导入与核心操作程序员阿超的博客 Python python 数据分析机器学习 Pandas DataFrame Series 数据清洗
引言：Pandas是什么，为何如此重要？如果说NumPy是处理原始数值数组的利器，那么Pandas则是驾驭结构化数据的瑞士军刀。在真实世界的数据分析项目中，数据很少是单纯的数字矩阵。它们通常以表格形式存在，包含行和列，每列可能有不同的数据类型（如文本、数字、日期），并且带有描述性的列名和行索引。Pandas正是为高效处理这类数据而生。Pandas构建于NumPy之上，它不仅继承了NumPy的高性能
面经总结系列（十六）：元象科技大模型推理优化工程师 GoAI AI面经总结机器学习算法人工智能大模型机器学习深度学习
‍作者简介：CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分享宝藏资料，关注公众号回复“加群”或➡️点击链接加群。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的
《深入浅出多模态》(四)：多模态经典模型CLIP GoAI 深入浅出多模态多模态大模型 LLM 人工智能
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介
二次开发源码借贷系统uniapp/借贷认证系统/小额信贷系统/工薪贷APP/资金贷系统h5 csdndddsd uniapp借贷系统开发小额贷系统app 工薪贷系统安装搭建信用贷认证系统 h5资金贷系统安装搭建教程借贷系统安装搭建借贷系统二次开发
前端：UNIAPP后端：ThinkPHP数据库：Mysql前端使用的uniapp可以打包APPH5小程序系统提供了完善的网络借贷体系，为金融中介平台提供从获客到贷后管理全流程服务，解决了借贷手续繁琐、流程缓慢等问题此源码为运营中版本，具有极高稳定性，防注入，防攻击，修复全部已知后门漏洞仅供学习演示、二次开发专用，禁止一切违法行为的利用！可提现金额(元)￥{{qbMoney}}充值提现余额明细余额变
Java后端面试必备：高频知识点与实战解析（Git/Maven/MySQL/SpringBoot全攻略）陈遇巧学习 java maven spring spring boot
1.面试ToC面向个人，B2B2C（第1个B是指商品或服务的供应商，第2个B是指从事电子商务的企业，C是消费者。例子：腾讯课堂，第1个B是腾讯公司，第2个B是入驻授课的企业，C是用户学习课程）1.详细说说你的项目吧从以下几个方面进行项目介绍：1.项目的背景，包括：是自研还是外包，什么业务，服务的客户群是谁，谁去运营等问题。2.项目的业务流程3.项目的功能模块4.项目的技术架构5.个人工作职责6.个
深入浅出多模态》（十一）之多模态经典模型：Flamingo系列 GoAI 机器学习多模态大模型人工智能 LLM 机器学习
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介绍：本作
Nuxt.js学习(二) --- Nuxt目录结构详解、Nuxt常用配置项、Nuxt路由配置和参数传递... 庭前云落前端 ---Nuxt.JS vue java javascript react js
[TOC]1、Nuxt目录结构详解Nuxt项目文件目录结构|--.nuxt//Nuxt自动生成，临时的用于编辑的文件，build|--assets//用于组织未编译的静态资源入LESS、SASS或JavaScript|--components//用于自己编写的Vue组件，比如滚动组件，日历组件，分页组件|--layouts//布局目录，用于组织应用的布局组件，不可更改。|--middleware/
ThinkPHP框架深入解析与实战技巧 weixin_42613017
本文还有配套的精品资源，点击获取简介：《深入理解ThinkPHP框架》一文深入探讨了ThinkPHP这一广泛使用的PHPWeb开发框架。文章详细阐述了ThinkPHP的核心概念、设计模式、主要特点以及核心组件。此外，还提供了基于ThinkPHP的开发实践案例，包括常见应用场景、开发流程以及进阶话题，如模块化开发、错误处理、RESTfulAPI实现和调试工具的使用。读者将通过本文全面学习到如何高效运
C++从入门到精通专栏简介 xiaoheshang_123 C++从入门到精通专栏开发语言 c++
目录C++从入门到精通专栏简介专栏概述专栏特色适用人群学习目标专栏结构第1章：C++语言基础第2章：面向过程编程第3章：面向对象编程(OOP)入门第4章：标准模板库(STL)初探第5章：高级特性第6章：现代C++第7章：实践项目第8章：性能优化与调试第9章：职业发展专栏优势期待与收获C++从入门到精通专栏简介专栏概述本专栏旨在为C++编程语言的学习者提供一个全面而系统的指南，帮助他们从零基础逐步成
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据郎郎不会飞深度学习目标识别 python 深度学习
深度学习目标检测之YOLOv3实战（二）训练自己的图像数据数据集准备数据集预处理原demo修改数据集训练目标检测补充二零二零年的大年初一，给大家拜个年，祝大家鼠年吉祥，万事如意，趁着喜气，把Yolov3训练自己的数据过程，记录一下，共勉共进。同样，无人机搭载山狗拍摄的视频，目标检测的种类是模型tank和airplane，部分效果图镇贴：数据集准备首先需要将自己的数据集准备好，不同场景下的目标数据尽
Python批量下载网易云音乐飙升榜所有音乐文件 Python_小屋 graphviz netty gpu ai webgl
Python小屋刷题神器最近升级的新功能介绍推荐教材：《Python程序设计基础与应用》（ISBN：9787111606178），董付国，机械工业出版社，2018.8出版，2021.3第11次印刷作者荣誉：机械工业出版社计算机分社成立20周年本科教材”金牌作者“，机械工业出版社高等教育教材专家咨询委员会委员，机械工业出版社”面向新工科高等院校大数据专业系列教材“编审委员会委员，全国高等院校计算机基
史上最全的CTF保姆教程从入门到入狱【带工具】最爱吃南瓜网络安全 web安全 windows
下面分享的资源包含国内9套教程教程1-CTF从入门到提升四周学习视频教程教程2-信息安全CTF比赛培训教程教程3-CTF从入门到提升教程4-CTF培训web网络安全基础入门渗透测试教程教程5-CTF入门课程教程6-CTF夺旗全套视频教程教程7-网络安全课程新手入门必看教程8-bugku_CTF_Web视频教程网络安全预科班课程CTF入门国外3套教程国外教程1套-GoogleCTF2018Begin
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出