LeadAI学院

Kaggle—So Easy!百行代码实现排名Top 5%的图像分类比赛

北京上海巡回站 | NVIDIA DLI深度学习培训2018年1月26/1月12日

NVIDIA 深度学习学院带你快速进入火热的DL领域
阅读全文 >

正文共4931个字，11张图，预计阅读时间30分钟。

前言

根据我个人的经验，学好AI，有五个必修：数学、数据结构、Python数据分析、ML、DL，必修之外，有五个选修可供选择：NLP、CV、DM、量化、Spark，然后配套七月在线的这些必修和选修课程刷leetcode、kaggle，最后做做相关开源实验。

今天，咱们就来看一看：如何用百行代码实现Kaggle排名Top 5%的图像分类比赛。

1、NCFM图像分类任务简介

为了保护和监控海洋环境及生态平衡，大自然保护协会（The Nature Conservancy）邀请Kaggle[1]社区的参赛者们开发能够出机器学习算法，自动分类和识别远洋捕捞船上的摄像头拍摄到的图片中鱼类的品种，例如不同种类的吞拿鱼和鲨鱼。大自然保护协会一共提供了3777张标注的图片作为训练集，这些图片被分为了8类，其中7类是不同种类的海鱼，剩余1类则是不含有鱼的图片，每张图片只属于8类中的某一类别。

图1给出了数据集中的几张图片样例，可以看到，有些图片中待识别的海鱼所占整张图片的一小部分，这就给识别带来了很大的挑战性。此外，为了衡量算法的有效性，还提供了额外的1000张图片作为测试集，参赛者们需要设计出一种图像识别的算法，尽可能地识别出这1000张测试图片属于8类中的哪一类别。Kaggle平台为每一个竞赛都提供了一个榜单（Leaderboard），识别的准确率越高的竞赛者在榜单上的排名越靠前。

图1. NCFM图像分类比赛

2、问题分析与求解思路

2.1、卷积神经网络

从问题的描述我们可以发现，NCFM竞赛是一个典型的“单标签图像分类”问题，即给定一张图片，系统需要预测出图像属于预先定义类别中的哪一类。在计算机视觉领域，目前解决这类问题的核心技术框架是深度学习（Deep Learning），特别地，针对图像类型的数据，是深度学习中的卷积神经网络（Convolutional Neural Networks, ConvNets）架构（关于卷积神经网络的介绍和算法，这里有个视频教程可以看下：CNN之卷积计算层，本博客也写过：CNN笔记）。

总的来说，卷积神经网络是一种特殊的神经网络结构，即通过卷积操作可以实现对图像特征的自动学习，选取那些有用的视觉特征以最大化图像分类的准确率。

图2. 卷积神经网络架构

图2给出了一个简单的猫狗识别的卷积神经网络结构，在最底下（同时也是最大的）的点块表示的是网络的输入层（Input Layer），通常这一层作用是读入图像作为网络的数据输入。在最上面的点块是网络的输出层（Output Layer），其作用是预测并输出读入图像的类别，在这里由于只需要区分猫和狗，因此输出层只有2个神经计算单元。而位于输入和输出层的，都称之为隐含层（Hidden Layer），图中有3个隐含层，正如前文提到的，图像分类的隐含层都是由卷积操作完成的，因此这样的隐含层也成为卷积层（Convolutional Layer）。

因此，输入层、卷积层、输出层的结构及其对应的参数就构成了一个典型的卷积神经网络。当然，我们在实际中使用的卷积神经网络要比这个示例的结构更加复杂，自2012年的ImageNet比赛起，几乎每一年都会有新的网络结构诞生，已经被大家认可的常见网络有AlexNet[5], VGG-Net[6], GoogLeNet[7], Inception V2-V4[8, 9], ResNet[10]等等。

2.2、一种有效的网络训练技巧—微调

我们没有必要从头开始一个一个的参数去试验来构造一个深度网络，因为已经有很多公开发表的论文已经帮我们做了这些验证，我们只需要站在前人的肩膀上，去选择一个合适的网络结构就好了。且选择已经公认的网络结构另一个重要的原因是，这些网络几乎都提供了在大规模数据集ImageNet[11]上预先训练好的参数权重（Pre-trained Weights）。这一点非常重要！因为我们只有数千张训练样本，而深度网络的参数非常多，这就意味着训练图片的数量要远远小于参数搜索的空间，因此，如果只是随机初始化深度网络然后用这数千张图片进行训练，非常容易产生“过拟合”（Overfitting）的现象。

所谓过拟合，就是深度网络只看过了少量的样本，因而“坐井观天”，导致只能识别这小部分的图片，丧失了“泛化”（Generalization）能力，不能够识别其它没见过、但是也是相似的图片。为了解决这样的问题，我们一般都会使用那些已经在数百万甚至上千万上训练好的网络参数作为初始化参数，可以想象这样一组参数的网络已经“看过”了大量的图片，因此泛化能力大大提高了，提取出来的视觉特征也更加的鲁棒和有效。

接下来我们就可以使用已经标注的三千多张海鱼图片接着进行训练，注意为了防止错过了最优解，此时的训练节奏（其实应该称为“学习速率”）应该比较缓慢，因此这样的训练策略我们称为“微调技术”（Fine-tune）。

当我们使用自己的标注数据微调某个预先训练的网络时候，有一些经验值得借鉴。以总图3为例，假设我们的网络结构是类似AlexNet这样的7层结构，其中前5层是卷积层，后2层是全连接层。

(1)

（1）我们首先微调最后一层Softmax分类器，假设原来的网络是用来分类1000类物体的（例如ImageNet的目标），而现在我们的数据只有10个类别标签，因此我们最后一层输出层（FC8）的神经元个数变为10。我们使用很小的学习率来学习层FC7与FC8之间的权重矩阵而固定这之前所有层的权重；

(2)

（2）一旦网络趋于收敛，我们进一步扩大微调的范围，这时微调两个全连接层，即FC6与FC7，以及FC7与FC8之间的权重，与此同时固定FC6之前的所有卷积层权重不变；

(3)

（3）我们将微调的范围扩大至倒数第一个卷积层C5；

(4)

（4）我们将微调的范围扩大至更多的卷积层。不过事实上，我们会认为位置相对靠前的卷积层提取出来的特征更加的底层和具有通用性，而位置相对靠后的卷积层以及全连接层更加与数据集的相关性大一些，因此有时候我们并不会微调前几个卷积层。

3、算法实现和分析

在NCFM这个比赛的论坛里已经有开源的实现供大家参考(https://www.kaggle.com/c/the-nature-conservancy-fisheries-monitoring/discussion/26202)，

在这里分析一下模型训练文件train.py的逻辑结构。

ü Import相关的模块以及参数的设置——图4；
ü 构建Inception_V3深度卷及网络，使用在ImageNet大规模图片数据集上已经训练好的参数作为初始化，定义回调函数保存训练中在验证集合上最好的模型——图5；
ü 使用数据扩增（Data Augmentation）技术加载训练图片，数据扩增技术是控制过拟合现象的一种常见的技巧，其思想很简单，同样是一张图片，如果把它水平翻转一下，或者边角裁剪一下，或者色调再调暗淡或者明亮一些，都不会改变这张图片的类别——图6；
ü Inception_V3网络模型训练；

图4. Import和参数设置

图5. 构建Inception_V3网络并加载预训练参数

图6. 使用数据扩增技术加载训练和验证图片集

图7. 模型训练

4、提升排名的若干技巧

一旦我们训练好了模型，我们就用这个模型预测那些测试图片的类别了，论坛中predict.py中的代码就是预测鱼类的并且生成提交文件。这里我们给大家分享一下在机器学习和图像识别类竞赛中常见的两个技巧，简单而有效。它们的思想都是基于平均和投票思想。其背后的原理用一句话总结就是：群众的眼睛是雪亮的！

技巧1：同一个模型，平均多个测试样例

这个技巧指的是，当我们训练好某个模型后，对于某张测试图片，我们可以使用类似数据扩增的技巧生成与改张图片相类似的多张图片，并把这些图片送进我们训练好的网络中去预测，我们取那些投票数最高的类别为最终的结果。Github仓库中的predict_average_augmentation.py实现的就是这个想法，其效果也非常明显。

技巧2：交叉验证训练多个模型

还记得我们之前说到要把三千多张图片分为训练集和验证集吗？这种划分其实有很多种。一种常见的划分是打乱图片的顺序，把所有的图片平均分为K份，那么我们就可以有K种<训练集，验证集>的组合，即每次取1份作为验证集，剩余的K-1份作为训练集。因此，我们总共可以训练K个模型，那么对于每张测试图片，我们就可以把它送入K个模型中去预测，最后选投票数最高的类别作为预测的最终结果。我们把这种方式成为“K折交叉验证”（K-Fold Cross-Validation）。图9表示的就是一种5折交叉验证的数据划分方式。

图9. 五折交叉验证

当然，技巧1和2也可以联合在一起使用。假设我们做了5折交叉验证，并且对于每一张测试图片都用5次数据扩增，那么不难计算，每一张测试图片的投票数目就是25个。采用这种方式，我们的排名可以更进一步。

5、后记

我们回顾了深度学习中的深度卷积网络的典型结构和特点，并且知道了如何使用梯度下降算法来训练一个深度网络。我们展示了如何用微调技术，使用Inception_V3网络来解决Kaggle的NCFM海鱼分类比，并且通过两个简单而有效的小技巧，使得我们的排名能够进入Top 5%。

如果读者对该比赛有兴趣，想进一步提升名次，那么一种值得尝试的方法是：物体检测（Object Detection）技术。试想一下，其实我们只要区分海鱼的品种，由于摄像头远近等关系，图片中海鱼的区域其实只占据一小部分像素点，更多的区域都是船体、桅杆或是海洋等噪音。如果有一种算法能够帮我们把海鱼从照片中“扣”（检测）出来，那么可以想象，深度网络的准确率就能够进一步提升了，这部分的工作就留给有兴趣的同学自己做进一步研究了。

七月在线彭老师、二零一七年五月十日。

参考资料

[1] https://www.kaggle.com/
[2] http://cs231n.github.io/neural-networks-3/
[3] https://github.com/tensorflow/tensorflow
[4] https://github.com/fchollet/keras
[5] Image Classification with Deep Convolutional Neural Networks. NIPS 2012.
[6] Very Deep Convolutional Networks for Large-Scale Image Recognition. ICLR 2015.
[7] Going Deep with Convolutions. CVPR 2015.
[8] Rethinking the Inception Architecture for Computer Vision. CVPR 2016.
[9] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning. ICLR 2016.
[10] Deep Residual Learning for Image Recognition. CVPR 2016.
[11] http://www.image-net.org/
七月在线《kaggle案例实战班》
kaggle实战公开课《模型分析与模型融合》

原文链接：http://blog.csdn.net/v_JULY_v/article/details/71598551

查阅更为简洁方便的分类文章以及最新的课程、产品信息，请移步至全新呈现的“LeadAI学院官网”：

www.leadai.org

请关注人工智能LeadAI公众号，查看更多专业文章

大家都在看

LSTM模型在问答系统中的应用

基于TensorFlow的神经网络解决用户流失概览问题

最全常见算法工程师面试题目整理（一）

最全常见算法工程师面试题目整理（二）

TensorFlow从1到2 | 第三章深度学习革命的开端：卷积神经网络

装饰器 | Python高级编程

今天不如来复习下Python基础

3d系统误差分析 Ai智享结构光 3d 数码相机计算机视觉
系统标定重投影误差预估在计算机视觉和三维重建领域中，评估一个相机系统标定精度的重要指标。通过比较真实的三维点在图像中的投影位置与标定模型计算出的投影位置之间的差异，来衡量标定的准确性。以下是对这一概念的详细解析：什么是系统标定？系统标定(SystemCalibration)是指对一个视觉系统（例如单目相机、双目相机系统或结构光系统）进行参数标定的过程，包括：内参标定：相机的内部参数（如焦距、光心、
虚拟专用网络（VPN）的 30 个知识 | 附带华为防火墙 IPSec VPN 配置实例 IT运维大本营网络华为 php
虚拟专用网络（VPN）定义：VPN就是一种能在公共网络上弄出个安全的私人网络的技术，靠加密连接实现。工作原理：VPN会通过隧道协议在用户的设备和VPN服务器之间弄出个加密的通道，这样就能保护数据传输啦。加密协议：常见的VPN加密协议有OpenVPN、L2TP/IPsec、PPTP和IKEv2这些。匿名性：用VPN能把用户的IP地址藏起来，这样上网的时候匿名性就高啦。安全性：VPN能保护用户在公共W
思科网络交换机配置命令（详细命令总结归纳） IT运维大本营华为思科锐捷网络服务器运维
前言一、交换机介绍二、交换机配置1、基本命令2、常用命令3、交换机恢复出厂配置4、telnet远程登录设置5、交换机VLAN设置（1）添加,删除vlan（2）命名vlan（3）将端口加入vlan6、交换机设置VLANIP地址7、Trunk的配置8、以太网通道配置(二层口)9、以太网通道配ip地址(三层口)10、VTP的配置11、三层交换机配置（1）配置虚拟接口IP地址（2）配置物理接口IP地址（3
HarmonyOS 应用开发之ArkData OpenHarmony_小贾 OpenHarmony HarmonyOS 移动开发 harmonyos 华为移动开发鸿蒙开发 ui
功能介绍ArkData（方舟数据管理）为开发者提供数据存储、数据管理和数据同步能力，比如联系人应用数据可以保存到数据库中，提供数据库的安全、可靠以及共享访问等管理机制，也支持与手表同步联系人信息。标准化数据定义：提供OpenHarmony跨应用、跨设备的统一数据类型标准，包含标准化数据类型和标准化数据结构。数据存储：提供通用数据持久化能力，根据数据特点，分为用户首选项、键值型数据库和关系型数据库。
2807. 在链表中插入最大公约数不玩return的马可乐链表数据结构 leetcode 算法职场和发展 c++
在本篇博客文章中，我们将探讨如何实现一个算法，该算法可以在链表中相邻节点之间插入一个新的节点，新节点的值为相邻两个节点值的最大公约数（GCD）。这个问题是LeetCode上的一个中等难度问题，涉及到链表操作和最大公约数的计算。问题描述解题思路理解问题首先，我们需要理解问题的核心：在链表的相邻节点之间插入新节点，新节点的值为相邻节点值的最大公约数。计算最大公约数我们需要一个函数来计算两个数的最大公约
LeetCode 383. 赎金信不玩return的马可乐算法/题库 leetcode 算法职场和发展蓝桥杯数据结构
在本篇博客中，我们将探讨LeetCode上的一个经典问题：383.赎金信。这个问题考察了我们对字符串处理和字符计数的理解和应用。问题描述解题思路这个问题可以通过字符计数的方法来解决。我们首先统计magazine中每个字符出现的次数，然后检查ransomNote中的每个字符是否都能在magazine中找到足够的数量。如果ransomNote中的任何一个字符在magazine中的数量不足，我们就返回f
黄金矿工小游戏（Java）不玩return的马可乐小项目 java intellij-idea ui 算法
在游戏开发的世界里，用代码构建一个充满趣味的游戏是一次极具挑战与收获的旅程。今天，我将带大家深入了解我用Java开发的“黄金矿工”游戏背后的代码逻辑和实现细节，一同领略编程与游戏结合的魅力。一、引言这款“黄金矿工”游戏拥有经典的玩法，玩家通过操控钩子抓取屏幕中的各种物体，包括黄金、石头和炸弹等，目标是在规定时间内达到一定的积分以进入下一关。同时，游戏还配备了登录注册系统，确保玩家数据的记录和管理，
封装Redis工具类（解决击穿，穿透） Li清水 Redis redis 数据库缓存
基于StringRedisTemplate封装一个缓存工具类Redis实战篇|Kyle'sBlog(cyborg2077.github.io)目录方法1：将任意Java对象序列化为JSON，并存储到String类型的Key中，并可以设置TTL过期时间方法2：将任意Java对象序列化为JSON，并存储在String类型的Key中，并可以设置逻辑过期时间，用于处理缓存击穿问题方法3：根据指定的Key查
力扣---螺旋矩阵 53488736abcdefg leetcode 矩阵算法
给你一个m行n列的矩阵matrix，请按照顺时针螺旋顺序，返回矩阵中的所有元素。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[1,2,3,6,9,8,7,4,5]题解：1.首先设定上下左右边界2.其次向右移动到最右，此时第一行因为已经使用过了，可以将其从图中删去，体现在代码中就是重新定义上边界3.判断若重新定义后，上下边界交错，表明螺旋矩阵遍历结束，跳出循环
机器学习数学基础-极值和最值华东算法王（原聪明的小孩子小孩哥解析宋浩微积分机器学习算法人工智能
极值和最值极值和最值是数学中关于函数变化的重要概念，它们描述了函数在某些点附近或在整个定义域内的“最大”或“最小”行为。理解极值和最值对优化问题、函数分析、物理建模等领域有重要的应用。1.极值（LocalExtrema）极值是指函数在某个区间内的某一点取得的局部最大值或最小值。(1)局部最大值（LocalMaximum）一个函数在某点(x=c)取得局部最大值，意味着存在一个包含(c)的小区间，使得
leetcode152.乘积最大子数组努力d小白 #动态规划算法数据结构 leetcode
给你一个整数数组nums，请你找出数组中乘积最大的非空连续子数组（该子数组中至少包含一个数字），并返回该子数组所对应的乘积。测试用例的答案是一个32-位整数。示例1:输入:nums=[2,3,-2,4]输出:6解释: 子数组[2,3]有最大乘积6。示例2:输入:nums=[-2,0,-1]输出:0解释: 结果不能为2,因为[-2,-1]不是子数组。思路：注意这道题涉及到符号问题；dp[i]表示以n
leetcode39.组合总和努力d小白 #回溯算法
给你一个无重复元素的整数数组candidates和一个目标整数target，找出candidates中可以使数字和为目标数target的所有不同组合，并以列表形式返回。你可以按任意顺序返回这些组合。candidates中的同一个数字可以无限制重复被选取。如果至少一个数字的被选数量不同，则两种组合是不同的。对于给定的输入，保证和为target的不同组合数少于150个。示例1：输入：candidate
leetcode437.路径总和III 努力d小白 #二叉树 java 算法开发语言
标签：前缀和问题：给定一个二叉树的根节点root，和一个整数targetSum，求该二叉树里节点值之和等于targetSum的路径的数目。路径不需要从根节点开始，也不需要在叶子节点结束，但是路径方向必须是向下的（只能从父节点到子节点）。示例1：输入：root=[10,5,-3,3,2,null,11,3,-2,null,1],targetSum=8输出：3解释：和等于8的路径有3条，如图所示。示例
leetcode 2545.根据第K场考试的分数排序付宇轩 leetcode 算法
1.题目要求:班里有m位学生，共计划组织n场考试。给你一个下标从0开始、大小为mxn的整数矩阵score，其中每一行对应一位学生，而score[i][j]表示第i位学生在第j场考试取得的分数。矩阵score包含的整数互不相同。另给你一个整数k。请你按第k场考试分数从高到低完成对这些学生（矩阵中的行）的排序。返回排序后的矩阵。示例1：输入：score=[[10,6,9,1],[7,5,11,2],[
leetcode 215.数组中的第K个最大元素嘤国大力士 LeetCode leetcode 算法数据结构
LeetCode第215题“数组中的第K个最大元素”要求找到未排序数组中第k个最大的元素。通常有几种常见的解决方案，包括使用排序、使用最小堆或快速选择算法。以下是这三种方法的详细C++实现：方法一：使用排序这种方法最为直观，先对数组进行排序，然后返回第k个最大的元素。#include#include#includeusingnamespacestd;classSolution{public:int
Gvim + VCS + Verdi 使用技巧之环境篇小白菜呀呀呀 VCS +Verdi 学习经验分享 bug
前言新手在刚刚接触到Gvim+VCS+Verdi的仿真验证环境时，可能会遇到加了相应语句及文件但还无法生成fsdb波形文件的问题。本文主要提供解决该问题的方法或调试的思路和方向。一、tb文件添加语句通常来讲，在环境配置正确的情况下，只要在tb文件中加入以下2条语句即可产生fsdb波形文件，因此首先需要排查这一项。initialbegin$fsdbDumpfile("fsdb_name.fsdb")
GaussDB lanlingxueyu 数据库 gaussdb
HCIA-GaussDB思维导图https://download.csdn.net/download/lanlingxueyu/88797517数据库介绍数据库技术概述数据库技术数据Data记录Record数据库DatabaseDB数据库是存放数据的仓库，是大量数据的集合。存放在数据库中数据的特点永久存储有组织可共享数据库管理系统DBMS数据库管理系统是一个能够科学地组织和存储数据，高效地获
深入了解JSON：Python中JSON的全面应用指南 kdayjj966 开发语言 json python
JSON（JavaScriptObjectNotation）是一种广泛使用的数据交换格式，以其轻量级和易于阅读及解析的特性而备受欢迎。JSON起源于JavaScript，但已经被许多编程语言广泛支持，包括Python。本教程将深入探讨JSON的构造、数据类型，以及在Python中的多种操作方式。JSON的基础构造JSON由两种主要结构组成：对象（Object）和数组（Array）。对象（Objec
【经典必看】对数价格刻度 vs. 线性价格刻度：有什么区别？Logarithmic Price Scale vs. Linear Price Scale: What‘s the Difference? 精通代码大仙投资数据挖掘 python 机器学习人工智能大数据深度学习自然语言处理
对数价格刻度vs.线性价格刻度：有什么区别？对数价格刻度vs.线性价格刻度：概览股票图表的解读可以根据查看数据时使用的不同价格刻度而有所不同。大多数在线和经纪商图表软件可以显示不同风格的图表。最常用的两种价格刻度用于分析价格变动：对数价格刻度—也称为“对数”—表示价格间距取决于基础资产价格的变化百分比。这通常是默认的图表样式。线性价格刻度—也称为“算术”—表示价格在Y轴上的间距是等距的。线性图表显
探索JavaScript的宇宙：《JS星球系统》潘俭渝Erik
探索JavaScript的宇宙：《JS星球系统》solar-system-of-jsVisualizethelanguagesontheJSplatform项目地址:https://gitcode.com/gh_mirrors/so/solar-system-of-js在快速发展的前端世界中，JavaScript已经成为无可争议的主宰，围绕它的语言和框架如群星璀璨，构成了一个壮观的“JS星球系统”
Auto PY to EXE：一键将Python脚本转换为可执行文件方玉蜜United
AutoPYtoEXE：一键将Python脚本转换为可执行文件项目地址:https://gitcode.com/gh_mirrors/au/auto-py-to-exe在软件开发的世界里，将Python脚本转换为可执行文件（.exe）是一个常见的需求。无论是为了分发给非技术用户，还是为了保护源代码，这个过程都显得尤为重要。今天，我们要介绍的是一款强大的工具——AutoPYtoEXE，它能够帮助你轻
创建您的第一个Angular应用：实现路由 cunjie3951 python java vue html linux ViewUI
在继续本教程之前，最好总结一下到目前为止已经完成的所有工作，以免造成任何混乱和错误。如果您错过了前三篇教程中的任何步骤，则最好返回并进行必要的更改。在第二个教程中，我们创建了三个不同的文件，分别名为country.ts，country-data.ts和country.service.ts。country.ts文件用于存储Country类定义，因此我们可以将其导入到其他文件中。country-dat
C#使用异步编程的好处贰貮 c#
C#不是异步编程的好处避免线程等待耗时操作，但是使用await还是要等待，反正都是等待，有啥区别呢？在C#中，异步编程的好处不仅仅是简单地避免线程等待耗时操作。尽管从表面上看，使用await关键字时程序似乎在等待某个操作完成，但实际上这种等待与传统的同步等待有着本质的区别。以下是异步编程与同步编程在等待耗时操作时的主要区别：异步编程的好处：不阻塞线程：当在异步方法中遇到await表达式时，该方法会
Python蓝桥杯刷题--妮妮的蓝桥果园2（split，map）重生之我要成为代码大佬蓝桥python学习算法 python 开发语言蓝桥杯
题目在蓝桥镇，妮妮拥有一片美丽的果园。果园中有N种不同的水果树，每种水果树上的水果都有其特别的价值。妮妮记下了每种水果的价值，用一个正整数Ai来表示。现在妮妮想知道，如果他把果园里所有种类的水果都摘下来卖掉，他能获得多少的总价值。你能帮助妮妮计算一下吗？输入格式输入的第一行包含一个整数N，表示果园中水果的种类数。接下来的一行包含N个整数A1,A2,...,AN，分别表示每种水果的价值。其中，满足1
一文看懂llama2（原理&模型&训练） Qpeterqiufengyi llama
自从Transformer架构问世以来，大型语言模型（LargeLanguageModels,LLMs）以及AIGC技术的发展速度惊人，它们不仅在技术层面取得了重大突破，还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出，这一技术日益走进大众视野，这也预示着一个由生成式AI塑造的未来正在加速到来。与此同时，MetaAIMetaAI在2023年推出了LLama（LargeLan
[ERROR] Malformed \uxxxx encoding.报错解决 Light__Chaser java
1、检查项目的.properties、.yml、pom.xml、logback等配置中，是否有路径错误使用2、更新maven仓库，重新下载jar包（没必要）可以将一些没下载成功的jar包重新下载，一般下载不成功的依赖，都会生成一个后缀未.lastupdated的文件，而且有这个文件一旦生成，那个依赖就会一直下载不成功，无论怎么reloadmaven仓库，都下载不成功。解决办法在文件资源管理器中找到
在CentOs上安装Docker，Docker中配置MYSQL，安装java Light__Chaser 微服务 java linux
在CentOs上安装Docker1.更新系统在安装Docker之前，建议先更新系统以确保所有软件包都是最新的。sudoyumupdate-y2.安装依赖包在CentOS上安装Docker需要一些额外的依赖工具。sudoyuminstall-yyum-utilsdevice-mapper-persistent-datalvm23.添加Docker仓库sudoyum-config-manager--a
利用auto-py-to-exe库的简单图形界面实现.py到.exe的转换 Lins号丹 Python编程 py文件打包 exe文件转换 auto-py-to-exe
文章目录1.auto-py-to-exe简介2.安装与使用3.配置项介绍4.打包完成1.auto-py-to-exe简介运行.py文件需要配套相应的Python解释器和相关的依赖项，而很多时候我们会面临光有待演示的.py程序，而没有支持演示的环境的尴尬。一种解决办法就是，将.py文件及其依赖的内容打包成可执行文件.exe，这样，就算用户电脑没有安装Python相关环境，也能够成功运行代码。Pyth
Python|基于DeepSeek大模型，实现文本内容仿写（8）写python的鑫哥 AI大模型实战应用人工智能 python 大模型 DeepSeek Kimi 文本仿写
前言本文是该专栏的第8篇，后面会持续分享AI大模型干货知识，记得关注。我们在处理文本数据项目的时候，有时可能会遇到这样的需求。比如说，指定某些文本模板样例，需要仿写或者生成该“模板”样例数据。再或者说，通过给予某些指定类型的关键词，生成关键词相关领域的文本素材或内容。如果单单投入人力去完成，这肯定是没问题，但耗费的更多是人力成本。而现阶段，对于这种需求，大大可以选择大模型去完成。而本文，笔者将基于
力扣hot100——矩阵 cloud___fly leetcode 矩阵算法
73.矩阵置零classSolution{public:voidsetZeroes(vector>&a){intn=a.size(),m=a[0].size();vectorr(n+10,0);vectorc(m+10,0);for(inti=0;ispiralOrder(vector>&a){intn=a.size(),m=a[0].size();intx=0,y=0;intsum=m*n;in
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

Kaggle—So Easy!百行代码实现排名Top 5%的图像分类比赛

你可能感兴趣的:(Kaggle—So Easy!百行代码实现排名Top 5%的图像分类比赛)