月疯

sklearn学习之KNN

机器学习之sklearn（knn）

文章目录

前言
一、KNN是什么？
二、KNN原理
三、使用步骤
- 1.引入库以及参数说明
- 2.应用场景（鸢尾花分类）
四、KNN的优缺点
五、k临近（KNN）与K-means的区别？
- 1、算法原理区别
- 2、算法本质区别
- 3、算法相似点
总结

前言

提示：以下是本篇文章正文内容，下面案例可供参考

一、KNN是什么？

KNN(K-Nearest Neighbor)是最简单的机器学习算法之一，可以用于分类和回归，是一种监督学习算法。它的思路是这样，如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。也就是说，该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

二、KNN原理

三、使用步骤

1.引入库以及参数说明

代码如下（示例）：

import re
import numpy as np
import jieba
from sklearn.neighbors import NearestNeighbors

from sklearn.neighbors import KDTree

from sklearn.neighbors import BallTree

def nar():
    # 定义一个数组
    X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
    #n_neighbors = 2, 默认值为2，表示查询k个最近邻的数目
    #指定用于计算最近邻的算法，auto表示试图采用最适合的算法计算最近邻,fit(X)表示用X来训练算法['auto', 'ball_tree', 'kd_tree', 'brute']
    nbrs = NearestNeighbors(n_neighbors=2, algorithm='ball_tree').fit(X)
    # 返回距离每一个点k个最近的点和距离指数，indices能够理解为表示点的下标，distances为距离
    distances, indices = nbrs.kneighbors(X)
    print(indices)
    print(distances)

    # 输出的是求解n个最近邻点后的矩阵图，1表示是最近点，0表示不是最近点
    list=nbrs.kneighbors_graph(X).toarray()
    print(list)
    #metric:用于树的距离度量。默认'minkowski与P = 2（即欧氏度量）。
    #须要存储树的规模约n_samples / leaf_size内存量。
    #为指定的leaf_size，叶节点是保证知足leaf_size <= n_points < = 2 * leaf_size，
    #测试 KDTree
    X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
    kdt = KDTree(X, leaf_size=30, metric="euclidean")

    list1=kdt.query(X, k=3, return_distance=False)
    print(list1)
    # 测试 BallTree
    X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
    bt = BallTree(X, leaf_size=30, metric="euclidean")

    list2=bt.query(X, k=3, return_distance=False)
    print(list2)
if __name__=="__main__":
    nar()

2.应用场景（鸢尾花分类）

代码如下（示例）：

#使用scikit - learn的KNN算法进行分类(iris(鸢尾花)数据集)
    #sklearn内部集成了iris的数据集，所以不需要下载，直接使用，iris相当于编程界的hellword，测试用的
    from sklearn.datasets import load_iris
    from sklearn import neighbors
    def nar():
    # 查看iris数据集
    iris = load_iris()
    print(iris)
    knn = neighbors.KNeighborsClassifier()
    print(iris.target)
    # 训练数据集
    knn.fit(iris.data, iris.target)
    # 预测
    #predict = knn.predict([[2.1, 4.2, 3.3, 2.4]])
    predict = knn.predict([[0.1, 0.2, 0.3, 0.4]])
    #分类结果
    print(predict)
    #分类结果对应花的名字
    print(iris.target_names[predict])

if __name__=="__main__":
    nar()

结果输出：

[0]
['setosa']

四、KNN的优缺点

优点：

1）算法简单，理论成熟，既可以用来做分类也可以用来做回归。

2）可用于非线性分类。

3）没有明显的训练过程，而是在程序开始运行时，把数据集加载到内存后，不需要进行训练，直接进行预测，所以训练时间复杂度为0。

4）由于KNN方法主要靠周围有限的邻近的样本，而不是靠判别类域的方法来确定所属的类别，因此对于类域的交叉或重叠较多的待分类样本集来说，KNN方法较其他方法更为适合。

5）该算法比较适用于样本容量比较大的类域的自动分类，而那些样本容量比较小的类域采用这种算法比较容易产生误分类情况。

缺点：

1）需要算每个测试点与训练集的距离，当训练集较大时，计算量相当大，时间复杂度高，特别是特征数量比较大的时候。

2）需要大量的内存，空间复杂度高。

3）样本不平衡问题（即有些类别的样本数量很多，而其它样本的数量很少），对稀有类别的预测准确度低。

4）是lazy learning方法，基本上不学习，导致预测时速度比起逻辑回归之类的算法慢。

注意，为了克服降低样本不平衡对预测准确度的影响，我们可以对类别进行加权，例如对样本数量多的类别用较小的权重，而对样本数量少的类别，我们使用较大的权重。另外，作为KNN算法唯一的一个超参数K,它的设定也会算法产生重要影响。因此，为了降低K值设定的影响，可以对距离加权。为每个点的距离增加一个权重，使得距离近的点可以得到更大的权重。

五、k临近（KNN）与K-means的区别？

1、算法原理区别

KNN：

1、分类算法
2、监督学习
3、数据集是带Label的数据
4、没有明显的训练过程，基于Memory-based learning
5、K值含义 - 对于一个样本X，要给它分类，首先从数据集中，在X附近找离它最近的K个数据点，将它划分为归属于类别最多的一类

K-means：

1、聚类算法
2、非监督学习
3、数据集是无Label，杂乱无章的数据
4、有明显的训练过程
5、K值含义- K是事先设定的数字，将数据集分为K个簇，需要依靠人的先验知识

2、算法本质区别

1、K-means本质上是无监督学习，而KNN是监督学习；K-means是聚类算法，KNN是分类（或回归）算法。

2、K-means算法把一个数据集分割成簇，使得形成的簇是同构的，每个簇里的点相互靠近。该算法试图维持这些簇之间有足够的可分离性。由于无监督的性质，这些簇没有任何标签。KNN算法尝试基于其k（可以是任何数目）个周围邻居来对未标记的观察进行分类。它也被称为懒惰学习法，因为它涉及最小的模型训练。因此，它不用训练数据对未看见的数据集进行泛化。

3、算法相似点

相似点：算法都包含给定一个点，在数据集中查找离它最近的点的过程。

总结

接下来对KNN算法的思想总结一下：就是在训练集中数据和标签已知的情况下，输入测试数据，将测试数据的特征与训练集中对应的特征进行相互比较，找到训练集中与之最为相似的前K个数据，则该测试数据对应的类别就是K个数据中出现次数最多的那个分类，其算法的描述为：

1）计算测试数据与各个训练数据之间的距离；

2）按照距离的递增关系进行排序；

3）选取距离最小的K个点；

4）确定前K个点所在类别的出现频率；

5）返回前K个点中出现频率最高的类别作为测试数据的预测分类。

参考文章：

【https://www.cnblogs.com/ybjourney/p/4702562.html】
【https://zhuanlan.zhihu.com/p/53084915】

你可能感兴趣的:(【人工智能AI】)

AI人工智能领域知识图谱在文本分类中的应用技巧 AI天才研究院 AI大模型企业级应用开发实战人工智能知识图谱分类 ai
AI人工智能领域知识图谱在文本分类中的应用技巧关键词：知识图谱、文本分类、图神经网络、实体关系抽取、深度学习、自然语言处理、特征融合摘要：本文深入探讨了知识图谱在文本分类任务中的应用技巧。我们将从知识图谱的基本概念出发，详细分析如何将结构化知识融入传统文本分类流程，介绍最新的图神经网络方法，并通过实际案例展示知识增强型文本分类系统的构建过程。文章特别关注知识表示学习与文本特征的融合策略，以及在不同
作为P.E.T.准讲师，我把小家伙揍了禾枫儿童咨询
P.E.T.是什么？是一门简单高效的亲子沟通的课程。小家伙是啥？是亲生儿子。小家伙23个月，这段时间因为学习到处跑，奶水早就不够他吃的了，当我告诉他，过几天我又要去上海了，结果原来不需要奶睡，没有夜醒的小家伙，忽然开始要含着奶睡，作为一名睡眠咨询师，怎么能随便给自己挖坑呢？更何况已经在做离乳的引导了，当然果断的SayNo！虽然被拒绝，但是家伙并没有大哭大闹，反而开始“作妖”。儿子：“NaiNai5
股票分析新王牌：手把手教你搭建AI智能体，附核心提示词秘笈黑巧克力可减脂 AIGC 人工智能
导言华尔街的旧神像正在崩塌，而新神由代码铸就。一套精心设计的提示词，能让AI智能体在数据洪流中为你淘出真金。在金融市场的惊涛骇浪中，传统分析工具常显乏力。当某知名基金经理在2023年因未能及时识别新能源板块的估值泡沫而遭遇滑铁卢时，一家名不见经传的量化团队却凭借AI智能体提前预警，成功规避了30%的回撤。我们正站在投资分析范式变革的临界点：股票分析智能体已成为机构与个人投资者的新一代“核武器”。本
Mac安装Homebrew(国内源)步骤指南莲华君 Macbook Homebrew
一、准备工作安装XcodeCommandLineTools（仅限Mac用户）在终端执行以下命令，按提示完成安装：xcode-select--install二、一键安装Homebrew（推荐）使用国内开发者维护的Gitee镜像脚本，自动配置国内源：执行安装脚本复制以下命令到终端运行（支持Mac和Linux）：/bin/zsh-c"$(curl-fsSLhttps://gitee.com/cunkai
“AI多模态视频解析引擎：毫秒级智能解构视听内容，生成结构化语义图谱。“
产品介绍在数字化浪潮席卷全球的当下，视频数据以前所未有的速度爆发式增长，社交媒体、安防监控、交通管理等各个领域每天都在产生海量视频信息。这些视频数据如同蕴藏丰富宝藏的深海，蕴含着巨大价值，但如何高效挖掘其中关键信息，成为横亘在各行业面前的一道难题。多模态视频结构化系统，正是为解决这一痛点而生，凭借其强大的功能、前沿的技术和创新的架构，成为视频数据处理领域的革新者与引领者。一、核心功能详解（一）音频
大学专业科普 | 人工智能、物联网和云计算技术鸭鸭鸭进京赶烤人工智能物联网云计算 5G 信号处理信息与通信网络
一、专业概述人工智能专业是一门融合计算机科学、数学、信息学等多学科知识的交叉学科。它旨在培养学生掌握人工智能领域的基本理论、方法和技能，以应对人工智能在各个领域的应用需求和发展挑战。二、主要课程基础课程：包括高等数学、线性代数、概率论与数理统计、离散数学等数学基础课程，为人工智能算法提供理论支撑；以及数据结构、算法设计与分析、计算机组成原理、操作系统、计算机网络等计算机科学基础课程，帮助学生理解人
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
单身程序员的幻想女友模拟器，面对对象的三大特征运维帮手大橙子开发语言 java intellij-idea 对象面对对象 windows 程序人生
你new出来的不仅是一个对象，更是一段陪伴、一份慰藉。你孤独的时候想有人和你说说话。而真正的那个她，也一定会出现，和你肩并肩看代码、看星星。项目结构SweetGirlfriendSimulator/├──src/└──com/└──love/├──Main.java//启动类├──Person.java//抽象人类├──IdealGirlfriend.java//理想女友类（可爱温柔）└──Coo
Python 协程 & 异步编程(asyncio) GeekAGI python 开发语言
文章目录协程&异步编程(asyncio)1.协程的实现1.1greenlet1.2yield1.3asyncio1.4async&awit1.5小结2.协程的意义2.1爬虫案例2.2小结3.异步编程3.1事件循环3.2协程和异步编程3.2.1基本应用3.2.2await3.2.3Task对象3.2.4asyncio.Future对象3.2.5futures.Future对象3.2.6异步迭代器3.
转行网络安全需要学什么？（非常详细）零基础入门到精通，收藏这一篇就够了网络安全苏柒 web安全计算机网络网络安全运维转业程序员编程
什么是网络安全？网络安全是指保护网络系统的硬件、软件及其系统中的数据，破坏、更改、泄露，使系统连续可靠正常地运行，网络服务不会中断。未来，我国将着重发展数字经济，发展云计算、大数据、物联网、工业互联网、区块链和人工智能等产业，这些产业全部都基于网络互联。网络的安全就是以上这些产业能够良性发展的基础，也是建设制造强国和网络强国的基础保障。什么是网络安全工程师？网络安全工程师是负责保护计算机网络系统，
转行网络安全需要学什么？（非常详细）从零基础到精通，收藏这篇就够了！～小羊没烦恼～黑客技术黑客网络安全 web安全安全学习运维网络
什么是网络安全？网络安全是指保护网络系统的硬件、软件及其系统中的数据，破坏、更改、泄露，使系统连续可靠正常地运行，网络服务不会中断。未来，我国将着重发展数字经济，发展云计算、大数据、物联网、工业互联网、区块链和人工智能等产业，这些产业全部都基于网络互联。网络的安全就是以上这些产业能够良性发展的基础，也是建设制造强国和网络强国的基础保障。什么是网络安全工程师？网络安全工程师是负责保护计算机网络系统，
转行网络安全需要学什么？（非常详细）零基础入门到精通，收藏这一篇就够了网络安全k叔 web安全计算机网络网络安全编程计算机转业信息安全
什么是网络安全？网络安全是指保护网络系统的硬件、软件及其系统中的数据，破坏、更改、泄露，使系统连续可靠正常地运行，网络服务不会中断。未来，我国将着重发展数字经济，发展云计算、大数据、物联网、工业互联网、区块链和人工智能等产业，这些产业全部都基于网络互联。网络的安全就是以上这些产业能够良性发展的基础，也是建设制造强国和网络强国的基础保障。什么是网络安全工程师？网络安全工程师是负责保护计算机网络系统，
全球化短剧平台全栈技术架构白皮书：多区域部署、智能分发与沉浸式体验的完整解决方案 ywyy6798 推客系统短剧小程序海外短剧短剧分销海外短剧系统开发短剧系统开发
一、全球化基础架构深度设计全球网络基础设施构建采用多活数据中心部署模式，在北美（弗吉尼亚）、欧洲（法兰克福）、亚太（新加坡）建立三大核心枢纽节点构建混合CDN网络，整合AWSCloudFront、Akamai、Fastly等主流CDN服务商，同时接入当地优质运营商CDN部署边缘计算节点网络，在全球200+边缘位置部署轻量级计算单元，实现用户请求的就近处理建立智能流量调度系统，基于实时网络状况监测数
2018-05-13 Youth is a state of mind 一个人的朝圣远行
本科毕业，23岁，有一部分我的同龄人已经结婚了，更有甚者孩子都几岁了，而我还在干嘛？感觉中年危机提前来了，哈哈，喜欢这句话：Youthisastateofmind,butnotonlyconcernedwithage.Otherwise,youhonestlyjustgraspthetailofit.规划是，当兵入伍两年，军队提干，考学，考研。目前在准备雅思考试，争取在英语学习上达到一个自己所能到
聚合cps+cpa分销系统开发实战：覆盖多领域的CPS+CPA双模式技术架构解析
引言在数字经济时代，聚合分销系统通过整合CPS（按销售分成）与CPA（按行动付费）双模式，为短剧、小说、外卖、电商、网盘、APP拉新等领域提供了高效的商业变现解决方案。本文结合微服务架构、中台化设计及实战案例，深度解析该系统的技术实现与架构设计。系统架构设计微服务与中台化双引擎采用SpringCloudAlibaba框架构建分布式微服务架构，将系统拆分为8大核心服务：mermaidgraphTDA
阿里巴巴推出ThinkSound：让AI像音效师一样“思考“创造声音至顶头条人工智能机器学习
这项由阿里巴巴通义实验室的刘华戴博士领导，联合香港科技大学和浙江大学共同完成的突破性研究，于2025年6月26日发表在arXiv预印本平台。有兴趣深入了解的读者可以通过论文编号arXiv:2506.21448v1访问完整论文，演示页面也可在https://ThinkSound-Demo.github.io查看。当你看电影时，是否想过那些逼真的音效是如何产生的？当汽车在银幕上疾驰而过，你听到的引擎轰
「Tokens是胡扯」？Mamba作者炮轰Transformer，揭秘AI模型致命缺陷 | AI早报未来世界2099 AI日报人工智能 transformer 深度学习业界资讯
1、OpenAI疯狂挖角反击！Meta华人科学家+马斯克三员大将集体跳槽2、清华&NTU突破性研究：仅需2张图，AI即可重构3D空间认知3、极智嘉港股上市首日破发！清华系机器人公司市值153亿引关注4、星海图融资超1亿美金！美团、今日资本领投，估值暴涨3倍5、华人团队用RL打造AIAgent，种子轮狂揽1200万美元融资6、Skywork-R1V3.0震撼开源：高考数学142分，多学科推理能力直逼
2025软考中高级全套备考资料免费领启航挨踢软考资料整理软件工程
无偿分享软考中高级全套学习资料，有需要的小伙伴自取，资料整理自互联网，如有侵权，请联系删除通过百度网盘分享的文件：中级软件设计师链接:https://pan.baidu.com/s/1-aKW35KBxpvd5Wqm5NmlxQ?pwd=ufpi提取码:ufpi通过百度网盘分享的文件：（软考中级）信息系统监理师链接:https://pan.baidu.com/s/1LgdNpqp8Us9yIMmh
软考热门科目全套学习资料启航挨踢软考资料整理笔记
软考热门科目学习资料免费分享，包括：系统集成项目工程师、数据库系统工程师、软件设计师、信息系统项目管理师、系统架构师等科目的教材、视频教程、历年真题，需要的小伙伴自取。资料来自互联网整理，如有侵权，请联系删除！通过百度网盘分享的文件：（软考中级）信息系统管理工程师链接:https://pan.baidu.com/s/1mCdZSIJHIDcd8g1TY3rAag?pwd=ywxd提取码:ywxd通
etcdctl常用命令会飞的胖达喵 etcd etcd
获取所有键值对：etcdctlget--prefix/或etcdctlget--prefix""--keys-only=true这个命令使用了get命令，并且通过设置--prefix参数为空字符串，表示获取所有的key。--keys-only=true参数表示只返回key，不返回与key关联的值。AI生成项目获取单个键的值：etcdctlgetkeyAI生成项目获取key和他们的值：etcdctl
无声视频自动配音效，开源模型thinksound 和mmaudio复现请站在我身后算法复现深度学习算法计算机视觉 AIGC 人工智能
朋友们，好久没看csdn发现自己的文章还有人在看，所以还是来更新了最近ASMR的视频蛮火的，就是切开任何东西会发出声音，但我看教程都是走到app的自动生成音效感觉无趣，还是自己复现1、thinksound最近一致排名挺高的一个项目，但是我个人感觉应该是训练的问题，效果真的不怎么好。ThinkSound:Chain-of-ThoughtReasoninginMultimodalLargeLangua
AI新贵崛起：Perplexity的估值为何两月飙升至180亿美元？在美的苦命程序员人工智能
在AI搜索领域的激烈竞争中，Perplexity的崛起令人瞩目。这家AI搜索初创公司在短短两个月内，估值从140亿美元激增至180亿美元，成为挑战谷歌的“潜力股”。这背后究竟有哪些驱动力？从商业化路径到未来市场布局，Perplexity的成功揭示了AI创业领域的新机遇和挑战。一、从5亿美元到180亿美元，Perplexity的惊人估值飙升Perplexity的估值在18个月内完成了五轮融资，尤其在
谷歌搜索的 AI 防守战，透露了什么新趋势？在美的苦命程序员人工智能
在AI搜索这一轮激烈竞逐中，谷歌这位“搜索一哥”正面临新旧对手的夹击：ChatGPT、Perplexity、Claude、Gemini……每一个看上去都野心勃勃、来势汹汹。但即便如此，数据显示，谷歌在全球搜索领域依然维持了89.5%的市场份额，网络访问量环比小幅增长1%。Gemini的月度用户增长更是达到了27%。这不仅是一场份额保卫战，更是谷歌对“搜索形态重塑”的深度试验。透过这场战役，我们也可
中国AI应用“三分天下”：国企成主力、中小企偏订阅、C端仍在观望在美的苦命程序员人工智能
AI在中国的落地路径，正在迅速分化：国企不再只是“建底座”，而是明确聚焦于AI应用的实际部署，特别是在制造、能源、装备等领域。订单量和投入强度明显提升。中小企业开始普遍接受“订阅制+垂直应用”的组合模型，以年费万元级的方式引入AI能力，用于财税、HR、客服等关键业务流程。C端市场则相对承压。虽有WPSAI等大模型产品突破，但整体变现节奏较慢，巨头产品仍处于免费体验或早期内测阶段。国企推动AI从“可
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
ThinkSound：阿里开源首个“会思考”的音频生成模型——从“看图配音”到“听懂画面”的技术跃迁从零开始学习人工智能音视频
1.为什么「看懂」还不够，AI必须「听懂」画面？过去两年，视频生成模型把画面做到了4K60fps，音频却仍是“罐头音效”：狗叫永远是同一段WAV，飞机轰鸣与镜头距离无关，雨点落在铁皮和草地声音毫无区别。根本原因在于——模型并不理解“为什么这个物体在这个场景会发出这样的声音”，只能做粗糙的“像素→波形”映射。阿里巴巴通义实验室在2025-07-20开源的ThinkSound，第一次把CoT（Chai
系统设计时平衡超时时间与多因素认证（MFA）带来的用户体验下降 Alex艾力的IT数字空间 ux 架构中间件微服务测试用例功能测试产品经理
金融系统中，平衡超时时间与多因素认证（MFA）带来的用户体验下降，需通过动态策略、技术优化和用户感知增强实现安全与便捷的协同一、动态调整认证强度基于风险的分级认证低风险场景（如常规查询）：缩短超时时间（如5分钟），但减少MFA层级（仅密码+设备指纹）。高风险场景（如转账、密码修改）：延长超时时间（如10分钟），但强制启用MFA（密码+短信验证码+生物识别）。异常行为触发：通过AI分析登录地点、设备
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
摩根士丹利：到2028年，AI投资将推动科技巨头新增1.5万亿美元债务——信贷市场如何填补这一缺口？在美的苦命程序员人工智能科技
在AI技术快速发展与全球数字化转型的推动下，AI基础设施建设正成为一项巨大的资本需求。摩根士丹利最新的报告指出，到2028年，全球数据中心建设的投资将需要接近2.9万亿美元，其中大部分资金将集中在AI计算与云基础设施的建设上。而最引人注目的是，尽管超大规模云服务商（如亚马逊AWS、微软Azure等）已将大部分资金投入到AI技术基础设施中，但依然存在1.5万亿美元的融资缺口。1️⃣全球AI基础设施的
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他