扉间798

震惊！ “深度学习”都在学习什么

常见的机器学习分类算法

俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合

算法融合用投票给特征值加权重

AdaBoost 集成学习算法

通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。

（一）投票机制

投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器都 “投出” 自己认为正确的类别，最后得票最多的类别就被确定为最终分类结果。比如在一个判断水果种类的任务中，有 5 个分类器，其中 3 个认为图像中的水果是苹果，1 个认为是橙子，1 个认为是香蕉，那么最终结果就是苹果。这种方式简单直接，能快速整合多个模型的意见。

（二）给特征值加权重

给特征值加权重则更为精细和复杂。不同的特征在模型的判断中具有不同的重要性，通过为每个特征分配合适的权重，可以让模型更关注关键特征，从而提升性能。例如在预测房价的模型中，房屋面积、房间数量、地理位置等都是重要特征，但地理位置可能对房价的影响更大。此时，就可以给地理位置特征赋予较高的权重，让模型在学习和预测过程中，对这一特征给予更多的 “关注” 。在实际操作中，确定权重的过程往往借助一些优化算法，通过不断调整权重，使模型在训练数据上的表现达到最优

kN近邻分类

KNN 属于有监督学习算法。其核心思想是：如果一个样本在特征空间中的 k 个最相似（即特征空间中距离最近）的样本中的大多数属于某一个类别，则该样本也属于这个类别。

决策树算法

决策树：通过递归分割特征空间构建决策树模型进行分类。从根节点开始，依据特征测试结果将实例分配到子节点，递归操作直至叶节点，从而完成分类，可处理数值型和标称型数据，常用于客户分类、信用评分等。

随机森林：属于 Bagging 集成学习，对数据集有放回随机采样且随机选择特征，组合多个决策树来提高预测性能，适用于分类和回归任务，尤其是大数据场景

贝叶斯算法

朴素贝叶斯：基于贝叶斯定理，假设特征间相互独立，通过先验概率和条件概率计算分类的概率，选取概率大的情况进行分类。常用于文本分类、垃圾邮件检测等标称型数据处理。

逻辑回归：基于统计的算法

虽带有 “回归” 二字，但实际是用于二分类任务的线性分类模型，通过 sigmoid 函数将线性组合转为概率，以此进行分类，如垃圾邮件检测、疾病诊断等场景。

支持向量机（SVM）5支持向量机算法

监督式学习方法，核心是构造分割面（超平面）将数据分离，在线性可分时寻找最优分类超平面，可处理数值型和标称型数据，应用于图像分类、文本分类、生物信息学等领域。

分类器

Softmax 分类器是一种常用的多分类算法

sigmoid 分类器是一种常用的二分类算法

Sigmoid 函数在机器学习中也有广泛应用，特别是在二分类问题中，常与逻辑回归结合使用。

文本分析

1. TF - IDF（Term Frequency - Inverse Document Frequency）

作用

TF - IDF 是一种用于信息检索与文本挖掘的常用加权技术。它衡量一个词在文档中的重要性，综合考虑了词在当前文档中的出现频率（TF）和在整个文档集合中的稀有程度（IDF）。一个词在某个文档中出现频率高，同时在其他文档中出现频率低，那么这个词对该文档的代表性就强，其 TF - IDF 值就高。

转换形式

给定一个文档集合，TF - IDF 会将每个文档转换为一个向量，向量的每个维度对应一个词，向量的值就是该词在文档中的 TF - IDF 值。例如，对于一个包含 1000 个不同词的文档集合，每个文档会被转换为一个 1000 维的向量。

应用场景

信息检索：在搜索引擎中，TF - IDF 可以用来评估查询词与文档的相关性，帮助用户找到最相关的文档。
文本分类：作为特征提取方法，将文本转换为向量后输入到分类模型中，帮助模型区分不同类别的文本。
关键词提取：通过计算每个词的 TF - IDF 值，找出文档中的关键词。

2. Tokenizer

作用

Tokenizer 是一个分词器，主要用于将文本拆分成一个个的词（或标记，token），并将这些词转换为数字表示。在深度学习中，神经网络通常只能处理数字输入，因此需要将文本数据转换为数字序列。Tokenizer 可以构建词汇表，并将每个词映射到一个唯一的整数索引。

转换形式

输入是文本数据，输出是整数序列。例如，输入文本 "This is a test"，经过 Tokenizer 处理后可能转换为 [1, 2, 3, 4]，其中每个数字对应词汇表中的一个词。

应用场景

深度学习模型输入准备：在训练基于神经网络的文本分类、情感分析、机器翻译等模型时，需要将文本数据转换为模型可以接受的数字序列。
文本预处理：在进行其他 NLP 任务之前，先对文本进行分词和编码，方便后续处理。

3. Word2Vec

作用

Word2Vec 是一种用于学习词向量表示的模型，它可以将每个词映射到一个低维的向量空间中，使得语义相近的词在向量空间中距离较近。通过学习词的上下文信息，Word2Vec 能够捕捉到词之间的语义关系。

转换形式

输入是文本数据，输出是每个词对应的向量。例如，在一个 300 维的词向量空间中，每个词都被表示为一个 300 维的向量。这些向量可以用于表示整个文本，例如将一个句子中的所有词向量相加或求平均得到句子的向量表示。

应用场景

文本相似度计算：通过计算词向量或句子向量之间的相似度，判断文本之间的语义相似度。
文本分类和聚类：将词向量或句子向量作为特征输入到分类或聚类模型中，帮助模型更好地理解文本的语义信息。

机器翻译：在翻译过程中，利用词向量的语义信息提高翻译的准确性。


# 读取数据
df = pd.read_csv('文件名.csv')
'''如果数据里面没有列名 加上 header=None'''
df = pd.read_csv('文件名.tsv', sep='\t')
'''多文件合并 手动添加标签'''
df1 = pd.read_csv('文件名1.csv', header=None, sep='\n\t')
df2 = pd.read_csv('文件名2.csv', header=None, sep='\n\t')
df3 = pd.read_csv('文件名3.csv', header=None, sep='\n\t')
df1['label'] = 0
df2['label'] = 1
df3['label'] = 2

df = pd.concat([df1, df2, df3])

'''txt '''

df = pd.read_csv('文件名.txt', header=None, sep='\n\t')

# 查看
df.info()

# 类不平衡处理
print(df['标签'].value_counts())
df1 = df[df['标签'] == '类别1'].sample('最少类别数量')
df2 = df[df['标签'] == '类别2'].sample('最少类别数量')
df3 = df[df['标签'] == '类别3'].sample('最少类别数量')

df = pd.concat([df1, df2, df3])

'''如果类别不是以数字形式出现的 做标签化'''
from sklearn.preprocessing import LabelEncoder

y = LabelEncoder().fit_transform(df['标签'])

# 独热
from tensorflow.keras import utils

y_one = utils.to_categorical(y, 'y的类别数量')

# 文本数据处理

import jieba

x = df['文本']
x = x.map(lambda s: jieba.lcut(s))
x = x.map(lambda s: [i for i in s if len(i) > 1])  # >*<  o r z  -.-!!      
'''停用词'''
stopwords = pd.read_csv('停用词库.txt', header=None, sep='\n\t')
stopwords = ['停用词1', '停用词2', '停用词3', '....']
x = x.map(lambda s: [i for i in s if i not in stopwords])
# x = x.map(lambda s:' '.join(s))
# 文本数据替换
import re


# 定义替换函数--去除标点符号和数字
def fun(s):
    result = re.sub(f'[^\w\s]', '', str(s))
    result = re.sub(f'[\d]', '', result)
    return result


x = x.map(fun)

# 高频词处理
from collections import Counter

h = ' '.join(x).split()
count = Counter(h)
# 词频最高的前十个
l = count.most_common(10)

x = x.map(lambda s: [i for i in s if i not in l])
x = x.map(lambda s: ' '.join(s))

# 循环方式处理了词频
'''
cout = {}
for i in x:
    for j in i:
        if count.get(j) == None:
            count[j] = 1
        else:
            count[j] += 1
h = sorted(count.items(), key=lambda s: s[1])
print(h)
stopwords = ['高频词1', '高频词2', '高频词3', '高频词4', '...']
x = x.map(lambda s: [i for i in s if i not in stopwords])
x = x.map(lambda s: ' '.join(s))
'''
# 绘制词云图
s = ''
for i in x:
    s += i + ' '
from wordcloud import WordCloud
import matplotlib.pyplot as plt

wd = WordCloud()
wd.generate(s)
plt.imshow(wd)
plt.show()

# 词性分析

import jieba.posseg as posg

f = ''
for i in x:
    f += i + ' '

cixing = posg.lcut(f)

print(cixing)
'''筛选名词'''
mingci = ''
for i, j in cixing:
    # ci, cixing = i
    if j == 'n':
        mingci += i + ' '

from gensim.models import Word2Vec
import logging
from gensim.models.word2vec import logger, LineSentence


# word2vec
def fun():
    # b.设置输出日志
    logging.basicConfig(level=logging.INFO)
    logger.info('running')
    # b.把语料变成句子集合
    sen = LineSentence('train.txt')
    # c.训练word2vec模型
    model = Word2Vec(sen, vector_size=100)
    # d.保存word2vec模型
    model.save('1.model')


with open('train.txt', 'w', encoding='utf8') as f:
    for i in x:
        f.write(i + '\n')
fun()

# 词转向量
# 一般用在机器学习
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer

tfidf = TfidfVectorizer()
x_tfidf = tfidf.fit_transform(x)

tf = CountVectorizer()
x_tf = tf.fit_transform(x)

from sklearn.model_selection import train_test_split, GridSearchCV, cross_val_score

X_train, X_test, y_train, y_test = train_test_split('x_tfidf 或 x_tf', y)

from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.naive_bayes import MultinomialNB

lo = LogisticRegression()
svc = SVC(probability=True)
rfc = RandomForestClassifier()
mnb = MultinomialNB()

gmodel = GridSearchCV('lo/svc/rfc/mnb', param_grid={'C/n_estimators/alpha': []}, cv=5)
gmodel.fit(X_train, y_train)

lo = LogisticRegression(C=gmodel.best_params_['C'])
lo.fit(X_train, y_train)
svc = SVC(C=gmodel.best_params_['C'], probability=True)
svc.fit(X_train, y_train)
rfc = RandomForestClassifier(nestimators=gmodel.best_params_['n_estimators'])
rfc.fit(X_train, y_train)
mnb = MultinomialNB(alpha=gmodel.best_params_['alpha'])
mnb.fit(X_train, y_train)

lo.predict(X_test)
svc.predict(X_test)
rfc.predict(X_test)
mnb.predict(X_test)

# 交叉验证
l = [lo, svc, rfc]
l1 = []
for i in l:
    l1.append(cross_val_score(i, X_train, y_train, cv=5).mean())
plt.bar(['lo', 'svc', 'rfc'], l1)
plt.show()

# 深度学习进行词转向量
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing import sequence

token = Tokenizer(4000)
token.fit_on_texts(x)
print(token.word_counts)
print(token.word_index)
seq = token.texts_to_sequences(x)
seq_pad = sequence.pad_sequences(seq, maxlen=64)

# 9.构建模型
# a设置词汇表大小
input_dim = 4001
# b设定词嵌入维度
out_put = 100
# c设定LSTM层单元数
lstm = 120
# d创建序列对象
from tensorflow.keras import models, layers, losses, optimizers, activations, metrics

model = models.Sequential()
# e设置嵌入层
model.add(layers.Embedding(input_dim=input_dim, output_dim=out_put, input_length=64))
# f定义lstm网络
model.add(layers.LSTM(lstm))
# model.add(layers.SimpleRNN(lstm))
# model.add(layers.GRU(lstm))
model.add(layers.Dense(units=1, activation=activations.sigmoid))
'''
units=1 由标签种类决定，如果二分类问题，y没有独热就写1，独热了就写2
多分类 有多少类别，就写多少类别，activation=activations.softmax
'''
# 全链接 三层全链接
model.add(layers.Dense(units=100, input_dim=64, activation=activations.relu))
model.add(layers.Dropout(0.2))  # 随机选择20个神经元不计入当次计算
model.add(layers.Dense(units=50, activation=activations.relu))
model.add(layers.Dropout(0.2))
# print(len(np.unique(y)))
model.add(layers.Dense(units=1, activation=activations.sigmoid))
'''
units=1 由标签种类决定，如果二分类问题，y没有独热就写1，独热了就写2
多分类 有多少类别，就写多少类别，activation=activations.softmax
'''
# 10.模型编译
model.compile(optimizer=optimizers.Adam(), loss=losses.binary_crossentropy, metrics='acc')
'''
二分类：用 binary_crossentrop
多分类：用 sparse_categorical_crossentropy y没独热的情况下
'''
# 12.打印模型结构
model.summary()
# 12.训练模型
model.fit(seq_pad, y, epochs=10, validation_split=0.2, batch_size=10)
'''
验证集：
validation_data:必须传入指定验证集，一般情况会使用测试集进行验证（X_test,y_test)
validation_split: 将前面传入的数据按照一定比例提取出来当作验证集  0.2 

将数据按批次传入进行训练
batch_size：将现有数据集切分成一定批次数，按批次传入训练

'''
# 13.保存模型
model.save('1.h5')

# 预测
# 加载预测数据
'''根据题目要求来'''
# 分词处理
s = '''这是一段样本'''
s = jieba.lcut(s)
s = [i for i in s if len(i) > 1]
s = [i for i in s if i not in stopwords]

# 词转向量
seq = token.texts_to_sequences(x)
seq_pad = sequence.pad_sequences(seq, maxlen=64)

# 预测
y_pre = model.predict_classes(seq_pad)

# 保存
pd.DataFrame(y_pre).to_csv('1.csv')

['', '', '']

【EI会议征稿】东北大学主办第三届机器视觉、图像处理与影像技术国际会议（MVIPIT 2025）诗远Yolanda 图像处理计算机视觉考研视频机器学习论文阅读
一、会议信息大会官网：www.mvipit.org官方邮箱：[email protected]会议地点：辽宁沈阳主办单位：东北大学会议时间：2025年9月27日-9月29日二、征稿主题集中但不限于“机器视觉、图像处理与影像技术”等其他相关主题。机器视觉：视觉中的统计机器学习；立体视觉标定；几何建模与处理；人脸识别与手势识别；早期视觉和生物学启发的视觉；光流法和运动追踪；图像分割和图像分类；基于模型的视觉
mysql怎样区分「主表」与从表跨越七海 Database System Design mysql 数据库 sql
实体完整性是通过主键约束实现的，而参照完整性是通过外键约束实现的，两者都是为了保证数据的完整性和一致性。主键约束比较好理解，就是主键值不能为空且不重复，已经强调好多次，所以这里重点记录对外键约束的学习。主表与从表若同一个数据库中，B表的外键与A表的主键相对应，则A表为主表，B表为从表。假设学生表(学号，姓名，性别，专业号)，专业表(专业号，专业名称)，则学生表中的专业号为学生表的外键，其与专业表中
MCP模型上下文协议：AI人工智能模型训练的自动化调参 AI天才研究院 AI人工智能与大数据人工智能自动化运维 ai
MCP模型上下文协议：AI人工智能模型训练的自动化调参关键词：MCP模型、自动化调参、AI训练、超参数优化、上下文协议、机器学习、深度学习摘要：本文深入探讨MCP模型上下文协议在AI模型训练自动化调参中的应用。MCP(ModelContextProtocol)是一种创新的自动化调参框架，通过上下文感知和动态参数调整机制，显著提升模型训练效率和性能。文章将从理论基础、算法实现、数学原理到实际应用进行
爬虫基础-urllib库的使用 a little peanut Python3网络爬虫 python 爬虫开发语言
注：本文章为学习过程中对知识点的记录，供自己复习使用，也给大家做个参考，如有错误，麻烦指出，大家共同探讨，互相进步。借鉴出处：该文章的路线和主要内容：崔庆才（第2版）python3网络爬虫开发实战bytes类型：https://blog.csdn.net/apple_50618492/article/details/114677967python中文官网：https://docs.python.o
AI--提升效率、驱动创新的核心引擎保持学习ing AI编程自动化低代码
自动化代码生成、低代码/无代码开发、算法优化实践等新兴技术在软件开发领域正逐渐崭露头角。这些技术为开发者提供了更高效、更便捷的开发方式，大大提升了软件开发的效率和质量。本文重点探讨的是这些技术在实际应用中的价值和优势。1、自动化代码生成1.1优势自动化代码生成是利用机器学习和人工智能技术，通过分析需求和已有代码，生成可用的代码片段或完整的程序。这种技术可以极大地减少开发人员的工作量，提高开发效率。
图论基础知识深度优先（Depth First Search, 简称DFS），广度优先（Breathe First Search, 简称BFS） mmaerd Leetcode刷题学习记录深度优先图论宽度优先机考
图论基础知识学习记录自代码随想录dfs与bfs区别dfs是沿着一个方向去搜，不到黄河不回头，直到搜不下去了，再换方向（换方向的过程就涉及到了回溯）。bfs是先把本节点所连接的所有节点遍历一遍，走到下一个节点的时候，再把连接节点的所有节点遍历一遍，搜索方向更像是广度，四面八方的搜索过程。深度优先搜索理论（DepthFirstSearch,简称DFS）搜索方向，是认准一个方向搜，直到碰壁之后再换方向换
深度解析基于贝叶斯的垃圾邮件分类大千AI助手人工智能 Python #OTHER 分类数据挖掘人工智能机器学习算法贝叶斯 Bayes
贝叶斯垃圾邮件分类的核心逻辑是基于贝叶斯定理，利用邮件中的特征（通常是单词）来计算该邮件属于“垃圾邮件”或“非垃圾邮件”的概率，并根据概率大小进行分类。它是一种朴素贝叶斯分类器，因其假设特征（单词）之间相互独立而得名（虽然这在现实中不完全成立，但效果通常很好）。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的
【Go】入门Go应该怎么学 CodeWithMe Go golang 开发语言后端
Go语言学习路线图一、为什么学Go？简洁、直观，容易上手，语法像C又比C简洁天然支持并发（goroutine+channel）编译速度快、跨平台强、部署简单（一个二进制）在云原生（K8s）、微服务、工具链开发领域非常受欢迎拥有丰富的标准库与成熟的社区二、学习阶段与资源第一阶段：Go基础语法&核心概念内容：变量、常量、类型流程控制（if、for、switch）数组、切片、map、字符串函数、返回值、
YOLOv11革命性升级：基于MobileNetv4的UIB和ExtraDW模块重构C3k2架构，实现移动端推理性能飞跃博导ai君深度学习教学-附源码 YOLO 重构
引言与背景概述在当今人工智能飞速发展的时代，目标检测技术已成为计算机视觉领域的核心技术之一。从自动驾驶汽车到智能安防系统，从移动端AR应用到工业质检，目标检测无处不在。然而，随着应用场景的多样化，特别是移动端和边缘设备的普及，对模型的计算效率提出了更为严苛的要求。YOLO（YouOnlyLookOnce）系列算法作为目标检测领域的领军者，一直在精度与速度之间寻求最佳平衡。从YOLOv1到最新的YO
从零开始：Python实现语音识别的完整教程_副本 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别开发语言 ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、语音转文本、音频处理、机器学习、深度学习、自然语言处理摘要：本文将带你从零开始学习如何使用Python实现语音识别功能。我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。背景介绍
爬虫实战之图片及人物信息爬取 nightunderblackcat Python进阶爬虫 python
爬虫对于许多Python初学者来说都是一个好玩有趣的技能,但大多数人都是从网上得来的经验,会认为学习爬虫是件很难的事,像处理反爬机制以及反反爬,总是让人望而却步,今天我们来进行爬虫实操,需要注意爬虫本身并不违法,但恶意爬取文件将会涉及相关法律,为避免不必要的纠纷,本文采取一个不存在的网站进行演示,本文适合Python初学者以及爬虫初学者学习,博主是大一.所以讲的话和相关技能并不特别专业,望大家谅解
Unity引擎开发：VR渲染技术_（19）.VR项目实例开发 chenlz2007 虚拟现实游戏2 unity vr lucene 游戏引擎 json 全文检索
VR项目实例开发在本节中，我们将通过一个具体的虚拟现实项目实例，详细介绍如何在Unity引擎中实现VR渲染技术。我们将从项目的基本设置开始，逐步讲解如何创建VR场景、配置相机、添加交互元素、优化性能等方面的内容。通过本节的学习，您将能够掌握在Unity中开发VR项目的基本流程和技术要点。1.项目基本设置1.1创建新的VR项目首先，打开UnityHub并创建一个新的项目。选择“3D”模板，然后在项目
七天学完十大机器学习经典算法-05.从投票到分类：K近邻(KNN)算法完全指南
接上一篇《七天学完十大机器学习经典算法-04.随机森林：群众智慧的机器学习实践》想象一下，你搬进了一个新小区。想知道这个小区整体氛围如何？最直接的方法就是看看你最近的几家邻居是什么样的人——如果邻居们都很安静、整洁，小区大概率不错；如果邻居们深夜喧哗、环境杂乱，你可能就得重新考虑了。K近邻（K-NearestNeighbors,KNN）算法的核心思想，就如同这个观察邻居的过程。它是机器学习中最直观
分类预测 | MATLAB实现BP神经网络多特征分类预测 matlab科研社分类 matlab 神经网络
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍近年来，随着大数据时代的到来以及计算能力的显著提升，人工智能技术得到了飞速发展。在众多人工智能算法中，反向传播神经网络（BackPropagationNeuralNetwork,BP神经网络）凭借其强大的非
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
Android Gantt View 安卓实现项目甘特图 netkiller-BG7NYT Android 手札 android 甘特图
需要做一个项目管理工具，其中使用到了甘特图。发现全网甘特图解决方案比较少，于是自动动手丰衣足食。前面我用Python和Node.js前端都做过，这次仅仅是移植到Android上面。其实甘特图非常简单，开发也不难，如果我专职去做，能做出一个非常棒产品。我写这个只是消遣，玩玩，闲的蛋痛，所以不怎么上心，就搞成下面这德行吧。仅仅供大家学习，参考。那天心情好了，完善一下。屏幕布局文件
2025年 UI 自动化框架使用排行 Thomas Kant 自动化测试 ui 自动化运维
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】</
机电一体化c语言程序设计,机电一体化专业《C语言程序设计》课程标准爱吃糖的果子狸机电一体化c语言程序设计
山东海事职业学院机电一体化专业《C语言程序设计》课程标准一、课程性质与任务《C语言程序设计》是机电一体化专业的职业能力素质课程之一，并且是本专业的核心专业课程之一，理论性和实践性均较强，既要掌握理论概念，又要动手编程，还要上机调试运行。通过本课程的学习，使学生掌握基本的程序设计过程和技巧，熟练应用MicrosoftVisualC6.0集成环境进行C语言的编写、编译与调试，培养学生的逻辑思维能力、抽
使用Ultralytics YOLO进行数据增强 alpszero YOLO计算机视觉应用 YOLO 人工智能机器学习
概述数据增强是计算机视觉领域的一项重要技术，它通过对现有图像进行各种转换，人为地扩展训练数据集。在训练深度学习模型时，数据增强有助于提高模型的鲁棒性，减少过拟合，并增强对真实世界场景的泛化。在训练计算机视觉模型的过程中，数据增强具有多种重要作用：扩展数据集：通过创建现有图像的变体，可以有效增加训练数据集的规模，而无需收集新数据。提高泛化能力：模型学会在各种条件下识别物体，使其在实际应用中更加稳健。
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1001 A+B Problem 热爱编程的通信人 c++算法
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺
Python 数据分析与可视化 Day 11 - 特征工程基础蓝婷儿 python python 数据分析人工智能
✅今日目标理解特征工程在数据分析和机器学习中的意义掌握常见特征类型的处理方式：数值型、类别型、时间型学习特征提取、转换、标准化、独热编码（One-HotEncoding）等核心操作为后续建模任务做好特征准备工作一、什么是特征工程？特征工程是将原始数据转换为模型可学习的“特征向量”的过程，是机器学习效果好坏的核心因素之一。常见任务包括：缺失值处理（已学）异常值处理（已学）数值归一化、标准化类别变量编
全球人工智能与大模型发展全景：技术历程、产品概览与未来趋势软件职业规划人工智能搜索引擎
一、人工智能的发展历程（一）萌芽期（1950s-1980s）1956年：人工智能的诞生人工智能（AI）的概念在1956年的达特茅斯会议上被正式提出。那是一个充满梦想和探索的时代，一群年轻的科学家，包括约翰·麦卡锡（JohnMcCarthy）、马文·明斯基（MarvinMinsky）和克劳德·香农（ClaudeShannon）等，齐聚达特茅斯学院，共同探讨一个前所未有的课题：如何让机器模拟人类智能。
推荐几本人工智能方面的书（入门级）人邮异步社区人工智能深度学习神经网络
以下推荐几本适合入门人工智能的书籍，帮助你逐步建立基础知识和理解：一、数学基础类《数学之美》推荐理由：深入浅出地讲解了自然语言处理与搜索方向的数学原理，对于理解算法背后的数学逻辑非常有帮助。本书的章节名称，有“统计语言模型”“谈谈中文分词”“贾里尼克和现代语言处理”“布尔代数和搜索引擎”“信息指纹及其应用”等，似乎太过专业，实际上高中和大学低年级的同学们都能看得懂，当然本书因此也可以称得上是“高级
分布式学习嘉陵妹妹分布式学习
1.列举三个非冯·诺依曼计算结构非冯结构是指不遵循传统冯·诺依曼体系的计算架构，包括：数据流结构（DataflowArchitecture）：指令执行取决于数据的可用性而不是程序计数器。神经网络结构（NeuralNetworkArchitecture）：模拟生物神经元连接，用于人工智能。量子计算结构（QuantumComputingArchitecture）：利用量子比特和量子叠加原理进行计算。2
C++———类与对象（中） dragoooon34 C++c++开发语言学习学习方法
引言书接上文类与对象（上），我们学习类与对象的一些基础知识，接下来我们接着学习。类的默认成员函数在C++中，当你定义一个类时，即使没有显式地声明某些成员函数，编译器也会为该类自动生成一些默认的成员函数。⼀个类，我们不写的情况下编译器会默认生成以下6个默认成员函数，需要注意的是这6个中最重要的是前4个，最后两个取地址重载不重要，我们稍微了解⼀下即可。其次就是C++11以后还会增加两个默认成员函数，移
线性代数-第9篇：二次型与正定矩阵：优化问题的数学基础程序员勇哥人工智能(AI)线性代数人工智能大数据 python
线性代数-第9篇：二次型与正定矩阵：优化问题的数学基础在人工智能、量化投资和大数据分析中，优化问题无处不在，比如机器学习的损失函数最小化、量化投资组合的风险最小化等。而二次型与正定矩阵作为线性代数中的重要概念，为解决这些优化问题提供了坚实的数学基础。本篇将深入解析它们的原理及其在实际场景中的关键应用。一、二次型：从向量到函数的桥梁1.定义与表达式二次型是一个关于向量x\mathbf{x}x的二次齐
激活函数和批归一化（BatchNorm）
简单记录学习~。在神经网络中，激活函数和批归一化（BatchNorm）的配合使用是为了解决‌数据分布偏移‌和‌梯度不稳定‌问题。以下是逐步解释：1.激活函数为何导致值向上下限移动？‌以Sigmoid/Tanh为例‌：这类饱和型激活函数（如Sigmoid、Tanh）的导数在输入绝对值较大时会趋近于0（饱和区）。例如：Sigmoid的输出范围是(0,1)当输入≫0时，输出接近1；x≪0时，输出接近0。
Python虚拟环境管理：conda、venv、pipenv三国杀 network爬虫 python conda 数据库 jupyter
Python虚拟环境管理：conda、venv、pipenv三国杀作为一名在Python生态系统中学习实践了六年的开发者，我深刻体会到了Python虚拟环境管理工具的重要性和复杂性。从最初接触virtualenv时的懵懂，到现在熟练使用conda、venv、pipenv等工具，每一次的学习和实践都让我对Python环境管理有了更深的理解。今天，我想和大家分享一下这几年来对这三个主流工具的使用心得，
C#教程（2）———— 各式各样的数据类型值类型篇大朋Sir C#教程 c#
C#教程（2）————各式各样的数据类型前言1数据类型概述2值类型2.1数值类型2.1.1整数类型2.2浮点数类型2.3字符类型2.4布尔类型2.5其它值类型2.6sizeof关键字总结前言在上一篇文章中，我们简单介绍了C#语言的历史，并通过一个简单的打印“HelloWorld”的程序，一起了解了C#程序的基本结构，那么在今天，我们将进一步学习更多的内容。我们的现实生活中总是存在着各式各样的数据，
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

震惊！ “深度学习”都在学习什么

常见的机器学习分类算法

AdaBoost 集成学习算法

kN近邻分类

决策树算法

贝叶斯算法

逻辑回归： 基于统计的算法

支持向量机（SVM）5支持向量机算法

分类器

Softmax 分类器是一种常用的多分类算法

sigmoid 分类器是一种常用的二分类算法

文本分析

1. TF - IDF（Term Frequency - Inverse Document Frequency）

作用

转换形式

应用场景

2. Tokenizer

作用

转换形式

应用场景

3. Word2Vec

作用

转换形式

应用场景

你可能感兴趣的:(深度学习,学习,人工智能)

逻辑回归：基于统计的算法