Vacancy@TLP

机器学习三天快速入门总结

day1

1、字典特征提取

from sklearn.feature_extraction import DictVectorizer
# sklearn.feature_extraction模块负责从原始数据中提取特征
# feature_extraction.DictVectorizer将特征值映射列表转换为向量

def dict_demo():
    data = [{'city': '北京', 'tem': 100}, {'city': '上海', 'tem': 60}, {'city': '深圳', 'tem': 30}]
    # 实例化一个转换器类
    transfer1 = DictVectorizer()
    # 调用fit_transform()
    data_new1 = transfer1.fit_transform(data)
    # 若sparse=True（默认）则返回一个sparse矩阵（稀疏矩阵）
    print("data_new1:\n", data_new1)
    print("data_new1类型：",type(data_new1))
    transfer2 = DictVectorizer(sparse=False)
    data_new2 = transfer2.fit_transform(data)
    # 写出矩阵来看其实是等价的，稀疏矩阵节省内存
    print("data_new2:\n", data_new2)
    print("data_new2类型：", type(data_new2))
    print("特征名字：\n", transfer1.feature_names_)
    return None


if __name__ == "__main__":
    dict_demo()

2、文本特征提取

from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
# sklearn.feature_extraction.text收集实用程序以从文本文档构建特征向量
# feature_extraction.text.CountVectorizer将文本文档集合转换为令牌计数矩阵（统计每个样本特征词出现的个数）
# feature_extraction.text.TfidfVectorizer将原始文档集合转换为TF-IDF功能矩阵
import jieba


def count_demo():
    data = ["life is short,i like like python", "life is too long,i dislike python"]
    # 实例化一个转换器类
    transfer = CountVectorizer()
    # 调用fit_transform()
    data_new = transfer.fit_transform(data)
    print("data_new:\n", data_new)
    # 转换为非稀疏矩阵
    print("特征名字：\n", transfer.get_feature_names_out())
    print("data_new:\n", data_new.toarray())
    return None


# 中文文本提取，手动分词
def count_chinese_demo():
    data = ["大胆 你 在 狗叫 什么", "我 什么 身份 你 什么 地位"]
    transfer = CountVectorizer()
    data_new = transfer.fit_transform(data)
    print("特征名字：\n", transfer.get_feature_names_out())
    print("data_new:\n", data_new.toarray())
    return None


# 进行中文分词
def cut_words(text):
    text = " ".join(list(jieba.cut(text)))
    # print(text)
    # print(type(text))
    return text


# 中文文本提取，自动分词
def count_chinese_demo2():
    # 将中文文本进行分词
    data = ["一种还是一种今天很残酷，明天更残酷，后天很美好，但绝对大部分是死在明天晚上，所有每个人不要放弃今天。",
            "我们看到的从很远星系来的光是在几百万年之前发出的，这样当我们看到宇宙时，我们是在看它的过去。",
            "如果只用一种方式了解某样事物，你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"]
    data_new = []
    for sentence in data:
        data_new.append(cut_words(sentence))
    # print(data_new)
    transfer = CountVectorizer()
    data_final = transfer.fit_transform(data_new)
    print("特征名字：\n", transfer.get_feature_names_out())
    print("data_new:\n", data_final.toarray())
    return None


# tfidf方法文本特征提取
def tfidf_demo():
    data = ["一种还是一种今天很残酷，明天更残酷，后天很美好，但绝对大部分是死在明天晚上，所有每个人不要放弃今天。",
            "我们看到的从很远星系来的光是在几百万年之前发出的，这样当我们看到宇宙时，我们是在看它的过去。",
            "如果只用一种方式了解某样事物，你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"]
    data_new = []
    for sentence in data:
        data_new.append(cut_words(sentence))
    # print(data_new)
    transfer = TfidfVectorizer(stop_words=["一种", "所以"])
    data_final = transfer.fit_transform(data_new)
    print("特征名字：\n", transfer.get_feature_names_out())
    print("data_new:\n", data_final.toarray())
    return None


if __name__ == "__main__":
    # count_demo()
    # count_chinese_demo()
    # cut_words("我草你妈的")
    # count_chinese_demo2()
    tfidf_demo()

3、特征预处理

import pandas as pd
from sklearn.preprocessing import MinMaxScaler, StandardScaler
# sklearn.preprocessing是预处理和规范化模块，包括缩放、居中、归一化、二值化方法
# sklearn.preprocessing.MinMaxScaler该估计器分别缩放和转换每个特征，以使其在训练集上处于给定范围内，例如介于零和一之间（归一化）
# sklearn.preprocessing.StandardScaler通过对原始数据进行变换把数据变换到均值为0，标准差为1的范围内（标准化）


# 归一化
def minmax_demo():
    # 获取数据
    data = pd.read_csv("dating.txt")
    data = data.iloc[:, :3]  # 取所有行和0、1、2列
    print("data:\n", data)
    # 实例化一个转换器类
    transfer = MinMaxScaler()  # 默认归一化到(0,1)
    # 调用fit_transform()
    data_new = transfer.fit_transform(data)
    print("data_new:\n", data_new)
    return None


# 标准化
def stand_demo():
    data = pd.read_csv("dating.txt")
    data = data.iloc[:, :3]  # 取前三列
    print("data:\n", data)
    transfer = StandardScaler()
    data_new = transfer.fit_transform(data)
    print("data_new:\n", data_new)
    return None


if __name__ == "__main__":
    # minmax_demo()
    stand_demo()

4、特征降维

import pandas as pd
from sklearn.feature_selection import VarianceThreshold
# feature_selection.VarianceThreshold是删除所有低方差特征的特征选择器
from scipy.stats import pearsonr
# 皮尔逊相关系数
from sklearn.decomposition import PCA
# sklearn.decomposition模块包括矩阵分解算法，其中包括PCA，NMF或ICA。该模块的大多数算法都可以视为降维技术
# sklearn.decomposition.PCA是主成分分析，利用数据的奇异值分解将其投射到较低维空间的线性降维


# 低方差特征过滤和相关系数
def variance_demo():
    # 获取数据
    data = pd.read_csv("factor_returns.csv")
    data = data.iloc[:, 1:-2]  # 取第1到第-2列
    print("data:\n", data)
    # 实例化一个转换器类
    transfer = VarianceThreshold(threshold=10)  # 默认是选择方差大于0的，这里设为选择方差大于10的
    # 调用fit_transform()
    data_new = transfer.fit_transform(data)
    print("data_new:\n", data_new, data_new.shape)
    # 原来有9个特征，过滤后只有7个
    # 计算某两个变量之间的相关系数
    r1 = pearsonr(data["pe_ratio"], data["pb_ratio"])
    # r1的第一个值是皮尔逊相关系数，后一个数是p值，p值越小表示相关系数越显著
    print("相关系数：\n", r1)
    r2 = pearsonr(data["revenue"], data["total_expense"])
    print("相关系数：\n", r2)
    return None


# 主成分分析
def pca_demo():
    data = [[2, 8, 4, 5], [6, 3, 0, 8], [5, 4, 9, 1]]
    # 实例化转换器类
    transfer1 = PCA(n_components=2)  # n_components=2表示将特征数降为2
    transfer2 = PCA(n_components=0.95)  # n_components=0.95表示保留95%的信息
    # 调用fit_transform()
    data_new1 = transfer1.fit_transform(data)
    data_new2 = transfer2.fit_transform(data)
    print("data_new1:\n", data_new1)
    print("data_new2:\n", data_new2)
    return None


if __name__ == "__main__":
    # variance_demo()
    pca_demo()

5、鸢尾花数据集测试

from sklearn.datasets import load_iris
# 加载并返回鸢尾花数据集
from sklearn.model_selection import train_test_split
# 将数组或矩阵切分为随机训练和测试子集

# sklearn数据集使用
def datasets_demo():
    # 获取数据集
    # iris是字典类型的数据
    iris = load_iris()
    print("鸢尾花数据集：\n", iris)
    print("查看数据集描述：\n", iris["DESCR"])
    print("查看特征值名字：\n", iris["feature_names"])
    print("查看目标值名字：\n", iris["target_names"])

    # 数据集划分
    # x是数据集的特征值，y是数据集的标签值
    # test_size表示测试集的大小，一般为float
    x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)
    print("训练集特征值：\n", x_train, x_train.shape)
    print("训练集标签值：\n", y_train, y_train.shape)
    print("测试集特征值：\n", x_test, x_test.shape)
    print("测试集标签值：\n", y_test, y_test.shape)
    return None


if __name__ == "__main__":
    datasets_demo()

day2

1、KNN鸢尾花种类预测

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
# sklearn.neighbors实现k近邻算法，sklearn.neighbors.KNeighborsClassifier分类器执行k最近邻投票
from sklearn.model_selection import GridSearchCV
# sklearn.model_selection.GridSearchCV详尽搜索估计器的指定参数

def knn_iris():
    # 1、获取数据
    iris = load_iris()
    # 2、划分数据集
    x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)
    # print("训练集特征值：\n", x_train, x_train.shape)
    print("训练集标签值：\n", y_train, y_train.shape)
    # print("测试集特征值：\n", x_test, x_test.shape)
    print("测试集标签值：\n", y_test, y_test.shape)
    # 3、特征工程：标准化
    transfer = StandardScaler()  # 实例化一个转换器对象
    x_train = transfer.fit_transform(x_train)
    # 上一步的fit已经计算了总体样本的均值和标准差，即transfer已经fit了，而测试集和训练集来自同一总体样本，标准化的时候不需要再fit了，直接transform
    x_test = transfer.transform(x_test)
    # 4、knn算法估计器
    estimator = KNeighborsClassifier(n_neighbors=3) # 实例化一个估计器对象
    estimator.fit(x_train, y_train) # 训练模型
    # 5、模型评估
    y_predict = estimator.predict(x_test)
    # (1)、直接对比真实值和预测值
    print("y_predict:\n", y_predict)
    print("预测值是否等于真实值：\n", y_predict == y_test)
    # (2)、计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为：\n", score)
    return None


# 添加网格搜索和交叉验证
def knn_iris_grid():
    # 1、获取数据
    iris = load_iris()
    # 2、划分数据集
    x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=6)
    # print("训练集特征值：\n", x_train, x_train.shape)
    print("训练集标签值：\n", y_train, y_train.shape)
    # print("测试集特征值：\n", x_test, x_test.shape)
    print("测试集标签值：\n", y_test, y_test.shape)
    # 3、特征工程：标准化
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    # 上一步的fit已经计算了总体样本的均值和标准差，即transfer已经fit了，而测试集和训练集来自同一总体样本，标准化的时候不需要再fit了，直接transform
    x_test = transfer.transform(x_test)
    # 4、knn算法估计器
    estimator = KNeighborsClassifier()
    # 加入网格搜索和交叉验证
    # 参数准备
    param_dict = {"n_neighbors": [1, 3, 5, 7, 9, 11]}
    estimator = GridSearchCV(estimator, param_grid=param_dict, cv=10)  # cv=10表示10折交叉验证
    estimator.fit(x_train, y_train)
    # 5、模型评估
    y_predict = estimator.predict(x_test)
    # (1)、直接对比真实值和预测值
    print("y_predict:\n", y_predict)
    print("预测值是否等于真实值：\n", y_predict == y_test)
    # (2)、计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为：\n", score)
    print("最佳参数：\n", estimator.best_params_)
    print("最佳结果：\n", estimator.best_score_)
    print("最佳估计器：\n", estimator.best_estimator_)
    print("交叉验证结果：\n", estimator.cv_results_)
    return None


if __name__ == "__main__":
    # knn_iris()
    knn_iris_grid()

2、朴素贝叶斯新闻分类

from sklearn.datasets import fetch_20newsgroups
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
# sklearn.naive_bayes.MultinomialNB是用于多项式模型的朴素贝叶斯分类器，适用于具有离散特征的分类（例如文本分类的字数统计）


def nb_news():
    # 1）获取数据
    news = fetch_20newsgroups(subset="all")
    # 2）划分数据集
    x_train, x_test, y_train, y_test = train_test_split(news.data, news.target)
    # 3）特征工程
    #      文本特征抽取-tfidf
    transfer = TfidfVectorizer()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)
    # 4）朴素贝叶斯预估器流程
    estimator = MultinomialNB(alpha=1)  # 默认alpha就是1（拉普拉斯平滑系数）
    estimator.fit(x_train, y_train)
    # 5）模型评估
    y_predict = estimator.predict(x_test)
    # (1)、直接对比真实值和预测值
    print("y_predict:\n", y_predict)
    print("预测值是否等于真实值：\n", y_predict == y_test)
    # (2)、计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为：\n", score)
    return None


if __name__ == "__main__":
    nb_news()

3、决策树鸢尾花分类

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, export_graphviz
# sklearn.tree模块包括用于分类和回归的基于决策树的模型
# sklearn.tree.DecisionTreeClassifier是决策树分类器
# sklearn.tree.export_graphviz以DOT格式导出决策树

def decision_iris():
    # 1）获取数据
    iris = load_iris()
    # 2）划分数据集
    x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2)
    # 3) 决策树估计器
    estimator = DecisionTreeClassifier(criterion="entropy")  # 按信息增益进行分类
    estimator.fit(x_train, y_train)
    # 4) 模型评估
    y_predict = estimator.predict(x_test)
    # (1)、直接对比真实值和预测值
    print("y_predict:\n", y_predict)
    print("预测值是否等于真实值：\n", y_predict == y_test)
    # (2)、计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为：\n", score)
    # 可视化决策树
    export_graphviz(estimator, out_file="iris_decision_tree.dot", feature_names=iris.feature_names)
    return None


if __name__ == "__main__":
    decision_iris()

day3

1、波士顿房价预测

from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression, SGDRegressor, Ridge
# sklearn.linear_model实现了各种线性模型
# sklearn.linear_model.LinearRegression是普通最小二乘线性回归
# sklearn.linear_model.SGDRegressor通过使用SGD最小化正则经验损失来拟合线性模型
# sklearn.linear_model.Ridge是具有l2正则化的线性最小二乘法（岭回归）
from sklearn.metrics import mean_squared_error
# sklearn.metrics包括评分功能，性能指标以及成对指标和距离计算
# sklearn.metrics.mean_squared_error是均方误差回归损失
import joblib  # 模型保存和加载


# 正规方程方法对波士顿房价预测
def Linear1():
    # 1）获取数据集
    boston = load_boston()
    print("特征数量:\n", boston.data.shape)
    # 2）划分数据集
    x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, random_state=22)
    # 3）特征工程：
    #   无量纲化 - 标准化
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)
    # 4）预估器流程
    #   fit() --> 模型
    #   coef_ intercept_
    estimator = LinearRegression()
    estimator.fit(x_train, y_train)
    print("正规方程权重系数:\n", estimator.coef_)
    print("正规方程偏置:\n", estimator.intercept_)
    # 5）模型评估
    y_predit = estimator.predict(x_test)
    print("预测房价:\n", y_predit)
    error = mean_squared_error(y_test, y_predit)
    print("正规方程均方误差为:\n", error)
    return None


# 梯度下降方法对波士顿房价预测
def Linear2():
    # 1）获取数据集
    boston = load_boston()
    # 2）划分数据集
    x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, random_state=22)
    # 3）特征工程：
    #   无量纲化 - 标准化
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)
    # 4）预估器流程
    #   fit() --> 模型
    #   coef_ intercept_
    estimator = SGDRegressor()
    estimator.fit(x_train, y_train)
    print("梯度下降权重系数:\n", estimator.coef_)
    print("梯度下降偏置:\n", estimator.intercept_)
    # 5）模型评估
    y_predit = estimator.predict(x_test)
    print("预测房价:\n", y_predit)
    error = mean_squared_error(y_test, y_predit)
    print("梯度下降均方误差为:\n", error)
    return None


# 岭回归对波士顿房价进行预测
def Linear3():
    # 1）获取数据集
    boston = load_boston()
    # 2）划分数据集
    x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, random_state=22)
    # 3）特征工程：
    #   无量纲化 - 标准化
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)
    # 4）预估器流程
    #   fit() --> 模型
    #   coef_ intercept_
    estimator = Ridge()
    estimator.fit(x_train, y_train)
    print("岭回归权重系数:\n", estimator.coef_)
    print("岭回归偏置:\n", estimator.intercept_)
    # 5）模型评估
    y_predit = estimator.predict(x_test)
    print("预测房价:\n", y_predit)
    error = mean_squared_error(y_test, y_predit)
    print("岭回归均方误差为:\n", error)
    # 模型保存
    joblib.dump(estimator, "my_ridge.pkl")
    return None


# 岭回归模型加载
def Linear4():
    estimator = joblib.load("my_ridge.pkl")
    # 1）获取数据集
    boston = load_boston()
    # 2）划分数据集
    x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, random_state=22)
    # 3）特征工程：
    #   无量纲化 - 标准化
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)
    # 模型加载
    estimator = joblib.load("my_ridge.pkl")
    # 4）模型评估
    y_predit = estimator.predict(x_test)
    print("预测房价:\n", y_predit)
    error = mean_squared_error(y_test, y_predit)
    print("岭回归均方误差为:\n", error)


if __name__ == "__main__":
    # Linear1()
    # Linear2()
    # Linear3()
    Linear4()

python中的@classmethod 无脑敲代码，bug漫天飞编程 python
@classmethod是一个装饰器，用于指示一个方法是一个类方法;类方法是通过类本身来调用的，而不是通过类的实例来调用。类方法接收的第一个参数是类本身（通常命名为cls），而不是类的实例。用处：创建类的实例。使用类方法作为工厂函数，可以隐藏对象的创建细节，并在创建对象时执行一些额外的逻辑.由于类方法接收的是类本身作为第一个参数，因此它们可以用于修改类级别的状态或属性。代码案例：classMyCl
PYQT5的UI转换报错：fatal python error: _pyinterpreterstate_get(): no current thread state解决办法 QX大黄蜂 python ui qt python
使用QT可视化工具设计界面，在将UI文件转换为py文件的时候报错：fatalpythonerror:_pyinterpreterstate_get():nocurrentthreadstatepythonrun原因可能是python版本与QT不兼容，具体原因不知道解决办法：使用以下配置将UI转换为py，再将py文件给其它程序调用python版本：3.7.1pyqt5版本：5.11.3pyqt5-t
Python 数据分析实战：宠物经济行业发展洞察萧十一郎@ python python 数据分析宠物
目录一、案例背景二、代码实现2.1数据收集2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1宠物用品用户满意度分析2.4.2宠物用品销售与价格关系分析2.4.3宠物经济行业未来发展预测三、主要的代码难点解析3.1数据收集3.2数据清洗-销售数据处理3.3数据分析-宠物用品用户满意度分析3.4数据分析-宠物用品销售与价格关系分析3.5数据可视化四、可能改进的代码4.1数据收集改进4.2数据清
一文搞懂python中常用的装饰器（@classmethod、@property、@staticmethod、@abstractmethod......） NosONE python python
本文分为两部分，第一部分是介绍python中常见的装饰器。另一部分是自定义装饰器，包括了一些非常好用的自定义装饰器。一文搞懂python中常用的装饰器常见的几个装饰器介绍及示例@classmethod装饰器基本用法@property、@setter装饰器基本用法@staticmethod装饰器基本用法@abstractmethod装饰器基本用法自定义装饰器类装饰器非常好用的自定义装饰器常见的几个装
python @classmethod Mmnnnbb123 python java 开发语言
1..什么是classmethodclassmethod是用来指定一个类的方法为类方法长的像下面这个样子123classcc:@classmethoddeff(cls,arg1,arg2,...):...cls通常用作类方法的第一参数跟self有点类似（__init__里面的slef通常用作实例方法的第一参数)。即通常用self来传递当前类对象的实例，cls传递当前类对象。self和cls没有特别
Fatal Python error: init_stdio_encoding: failed to get the Python codec name of the stdio encoding CCLZMY python 开发语言后端
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入D:\Metag
【收藏】如何优雅的在 Python matplotlib 中可视化矩阵，以及cmap色带设置 Think Spatial 空间思维 Python骚操作合集 python matplotlib 可视化矩阵 cmap
有时需要将numpy矩阵绘制出来看趋势，这时候可以使用plt.imshow()方法来可视化同时还需要对cmap进行设置，使用不同的色带，达到更好的可视化效果。代码importnumpyasnpfrommatplotlibimportpyplotaspltdata2D=np.random.random((50,50)
如何在 virtualenv 中从 python scipt 运行 Tensorboard? 潮易 python virtualenv 开发语言
如何在virtualenv中从pythonscipt运行Tensorboard?要在virtualenv中从Pythonscript运行TensorBoard，你需要遵循以下步骤：1.安装TensorBoard：确保你已经安装了TensorBoard。如果还没有安装，可以通过pip安装：```bashpipinstalltensorboard```2.在你的项目目录下创建一个日志目录（logdir
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
外星人入侵-Python-二 Java版蜡笔小新 Python python pygame 开发语言
武装飞船开发一个名为《外星人入侵》的游戏吧！为此将使用Pygame，这是一组功能强大而有趣的模块，可用于管理图形、动画乃至声音，让你能够更轻松地开发复杂的游戏。通过使用Pygame来处理在屏幕上绘制图像等任务，可将重点放在程序的高级逻辑上。你将安装Pygame，再创建一艘能够根据用户输入左右移动和射击的飞船。在接下来的两章，你将创建一群作为射杀目标的外星人，并改进该游戏：限制可供玩家使用的飞船数，
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
Jira获取story信息更新子任务状态脚本技术实现吾爱乐享 w w w w .f e n
title:Jira获取story信息更新子任务状态脚本技术实现tags:-Jiracategories:-Jira一、项目背景在Jira项目管理系统中，当story主任务处于特定状态（如“READYFORPM”或“已关闭”）时，需要对其所有子任务的状态进行更新。为了实现这一自动化操作，编写了一个Python脚本，以提高工作效率和准确性。二、技术选型编程语言：Python，因其简洁易读的语法和丰富
元数据驱动的设想吾爱乐享 python
title:元数据驱动的设想tags:pythoncategories:python文章目录1.背景针对相似结构的表单，为了提高ui自动化编写效率，减少以减少重复工作，设想是否可以设计一个针对neoUI2.0通过元数据驱动的方式适应不同业务对象的测试框架2.设计元数据模型-字段名-字段类型-是否必填-是否只读-默认值-业务逻辑（可选，后期扩展）3.构建自动化测试框架利用现有的RF框架已实现的功能，
在Robot Framework中Run Keyword If的用法吾爱乐享 Robot Framework Robot Framework
基本用法使用ELSE使用ELSEIF使用内置变量使用Python表达式本文永久更新地址:在RobotFramework中，RunKeywordIf是一个条件执行的关键字，它允许根据某个条件来决定是否执行某个关键字。下面是RunKeywordIf的基本用法：RunKeywordIfconditionkeyword...ELSEkeyword这里的condition是一个表达式，如果该表达式为真（即条
Python实战：开发经典猜拳游戏（石头剪刀布）藍海琴泉游戏
目录引言：为什么选择猜拳游戏作为入门项目？第一部分：基础知识点与代码实现1.游戏逻辑与流程2.代码分步实现2.1导入必要模块2.2定义游戏规则函数2.3生成计算机选择2.4判断胜负逻辑2.5主循环与交互3.代码运行效果示例第二部分：功能扩展与优化1.添加计分系统2.支持多轮游戏与退出选择3.增加图形化界面（可选）第三部分：进一步学习方向1.深化游戏功能2.学习相关知识3.书籍与资源推荐适合人群：编
Python函数完全解读：从零基础到高阶实战藍海琴泉 python 开发语言
目标读者：编程新手|转行者|需系统掌握函数用法的开发者目录一、函数是什么？为什么需要函数？二、函数基础语法详解1.定义与调用2.返回值：函数的输出结果3.参数传递机制4.案例：计算BMI指数三、变量作用域：理解局部与全局1.局部变量2.全局变量四、函数进阶：lambda与高阶函数1.lambda匿名函数2.高阶函数五、函数高级特性1.装饰器：增强函数功能2.递归函数六、实战案例：文件处理工具一、函
本地部署deepseek-r1:14b 批量调用 Python调用本地deepseek-r1:14b实现对本地数据库的AI管理朴拙Python交易猿 python 数据库开发语言
这篇文章主要为大家详细介绍了Python如何基于DeepSeek模型，调用本地deepseek-r1:14b实现对本地数据库的AI管理场景描述基于DeepSeek模型，实现对本地数据库的AI管理。实现思路1、本地python+flask搭建个WEB，配置数据源。2、通过DeepSeek模型根据用户输入的文字需求，自动生成SQL语句。3、通过SQL执行按钮，实现对数据库的增删改查。模型服务方法1启动
Matplotlib 柱形图 lly202406 开发语言
Matplotlib柱形图引言在数据可视化领域，柱形图是一种非常常见且强大的图表类型。它能够帮助我们直观地比较不同类别或组之间的数据大小。Matplotlib，作为Python中最受欢迎的数据可视化库之一，提供了丰富的绘图功能，其中包括创建柱形图。本文将详细介绍Matplotlib中的柱形图，包括其基本用法、高级特性以及如何进行优化。基本用法安装Matplotlib在开始使用Matplotlib之
Matplotlib如何创建交互式图表？ EdgarBertram matplotlib
Matplotlib是一个强大的Python绘图库，它可以用于生成高质量的静态图像。然而，Matplotlib同样支持创建交互式图表，这对于数据分析和可视化非常有用。交互式图表允许用户通过交互方式探索数据，例如缩放、平移或者查询数据点。下面我们将详细介绍如何使用Matplotlib创建交互式图表。一、安装与配置首先，确保你已经安装了Matplotlib库。你可以使用pip来安装：bash复制代码p
如何用PHP开发一个api数据接口幽蓝计划 php
对于一个iOS开发者来说，我一直觉得会写接口是一件很酷的事情，因为它可以实时修改前台数据，而不像App一样需要更新版本和接受审核。更重要的是，它意味着你的技术完成了一个闭环，可以独自完成一整个项目的开发。PHP是我接触的第一个脚本语言，使用之后更是感觉PHP功能强大，开发过程非常友好方便，虽然之后也学习过Python、JavaScript等语言，但现在还是习惯使用PHP，下面就来介绍一下如何用PH
使用E2B数据分析沙盒进行文件分析 qahaj 数据分析数据挖掘 python
使用E2B数据分析沙盒进行文件分析在现代数据分析中，运行环境的安全性与灵活性是确保数据处理高效可靠的关键因素。E2B提供了一个数据分析沙盒，能够在隔离的环境中安全地执行代码，非常适合构建诸如代码解释器或类似于ChatGPT的高级数据分析工具。在这篇文章中，我将演示如何使用E2B的数据分析沙盒来对上传的文件进行分析，为您提供一个强大的Python代码示例。核心原理解析E2B的数据分析沙盒为开发者提供
Python笔记——DeprecationWarning 小橘猫cate Python python 开发语言
定义如下阶跃函数时出现警告，defstep_function(x):returnnp.array(x>0,dtype=np.int)DeprecationWarning:`np.int`isadeprecatedaliasforthebuiltin`int`.Tosilencethiswarning,use`int`byitself.Doingthiswillnotmodifyanybehavio
使用 ArcGIS 和 Python 进行地理信息系统(GIS)分析 scaFHIO arcgis python java
在本篇文章中，我们将探讨如何利用ArcGIS和Python进行地理信息系统(GIS)分析。ArcGIS是由Esri开发和维护的一系列GIS软件，包括客户端、服务器和在线解决方案。本文主要聚焦于如何使用Python和arcgis库来实现GIS功能。技术背景介绍ArcGIS提供了功能强大的工具来进行矢量和栅格分析、地理编码、地图制作以及路线和路径规划。通过arcgisPython库，我们可以访问Esr
PHP 爬虫实战：爬取淘宝商品详情数据 EcomDataMiner php 爬虫开发语言
随着互联网技术的发展，数据爬取越来越成为了数据分析、机器学习等领域的重要前置技能。而在这其中，爬虫技术更是不可或缺。php作为一门广泛使用的后端编程语言，其在爬虫领域同样也有着广泛应用和优势。本文将以爬取斗鱼直播数据为例，介绍php爬虫的实战应用。准备工作在开始爬虫之前，我们需要做一些准备工作。首先，需要搭建一个本地服务器环境，推荐使用WAMP、XAMPP等集成化工具，方便部署PHP环境。其次，我
DeprecationWarning: 无效的转义序列‘\/‘解决方案数据科学智慧 linux 运维服务器 Python
DeprecationWarning:无效的转义序列’/'解决方案在Python编程中，您可能会遇到"DeprecationWarning:无效的转义序列’/'"的警告消息。这个警告通常在您尝试使用无效的转义序列时出现，例如在正则表达式或字符串中。本文将为您提供解决方案，以解决这个问题。首先，让我们了解一下转义序列的概念。在Python中，某些字符前面带有反斜杠（\），以表示特殊含义，例如换行符（
python做飞机大战让敌机打子弹_python（pygame）滑稽大战(类似飞机大战) 教程青云若水
初始准备工作本项目使用的python3版本(如果你用python2，我不知会怎么样)Ide推荐大家选择pycharm(不同ide应该没影响)需要安装第三方库pygame，pygame安装方法(windows电脑，mac系统本人实测与pygame不兼容，强行运行本项目卡成ppt)电脑打开cmd命令窗口，输入pip3installpygame补充说明:由于众所周知的原因，安装过程中下载可能十分缓慢，甚
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
python之连连看游戏 CrMylive. python 游戏 pygame
实现一个简单的连连看游戏需要用到pygame库和一些基本的数据结构和算法。导入pygame库在程序开始之前，首先需要导入pygame库。在Python中，可以使用以下代码导入pygame库：importpygame初始化Pygame在导入pygame库之后，需要使用以下代码初始化pygame：pygame.init()设置游戏窗口设置游戏窗口的大小、标题等属性。可以使用以下代码设置游戏窗口大小为6
Python, Java, C ++开发全球热能动态监测APP Geeker-2025 python java c++
开发一个“全球热能动态监测APP”是一个非常有意义的想法，尤其是在能源管理和环境保护领域。以下是开发该APP的详细思路和技术实现方案，分别针对Python、Java和C++。---###**功能需求分析**1.**全球热能数据展示**：-各国或地区的热能生产、消费和进出口数据。-实时监测热能动态（如发电厂的热能输出、温度变化等）。2.**地图可视化**：-在地图上标注热能发电厂的位置。-使用颜色或
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

机器学习三天快速入门总结

day1

day2

day3

你可能感兴趣的:(机器学习,python,sklearn)