机器深度学习二分类电影的情感问题

二分类问题可能是应用最广泛的机器学习问题。今天我们将学习根据电影评论的文字内容将其划分为正面或负面。

一、数据集来源

我们使用的是IMDB数据集，它包含来自互联网电影数据库（IMDB）的50000条严重两极分化的评论。为了避免模型过拟合只记住训练数据，我们将数据集分为用于训练的25000条评论与用于测试的25000条评论，训练集和测试集都包含50%的正面评论和50%的负面评论。

与MNIST数据集一样，IMDB数据集也内置于Keras库。它已经过预处理：评论（单词序列）已经被转换为整数序列，其中每个整数代表字典中的某个单词。

通过以下代码加载数据集并限制每条评论最多取前一万个常用的word，以便于我们进行向量处理。

import tensorflow as tf
imdb = tf.keras.datasets.imdb
(train_data, train_labels),(test_data, test_labels) = imdb.load_data(num_words=10000)
print(train_data[0])
print(train_labels[0])

通过输出可以看到，train_data和test_data是评论记录的集合，每条评论记录又是由众多的单词索引组成的集合。
train_labels和test_labels是针对评论的分类的集合，其中0表示负面评论，1表示正面评论。

[1, 14, 22, 16, 43, 530, 973, 1622, 1385, 65, 458, 4468, 66, 3941, 4, 173, 36, 256, 5, 25, 100, 43, 838, 112, 50, 670, 2, 9, 35, 480, 284, 5, 150, 4, 172, 112, 167, 2, 336, 385, 39, 4, 172, 4536, 1111, 17, 546, 38, 13, 447, 4, 192, 50, 16, 6, 147, 2025, 19, 14, 22, 4, 1920, 4613, 469, 4, 22, 71, 87, 12, 16, 43, 530, 38, 76, 15, 13, 1247, 4, 22, 17, 515, 17, 12, 16, 626, 18, 2, 5, 62, 386, 12, 8, 316, 8, 106, 5, 4, 2223, 5244, 16, 480, 66, 3785, 33, 4, 130, 12, 16, 38, 619, 5, 25, 124, 51, 36, 135, 48, 25, 1415, 33, 6, 22, 12, 215, 28, 77, 52, 5, 14, 407, 16, 82, 2, 8, 4, 107, 117, 5952, 15, 256, 4, 2, 7, 3766, 5, 723, 36, 71, 43, 530, 476, 26, 400, 317, 46, 7, 4, 2, 1029, 13, 104, 88, 4, 381, 15, 297, 98, 32, 2071, 56, 26, 141, 6, 194, 7486, 18, 4, 226, 22, 21, 134, 476, 26, 480, 5, 144, 30, 5535, 18, 51, 36, 28, 224, 92, 25, 104, 4, 226, 65, 16, 38, 1334, 88, 12, 16, 283, 5, 16, 4472, 113, 103, 32, 15, 16, 5345, 19, 178, 32]
1

我们可以通过word与编号的映射关系将评论的内容转化为具体的文本

def get_text(comment_num):
    """将数字形式的评论转化为文本"""
    # word_index = tf.keras.datasets.imdb.get_word_index()
    word_index = imdb.get_word_index()
    reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])
    text = ' '.join([reverse_word_index.get(i - 3, '?') for i in comment_num])
    return text
comment = get_text(train_data[0])
print(comment)

第一条电影评论的内容

? this film was just brilliant casting location scenery story direction everyone's really suited the part they played and you could just imagine being there robert ? is an amazing actor and now the same being director ?

二、格式化输入数据

由于我们无法直接将整数序列输入神经网络，所以需要将其转换为张量。可以通过以下两种方式进行转化

填充列表，使其具有相同的长度，然后将列表转化为(samples, word_index)的2D形状的整数张量。对列表进行one-hot编码，将其转化为0和1组成的向量。

这里我们采用one-hot进行编码处理

def vectorize_sequences(sequences, diamension = 10000):
    results = np.zeros((len(sequences), diamension))
    for i, sequence in enumerate(sequences):
        results[i, sequence] = 1
    return results
x_train = vectorize_sequences(train_data)
print(x_train[0])
print(len(x_train[0]))
x_test = vectorize_sequences(test_data)
print(x_test[0])
print(len(x_test[0]))

转化完成的输入结果

[0. 1. 1. ... 0. 0. 0.]

10000

[0. 1. 1. ... 0. 0. 0.]

将标签进行向量化处理

y_train = np.asarray(train_labels).astype('float32')
y_test = np.asarray(test_labels).astype('float32')

三、构建神经网络

针对这里二分类单标签，我们可以直接使用带有relu激活函数的全连接层的简单堆叠。
我们使用了两个具有16个隐藏单元的中间层和具有一个隐藏单元的层。中间层使用的relu激活函数负责将所有的负值归零，最后一层使用sigmoid函数将任意值压缩到[0,1]之间并作为预测结果的概率。

model = models.Sequential()
model.add(layers.Dense(16, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(16, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

这里的Dense层实现了如下的张量计算,传入Dense层的参数16表示隐藏单元的个数，同时也表示这个层输出的数据的维度数量。隐藏单元越多，网络越能够学习到更加复杂的表示，但是网络计算的代价就越高。

output = relu(dot(W, input) + b)

我们使用rmsprop优化器和binary_crossentropy损失函数来配置模型。

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['accuracy'])

四、训练模型

将训练数据分出一小部分作为校验数据，同时将512个样本作为一批量处理，并进行20轮的训练，同时出入validation_data来监控校验样本上的损失和计算精度。

x_val = x_train[:10000]
partial_x_train = x_train[10000:]
y_val = y_train[:10000]
partial_y_train = y_train[10000:]
history = model.fit(partial_x_train, partial_y_train, epochs= 20, batch_size=512, validation_data=(x_val, y_val))

调用fit()返回的history对象包含训练过程的所有数据

history_dict = history.history
print(history_dict.keys())

字典中包含4个条目，对应训练过程和校验过程的指标，其中loss是训练过程中损失指标，accuracy是训练过程的准确性指标，而val_loss是校验过程的损失指标，val_accuracy是校验过程的准确性指标。

dict_keys(['loss', 'accuracy', 'val_loss', 'val_accuracy'])

我们使用Matplotlib画出训练损失和校验损失的情况

loss_values = history_dict['loss']
val_loss_values = history_dict['val_loss']
epochs = range(1, len(loss_values) + 1)
plt.plot(epochs, loss_values, 'bo', label='Training loss')
plt.plot(epochs, val_loss_values, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

从图中可以看到整个训练过程，损失函数值一直在不断的变小，但是校验过程的损失函数值却先变小后变大，在2.5-5之间的某个点达到最小值。

我们使用Matplotlib画出训练精度和校验精度的情况

plt.clf()
acc = history_dict['accuracy']
val_acc = history_dict['val_accuracy']
plt.plot(epochs, acc, 'bo', label='Training accuracy')
plt.plot(epochs, val_acc, 'b', label='Validation accuracy')
plt.title('Training and validation accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

从图中可以看到整个训练过程，准确度值一直在不断的升高，但是校验过程的精度数值却在不断的进行波动，在2.5-5之间的某个点达到最大值。

通过对训练和校验指标的分析，可以看到训练的损失每轮都在降低，训练的精度每轮都在提升。但是校验损失和校验精度基本上在第4轮左右达到最佳值。为了防止这种过拟合的情况，我们可以在第四轮完成之后直接停止训练。

history = model.fit(partial_x_train, partial_y_train, epochs= 4, batch_size=512, validation_data=(x_val, y_val))
results = model.evaluate(x_test, y_test)
print(results)

重新执行可以看到模型的精度可以达到87%

782/782 [==============================] - 1s 876us/step - loss: 0.3137 - accuracy: 0.8729
[0.3137112557888031, 0.8728799819946289]

五、使用测试数据预测结果

使用训练的模型对test数据集进行预测

result = model.predict(x_test)
print(result)

[[0.31683978]

[0.9997941 ]

[0.9842608 ]

...

[0.18170357]

[0.23360077]

六、小结

需要对原始数据进行预处理并转化为符合要求的张量。
对于二分类问题，最后一层使用sigmoid作为激活函数，并输出0-1的标量来表示结果出现的概率。
对于二分类问题的sigmoid标量输出，应该使用binary_crossentropy损失函数。
随着训练过程的进行，很容易出现过拟合现象，我们需要时刻监控模型在非训练数据集的表现。

到此这篇关于机器深度学习之电影的二分类情感问题的文章就介绍到这了,更多相关深度学习内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

聚焦全球食品加工与包装——探索食品新生产系统、人工智能和可持续性的前沿全景动态人工智能
swop2024：聚焦全球食品加工与包装的热门话题——探索食品新生产系统、人工智能和可持续性的前沿科技创新被认为是发展新质生产力的核心，特别是在全球食品安全与健康领域的研究推动下，食品加工及包装行业正迎来前所未有的创新浪潮。根据中国食品科学技术学会发布的【2023-2024年度全球食品安全与健康十大研究热点】，食品新生产系统、人工智能以及可持续食品包装等三大热点趋势受到极大关注。swop包装世界（
小白WEB前端学习（七） Sun ᥫᩣ涵 WEB前端前端学习
续：小白WEB前端学习（六）继续学习CSS（五）8.响应式布局：响应式布局意在实现不同屏幕分辨率的终端上浏览网页的不同展示方式1.响应式布局介绍：优点:面对不同分辨率设备灵活性强能够快捷解决多设备显示适应问题缺点:兼容各种设备工作量大，效率低下代码累赘，会出现隐藏无用的元素，加载时间加长手机:76899212482.media媒体查询HTML标签字号手机屏幕大小不同，分辨率不同如何设置不同的htm
阿里云服务器国际站：如何安装？？聚好云阿里云服务器阿里云服务器国际站阿里云服务器代理商阿里云服务器云计算
阿里云服务器国际站：如何安装？？在阿里云上安装和配置服务器通常涉及以下几个步骤。这里主要以创建一个ECS（ElasticComputeService，弹性计算服务）实例为例：###1.注册与登录-**注册账户**：如果还没有阿里云账号，请前往[阿里云官网](https://www.aliyun.com)注册一个账户。-**登录**：使用注册的账户登录阿里云控制台。###2.创建ECS实例-**访问
腾讯云服务器国际站：腾讯云服务器动态IP服务器，灵活稳定的网络解决方案聚好云腾讯云服务器腾讯云代理商网络腾讯云服务器
腾讯云服务器国际站：腾讯云服务器动态IP服务器，灵活稳定的网络解决方案腾讯云服务器动态IP服务器，灵活稳定的网络解决方案。随着互联网的快速发展，越来越多的企业和个人都面临着网络服务器的选择和管理问题。在这个背景下，腾讯云服务器动态IP服务器成为了许多人的首选，因为它提供了灵活稳定的网络解决方案。首先，腾讯云服务器动态IP服务器的灵活性使其成为了许多用户的首选。用户可以根据自己的需求随时调整服务器的
【Python实战】元组！编程小白的必修课！努力学习的耶耶 python
想对大家说的话：大家好呀，耶耶最近打算开一起新的专栏，带着大家敲代码，让大家在了解python理论的基础上学会实操，真正做到大彻大悟！在这里，我会将Python代码像拆解精密玩具一样，一步步剖析，确保每一步的来龙去脉都清晰可见。我会详细解释为什么选择特定的关键字和结构，通过对比不同类型的代码片段，让你不仅知其然，更知其所以然！！！拜托大家给我点一个关注！让我们一起进步吧！！！上期本期学习了如何处理
【go语言】变量和常量加油，旭杏 Go语言 golang 服务器开发语言
一、变量1.1变量的定义程序：我们向电脑说了一段话，需要电脑才能理解（沟通机制，xxx语言--汇编--机器码），电脑实际上识别的是机器码：011101（高低电频）机器码：穿孔纸带汇编：早些时候，现在的很多机器硬件底层代码，都是汇编人能读懂的代码：英文、中文将我们的语言和机器进行对接（C、Java、Go--->编译器-->计算机中去执行：无需理解的，我们只需要写我们能看懂的代码即可），我们理解的世界
微信小程序开发项目-基于微信小程序的毕业设计180套(源码+演示录像+LW) 职场程序猿微信小程序毕业设计微信小程序课程设计小程序 java 毕设毕业设计
大家好！我是职场程序猿，感谢您阅读本文，欢迎一键三连哦。今天给大家分享180+的微信小程序毕业设计，后台用Java开发，这些项目都经过精心挑选，涵盖了不同的实战主题和用例，可做毕业设计和课程设计参考。✍️除了源码，对于大部分项目实现的功能都有相应的介绍，并且配有演示视频，方便大家根据自己的需要择优下载学习。另外如有定制需求或者想要相对应的论文参考，文末可以十我VX联系。后续还会持续更新，欢迎关注！
Kotlin Bytedeco OpenCV 图像图像49 仿射变换图像裁剪深色風信子 kotlin opencv 仿射变换图像裁剪 bytedeco javacpp
KotlinBytedecoOpenCV图像图像49仿射变换图像裁剪1添加依赖2测试代码3测试结果在OpenCV中，仿射变换（AffineTransformation）和透视变换（PerspectiveTransformation）是两种常用的图像几何变换方法。变换方法适用场景仿射变换简单的几何变换（平移、旋转、缩放、剪切）。透视变换改变图像视角和模拟3D投影效果。变换方法解释特点应用场景实现方法
Lisp语言的循环实现齐雅彤包罗万象 golang 开发语言后端
Lisp语言的循环实现引言Lisp（LIStProcessing）是一门历史悠久且具有高度灵活性和表达力的编程语言。自1958年首次面世以来，Lisp语言在学术界与工业界均得到了广泛应用。它的函数式编程范式和强大而独特的宏系统使得Lisp在处理符号处理和人工智能领域特别出众。循环结构是程序设计中不可或缺的部分，而在Lisp中，循环的实现与其他编程语言有很大不同。本文将探讨Lisp语言中循环的各种实
阿里云服务器国际站：阿里云服务器的架构聚好云阿里云服务器代理商阿里云服务器阿里云服务器国际站阿里云服务器架构
阿里云服务器的架构目录阿里云服务器的架构阿里云服务器的主要原理阿里云服务器国际站：阿里云服务器的架构计算架构：X86计算架构：这是最常见的架构，其CPU采用Intel处理器，企业级x86每一个vCPU都对应一个IntelXeon处理器核心的超线程。涵盖了计算型c7、通用型g7、内存型r7等多种实例规格，适用于绝大多数的使用场景，如Web网站应用、企业级应用、内存型或者关系型数据库类应用、高网络收发
2025年01月18日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：MiniCPM-o项目地址url：https://github.com/OpenBMB/MiniCPM-o项目语言：Python历史star数：15141今日star数：736项目维护者：yiranyyu,iceflame89,yaoyuanTHU,LDLINGLINGLING,tc-mb项目简介：MiniCPM-o2.6：适用于手机上视觉、语音和多模式直播的GPT-4o级多模态大规模语
《链表之美：C语言中的灵活数据结构》就爱学编程 C 数据结构链表 c语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！目录引言正文一、节点结构二、基本操作1.创建链表2.插入节点3.删除节点4.查找节点5.修改节点数据三、应用场景四、源码LT.hLT.cTest.c五、总结快乐的时光总是短暂，咱们下篇博文再见啦！！！不要忘了，给小编点点赞和收藏支持一下，在此非常感谢！！！引言
重生之我在异世界学编程之C语言：深入位段篇就爱学编程 C语言 c语言开发语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一位段的基本使用（1）位段的声明（2）位段的访问二位段的大小计算（1）从右向左分配位（2）对齐要求（3）填充位三经典习题习题1：位段存储计算习题2：位段与对齐习题3：位段与结构体数组习题4：位段与位操作习题5：位段与内存映射习题6：位段与网络协
Spring Cloud Alibaba 及其组件的作用、适用场景与与 Eureka 的区别小白的一叶扁舟 Java开发 eureka 云原生 springcloud alibaba 中间件 java
前言：随着微服务架构在现代应用中的普及，如何高效构建、管理和运维分布式系统成为开发者的核心关注点。SpringCloudAlibaba是在SpringCloud基础上集成Alibaba开源技术的一站式解决方案。它提供丰富的组件，旨在简化分布式系统的开发与运维，特别适合需要高可用性和复杂功能的企业级应用。本文将详细介绍SpringCloudAlibaba的核心组件及其适用场景，比较其与传统服务注册发
四、【Vue3】——setup不得不说的两个注意点 YIFEI132 Vue3 vue.js javascript 前端
在Vue3中setup被称为组合式API表演的舞台，可见其重要性与地位，在小编第一篇中浅谈过setup的使用，这节可以进阶学习一下setup中两个注意点：执行时机以及其参数。一、拉开序幕的setup理解：Vue3.0中一个新的配置项，值为一个函数。setup是所有CompositionAPI（组合API）“表演的舞台”。组件中所用到的：数据、方法等等，均要配置在setup中。setup函数的两种返
深入剖析 JVM 内存模型小白的一叶扁舟面试题 jvm java spring boot 架构
前言：下面分别介绍了新生代和老年代的不同收集器及其相关子类型，并附有示例代码和说明，感兴趣的朋友可以参考一下。简介：在Java虚拟机（JVM）的世界里，内存模型是其核心架构之一，它决定了Java程序如何存储和管理数据，深刻影响着程序的性能和稳定性。了解JVM内存模型，对于优化Java应用、排查内存相关问题至关重要。一、类加载器子系统类加载器子系统在JVM中扮演着数据“搬运工”的角色，负责将字节码文
JPA 和 Hibernate（Springboot中使用HQL）小白的一叶扁舟 Java开发 hibernate spring boot java 后端
前言：在项目开发过程中，使用Springboot集成HQL，在此用于记录，下方有原生方法及HQL注意事项和示例，有兴趣的可往下阅读。一、基本概念JPA：全称是JavaPersistenceAPI，即Java持久化API，是SUN公司推出的一套基于ORM的规范，由一系列接口和抽象类构成。它是EJB3规范中负责对象持久化的应用程序编程接口（ORM接口），定义了多种注释，这些注释可分为类级别、方法级别和
Redis从0到1详解（SpringBoot）小白的一叶扁舟面试题 redis spring boot 数据库 spring cloud java 后端中间件
前言在现代应用中，Redis扮演着重要的角色，作为高性能的缓存和消息队列，它能够大大提高系统的响应速度和吞吐量。在SpringBoot项目中使用Redis，不仅能通过简单的配置连接Redis服务，还能利用Redis提供的各种高效算法，如LRU（最近最少使用）和LFU（最不常用）来实现智能的数据管理。此外，分布式锁也可以通过Redis提供的功能来实现，保证多线程或多服务之间的数据一致性。本文将介绍如
SpringBoot之定义接口返回类型有几种方式？ java熬夜党 Java spring boot java mybatis
SpringBoot系列教程之定义接口返回类型的几种方式实现一个web接口返回json数据，基本上是每一个javaer非常熟悉的事情了；那么问题来了，如果我有一个接口，除了希望返回json格式的数据之外，若也希望可以返回xml格式数据可行么？答案当然是可行的，接下来我们将介绍一下，一个接口的返回数据类型，可以怎么处理I.项目搭建本文创建的实例工程采用SpringBoot2.2.1.RELEASE+
STM32更新程序OTA 嵌入式小强工作室 stm32 嵌入式硬件单片机
STM32的OTA（Over-The-Air）更新程序是一种通过无线通信方式，为设备分发新软件、配置甚至更新加密密钥的技术。以下是关于STM32OTA更新程序的详细介绍：一、OTA升级流程STM32的OTA升级流程通常包括以下几个关键步骤：固件打包：在进行OTA升级之前，开发人员需要将新的固件代码编译成二进制文件。为了确保文件的完整性和安全性，通常会添加校验码（如MD5或SHA-1）。服务器部署：
大数据的一些基本概念 weixin_49536779 大数据数据分析数据库 python
首先，大数据是什么？大数据是指数据集规模巨大且复杂，传统的数据处理软件无法高效处理它们。它是非常大的数据集。这种复杂性可能来自于数据的“3V”特性：体量（Volume）、多样性（Variety）和速度（Velocity）。体量（Volume）首先，什么是体量？体量指的是以PB（Petabytes）为单位的数据量，甚至是EB（Exabytes）。这种数据量远大于GB（Gigabytes）或TB（Te
MySQL-练习-数据汇总-CASE WHEN 赛丽曼 MySQL mysql 数据库
文章目录一.数据介绍二.数据汇总三.使用CASEWHEN和GROUPBY将数据分组1.使用CASEWHEN自定义分组练习15练习162.CASEWHEN中ELSE的使用练习17练习18练习193.在GROUPBY中使用CASEWHEN练习20练习214.CASEWHEN和COUNT练习22练习235.GROUPBY和CASEWHEN组合使用练习246.SUM中使用CASEWHEN练习257.SUM
GitHub的原理及应用详解（二）凛鼕将至 Java技术栈高级攻略 github
本系列文章简介：GitHub是一个基于Git版本控制系统的代码托管平台，为开发者提供了一个方便的协作和版本管理的工具。它广泛应用于软件开发项目中，包括但不限于代码托管、协作开发、版本控制、错误追踪、持续集成等方面。GitHub的原理可以简单概括为，在本地创建一个仓库（repository），可以将项目的代码和文件上传到仓库中进行管理。每次对代码的修改都会生成一个新的版本，并记录下修改的内容和时间等
深入解析Spring AI框架：在Java应用中实现智能化交互的关键鵝鵝鵝 java spring 数据库后端开发语言
合集-Spring源码分析(22)1.Spring入门系列：浅析知识点2023-04-102.Spring源码系列：初探底层，手写Spring2023-04-123.Spring源码系列：核心概念解析2023-04-204.Spring源码系列（补充）：详解ApplicationContext2023-04-215.Spring源码：bean的生命周期（一）2023-05-016.Spring源码
pycharm无法创建python file_pycharm无法导入本地模块的解决方式 weixin_39873356 file
最近学习python的django，需要导入本地的view模块，参考一些别人导入包的方法importsyssys.path.append('C:\\Users\\hhua\\Desktop')#括号中的内容为A所在的目录importA.Demo1#不能加.py否则会报错(错误为没有这个文件A.Demo1.py)但是不论用相对路径导入还是绝对路径导入，运行都会出错，但是我又用命令行试了一遍，发现命令
PyCharm 2024 终端打开失败问题 DawnDongZ Windows pycharm python
PyCharm2024终端打开失败问题PyCharm2024终端问题问题解决方法PyCharm2024终端问题问题在PyCharm2024版本，打开本地命令行终端时异常提示CannotopenCommandPrompt，参考其他类似情况文章处理，切换软件终端为PowerShell再次启动打开同样报错解决方法调整PyCharm终端仿真配置在菜单栏目点击帮助-->查找操作在弹出窗口中输入注册表，进入注
自动化评估：利用机器学习算法评估 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1评估的意义评估在各个领域都扮演着至关重要的角色，例如教育、人力资源、医疗保健等。传统评估方式通常依赖人工，费时费力且容易受到主观因素的影响。随着机器学习技术的不断发展，自动化评估逐渐成为一种趋势，它能够提高评估效率、降低成本并减少人为偏差。1.2机器学习在评估中的优势机器学习算法能够从大量数据中学习规律，并根据这些规律对新的数据进行预测或分类。在评估领域，机器学习可以用于：自动评
利用E2B环境进行数据分析 - 创建一个简单的OpenAI Agent srudfktuffk 数据分析数据挖掘 python
在AI技术应用中，数据分析是一个关键环节。E2B的云环境为大模型（LLM）的运行提供了一个安全的运行时沙箱，非常适合用来构建代码解释器或进行高级数据分析。在这篇文章中，我们将介绍如何利用E2B的DataAnalysis沙箱，结合OpenAI的API，创建一个简化的自动化数据分析应用。技术背景介绍E2B的DataAnalysis沙箱能够安全地执行代码，是构建自动化数据分析工具的理想选择。该沙箱提供了
kotlin协程使用举例小李飞飞砖 kotlin 开发语言 android
Kotlin协程通过简化异步任务的处理，使代码更易于阅读和维护。以下是一些常见的使用场景及代码示例，展示如何使用Kotlin协程：1.启动一个简单的协程使用launch在协程作用域内启动一个协程。importkotlinx.coroutines.*funmain()=runBlocking{launch{delay(1000L)//模拟一些异步工作println("World!")}println
Kotlin协程中withContext、async 和 launch 的区别小李飞飞砖 kotlin java 前端
文章目录一、withContext、async和launch对比1.withContext2.async3.launch总结对比任务启动：适用情境：二、为何说withContext是顺序执行1.挂起协程但不创建新协程2.顺序流程的保证3.用例场景的体现结论withContext、async和launch是Kotlin协程库中用来管理并发和异步任务的三个不同的构建器。它们适用于不同的场景，具有不同的
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他