柳小葱

Tensorflow 入门基础——向LLM靠近一小步

进入tensflow的系统学习，向LLM靠拢。

目录

1. tensflow的数据类型
- 1.1 数值类型
- 1.2 字符串类型
- 1.3 布尔类型的数据
2. 数值精度
3. 类型转换
- 3.1 待优化的张量
4 创建张量
- 4.1 从数组、列表对象创建
- 4.2 创建全0或者1张量
- 4.3 创建自定义数值张量
5. 创建已知分布的张量（正态和均匀分布）
6 创建序列
参考资料

1. tensflow的数据类型

1.1 数值类型

数值类型的张量是tensorflow主要的数据载体，根据维度数来区分，可分为：

标量Scalar：单个实数，如1，2，3，4等，维度数为0，shape为[]
向量Vector：n个实数的有序集合，如[1,2,5,62,21]等，维度为1，长度不定，shape为[n]
矩阵Matrix：n行m列实数的有序集合，如[[1,23],[2,32],[5,23]]的矩阵，维度数为2，每个维度上长度不定，shape为[n,m]
张量Tensor：所有维度数dim >2的数据统称为张量。张量的每个维度也作为轴Axis，一般维度代表了具体的业务含义，例如shape的张量[2,32,32,3]的张量共有4维，如果表图片数据，每个维度分别代表图片数量、图片高度、图片宽度、图片通道数，其中2代表了2张图片，32代表了高，宽均为32，3代表了RGB的3个通道。

在tensorflow中，一般将标量、向量、矩阵也都统称为张量，不作区分需要根据张量的维度数和形状自行判断。

创建一个标量，并查看数据类型

a=1.1 ##python的普通常量
type(a)
import tensorflow as tf
b=tf.constant(2.2) #tf的张量
type(b)

结果：（张量只能通过tf的函数去创建，不能使用python的普通语法创建）

2. 创建一个向量并展示向量信息

c=tf.constant([1,23,4,5,56])
c

结果：（id是tensorflow中内部索引的对象编号，shape表示张量的形状，dtype代表张量数职的精度值，张量numpy()方法可以返回Numpy.array类型的数据，方便到处数据到系统其他模块）

#将数据导出为numpy的array类型
c.numpy()

3. 与标量不同，向量的定义碧玺通过list传给tf.constant() 函数，例如创建一个和多个元素的向量：

##将一个元素的list转换为张量
d=tf.constant([1.2])

##多个元素的list转换为张量
e=tf.constant([1.2,13,14,151,15,15])

4. 创建矩阵张量原理同list

#创建矩阵张量
f=tf.constant([[1,2,3,4],[5,6,7,8]])
f

1.2 字符串类型

TF除了支持数值类型的张量之外，还支持字符串类型的数据，例如在表示图片数据时，可以先记录图片的路径字符串，再通过预处理函数根据路径读取图片张量。

创建字符串张量

a=tf.constant('hello,DEEP learning!')
a

tf还提供了一些2字符串类型的工具函数，如小写化lower()、拼接join()、长度length()、切分split()等。

tf.strings.lower(a) #小写化字符串

但是在tf中最常用的还是数字类型的数据，因此字符类型的数据的函数不做过多赘述。

1.3 布尔类型的数据

为了方便表达比较运算操作的结果，tf还支持布尔类型的张量，布尔类型张量只需要传入python语言的布尔类型数据，转换成为内部布尔类型即可。

创建布尔类型的张量

a=tf.constant(True)
a

2. 创建布尔类型的向量

b=tf.constant([True,False])
b

3. tf的布尔类型和python的布尔类型并不等价，不能通用

a=tf.constant(True)
a is True

2. 数值精度

对于数值类型的张量，可以保存为不同字节长度的精度，如浮点数3.14即可以保存为16位（bit）长度，也可以保存为32位甚至64位的精度。位越长，精度越高，同时占用的空间也就越大，常用的精度类型有tf.int16、tf.int32、tf.int64、tf.int64、tf.float16、tf.float32、tf.float64等，其中tf.float64即为tf.double。

tf.constant(123456789,dtype=tf.int16)
tf.constant(123456789,dtype=tf.int32)

可以看到，保存精度过低，数据123456789发生了溢出，得到了错位的结果，一般使用tf.int32、tf.int64精度，对于浮点数，高精度的张量可以表示更精准的数据，例如：采用tf.float32精度2保存’pai’ 时，实际保存为的数据位3.1415927.

import numpy as np
np.pi
tf.constant(np.pi,dtype=tf.float32)

如果采用tf.float64精度保存，则能够获得更高的精度，实现如下：

tf.constant(np.pi,dtype=tf.float64)

3. 类型转换

系统的每个模块使用数据类型，数值类型可能各不相同，对于不符合要要求的张量的类型及精度，需要通过tf.cast函数进行转换，例如：

a=tf.constant(np.pi,dtype=tf.float16)
tf.cast(a,tf.double)

进行类型转换时，需要保证转换操作的合法性，例如将高精度的张量转换为低精度的张量时，可能发生数据溢出隐患：

a=tf.constant(123456789,dtype=tf.int32)
tf.cast(a,tf.int16)

布尔类型与整型之间互信转型是合法的，是比较常见的操作：

a=tf.constant([True,False])
tf.cast(a,tf.int32)

一般末日0表示false,1表示True，在tf中，将非0数字，都视为True，例如：

a=tf.constant([-1,0,1,2])
tf.cast(a,tf.bool)

3.1 待优化的张量

为了区分需要计算梯度信息的张量与不需要计算梯度信息的张量，TF增加了一种专门的数据类型来支持梯度信息的记录：tf.Variable。tf.Variable类型在普通的张量类型的基础上增加了name、trainable等属性来支持计算图的构建。由于梯度运算会消耗大量的计算资源，而且会自动更新相关参数，对于不需要优化的张量，如何神经网络的输入X，不需要通过tf.Variable封装；相反，对于需要计算梯度优化的张量，如神经网络层的W和b，需要通过tf.Variable包裹以便TF跟踪梯度信息。
例如tf.Variable() 函数可以将普通张量转换为待优化的张量：

d=tf.constant([-1,0,1,2])#创建tf张量
b=tf.Variable(d)#转换为variable类型

其中name和trainable是variable特有的属性，name属性用于命名计算图中的变量，这趟命名体系是TF内部维护的，一般不需要用户关注name属性，trainable属性表示当前张量是否被优化，创建variable对象时是默认启用优化标志，可以设置trainable=false来设置张量不需要优化。
除了通过普通的方式创建variable，就可以之间创建，例如：

a=tf.Variable([1,2],[3,4])#直接创建variable张量
a

4 创建张量

创建tf中，可以通过多种方式创建张量，如从python列表对象创建，从numpy数组创建，或者创建采样自某种已知分布的张量等。

4.1 从数组、列表对象创建

Numpy array 数据和python list 列表是python程序中间非常重要的数据载体，很多数据通过python语言将数据加载至array 或者 list，再转化为Tensor类型，通过TF运算处理后导入到array或者list。方便其他模块调用。
通过tf.convert_to_tensor函数可以创建新Tensor，并保存在python list 对象或者numpy array 对象中的数据导入到Tensor：

tf.convert_to_tensor([1,2.])

import numpy as np
tf.convert_to_tensor(np.array([[1,2],[3,4]]))

注意，numpy 浮点数数组默认使用64位精度保存数组，转换到tensor类型时精度位tf.float64，可以在需要时将其转换为tf.float32类型。
实际上，tf.constant() 和tf.convert_to_tensor() 都能够自动地把numpy 数组或者python列表数据类型转化为Tensor类型。

4.2 创建全0或者1张量

将张量创建为全0或者全1数据是非常常见的张量初始化手段。考虑线性变换y=wx+b，将权值权值矩阵w初始化为全1矩阵，偏置b初始化为全0的向量，此时线性变化层输出y=x，因此是一种比较好的层初始化状态，通过tf.zero() 和 tf.ones() 即可创建任意形状，且内容全0或者全1的张量。创建全0和1的标量：

tf.zeros([]) #创建全0的标量
tf.ones([]) #创建全1的标量

创建全0和全1的向量：

tf.zeros([1]) #创建全0的向量
tf.ones([1]) #创建全1的向量

通过tf.zeros_like，tf.ones_like 可以方便地新建与某个张量shape 一致，且内容为全0或全1的张量。例如创建一张张量A形状一样的全0张量：

a=tf.ones([2,3])
tf.zeros_like(a)

a=tf.zeros([3,2])
tf.ones_like(a)

tf. *_like 是一系列的便捷函数，可以通过tf.zero(a.shape)等方式实现。

4.3 创建自定义数值张量

除了初始化为全0，或者全1的张量之外，有时也需要全部初始化为某个自定义数值的张量，例如将张量的数值全量初始化为-1等。
通过tf.fill(shape,value)，可以创建全自定义数值value的张量，形状有shape参数制定。例如：

创建所有元素为-1的标量：

tf.fill([],-1) #创建-1的标量

创建所有元素为-1的向量

tf.fill([1],-1)#创建-1的向量

创建所有元素为99的向量

tf.fill([2,2],99)#创建2行2列，元素全为99的矩阵

5. 创建已知分布的张量（正态和均匀分布）

正态分布和均匀分布是常见的分布之一，通过tf.random.normal(shape,mean=0.0，stddev=1.0) 可以创建形状为shape，均值mean，标准差为stddev的正态分布N（mean，stddev^3）。例如，创建均值为0，标准差1的正态分布：

tf.random.normal([2,2])

创建均值为1，标准差为2的正态分布：

tf.random.normal([2,2],mean=1,stddev=2)

通过tf.random.uniform(shape,minval=0,maxval=none,dtype=tf.float32)可以创建采样自[minval,maxval]区间的均匀分布的张量。例如：

tf.random.uniform([2,2])#创建采样自区间[0,1]，shape=[2,2]的矩阵：

创建采样区间在[0.10]，shape为[2,2]的矩阵：

tf.random.uniform([2,2])

如果需要均匀采样整型类型的数据，就必须指定采样区间最大值maxval参数，同时指定数据类型为tf.int*类型:

tf.random.uniform([2,2],maxval=100,dtype=tf.int32)#创建采样自[0.100]均匀缝补的整形矩阵

6 创建序列

如果需要快速创建序列，可以使用range( x,delta=1)函数,创建[0,x)，步长为delta的整型序列

tf.range(10)#创建步长为1，0-10的数据序列

tf.range(10,delta=2)#创建步长为2，0-10的数据序列

创建[2,10)，步长为2的序列：

tf.range(2,10,delta=2)

参考资料

TensorFlow深度学习

你可能感兴趣的:(tensorflow,人工智能,python)

Python知识点（史上最全） espss python 开发语言
【腾讯文档】python资料https://docs.qq.com/doc/【腾讯文档】python资料https://docs.qq.com/doc/DTGtwYWlVeHpEanNZ不想看文字的可以点击链接：python简介Python是一种解释型语言Python使用缩进对齐组织代码执行，所以没有缩进的代码，都会在载入时自动执行数据类型：整形int无限大浮点型float小数复数complex由
.NET架构师：全网最全“权限系统”设计剖析数字智慧化基地 .NET/C#中大型项目开发 .net .netcore 微服务架构系统架构
作者：科技、互联网行业优质创作者专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造欢迎关注我（Net数字智慧化基地），里面有很多高价值技术文章，是你刻苦努力也积累不到的经验，能助你快速成长。升职+涨薪！！1为什么需要权限管理日常工作中权限的问题时时刻刻伴随着我们，程序员新入职一家公司需要找人开通各种权限，比如网络连接的权限、编码下载提
洛谷题单python解【算法1-1】模拟与高精度 Keyk__ 算法 python 开发语言
P1009[NOIP1998普及组]阶乘之和deffac(n):ifn==0orn==1:return1else:returnn*fac(n-1)s=int(input())fac_sum=0forjinrange(1,s+1):fac_sum+=fac(j)print(str(fac_sum))
基于Python第三方模块Pandas以指定数量分割数据写入同一个Excel的不同Sheet表中袁袁袁袁满 Python实用技巧大全 python pandas excel 不同Sheet表
记录一下工作中的小技巧：在Python中，使用pandas库来从SQLServer或者Mysql读取数据（或其他数据来源），然后根据需要将数据分割并写入不同的Excelsheet。下面是一个详细的步骤说明，包括如何连接SQLServer或者Mysql数据库、读取数据、分割数据以及将分割后的数据写入不同的Excelsheet。文章目录步骤1:安装必要的库步骤2:连接数据库并读取数据步骤3:分割数据步
python --filelock文件锁(防多开) 像风一样的男人@ 开发语言 python
filelock==3.16.1fromfilelockimportFileLock,Timeoutlock=FileLock(FILE_LOCK)#文件路径try:#设置超时时间，如果超过这个时间还不能获得锁，则抛出异常lock.acquire(timeout=0.01)print("正常运行")exceptTimeout:print("程序已经在运行中，无法启动多个实例。")
python异常处理游客520 python从入门到出家 python全栈学习 python 开发语言
在编写Python程序时，难免会遇到各种错误和异常。无论是文件不存在、网络连接失败，还是简单的除以零操作，这些异常情况都可能导致程序崩溃。为了让程序更加健壮，Python提供了强大的异常处理机制。本文将详细介绍Python中的异常处理，帮助你编写更加可靠的代码。1.什么是异常？异常是程序在执行过程中发生的错误或意外情况。当Python解释器遇到无法处理的错误时，它会抛出一个异常。如果不进行处理，程
python办公自动化-业务实操：xlwings解决excel批量插产品图的问题斑点鱼 SpotFish python xlwings python excel 前端
近期，业务同事有个巨大的烦恼一直困扰着她，因使用频繁一直麻烦其他同事帮忙插图实在很不方便，她找到了斑点鱼帮她解决这个问题。业务同事A:斑点鱼，可以帮我修复excel宏插图错位的问题么？Spotfish:宏斑点鱼不会，斑点鱼可以用python对excel插图，但要按照规定格式来，你还需要吗？业务同事A:可以，只要不错位就行，不用再麻烦其他同事帮我跑图~Spotfish:好的，那斑点鱼就用Python
【Python】list（列表）：有序、可变的集合彬彬侠 Python基础 list 列表集合 python
在Python中，list（列表）是一种非常常见的数据结构，它是一个有序、可变的集合，可以包含多个元素（包括不同类型的元素）。Python提供了丰富的操作来处理列表，下面我将详细介绍常见的列表操作。1.创建列表你可以通过方括号[]来创建一个列表。#创建一个空列表empty_list=[]#创建一个包含多个元素的列表fruits=["apple","banana","cherry"]#列表可以包含不
盘点时下最流行的十大编程语言优缺点，附2024年5月最新的编程语言排行榜单嵌入式软件测试开发 IT杂谈 python 开发语言 c语言 c++c#java javascript
文章目录前言一、Python二、C三、C++四、Java五、C#六、JavaScript七、VisualBasic八、Go九、SQL十、Fortran总结前言TIOBE公布了2024年5月最新的编程语言排行榜，本次的亮点是Fortran这个编程界的元老级语言，竟然在沉寂20多年后，再次闯入榜单的Top10。前10名分别是Python、C、C++、Java、C#、JavaScript、VisualB
Python爬虫实战：从零到一构建数据采集系统 DevKevin 爬虫 python 爬虫开发语言
文章目录前言一、准备工作1.1环境配置1.2选择目标网站二、爬虫实现步骤2.1获取网页内容2.2解析HTML2.3数据保存三、完整代码示例四、优化与扩展4.1反爬应对策略4.2动态页面处理4.3数据可视化扩展五、注意事项六、总结互动环节前言在大数据时代，数据采集是开发者的必备技能之一，而Python凭借其简洁的语法和丰富的库（如requests、BeautifulSoup）成为爬虫开发的首选语言。
100天精通Python（爬虫篇）——第112天：‌爬虫到底是违法还是合法呢？（附上相关案例和法条）袁袁袁袁满 100天精通Python python 爬虫爬虫到底是违法还是合法呢爬虫的合法性爬虫须知网络爬虫爬虫工程师
文章目录一、爬虫到底是违法还是合法呢？二、爬虫技术可能触犯的法律风险2.1爬虫引发不正当竞争案例1案例2法条说明分析说明2.2爬虫侵犯用户个人信息案例法条说明分析说明2.3爬虫非法入侵计算机系统获取数据案例法条说明分析说明2.4提供非法爬虫工具案例法条说明分析说明2.5爬虫破坏计算机信息系统案例法条说明分析说明三、爬虫如何避免触犯法律红线？四、总结一、爬虫到底是违法还是合法呢？爬虫技术是一种自动化
利用 Django 与 Redis 打造高性能缓存系统 lozhyf 工作学习面试缓存 django redis
引言在当今的Web开发领域，性能优化是至关重要的一环。随着用户数量的增加和数据量的增长，网站的响应速度很容易成为瓶颈。缓存是一种有效的性能优化手段，它可以减少对数据库的频繁访问，从而显著提高系统的响应速度。Django作为一个强大的PythonWeb框架，与Redis这一高性能的内存数据库相结合，能够轻松打造出高效的缓存系统。本文将详细介绍如何在Django项目中集成Redis实现缓存功能。环境准
Python学习心得特殊方法 lifegoesonwjl python 开发语言 pycharm 前端
一、特殊方法：python当中一切皆对象。这也就说我们可以将其看成对象去调用对应类的特殊方法，去编写程序，从而代替某些运算符的使用。1.特殊方法：运算符特殊方法功能描述+__add__()执行加法运算-__sub__()执行减法运算,>=,!=__gt__(),__ge__(),__ne__()执行比较运算*,/__mul__(),__truediv__()执行乘法运算，非整除运算%,//__mo
解析Python网络爬虫：核心技术、Scrapy框架、分布式爬虫（选择题、填空题、判断题）（第1、2、3、4、5、6、7、10、11章）一口酪 python 爬虫 scrapy
第一章【填空题】网络爬虫又称网页蜘蛛或（网络机器人）网络爬虫能够按照一定的（规则），自动请求万维网站并提取网络数据。根据使用场景的不同，网络爬虫可分为（通用爬虫）和（聚焦爬虫）两种。爬虫可以爬取互联网上（公开）且可以访问到的网页信息。【判断题】爬虫是手动请求万维网网站且提取网页数据的程序。×爬虫爬取的是网站后台的数据。×通用爬虫用于将互联网上的网页下载到本地，形成一个互联网内容的镜像备份。√聚焦爬
adeepSeek 使用指南与资源分享后端
a#deepSeek使用指南与资源分享一、DeepSeek简介deepSeek是一款具有强大推理能力的人工智能模型，其在自然语言处理、逻辑推理和多模态交互等领域表现出色。随着技术的不断发展，DeepSeek已成为Ai领域的热门话题1。二、DeepSeek使用技巧**提示词的使用88提示词是与Deepseek交互的关键。根据卡兹克的分享，DeepSeek的提示词技巧在于简洁明了，避免过度复杂的指令1
python上传文件进度_Django Ajax 文件上传及进度显示天天小宇 python上传文件进度
在Django1.0版本后，文件上传的处理做了很大的改变，其中很重要的一点就是引入了UploadHandlers的概念。UploadHandlers这是个和Django中的Middleware差不多的东西，可以通过在settings.py文件中设置FILE_UPLOAD_HANDLERS定义一系列UploadHandlers，和Middleware相似的地方主要表现为以下两点：1、Django会按
面试常见问题：python中异常处理，try-except-finally的使用老谢不老软件测试-面试常见问题 python 开发语言
在Python中，异常处理机制是通过try-except-finally结构来实现的。它允许程序在运行时捕获和处理错误，从而避免程序崩溃，并提供更友好的错误提示或恢复机制。一、异常处理的基本语法try:#可能引发异常的代码块risky_code()exceptSomeExceptionase:#捕获特定异常并处理handle_exception(e)exceptAnotherExceptionas
Python中的for循环详解 pytorchCode python 开发语言 Python
for循环是Python中最常用的循环结构之一，它允许我们迭代遍历一个可迭代对象（例如列表、元组、字符串等）中的每个元素，并执行相应的操作。在本文中，我们将详细介绍for循环的语法、工作原理以及如何使用它来处理数据。首先，让我们看一下for循环的基本语法：for变量in可迭代对象:#执行语句块在这个语法中，关键字for引导循环的开始，后面的变量是用来存储每次迭代中的当前元素的。in关键字之后是一个
python 3.6.8支持的Django版本是多少？信阳农夫 Django学习笔记 python django sqlite
Python3.6.8支持的Django版本取决于Django的官方支持策略。以下是Django对Python3.6的支持情况：Django对Python3.6的支持Django3.2.x：Django3.2是长期支持（LTS）版本，支持Python3.6、3.7、3.8、3.9和3.10。官方支持截止到2024年4月。Django4.0.x及以上：Django4.0及以上版本不再支持Python
Python类与对象简介红虾程序员 Python python 开发语言 pycharm ide
目录一、类和对象基本概念二、类和对象的使用使用class关键字定义类：通过调用类名来创建对象：访问对象的属性调用对象的方法三、封装（Encapsulation）四、继承（Inheritance）1、单继承2、多继承五、多态（Polymorphism）六、魔法方法、类方法和静态方法1、魔法方法（MagicMethods）2、类方法（ClassMethods）3、静态方法（StaticMethods）
PyCharm 入门使用指南：从安装到第一个Python项目 Py-wang pycharm python 开发语言
引言PyCharm是由JetBrains开发的一款功能强大的Python集成开发环境（IDE），广泛应用于Python开发中。无论你是初学者还是经验丰富的开发者，PyCharm都能为你提供高效的开发体验。本文将带你从安装PyCharm开始，逐步了解如何使用它来创建和运行你的第一个Python项目。目录PyCharm的安装创建第一个Python项目PyCharm的基本界面介绍编写和运行Python代
python for 循环使用方法曹大卫779 python 开发语言后端
Python的for循环for语句是Python中执行迭代的两个语句之一，另一个语句是while。如果你对Python的迭代并不是很熟悉的话，Python中的迭代：for、while、break、以及continue语句是一个不错的切入点。Python中，for循环用于遍历一个迭代对象的所有元素。循环内的语句段会针对迭代对象的每一个元素项目都执行一次。暂且可以将迭代对象想象成一个对象集合，我们可以
2024年国内人工智能大模型汇总 kiiy2 人工智能 ai 学习
文心一言文心一言（ERNIEBot）是百度基于文心大模型技术推出的生成式对话产品，将于2023年3月完成内测并面向公众开放。该产品是百度在人工智能领域深耕十余年后，拥有产业级知识增强文心大模型ERNIE的基础上，利用跨模态、跨语言的深度语义理解与生成能力而开发的一款AI聊天机器人。它被设计用于回答用户的问题和提供信息，以帮助人们解决问题和获取知识。此外，文心一言还可以通过学习和训练，不断提高自己的
大一的你如何入门TensorFlow eso1983 tensorflow 人工智能 python
刚刚迈入大学的你，对计算机编程还比较陌生。对于现在主流人工智能技术架构TensorFlow的学习，需要循序渐进。入门TensorFlow编程需要结合基础知识学习和实践操作。首先可能需要巩固Python基础，特别是NumPy和数据处理相关的库，因为TensorFlow很多操作和这些库有关联。接下来，可能需要了解机器学习的基本概念。TensorFlow毕竟是一个机器学习框架，如果没有基本的理解，直接上
Python项目依赖导出并实现离线安装方法 der_Papagei python
目录1.依赖导出1.1配置文件生成1.2依赖包导出2.依赖包离线安装1.依赖导出1.1配置文件生成项目依赖配置文件的可通过命令pipfreeze完成。具体格式为：pipfreeze>requirements.txt其中，requirements.txt为导出的文件地址。pipfreeze常用参数令有：含义-l或--local如果使用了全局Python环境和虚拟环境，默认情况下
Python中的for循环语句详解追逐程序梦想者 python 算法前端 Python
在Python编程语言中，for循环语句是一种常用的控制结构，用于迭代遍历可迭代对象（如列表、元组、字符串等）中的元素。通过for循环，我们可以方便地对序列中的每个元素执行相同的操作，从而简化代码的编写和维护。本文将详细介绍Python中的for循环语句，并提供一些示例代码来帮助理解。for循环的语法结构如下所示：for变量in可迭代对象:#执行的代码块其中，关键字for标识了一个循环的开始，后面
【蓝桥杯集训·每日一题2025】 AcWing 6134. 哞叫时间II python 查理零世蓝桥杯2025每日一题蓝桥杯 python 算法
6134.哞叫时间IIWeek12月20日农夫约翰正在试图向埃尔茜描述他最喜欢的USACO竞赛，但她很难理解为什么他这么喜欢它。他说「竞赛中我最喜欢的部分是贝茜说『现在是哞哞时间』并在整个竞赛中一直哞哞叫」。埃尔茜仍然不理解，所以农夫约翰将竞赛以文本文件形式下载，并试图解释他的意思。竞赛被定义为一个包含NNN个整数的数组a1,a2,…,aNa_1,a_2,…,a_Na1,a2,…,aN。农夫约翰定
Python爬虫：分布式爬虫架构与Scrapy-Redis实现挖掘机技术我最强爬虫专栏 python 爬虫分布式
摘要在面对大规模的数据爬取任务时，单台机器的爬虫往往效率低下且容易受到性能瓶颈的限制。分布式爬虫通过利用多台机器同时进行数据爬取，可以显著提高爬取效率和处理能力。本文将介绍分布式爬虫的架构原理，并详细讲解如何使用Scrapy-Redis实现分布式爬虫。一、引言随着互联网数据量的持续增长，许多爬虫任务需要处理海量的网页数据。单台机器的资源有限，在面对大规模爬取任务时，可能会出现爬取速度慢、内存不足等
Python发展史 zougangx Python python 语言 java .net byte unix
Python的创始人为GuidovanRossum。1989年圣诞节期间，在阿姆斯特丹，Guido为了打发圣诞节的无趣，决心开发一个新的脚本解释程序，做为ABC语言的一种继承。之所以选中Python（大蟒蛇的意思）作为程序的名字，是因为他是一个MontyPython的飞行马戏团的爱好者。ABC是由Guido参加设计的一种教学语言。就Guido本人看来，ABC这种语言非常优美和强大，是专门为非专业程
python在运行RabbitMQ运行时遇到的坑之一：Stream connection lost: IndexError(‘pop from an empty deque‘) weixin_45729710 python rabbitmq 开发语言
在运行这段代码时出现了这样的报错：Streamconnectionlost:IndexError('popfromanemptydeque')，但是调试这段代码的时候又没有问题importjsonimportthreadingimporttimefromcollectionsimportdefaultdictimportpikafromloguruimportloggerfromconfigimp
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他