qq924178473

TensorFlow系列——本地运行使用feature_column做特征工程

关键词：

tf.contrib.data.parallel_interleave
tf.data.TFRecordDataset
input_layer
make_initializable_iterator()
train.MonitoredTrainingSession
test_op.initializer
parse_example
data.Dataset.list_files
data.experimental.make_batched_features_dataset
data.Dataset.from_tensor_slices
compat.v1.data.make_one_shot_iterator
feature_column.shared_embeddings
shared_embedding_columns_v2

一、使用feature_column.inpout_layer做特征工程

---------TensorFlow1.x---------

1、使用parse_example方式

1.1、在自定义tfrecord数据解析函数中使用

# 注意：使用的是批处理tf.parse_example而不是tf.parse_single_example
def parse_exmp(serial_exmp):
        oriExample = tf.parse_example(serial_exmp,features={'user_data':tf.FixedLenFeature([43], tf.float32)})
        oriAllData = oriExample.get("user_data")
        feaDics=dict()
        retainLabel = oriAllData[:,0:1]
        feaDics["sta_fea1"]=oriAllData[:,1:18]
        feaDics["click_level"]=tf.cast(oriAllData[:,18:19],dtype=tf.int64)
        rs = tf.feature_column.input_layer(features=feaDics,feature_columns=get_feature_columns_new())
        return rs

1.2、读取tfrecord数据集并做特征处理

# train_files是tfrecord文件列表
# 注意：batch()和prefetch()是必须的
input_files = tf.data.Dataset.list_files(train_files)
dataset = input_files.apply(tf.contrib.data.parallel_interleave(tf.data.TFRecordDataset,cycle_length=reader_num_threads)).batch(10).prefetch(5)
dataset = dataset.map(parse_exmp,num_parallel_calls=8)

1.3、输出处理结果

test_op = dataset.make_initializable_iterator()
one_element = test_op.get_next()
with tf.train.MonitoredTrainingSession() as sess:
    sess.run(test_op.initializer)
    print(sess.run(one_element))

2、使用make_batched_features_dataset自动解析tfrecord数据方式

2.1、在自定义tfrecord数据解析函数中使用

def parse_exmp_batched(serial_exmp):
        oriAllData = serial_exmp.get("user_data")
        feaDics=dict()
        retainLabel = oriAllData[:,0:1]
        feaDics["click_level"]=tf.cast(oriAllData[:,18:19],dtype=tf.int64)
        feaDics["valid_flg"]=tf.cast(oriAllData[:,19:20],dtype=tf.int64)
        feaDics["actDay_fea1"]=oriAllData[:,20:33]
        rs1 = tf.feature_column.input_layer(features=feaDics,feature_columns=get_feature_columns_new()[0])
        rs2 = tf.feature_column.input_layer(features=feaDics,feature_columns=get_feature_columns_new()[1])
        rs3 = tf.concat([rs1,rs2],-1)
        print(rs1)
        print(rs2)
        #return feaDics,{"label":tf.to_float(retainLabel)}
        return rs1,rs2,rs3

2.2、从文件中读取tfrecord数据

def train_input_fn():
        return tf.data.experimental.make_batched_features_dataset(
            file_pattern=train_files,
            batch_size=10,
            features=feature_schema,
            label_key=None
            ...
dataTest = train_input_fn()
dataset = dataTest.map(parse_exmp_batched,num_parallel_calls=8)

2.3、输出处理结果

同上

---------TensorFlow2.x---------

3、使用parse_example方式

3.1、在自定义tfrecord数据解析函数中使用

def parse_exmp(serial_exmp):        
        oriExample = tf.io.parse_example(serial_exmp,features=feature_spec)
        oriAllData = oriExample.get("user_data")
        feaDics=dict()
        retainLabel = oriAllData[:,0:1]
        feaDics["sta_fea1"]=oriAllData[:,1:18]
        feaDics["click_level"]=tf.cast(oriAllData[:,18:19],dtype=tf.int64)
        rs = tf.compat.v1.feature_column.input_layer(features=feaDics,feature_columns=get_feature_columns_new())
        print(rs)
        return rs

3.2、读取tfrecord数据集并做特征处理

dataset = tf.data.Dataset.from_tensor_slices(train_files).interleave(map_func=lambda x:tf.data.TFRecordDataset(x),cycle_length=batch_size,block_length=1,num_parallel_calls=8).batch(10).prefetch(5)
dataset =dataset.map(parse_exmp,num_parallel_calls=8)

3.3、输出处理结果

test_op = tf.compat.v1.data.make_one_shot_iterator(dataset)
one_element = test_op.get_next()
print(one_element)

4、使用make_batched_features_dataset自动解析tfrecord数据方式

4.1、在自定义tfrecord数据解析函数中使用

同TensorFlow1.x

4.2、从文件中读取tfrecord数据

同TensorFlow1.x

4.3、输出处理结果

同1.3

二、使用自定义输入层方式做特征工程

---------TensorFlow1.x---------

1、使用make_batched_features_dataset自动解析tfrecord数据方式

1.1、创建自定义输入层

重写自定义的inputlayer输入层

1.2、使用自定义输入层

def parse_exmp_batched(serial_exmp):
        oriAllData = serial_exmp.get("user_data")
        feaDics=dict()
        retainLabel = oriAllData[:,0:1]
        feaDics["sta_fea1"]=oriAllData[:,1:18]       
        input_layers = myInputLayer(feature_columns_1=get_feature_columns_new()[0],feature_columns_2=get_feature_columns_new()[1],name="inputlayer")
        outputRs = input_layers(feaDics)    
        print(outputRs)
        return outputRs

1.3从文件中读取tfrecord数据

def train_input_fn():
        return tf.data.experimental.make_batched_features_dataset(
            file_pattern=train_files,
            batch_size=10,
            features=feature_schema,
            label_key=None
            ...
dataTest = train_input_fn()
dataset = dataTest.map(parse_exmp_batched,num_parallel_calls=8)

1.3、输出处理结果

test_op = dataset.make_initializable_iterator()
one_element = test_op.get_next()
with tf.train.MonitoredTrainingSession() as sess:
    sess.run(test_op.initializer)
    print(sess.run(one_element))

2、使用parse_example——不啰嗦了

---------TensorFlow2.x---------

3、使用make_batched_features_dataset自动解析tfrecord数据方式

from datetime import datetime,timedelta
import random
import tensorflow as tf
from tensorflow.python.feature_column import feature_column_v2 as fc_v2

class myInputLayer(tf.keras.layers.Layer):
    def __init__(self,feature_columns_1,
                 feature_columns_2,
                 trainable=True,
                 name=None,
                 **kwargs):
        ...

    def build(self, input_shape):
        ...
    def call(self, inputs, **kwargs):
        ...
        return ...

feature_schema = {
    "user_data": tf.io.FixedLenFeature(shape=(43,),dtype=tf.float32),
    # "label": tf.io.FixedLenFeature(shape=(1,),dtype=tf.float32)
}

def parse_exmp_batched(serial_exmp):
        oriAllData = serial_exmp.get("user_data")
        feaDics=dict()
        retainLabel = oriAllData[:,0:1]
        feaDics["sta_fea1"]=oriAllData[:,1:18]
        feaDics["click_level"]=tf.cast(oriAllData[:,18:19],dtype=tf.int64)
        input_layers = myInputLayer(feature_columns_1=get_feature_columns_new()[0],feature_columns_2=get_feature_columns_new()[1],name="inputlayer")
        outputRs = input_layers(feaDics)
        return outputRs

train_files = [...]

def train_input_fn():
        return tf.data.experimental.make_batched_features_dataset(
            file_pattern=train_files,
            batch_size=10,
            features=feature_schema,
            label_key=None,
            ...)
dataTest = train_input_fn()
dataset = dataTest.map(parse_exmp_batched,num_parallel_calls=8)
test_op = tf.compat.v1.data.make_one_shot_iterator(dataset)
one_element = test_op.get_next()
print(one_element)

4、使用parse_example方式

from datetime import datetime,timedelta
import random
from tensorflow.python.feature_column import feature_column_v2 as fc_v2
import tensorflow as tf
print(tf.executing_eagerly())

class myInputLayer(tf.keras.layers.Layer):
    def __init__(self,feature_columns_1,
                 feature_columns_2,
                 trainable=True,
                 name=None,
                 **kwargs):
        ...

    def build(self, input_shape):
        ...
        super(myInputLayer,self).build(None)
    def call(self, inputs, **kwargs):
        ...
        return ...

feature_schema = {
    "user_data": tf.io.FixedLenFeature(shape=(43,),dtype=tf.float32),
}

def get_feature_schema(exludeFea: List[str]) -> Dict:
    valid_fea_schema = dict()
    valid_fea_schema = {key: value for key, value in feature_schema.items() if key not in exludeFea}
    return valid_fea_schema

feature_schemas = get_feature_schema([])

def get_feature_columns(args):
    fea_1 = tf.feature_column.numeric_column(key="user_data",shape=(43),dtype=tf.float32)
    return [fea_1]

def get_feature_columns_new():
    ...
    act_first_fea1 = tf.feature_column.categorical_column_with_identity(key="act_first_fea1",num_buckets=2)
    act_last_fea1 = tf.feature_column.categorical_column_with_identity(key="act_last_fea1",num_buckets=2)
    click_level_emb = tf.feature_column.embedding_column(click_level,5)
    valid_flg_emb = tf.feature_column.embedding_column(valid_flg,3)
    act_first_fea1_emb,act_last_fea1_emb = tf.feature_column.shared_embeddings([act_first_fea1,act_last_fea1],2,'mean',initializer=None,trainable=True)
    
    return [sta_fea1,actDay_fea1,click_level_emb,valid_flg_emb],[
            act_first_fea1_emb,act_first_fea2_emb,act_first_fea3_emb,act_first_fea4_emb,act_first_fea5_emb,
            act_last_fea1_emb,act_last_fea2_emb,act_last_fea3_emb,act_last_fea4_emb,act_last_fea5_emb]

feature_column = get_feature_columns("")

def parse_exmp(serial_exmp):
        feature_spec = tf.feature_column.make_parse_example_spec(feature_column)
        oriExample = tf.io.parse_example(serial_exmp,features=feature_spec)
        print(oriExample)
        oriAllData = oriExample.get("user_data")
        feaDics=dict()
        retainLabel = oriAllData[:,0:1]
        feaDics["sta_fea1"]=oriAllData[:,1:18]
        feaDics["click_level"]=tf.cast(oriAllData[:,18:19],dtype=tf.int64)  
        inputnet = myInputLayer(get_feature_columns_new()[0],get_feature_columns_new()[1],name="inputlayer")
        rs = inputnet(feaDics)
        return rs

train_files = [...]
batch_size = 10
dataset = tf.data.Dataset.from_tensor_slices(train_files).interleave(map_func=lambda x:tf.data.TFRecordDataset(x),cycle_length=batch_size,block_length=1,num_parallel_calls=8).batch(10).prefetch(5)

dataset =dataset.map(parse_exmp,num_parallel_calls=8)
test_op = tf.compat.v1.data.make_one_shot_iterator(dataset)
one_element = test_op.get_next()
print(one_element)

你可能感兴趣的:(深度学习-实践,tensorflow,feature_column,自定义输入层)

vpc网络的原理会探索的小学生网络
一、VPC的基本概念和功能VPC是一个专有的云上私有网络，允许用户在公共云上配置和管理一个逻辑隔离的网络区域。用户可以自定义IP地址范围、创建子网、配置路由表和网络网关。VPC提供了类似于传统数据中心的安全和可配置的私有网络空间，同时又具备云计算的弹性和可扩展性‌二、VPC的关键组件和技术细节vSwitch‌：交换机，组成专有网络的基础网络设备，用于连接不同的云资源。‌vRouter‌：路由器，作
python绘制等边三角形的代码_Python打印等边三角形 weixin_39621178
示例1:#!/usr/bin/python#-*-coding:UTF-8-*-#根据输入打印rows=int(raw_input('pleaseinputnumber:'))#等边三角形foriinrange(0,rows+1):forjinrange(0,rows-i):print"",j+=1forkinrange(0,2*i-1):ifk==0ork==2*i-2ori==rows:ifi
Python写倒三角森之林 python
4.(程序题)编程显示如下所示的三角形图案。要求程序运行时，输入一个正整数，显示该整数行高度的三角形图案。#############h=int(input("请输入高度："))foriinrange(h):forjinrange(i,h):print("#",end="")forrinrange(0,i):print("",end="")print("")
【布鲁姆6大认知层级】搞技术的季经验分享
认知思维目标层次由低到高、由简到繁分为六个层次，层层递进，这6个层级分别是：记忆——理解——应用——分析——评价——创新。第一层：记忆是指认识并记忆概念、知识，将其储存在大脑并及时提取，例如背单词、古诗、名词概念等。这一层次所涉及的是具体知识或抽象知识的辨认，虽然机械，但对学习和解决更复杂的问题来说是必不可少的基础环节。第二层：理解是指对事物或知识的领会，当学习者对"新"知识与原有知识产生联系时，
Java Web开发技术解析：从基础到实践的全栈指南以恒1 java 前端开发语言
JavaWeb开发技术解析：从基础到实践的全栈指南在互联网技术演进中，JavaWeb凭借其跨平台特性、成熟的生态系统和强大的企业级服务能力，成为构建动态Web应用的核心技术栈。本文从技术组成、开发工具、实战应用三个维度，全面解析JavaWeb的完整技术体系，并结合最新行业实践探讨其演进方向。一、JavaWeb的核心技术组成JavaWeb开发以Servlet和JSP为基石，通过分层架构实现动态网页生
Qt 自定义标题栏——QtWidgets 十年之少 Qt Widgets Qt 自定义标题栏
1.去掉标题栏，实现窗体拖动（常用）以上转载方法实现窗体拖动是通过Windows事件的；但是有时候为了跨平台这种的话就得重写，比较麻烦，所以还是采用最原始的方法：通过QWidgets的鼠标事件来实现。.h文件classQRCodeDialog:publicQDialog{Q_OBJECT...protected:voidmouseMoveEvent(QMouseEvent*event)overri
双指针之滑动窗口旧念25 算法数据结构
滑动窗口是双指针的一种所谓滑动窗口，就是不断的调节子序列的起始位置和终止位置，从而得出我们要想的结果。给定一个含有n个正整数的数组和一个正整数s，找出该数组中满足其和≥s的长度最小的连续子数组，并返回其长度。如果不存在符合条件的子数组，返回0。示例：输入：s=7,nums=[2,3,1,2,4,3]输出：2解释：子数组[4,3]是该条件下的长度最小的子数组暴力解法两层for循环嵌套，第一层for循
GraphCube、Spark和深度学习技术赋能快消行业关键运营环节 weixin_30777913 开发语言大数据深度学习人工智能 spark
在快消品（FMCG）行业，需求计划（DemandPlanning）、库存管理（InventoryManagement）和需求供应管理（DemandSupplyManagement）是影响企业整体效率和利润水平的关键运营环节。GraphCube图多维数据集技术、Spark大数据分析处理技术和深度学习技术的结合，为这些环节提供了智能化、动态化和实时化的解决方案，显著提升业务运营效率和企业利润。一、技术
从 0 到 1 构建 Python 分布式爬虫，实现搜索引擎全攻略七七知享 Python python 分布式爬虫搜索引擎算法程序人生网络爬虫
从0到1构建Python分布式爬虫，实现搜索引擎全攻略在大数据与信息爆炸的时代，搜索引擎已然成为人们获取信息的关键入口。你是否好奇，像百度、谷歌这般强大的搜索引擎，背后是如何精准且高效地抓取海量网页数据的？本文将带你一探究竟，以Python为工具，打造属于自己的分布式爬虫，进而搭建一个简易搜索引擎，完整呈现从底层代码编写到系统搭建的全过程。通过本文的实践，我们成功打造了Python分布式爬虫，并以
STM32寄存器编码流程总结（上部）物联网菜鸟基础知识学习 stm32 单片机嵌入式硬件
目录一、GPIO二、中断系统三、USART串口通信四、I2C通讯五、高级定时器六、DMA存储访问七、ADC数模转换八、API通信九、FSMC控制器十、LCD显示一、GPIO1.时钟的配置//开启引脚的时钟RCC->APB2ENR|=RCC_APB2ENR_IOPAEN;2.设置GPIO的工作模式//PA0的工作模式为通用推挽输出模式//CNF选择输入或输出的不同模式GPIOA->CRL&=~GPI
第三十篇维度建模：从理论到落地的企业级实践随缘而动，随遇而安数据库 sql 数据仓库大数据数据库架构
目录一、维度建模核心理论体系1.1Kimball方法论四大支柱1.2关键概念对比矩阵二、四步建模法全流程解析2.1选择业务过程（以电商为例）2.2声明原子粒度（订单案例）2.3维度设计规范时间维度（含财年逻辑）SCDType2完整实现（Hudi）2.4事实表类型与设计三、企业级建模实战：电商用户分析3.1业务矩阵分析3.2模型实现代码四、高级建模技巧4.1多星型模式关联4.2大数据场景优化五、性能
AI界劳斯莱斯o1 -Pro来了！百万token收费600刀，OpenAI在AI普惠反方向狂奔？算家计算话题文章人工智能算家云 OpenAI o1-pro API OpenAI发布最贵模型 DeepSeek
刚刚，OpenAI宣布推出其最新的高性能推理模型o1-pro。当大家还在为GPT-4.5的订阅费感到肉痛时，OpenAI用一记价格暴击刷新了认知——全新推理模型o1-pro的API定价，输入每百万token收费150美元，输出每百万token收费600美元，比前代模型贵了10倍，更是将DeepSeek-R1甩出270倍价差。与OpenAI其他模型相比，o1-pro的价格高出了不止一点：目前o1-p
LeetCode热题100JS（59/100）第十一天|46|78|17|39|22 Alicesflower LeetCode热题100JS leetcode javascript 算法
46.全排列题目链接：46.全排列难度：中等刷题状态：2刷新知识：解题过程思考示例1：输入：nums=[1,2,3]输出：[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]题解分析参考题解链接：全排列放下1刷过程/***@param{number[]}nums*@return{number[][]}*///varpermute=function(num
生成式对抗网络在人工智能艺术创作中的应用与创新研究辛迎蕌人工智能
摘要本文深入探究生成式对抗网络（GAN）在人工智能艺术创作领域的应用与创新。通过剖析GAN核心原理，阐述其在图像、音乐、文学等艺术创作中的实践，分析面临的挑战与创新方向，呈现GAN对艺术创作模式的变革，为理解人工智能与艺术融合发展提供全面视角。一、引言在人工智能与艺术深度融合的时代浪潮中，生成式对抗网络（GAN）作为一项突破性技术，为艺术创作带来了全新的可能性。它打破传统创作边界，以独特的对抗学习
【Kafka高级】Kafka性能优化与调优实践全栈追梦人 kafka 性能优化 linq
在大规模数据处理和实时消息传递场景中，Kafka的性能优化至关重要。本文将从生产者性能优化、消费者性能优化以及集群性能调优三个方面展开，结合实际代码示例和配置参数，帮助读者更好地理解和应用Kafka性能优化策略。一、生产者性能优化Kafka生产者的性能直接影响消息发送的效率和系统的吞吐量。以下是一些关键优化策略：1.1批量发送生产者会将消息批量发送到Kafka，减少网络请求次数。以下参数对批量发送
使用Nginx实现后端负载均衡海上彼尚 node.js nginx 负载均衡运维 node.js
目录引言一、负载均衡的核心作用二、基础配置三步曲1.定义后端服务器组（upstream）2.配置代理转发规则3.重载配置生效三、六大负载均衡算法详解四、高级配置技巧1.健康检查机制2.会话保持方案3.SSL终止优化五、实战场景配置案例案例1：WebSocket负载均衡案例2：多级地域分发案例3：连接池优化六、最佳实践与陷阱规避结语引言在现代高并发场景下，单一服务器难以支撑海量请求的处理。Nginx
ollama 基本使用教程海上彼尚 AI ai 前端
目录1.安装OllamamacOS或LinuxWindows(WSL2)2.基础命令启动与停止更新Ollama3.模型管理下载预训练模型运行模型查看已安装模型删除模型从Modelfile创建自定义模型4.高级功能服务器模式与API多会话管理环境变量配置5.常见问题与技巧加速模型下载查看日志模型参数调整模型导出与分享Ollama是一个开源的大型语言模型服务工具，能够帮助用户在本地运行大模型。通过简单
深陷“大数据杀熟”漩涡的飞猪，庄卓然如何力挽狂澜？财经三剑客大数据
在线旅游市场（OTA）的蓬勃发展为消费者带来了诸多便利，然而，在这股数字化浪潮中，飞猪旅行却因其频繁陷入“大数据杀熟”的争议而备受瞩目。这一行为不仅损害了消费者的合法权益，更让飞猪的品牌形象蒙上了一层阴影。近年来，飞猪平台上关于价格乱象的投诉屡禁不止。在黑猫投诉平台上，与“飞猪”相关的投诉累计已超9万条，其中直接以“飞猪杀熟”为关键词的投诉便达数百条。消费者们纷纷反映，在飞猪平台上预订机票、酒店等
如何将丝杆升降机与PLC控制系统集成 demaichuandong 制造人工智能自动化
将丝杆升降机与PLC（可编程逻辑控制器）控制系统集成，通常涉及以下几个关键步骤：一、明确需求与设计确定控制要求：根据丝杆升降机的功能需求，明确PLC需要控制的动作、状态监测以及故障报警等功能。选择合适的PLC型号：根据控制要求的复杂性和输入输出点的数量，选择合适的PLC型号。设计控制系统架构：绘制控制系统方框图，明确PLC、传感器、执行器等组件之间的连接关系。二、硬件连接与配置连接传感器与执行器：
java NIO中的FileSystems工具类可以读取本地文件系统，ZIP/JAR等，无需解压处理，还可以复制文件爱的叹息 Java 基础整理 java nio jar
在JavaNIO（java.nio.file包）中，FileSystems是一个工具类，用于操作和管理文件系统。它提供了静态方法来获取或创建文件系统实例，并支持自定义文件系统实现。以下是其核心功能和用法：1.核心功能(1)获取默认文件系统获取当前运行环境的默认文件系统（如本地文件系统）：FileSystemfileSystem=FileSystems.getDefault();(2)创建新的文件系
这些搜索技巧你不会？前端后端
Hey,我是沉浸式趣谈本文首发于【沉浸式趣谈】，我的个人博客https://yaolifeng.com也同步更新。转载请在文章开头注明出处和版权信息。如果本文对您有所帮助，请点赞、评论、转发，支持一下，谢谢！每天搜索，你却只会简单输入几个词？搜索结果总被广告和无关内容淹没？掌握这些搜索技巧，让你不再在信息海洋中迷失，直达目标信息！基础搜索技巧1.多关键词搜索方式：关键词1关键词2关键词3例如：Py
嵌入式硬件篇---WIFI模块 Ronin-Lotus 程序代码篇嵌入式硬件篇嵌入式硬件 c WIFI
文章目录前言一、核心工作原理1.物理层（PHY）工作频段2.4GHz5GHz调制技术直接序列扩频正交频分复用高效数据编码2.协议栈架构MAC层Beacon帧4次握手3.核心工作模式二、典型应用场景1.智能家居系统远程控制环境监测视频监测2.工业物联网设备远程运维生产线监控仓储管理3.医疗设备远程诊疗医疗影像药品管理4.消费电子智能音箱游戏设备打印设备三、ESP32开发示例1.环境配置（Platfo
【C++】C++从入门到精通教程（持续更新...）废人一枚 C++c++开发语言
前言最近在整理之前一些C++资料，重新整理出了一套C++从基础到实践的教程，包含概念、代码、运行结果以及知识点的扩展，感兴趣的后续大家持续关注。以下是更新的文章目录，文章之后整理了一个知识思维导图，看起来比较清楚点。目录1、C++基础知识C++基础知识一个简单的C++程序函数重载引用的概念引用与指针的区别引用作为函数参数引用作为返回值面向对象类的定义类的声明结构体与类的区别inline函数this
Marker可以快速且准确地将PDF转换为markdown格式。星霜笔记开源关注简介免费源码 pdf
MarkerMarker可以快速且准确地将PDF转换为markdown格式。支持多种文档类型（针对书籍和科学论文进行了优化）支持所有语言移除页眉/页脚/其他杂质格式化表格和代码块提取并保存图像以及markdown将大多数方程转换为latex支持在GPU、CPU或MPS上运行工作原理Marker是一个由深度学习模型组成的管道：提取文本，必要时进行OCR处理（启发式算法，surya，tesseract
TCP/IP协议——ARP 胡小冰 TCP／IP 网络
ARP只要确定了IP地址，就可以向这个目标地址发送IP数据报。然而，在底层数据链路层，进行实际通信时确有必要了解每个IP地址所对应的MAC地址。一、ARP概要ARP是一种解决地址问题的协议。以目标IP地址为线索，用来定位下一个应该接受数据分包设备对应的MAC地址。如果目标主机不在同一个链路上时，可以通过ARP查找下一跳路由器的MAC地址。不过ARP只适用于IPv4，不能用于IPv6。IPv6中可以
Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
react 技术栈请问该如何优化 DOM 大小混血哲谈 react.js 前端前端框架
针对React应用中DOM大小过大的问题，以下是详细的优化方案和具体操作步骤，帮助你提升Lighthouse性能评分和用户体验：一、问题根源分析DOM大小过大（如超过1500个节点或深度超过32层）会导致：渲染性能下降：浏览器解析和渲染DOM的时间增加。内存占用过高：大量DOM节点占用更多内存，影响低端设备表现。交互延迟：事件监听器绑定过多节点时，响应变慢。常见原因：未优化的列表渲染（如长列表一次
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
YOLOv12优化：图像去噪 | AAAI2025 Transformer |一种基于Transformer的盲点网络（TBSN）架构，结合空间和通道自注意力层来增强网络能力 AI小怪兽 YOLOv12魔术师 YOLO transformer 深度学习人工智能 python
提出了一种基于Transformer的盲点网络（TBSN）架构，通过分析和重新设计Transformer运算符以满足盲点要求。TBSN遵循扩张BSN的架构原则，并结合空间和通道自注意力层来增强网络能力。如何使用：1）结合C3k2二次创新使用；2）结合A2C2f二次创新使用；亮点包括：1.提出了一种新的基于Transformer的盲点网络（TBSN）架构；2.引入了知识蒸馏策略来提高计算效率；3.在
ACI EP Learning Whitepaper 1. ACI EP组件 m0_54931486 思科 ACI 网络思科 ACI Endpoint ACI fabric Nexus EP 学习
1.ACIEndpointACI网络架构的Endpoint表整合了传统MAC地址表和ARP表的功能。其核心机制是通过硬件层直接学习数据包的源MAC地址与IP地址映射关系，摒弃了传统ARP协议依赖广播请求获取下一跳MAC地址的模式。这种设计优化体现在两方面：1）减少控制面ARP流量处理带来的资源消耗；2）基于终端实际流量即可实时感知主机IP/MAC地址的拓扑迁移，无需依赖GARP通告即可实现终端移动
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他