WitsMakeMen

京东到家机器学习平台建设

1. 前言

京东到家作为行业领先的即时零售平台，一直把为消费者提供快捷便利高效高质量的即时零售服务作为自己的责任。到家算法团队作为支持京东到家各个业务场景的算法力量，一直以使用算法能力赋能整个到家业务作为团队目标，不断思考怎样提升算法能力和效率，以便更好的服务于到家业务，更好的助力业务发展。

随着京东到家业务的发展和壮大，原有基于线性模型和树模型的基本算法能力已经逐渐无法满足到家业务发展的需求。更多的搜索、推荐以及用户增长等业务场景的算法需求，需要算法团队提供更强大的算法能力，更好的感知用户瞬息万变的意图需求。当前业界先进的算法应用大多都基于深度学习建设完成，深度学习模型能更好地挖掘文本、图片、声音、序列、图结构中的深层次数据信息。依托深度学习模型丰富的模型结构可以更好地抽象提取数据中的高阶特征信息，并且通过结合专家网络等多目标学习任务的方式增强了对用户长短期多样性意图兴趣感知能力，为用户提供更极致服务体验的同时也更有利于业务发展。

所以我们从当前京东到家的业务特点出发，结合算法团队的真实算法迭代需求，融合了原有的算法迭代工具和脚本，进行系统化地沉淀和升级。同时引入了业界先进的kubernetes分布式资源管理框架，以tensorflow2.0作为深度模型训练预测框架。建设完成了从模型离线训练，模型特征管理到在线预测服务的一整套训练预测流程。整个系统采用开闭模式进行设计，将复杂的分布式训练和模型上线过程进行封装，对用户黑盒处理。将算法核心的模型定义和特征生产过程开放出来，实现了处理过程的自定义。总体来说，我们的最终目标就是让算法开发专注于核心工作：特征工程和算法模型。

到家机器学习平台建设以来，承接了京东到家多个业务场景的深度学习模型算法需求，在到家首页feeds推荐、频道feeds推荐以及全局搜索等业务场景均取得了显著的效果，其中首页feeds推荐场景点击率ctr指标累计提升30+%，为到家业务发展提供了高效的算法能力支持。

本文将对到家机器学习平台实现原理和功能进行全面介绍，并分享系统建设过程中遇到的问题和反思。

2. 机器学习平台总体架构

随着以AlphaGo为代表的深度学习应用的成功，第三次人工智能热潮到来，算法在各大互联网公司业务中都发挥着重要的作用。如何提升算法研发的效率，成为各大互联网公司思考的重要工作。像业界比较知名的京东九数算法平台、阿里PAI机器学习平台、百度PaddlePaddle算法平台以及美团Poker算法平台，都通过友好的可视化交互方式提供了大规模数据的深度模型训练任务支持，为整个公司算法发展提供了基础能力。毫无疑问，算法平台可以帮助算法研发将精力聚焦在核心算法工作中去，大幅提升整体算法迭代效率。

到家机器学习平台，参照业界主流机器学习平台的功能划分，将整个平台分为了三个子系统：模型离线训练系统，模型特征配置系统和在线模型预测服务，三个平台各司其职相辅相成，共同组成到家机器学习平台。

我们将模型训练、管理和上线过程进行抽象解释，并将各个功能部分对应到三个系统平台，指出三个系统平台要解决的核心问题：

除了三个平台要解决技术上的核心痛点外，整个到家机器学习平台参考业界先进机器学习平台的设计方案，将模型定义过程和模型训练、上线和部署过程分离开，为用户提供可视化交互方式，并简化了模型训练整体流程，减少上线部署出错概率，从而提高算法迭代质量。模型训练平台基于tensorflow2.0深度模型训练框架，支持图片、序列文本、声音等多模态模型输入，有效增加了算法可利用的输入资源。同时深度模型可以更好的探索迁移学习、负反馈学习、序列化注意力机制、图学习和强化学习等技术领域，让到家算法进入了加速迭代的阶段。

3. 模型训练平台

本章节主要对平台功能进行一个深度剖析。首先对模型实验功能部分进行了详细介绍。其次对平台训练实现原理进行说明，重点阐述了如何通过分布式资源管理和模型分布式训练，解决大模型大数据量级的模型训练问题。最后对未来平台还可以继续优化和改进的部分进行了总结与思考。

3.1 训练平台功能介绍

离线训练平台涵盖了算法平台通用的功能，其中包括：样本实验、模型实验、资源管理、模型debug工具以及实时ab实验工具。这些功能都是在算法开发调试上线过程中，总结发现对算法效率提升最有效的功能部分。

样本实验：主要功能是将离线准备好的实验样本，进行业务相关的转换处理，临时储存在训练系统中，工后续的模型实验使用。
模型实验：主要是为用户提供一个可视化创建模型训练实验功能入口，将底层创建分布式训练任务的脚本，进行抽象并组件话呈现，简化创建分布式训练实验的成本。
资源管理：对使用者来说，可以通过该功能观察系统训练资源的使用情况，并且实时展示全局消耗资源较大的训练任务。
debug工具：主要是为分析线上模型效果好坏提供系统工具支持，未来会进一步开发并完善。
实时ab实验数据：结合系统后端实时流数据，通过flink处理，将系统的实时曝光，实时用户行为和订单数据，进行归因分析，提供实时级别的实验ab数据，有助于发现线上实验问题。

3.2 模型训练过程

模型训练过程也是整个平台主要的功能部分，其中包括了模型实验创建，实验运行，已有实验的列表，以及训练生成模型的保存管理。

实验创建主要为开发人员提供了七个主要功能组件，其中最主要的有：

样本输入（包括训练样本输入和预测样本输入）：主要功能是将前面生成的实验样本引入到我们实验中，供模型训练和预测使用。
模型训练：将用户定义好的模型文件，通过git方式拉取并引入到模型训练任务中，同时需要配置训练任务中各种类型的训练节点使用资源情况，训练任务生成式基于kubernetes分布式框架。

3.3 实现原理

模型训练平台基于kubernetes作为分布式资源管理框架，使用tensorflow作为机器学习框架。其中kubernetes是Google开源的容器编排引擎，是一个很好的分布式任务生成管理工具，kubernetes支持自动化部署，大规模可伸缩可扩展，应用容器化管理等功能，目前很多云存储云服务都是基于该开源软件设计开发。tensorflow则是目前最受欢迎的机器学习框架之一，他在工业界应用最为广泛，目前各大互联网公司支持最完善机器学习平台都是基于tensorflow提供服务。本节将首先介绍tensorflow分布式训练原理和实现，然后介绍kubernetes如何将分布式训练任务提交并执行。

3.4 tensorflow训练原理

tensorflow作为业界最受欢迎并且应用最为广泛的机器学习框架，具有非常强大的分布式训练和预测支持能力。tensorflow目前主要支持的分布式训练方式有两种Multi-Work训练和Parameter-Server训练。其中Multi-Work分布式训练方式只是将训练数据进行分布式拆分，整个模型结构不会进行分布式拆分，所以Multi-Work主要使用于小模型大数据的训练场景。Parameter-Server分布式训练方式，不仅将模型训练数据进行分布式拆分，同时会将整个模型结构按照模型特点进行分布式拆分，适用于数据量较大同时模型结构也非常大的训练场景。模型训练平台支持两种分布式模型训练方式。

3.4.1 Multi Worker分布式训练原理

对于Multi-Work分布式训练方式来说，所有的节点都是worker节点，没有主从关系，每个worker节点唯一的区别就是输入的训练数据。分布式任务启动之初，就会将整个训练数据按照worker的个数进行拆分，每个worker只会得到其中的一份训练数据，然后并行的执行自己的训练任务，训练任务计算完成各自的梯度后，通过ring-allreduce的方式更新整个集群的参数梯度。训练任务相对比较简单，只需要使用MultiWorkerMirroredStrategy策略，将模型定义和编译定义到strategy策略内部即可，然后将训练任务打包成docker镜像，供后续kubernetes提交训练任务使用。

其中初始化模型阶段，会自动拉取和加载自定义的模型文件，这块代码和整个模型训练过程解耦合，更加方便的为用户提供了可扩展的空间。同时数据加载部分，同样通过接口的方式加载用户自定义的模型数据处理函数，真正模型和数据定义，都是有用户结合平台规范，自定义完成，提供了灵活的模型和数据定义方式。

    # multi-work分布式训练代码
    def train(self):
        strategy = tf.distribute.experimental.MultiWorkerMirroredStrategy()
        with strategy.scope():
            # 初始化模型
            self.model = your_model_here
                       
            # 加载训练数据 
            train = get_csv_dataset(self.train_data_file_list, batch_size=64 * self.num_workers, num_epochs=10)
            eval = get_csv_dataset(self.eval_data_file_list, batch_size=64 * self.num_workers)
            test = get_csv_dataset(self.test_data_file_list, batch_size=64 * self.num_workers, shuffle=False)

            # 模型编译
            self.model.compile(
                optimizer=self.model_optimizer,  # Optimizer
                # Loss function to minimize
                loss=self.train_loss,
                # List of metrics to monitor
                metrics=self.train_metrics,
            )

        callbacks = []
        # tensorboard监控
        if not self.close_tensorboard:
            log_dir= self.model_parent_path + "/logs/%s/%d" % (self.model_name, self.version)
            tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)
            callbacks.append(tensorboard_callback)

        # 分布式训练容错恢复, 挂载到镜像目录
        if self.use_check_point:
            checkPointPath = self.model_parent_path + '/tmp/%s/%d' % (self.model_name, self.version)
            modelCheckpoint = tf.keras.callbacks.ModelCheckpoint(filepath=checkPointPath)
            callbacks.append(modelCheckpoint)

        # 模型训练
        history = self.model.fit(
            train,
            epochs=self.epochs,
            validation_data=eval,
            callbacks=callbacks
        )
        
        # 模型验证
        results = self.model.evaluate(eval)
        # 预测验证集
        predictions = self.model.predict(test)

        # 保存模型
        model_file_dir = self.model_parent_path +  '/save_model/keras/%s/%d/%s' % (self.task_name, self.version, self.worker_name)
        self.model.save(model_file_dir)

3.4.2 Parameter Server分布式训练原理

对于Parameter-Server分布式训练方式来说，训练任务按照功能的不同，分为chief节点，parameter-server节点和worker节点。其中chief节点负责拆分训练数据和模型结构，并将模型参数分发到不同的parameter-server和worker节点。parameter-server服务节点负责模型参数梯度的收集和更新。worker节点则负责根据分发的训练数据，计算本节点负责部分参数梯度的计算，将计算完成的梯度推送到parameter-server服务器，然后再拉取最新的参数信息。

整个训练过程需要多种训练任务相互配合，共同完成整个模型的梯度计算和参数更新。相对于Multi-Work训练方式，Parameter-Server分布式训练方式计算效率更高，梯度更新更快，适合于模型结构更大更复杂的训练任务。但是Parameter-Server分布式训练方式也有自己的缺点，那就是训练过程为了加速的需要一般采用异步参数更新方式，这样会牺牲的一部分准确性，导致模型训练效果稍差，但是相对于其对整个模型训练起到的加速作用，一点效果的牺牲还是有必要的。

训练任务根据task_type的不同执行不同的代码逻辑，训练过程定义完成后，同样打包成kubernetes可执行的docker镜像，提供给后续的kubernetes分布式任务执行模块使用。

    # parameter-server分布式训练代码
    def train(self):
        # 定义集群参数
        cluster_spec = tf.train.ClusterSpec(self.cluster)
        cluster_resolver = tf.distribute.cluster_resolver.SimpleClusterResolver(cluster_spec, task_type=self.task['type'], task_id=self.task['index'])
        # chief任务
        if cluster_resolver.task_type == 'chief':
            variable_partitioner = (tf.distribute.experimental.partitioners.MinSizePartitioner(min_shard_bytes=(256 << 10), max_shards=self.num_ps))
            strategy = tf.distribute.experimental.ParameterServerStrategy(cluster_resolver, variable_partitioner=variable_partitioner)
            with strategy.scope():
                # 初始化模型
                self.model = your_model_here
                # 模型训练数据
                train = tf.keras.utils.experimental.DatasetCreator(dataset_train_fn)
                eval = tf.keras.utils.experimental.DatasetCreator(dataset_eval_fn)
                test = get_csv_dataset(self.test_data_file_list, features=self.model.feature_names, labels=self.model.label_names, batch_size=64 * self.num_workers, num_epochs=1, features_meta_info=self.model.features_meta_info)
                # 模型编译
                self.model.compile(
                    optimizer=self.model_optimizer,  # Optimizer
                    # Loss function to minimize
                    loss=self.train_loss,
                    # List of metrics to monitor
                    metrics=self.train_metrics,
                )
            callbacks = []
            # tensorboard监控
            if not self.close_tensorboard:
                log_dir = self.model_parent_path + "/logs/%s/%d" % (self.model_name, self.version)
                tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)
                callbacks.append(tensorboard_callback)
            # 分布式训练容错恢复, 挂载目录
            if self.use_check_point:
                checkPointPath = self.model_parent_path + '/tmp/%s/%d' % (self.model_name, self.version)
                modelCheckpoint = tf.keras.callbacks.ModelCheckpoint(filepath=checkPointPath)
                callbacks.append(modelCheckpoint)

            # 模型训练
            try:
                self.model.fit(
                    train,
                    batch_size=self.batch_size,
                    epochs=self.epochs,
                    steps_per_epoch=self.steps_per_epoch,
                    validation_data=eval,
                    validation_steps=self.validation_steps,
                    callbacks=callbacks
                )
            except:
                traceback.print_exc()

            # 模型验证
            results = self.model.evaluate(eval, steps=self.eval_test_step)

            # 预测验证集
            predictions = self.model.predict(test, steps=self.eval_test_step)
          
            # 保存模型
            model_file_dir = self.model_parent_path + '/save_model/keras/%s/%d/%s' % (
            self.task_name,  self.version, self.worker_name)
            self.model.save(model_file_dir)
        
        # worker/ps任务
        elif cluster_resolver.task_type in ("worker", "ps"):
            server = tf.distribute.Server(
                cluster_resolver.cluster_spec(),
                job_name=cluster_resolver.task_type,
                task_index=cluster_resolver.task_id,
                protocol="grpc")
            server.join()

3.5 kubernetes分布式原理

kubernetes作为Google开源的分布式容器编排引擎，积累了Google自动化容器分布式经验，并且吸收了来自社区的大量想法和经验，目前在业界广受欢迎，并且应用广泛。kubernetes非常适合大规模分布式应用的开发，可以对容器根据资源要求自动进行应用部署，同时在遇到异常后可以快速的自我修复，提供自动服务发现和横向水平扩展，是一款功能非常强大的开源框架，非常适合于到家模型训练平台的开发使用。

3.5.1 基本原理

kubernetes主要分为两部分组成Master和Node。其中Master负责整个集群的正常运行和调度管理，组成部分包括API-Server， Controller，Scheduler和etcd。Node作为实际工作的执行者，组成部分包括kubelet，Storage-Plugin，Network-Plugin和Kuber-Proxy。Master通过自身组件，提供了容器自动化部署，自动化横向扩展以及异常的自动恢复等功能，对使用者提供了kubectl交互工具，对整个集群进行任务创建和管理。同样Node通过自身的组件，负责真正部署启动Master希望得到的容器状态，对外可以提供网络和存储等服务，同时容器内部相互之间的通信，通过Kuber-Proxy实现路由交互。

3.5.2 分布式训练应用

模型训练平台使用了kubernetes生成job任务用来训练模型，其中结合训练任务的不同，结合训练执行image镜像，生成不同类型的yaml任务描述文件，并且提交到kubernetes集群，完成分布式任务的训练。

其中yaml任务描述文件如下，其中一个yaml文件定义了两个组成部分，包括一个Job实例和一个Service实例。Job部分负责了定义Job启动的镜像，以及镜像需要的各种参数定义和环境配置信息，其中env定义的环境配置，是tensorflow分布式训练的关键信息，定义了分布式训练的方式和分布式训练任务其他节点信息，cluster定义了整个集群的服务节点，task标明自己在整个集群中承担的角色。Service定义了当前Job集群内部网络域名信息，提供给cluster定义整个集群交互使用。结合不同类型的训练任务，生成不同类型Job任务的工作，有训练平台的train-job-generator任务生成模块负责。

# multi-worker 一个训练节点的生成yaml文件
apiVersion: batch/v1
kind: Job
metadata:
  name: worker-2
spec:
  template:
    spec:
      containers:
      - name: worker-2
        image: multi_worker_trainer:0.2
        args: ["base_models1", "BaseModel"]
        env:
        - name: TF_CONFIG
          value: '{"cluster":{"worker":["service-worker-0:3333","service-worker-1:3333", "service-worker-2:3333"]},"task":{"index":2,"type":"worker"}}'
        ports:
        - containerPort: 3333
        volumeMounts:
          - mountPath: /deep_learning_models/datas
            name: models
      volumes:
        - name: models
          hostPath:
            path: /root/datas
      restartPolicy: Never
  backoffLimit: 0
---
kind: Service
apiVersion: v1
metadata:
  name: service-worker-2
spec:
  type: LoadBalancer
  selector:
    job-name: worker-2
  ports:
  - port: 3333

到这里整训练任务集群需要的训练镜像和训练任务定义已经全部准备完成，剩下的工作就是怎么将训练任务提交到分布式训练集群。模型训练平台支持多个用户同时训练多个模型任务的同时，还要考虑整个集群的资源合理分配的需要，所以我们提供了统一的实验任务调度experiment-scheduler模块。为每个用户提供固定额度的训练资源，相对公平的保证每个用户的使用权限。提交到experiment-scheduler任务队列中的训练任务，会根据队列目前的资源状况，进行自动化执行，并且将执行的状态和结果实时的反馈给用户，让用户了解到当前实验的阶段和状态。

3.6 总结

模型训练平台目标是封装标准化整个模型训练过程，提供可扩展自定义的模型定义和数据处理，为用户提供灵活又简单的训练平台工具，提升算法迭代效率，减少出错的概率。针对通用的模型结构和数据处理方式，后续也可以组件标准化，为更多有算法需求的非算法同学提供支持。

4. 特征模型管理平台

为了解决多业务多场景多模型的模型管理需求，以及提供复杂而灵活的模型输入算子转换能力，系统设计开发了特征模型管理平台。平台具备模型唯一标识存储能力，可以根据业务线和业务场景区分并生效特定模型。同时平台算子能力，提供了一套统一的算子开发规范，除了提供通用的算法能力外，还支持算子自定义能力。减少了特征模型上线和管理的复杂性，提升了上线服务效率。

4.1 模型文件管理

模型训练平台生产好的模型最终会产生一个文件集合，里面含有模型文件以及特征的说明信息conf。这两者是缺一不可的。管理好这个生产好的模型文件集合至关重要，模型存放位置，版本信息，模型类型，都需要有一个清晰且规则化的方式存储，这是模型在线服务实现热加载及卸载的基石。因为日常在搜索、推荐各场景的模型数量极多，可视化的知道哪些模型在线使用这样的管理功能也极为重要。

4.2 基础特征管理

特征信息在京东到家主要含有以下几个大类：用户特征、商品特征、商家特征、门店特征等以及他们组合在一起的交叉特征，再者就是上下文特征的规范化。这部分特征与模型训练平台时候需要的样本特征有一定的关联关系。基础特征管理就是为了能让这部分特征，在线上使用的时候能得到复用。我们知道训练一个模型所需要的特征都是比较多的，但是在多个场景下，模型中所使用的特征存在很多的重合度。如果每个模型都是自己一套样本特征训练及使用，那这样会有很大的资源浪费，并且不能很好的统一特征类别。基础特征管理不光要记录这部分的特征类别，更需要知道这部分特征存放的位置，且能在线上使用的时候找到它。

4.3 模型特征管理

模型特征管理是整个特征模型管理平台的一个核心，因为它决定了模型在线预测能使用的特征都有哪些，以及如何使用这部分特征。很多的实时性上下文特征，或者是基础特征，在不同的模型中使用方式方法是会存在差异的。这部分的差异全靠算子解决，模型特征管理也负责了算子的设计及发布。提供适配性特别强的算子接口，平台化算子能力使算子的扩展及使用更加便利。模型特征管理需要将基础特征与在线模型建立映射关系，同时热发布算子包，以满足不同模型的特征需求。由于模型在线预测的时候，获取特征或者计算特征都有可能在某些时候存在着不可预知的异常现象，所以在映射模型与特征关系的时候，需要为每个特征提供默认的参考值，以应对突发异常情况，保证模型预测的合法性。

4.4 总结

特征模型管理平台是模型训练及模型在线服务系统之间的桥梁，实现了热发布和替换线上模型的能力，减少了人工参与模型发布及修改代码的成本。可视化的管理界面，更能让我们知道各个版本的模型之间的微小差异，加速了我们实验迭代的步伐，提高了人效。

5. 在线模型预测服务

在线模型预测服务的主要目标有两点：第一，对外提供统一的模型预测请求Api接口，通过接口调用的方式实现模型计算逻辑与业务代码逻辑解耦。第二，通过将原本复杂的模型特征数据查询以及模型更新逻辑进行抽象，将所有模型计算相关的功能封装在一个独立服务中，实现了模型功能上的高内聚。

5.1 模型接口的定义

模型预测接口的入参包含了模型信息和item信息。模型信息中的modelType用于区分本次请求中的模型类型，例如xgb、lr，以及深度模型等。在同一种模型类型下为了区分不同的模型实体又引入了模型标签modelTag的概念。至此，通过modelType + modelTag的方式就可以方便地定位到唯一的具体模型。由于模型预测是一种抽象行为，任何需要被预测的信息都可以作为item，item可以是商品也可以是门店，还可以是分类等其他信息。item中包含了几个必须项：item唯一id、item基本参数、item上下文特征。item唯一id做为唯一表示用于运算逻辑多层转换过程中的标记id。item基本参数主要用于拼接查询特征时使用的key，比如说商品id、商家id等。上下文特征是指在业务逻辑执行过程产生的对模型预测有用的特征信息，例如上级来源页面、召回级别等都算作是上下文特征。

如上所述，请求方通过调用api接口时指定modelType + modelTag + Item[]就可以简单地完成一次模型预测请求，具体的细节都交由模型预测服务内部进行处理。

5.2 抽象的特征组装逻辑

在线模型预测逻辑的前提获取到所有模型需要的特征，如何通过一套抽象的逻辑实现所有类型模型的特征组装也就成了重中之重。

如上图所述，整个模型的特征组装逻辑分成了以下几个步骤：

获取模型特征配置：通过入参中的modelType和modelTag查询请求目标模型对应的特征列表。
redis查询条件组合：通过第一步查询出的feature上的配置信息以及item上的基本参数信息进行特征查询key组合，并且最终要按redis集群维度进行聚合去重。
并行获取redis查询结果：并行查询redis，得到redis查询出的kv数据。但此时的value还是json结构，json中的具体filed才对应到feature维度。
redis json特征解析：将第三步得到的json转换成featre维度数据，并且将所属关系挂在到初始的item上。
多类型特征整合：将模型feature配置中定义的redis特征、item自带的上下文特征、常量特征进行整合，作为原始特征集合待用。
算子加工：部分特征无法直接被模型使用，需要经过算子逻辑加工，比如json信息提取、onehot编码等，加工后的结构会作为新的特征项加到特征集合中。有些深度模型内部也支持自定义算子，但对于简单模型来说在服务中增加算子支持还是必要的，在实际使用中可按需配置。
预测得分：将此前获取到的完整特征数据输入到模型，计算获取模型预测得分返回。

5.3 模型服务场景化隔离部署

在线模型预测服务上线后，随着业务场景接入越来越多服务整体的吞吐量也大幅增长，这也导致了一些隐藏的问题被暴露出来。比如在业务调用峰值期间或者压测期间，总会出现个别模型qps极高，甚至极端情况下单个模型的请求量能占据整体模型预测请求量一半以上。这会导致在线模型预测服务的问题排查、限流设置以及服务器资源规划变的非常复杂。针对这些问题，我们提出了场景化隔离方案，如下图：

首先将模型预测调用请求按业务场景进行划分，针对每个场景的模型预测请求提供独立的集群进行响应。每个模型服务集群只加载所属当前场景的模型，并且对外保留独立的别名供调用方请求。各个调用方不用事先模型和别名的对应关系，调用期间可通过配置数据查询到当前请求模型对应的rpc别名，实现了在请求过程中的动态别名路由，而具体配置数据都由模型服务进行维护与同步。通过这样的方式做到了模型请求的场景化隔离，实现了不同场景模型的调用不互相干扰，也方便了工程端的问题排查以及服务器资源规划。

5.4 总结

在线模型预测服务实现了对模型预测行为在功能架构上的高内聚低耦合，为众多业务场景提供了稳定的模型预测能力支持。相比最初的模型接入方式，在线模型预测服务简易的api更便于接入，也为研发同学对更多的业务场景进行算法赋能提供了方便。

6. 算法应用实践

到家算法团队目前主要支持京东到家的算法需求。其中京东到家算法应用场景包括：nlp基础能力建设，搜索召回排序，推荐召回排序，用户增长，门店配送履约预测，销量预测，价格预测管控等算法应用场景。每一个算法应用场景有自己独特的场景特点，所以需要的算法平台支持能力各有差异。对于搜推排序这类在线应用算法场景，平台重点支持了文本序列等多模态特征处理，并且提供了高效的在线预测服务，满足线上实时在线请求需求。对于销量预测这类离线的预测需求，提供了离线预测模块，将预测好的结果输出到hive存储中，提供业务支持。

6.1 首页feeds推荐应用

以首页feeds推荐场景算法支持为例，目前首页feeds推荐场景为用户推荐定位lbs位置下周边店铺的全部商品，需要推荐的门店数量大，同时每个店铺符合要求的商品也比较丰富。怎样从丰富的门店和商品中，为每个用户推荐适合的商品，是该业务场景面临的业务挑战。针对该业务场景的面临的挑战，算法开发同学结合首页feeds场景的业务特点，设计并开发了针对该业务场景的多目标深度专家网络结构。其中对id类输入进行embedding向量化处理，高维稀疏特征转为低维稠密特征。对于dense类稠密特征，进行离散化分桶等特征处理，消除了特征中的噪音，降低了数据的复杂度，增加了模型的鲁棒性。对于行为序列数据，使用transformer将序列和目标值进行encoder和decoder编码处理，挖掘序列中潜在的用户意图兴趣。

其中序列编码部分，使用了经典的self-attention的多头注意力机制：

6.2 图技术探索

7. 总结和展望

随着京东到家即时零售业务的发展和壮大，京东到家算法团队也在不断成长，对算法技术体系和平台工具的打磨也从未停止。在这个过程中，我们将历史经验进行总结和沉淀，并结合业界先进的技术和开源框架，提出并实现了一套适合到家业务的机器学习平台，为算法技术的升级和快速落地提供了系统性的保障。

机器学习平台上线以来，支持了全局搜索商品排序，首页feeds推荐排序，频道feeds推荐排序和店内商品排序等业务场景的深度模型算法应用需求，覆盖了到家90+%分发流量场景和转化流量场景。

目前到家算法团队结合机器学习平台快速迭代算法的能力，在多个业务场景应用图注意力深度模型等业界先进的搜推技术，并取得显著的业务效果。期望在未来的业务发展过程中，机器学习平台能够不断提升算法迭代效率，更好地支持新算法技术落地应用，将算法能力赋能到京东到家业务的每一个角落。

你可能感兴趣的:(机器学习,人工智能,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &