滴滴技术

数据产品的一些思考

导读：一个成功的数据产品有三个核心层，包含一个中心（应用层）与两个基本点（数据层和算法层）。其中应用层最重要，就是说给谁创造价值，也可以叫业务目标。判断一个数据产品的好坏在于它有没有真正给受众创造价值，创造多大价值。

我们以一套数据产品为例来阐述它的三个核心层。

比如说，“5G红外成像测温”作为一个数据产品已逐步在全国各类重要区域投入使用。应用层是要做到在公共场所中（像飞机场，或火车站），如何无感、无接触、且快速精准的识别高温人员，这个业务目标对2020年的新冠防疫有非常大的价值。为了达到该业务目标，在数据层，我们很容易收集到大量有很高准确度的训练数据集。具体地说，通过挑选固定人群出现在各种公共场所中，并同时采他们的红外热成像数据和体温的信息。在算法层，基于前面大量的训练数据集，我们用人脸识别技术与红外热成像等相关的算法技术（像神经网络）来训练统计模型来精准地预测人体的体温，但是人与成像仪器的距离对预测的准确性会有很大的影响。

三个核心层

如同例子所示，三个核心层相辅相成，相互制约，相互作用，缺一不可。具体地说，它们三个关系如下：

应用层：
应用层是实现技术落地，为算法层提供目标与方向，为未来数据层建设提供指引。
数据层：
数据层是以业务需求为指导进行高效的、有序的底层数据建设，方便数据提取、清洗与处理，并降低数据分析的技术难度。
算法层：
算法层是为了实现业务目标，深入理解业务，提供技术支持，进行数据的深度挖掘，并弥补一部分数据建设上的缺陷，帮助找到数据层优化的方向。

应用层

应用层也分好几个层级的，核心点就是能够给一部分人群，企业或政府创造出价值，而这些层级主要是要从影响的受众多少和程度来区分，有大有小，我们来看几个例子：

可以做几个 R 包，像中山大学王学钦老师的球（Ball）软件包，如果有人用来分析数据，并得到正确结论，就是一种价值。
耶鲁大学的张和平老师有关不孕症的结果，能够影响一部分病人的治疗方案。
密西根大学的宋学坤老师和合作者解决了活体肾移植领域供受者不匹配的问题，使得肾脏配对的成功率比 Alvin Roth 方法提高了20~30%。
可以给政府/公司出一些专题分析，商业智能和报告（像北京大学陈松溪老师有关环境和新冠的报告受到政府机关的重视），给产品进行一些基本的分析，对决策提一些有深度的想法，以提高决策的精准度。
做个 app 或电商，像滴滴、京东，和阿里等等，这些平台把供给和需求打通，以增加贸易的效率。
像学而思这样的平台，给许多没有进私立学校和重点学校的学生们一个接触顶级教资的机会。

数据层

有了一个好的应用层问题，数据层就变得非常关键，就是能不能在一定成本下收集到有用的数据，以达到业务的目标。在现在许多场景中，相关数据产品之所以可以业务落地的一个关键点就是数据层上的突破，即能够相对容易地找到与业务目标相关的数据源和特征。现在各种 app，电商，搜索平台都汇集了许多用户的行为信息，它们是公司优惠策略的金矿，但是这些海量的数据到底能不能发挥应有的效果，主要是三点：

数据需要服务于应用才有价值。比如说，许多平台收集了大量视频的数据，存储它们花费很大，所以需要删除大量与业务无关的东西，并进行压缩以降低成本。

数据收集是有成本的，是否要收集相关数据要看能不能真正为业务创造出价值，我们一定要平衡成本和收益。如果成本远大于的收益的话，我们可能就不需要相关的数据。

数据需要能转化为达成业务目标的策略，更直白地说，就是如何把数据转化成业务抓手，以正确地影响业务。

▍我们来讨论两个场景

第一个场景是数据对业务价值有很强的确定性，就如“5G红外成像测温”的相关训练数据。

我们再考虑另外一个非常有名的 ImageNet (http://image-net.org/)，它是计算机视觉领域一个跨时代的数据集，以场景之丰富多样和各种复杂的问题而受到广泛关注，而它的一个关键突破就是最近十几年整个领域在标注能力和效率的提升, 而标注好坏的一个要点就是问题确定性的大小，也就是说能否很确定地找到与业务目标相关的特征。ImageNet 的问题虽然很复杂，但是不确定性是非常小的。用 ImageNet 这种高确定性的数据来打造商业落地的数据产品极度依赖于现在的算力和算法层的突破。

第二个场景是数据对业务价值有很强的不确定性，这种不确定性有两个维度：

1.我们不知道哪些数据真正重要。

在许多情况，我们根本不知道什么信息是最关键的，像许多疑难杂症，可能是因为“病”的定义本身都不清楚，像精神类的许多疾病，由此许多后续动作的不确定性很大。也可能是因为病理的整个机制都不清楚，我们无从下手。

2.我们不清楚有没有能力收集到相关数据。

现在许多研究虽然收集了许多数据，其实我们根本不知道这些数据能不能真正可以帮助医生治病救人。许多病理研究都要测不同层级基因的信息，各个政府和机构投入了大量的资源来制造相关的仪器和收集相关数据。

为什么? 因为这些仪器并不能满足应用的需求，也不能达到业务的目标=治病救人，所以科学家们还在不断的努力中。另外，因为对个人数据隐私的保护，各个国家开始进行了相关的立法，以规范各个商家，组织，和政府机关对个人数据的使用和管理，所以许多跟业务相关的数据并不能应用在一些策略中。

算法层

算法层也是我们学术同仁所说的理论研究。统计学和机器学习里面许多有影响力的理论方法都是有很多应用场景和能解决实际问题的理论方法。比如说，抽样方法和实验设计方法（像方开泰老师的均匀设计）都是在收集数据方向，许多同仁在实践中抽象出来的有一定普实性的理论。像 MCMC，线性模型，随机森林，SVM，和神经网络等估计和预测方法都是在实践中得到广泛应用，并创造出相当大的价值。在互联网的领域，最流行的三种学习方法可能是简单的回归模型，随机森林（或 XGBoost），和深度学习。

▍回归模型

回归模型是研究一些被解释变量关于另一些解释变量的具体函数关系的方法。它通常用于数据建模，预测分析，时间序列模型以及发现变量之间的因果关系，是许多数据建模的第一选择。例如，我们可以用回归模型来研究司机的一些不良的驾驶行为（比如鲁莽驾驶，开车手机等等）与道路交通事故数据之间的关系。

▍随机森林

随机森林（或 XGBoost），是一个高度灵活和有效的学习方法，它能够有效地处理大数据，而且它可以进行大量特征进行变量选择，是做回归和分类问题的首选工具之一。随机森林的应用前景非常多，包含客服进线问题的预测，推荐系统，实时分流，用户分层等等。

▍深度学习

深度学习是处理有时/空相关性数据的重要学习方法，特别是在图像识别、语音识别、和自然语言理解这三个领域都有非常不错的表现，可以说是这三个领域的首选模型。跟传统统计方法相比，深度学习能放大局部一些弱的信号，并把这些放大的信号拉齐到同一个位置。它最大的优点就是使得特征提取和特征选择自动化，学习到的特征对原始数据有更本质的刻画，可能更利于进行统计分类和推断，上海 ImageNet 的数据就引起了深度学习的发展和突破。

我们最近一直在做网约车运营相关的策略和研究。通过这段时间的理解，我们越来越感觉实验设计，因果推断，和强化学习这三个方向起着关键的作用。因为篇幅的缘故，我们这里只稍微阐述一下它们的重要性。

实验设计和因果推断可以说是医疗行业，工业应用，和互联网公司中被最广泛使用的统计方法。在大部分的应用场景中，我们关心的是业务中的因果关系，就是通过找到并改变一些抓手变量，来达到预期的业务目标，并考虑环境变量的影响。

为了对因果关系进行推断，我们有的时候可以用观察的数据，但是这个需要一些强的假设条件。随机实验就依赖于实验设计，本质上就是一个设计一种实验方法收集一些有用且有效的数据，可以更科学的看清楚策略的实际效果，以进行因果推断。

强化学习开始在应用中起着越来越重要的作用，主要是因为它的一个主要目的是找到达到最优的中长期奖励的策略。最近它在围棋和电子游戏中达到或超过了人类水平, 而且在精准医疗上也有很多的应用。随着大数据技术和科技的发展，因为我们收集的数据在时间上越来越精细，所以有可能设计一些动态的策略来达到业务的目标。

比如说，网约车平台汇集了大量车的时空轨迹和用户的行为轨迹，而平台策略主要影响用户的行为和供需匹配的效率。我们可以考虑一些策略来影响用户的短期行为，也可以考虑一些中长期的策略（像定价）。我们最近一直在用强化学习来做优化平台各种平台策略，具体的强化学习学习过程包含 (i) 输入是每个用户的历史轨迹，包括订单行为，呼叫记录和领劵行为等；(ii) 模型产出每个乘客/司机在不同 action 下的长期收益。

算法层是连接数据层和应用层的桥梁。不同业务目标对数据和算法的要求不一样。越是重要的决策和洞察越需要与业务紧密相关的数据（深度特征），以及更高深的算法，像因果推断。比如说，大部分公司希望对用户行为的进行一定的引导，特别是深层次和长期的目标，数据的不确定性就会越高，由此处理这些数据需要很强的算法和数学推导能力，像强化学习。此外，算法层也可以弥补一部分数据建设上的缺陷，就是用高深的算法来进行数据挖掘，这可以帮助我们找到未来数据层建设的方向, 这是为什么数据挖掘重要的根本原因。

结论

最后，我们把数据产品从业务的角度来进行归类：

生存型：对于业务来说，我愿意为你买单，就是因为我离不开你，没有你就没有办法活，这个最重要。
服务型：有没有你，我的服务水平有很大的差异，这就是服务型。
品质型：有了你，我们的服务显得高大上，这个是品质型。

每一类数据产品的受众人群的大小和背景不一样。一个高水平的数据建设就是以应用层为引导，打造出最经济实惠的数据框架，并根据用户来定制对应的数据产品，而每个数据产品都是应用层，数据层和算法层三者的有机融合。



本文作者
▬
北卡罗来纳大学教堂山分校生物统计学终身教授 ，2018年加入滴滴出行，带领工程师们为滴滴出行平台的运营打造一套双边市场的创新理论和平台。
北卡州立大学统计博士，2018年加入滴滴出行，主要从事统计和机器学习在双边交易市场的研究和应用。

推荐阅读
▬



更多推荐
▬

滴滴开源 / Open Source

技术干货 / Recommended article

滴滴开源夜莺Nightingale：企业级监控解决方案 | 滴滴业务研发的精益实践

docker compose 安装 Neo4j MonkeyKing.sun docker neo4j 容器
使用DockerCompose安装Neo4j非常方便。以下是一个示例步骤，展示如何使用DockerCompose来安装并运行Neo4j。步骤1：安装Docker和DockerCompose确保你已经安装了Docker和DockerCompose。如果尚未安装，可以参考以下链接进行安装：Docker安装DockerCompose安装步骤2：创建DockerCompose文件在你的工作目录中创建一个d
剑指 Offer 03. 数组中重复的数字
剑指Offer03.数组中重复的数字题目：在一个长度为n的数组nums里的所有数字都在0～n-1的范围内。数组中某些数字是重复的，但不知道有几个数字重复了，也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。思路：例如nums=[2,3,1,0,2,5,3]，我们从第一个数字开始遍历，首先遍历到下标0，也就是数字2，它不等于它的下标，因此将它和位置为2的数字1进行交换，得到[1,3,2,0
安装qt-sdk
Qt是一个跨平台的C++图形用户界面应用程序框架。Qt是完全面向对象的，很容易扩展，并且允许真正地组件编程。QtCreator是Qt被Nokia收购后推出的一款新的轻量级集成开发环境（IDE）。QTSDK包括了Qt库、QtCreatorIDE和Qt工具。QTCreator和QTSDK是需要分别单独安装的~在之前（这里:http://blog.csdn.net/arackethis/article/
apt-get install E: 无法定位软件包问题欧阳秦穆
在etc/apt的sources.list添加镜像源debhttp://archive.ubuntu.com/ubuntu/trustymainuniverserestrictedmultiverse然后sudoapt-getupdate接着安装就可以了
【python】解决No module named _sqlite3的问题欧阳秦穆
环境版本说明：centos7python3.6.4django2.0在创建django项目时候。报错以下信息详细错误信息如下：原因：未安装sqlite模块解决：1安装sqlite-develyuminstallsqlite-devel2重新编译pythoncd/usr/local/python3.6.4./configuremakemakeinstall
CentOS-7的“ifupdown“与Debian的“ifupdown“对比笔记250706 kfepiza OS操作系统 Windows Linux 等 #控制台命令行 Shell bash cmd 等网络通讯传输协议 IP TCP UDP 物联 centos debian 笔记 linux 网络
CentOS-7的"ifupdown"与Debian的"ifupdown"对比笔记250706CentOS7和Debian的ifupdown工具名称相同，但在实现机制、配置文件语法和系统集成上存在显著差异。以下是核心对比分析：⚙️一、核心差异概览对比维度CentOS7Debian工具定位network-scripts套件的一部分，依赖传统ifcfg文件独立包(ifupdown)，使用/etc/ne
springboot + neo4j 功能使用风行傲天 spring boot neo4j windows
注意：1、使用jpa处理数据时，如果对象中有relationship关系，数据中没有写关系，更新数据时会将原有的关系删除掉(出来方法可以先查询出原来的数据，然后在编辑)2、集成添加依赖org.springframework.bootspring-boot-starter-data-neo4jspring:#neo4j图数据库neo4j:uri:bolt://localhost:7687authen
Neo4j Windows 3.5 详细安装教程赵允静Joy
Neo4jWindows3.5详细安装教程neo4jwindows3.5详细安装教程附百度云链接项目地址:https://gitcode.com/Resource-Bundle-Collection/1af38本资源文件提供了Neo4jWindows3.5版本的详细安装教程，帮助用户快速完成Neo4j的安装和配置。教程内容包括从下载、解压、配置环境变量到启动Neo4j服务的全过程。安装步骤访问官网
版本迭代与App Store上架 ZeroOnet 经验教训 App-store 上架被拒理由版本迭代教程
前言自从Xcode8引入了Automaticmanagesigning，广大iOSDeveloper终于松了很多口气了。（幸运的我是在这之后才有上架的经历，嘿嘿！）现在的上架也就不再那么多坑点了，很多步骤都是水到渠成。这篇博客就分享一些我在这过程中的经验，同时也会粗略演示上架的过程和注意事项，最有价值的是两个被拒的原因，一定不要错过哟！版本迭代之前实验室里做过的一个关于智能停车的项目——停如意，需
JavaScript 中导入模块时，确实不需要显式地写 node_modules 路径。咔咔咔索菲斯 javascript vue
1.正确的导入语法在Webpack、Vite等打包工具中，node_modules目录是默认的模块搜索路径，因此直接写包名即可：//✅正确：直接使用包名import'nprogress/nprogress.css';//❌错误：不需要显式写node_modules路径import'node_modules/nprogress/nprogress.css';2.为什么不需要写node_module
mediapipe流水线分析三江太翁 Android NDK 人工智能 mediapipe android
目标检测Graph一流水线上游输入处理1TfLiteConverterCalculator将输入的数据转换成tensorflowapi支持的TensorTfLiteTensor并初始化相关输入输出节点，该类的业务主要通过interpreterstd::unique_ptrtflite::Interpreterinterpreter_=nullptr;实现类完成数据在cpu/gpu上的推理1.1Tf
Flutter 使用http库获取网络数据的方法(一)
前言对于大部分应用来说，获取网络数据都是必不可少的一个功能。幸运的是，Dart和Flutter就为我们提供了这样的工具。1.使用http库请求网络数据我们看看如何使用http获取网络数据。1.添加httppackagehttp包是Flutter官方推荐的网络请求库，简单易用。需要在pubspec.yaml中添加依赖：dependencies:http:^1.4.0然后我们在需要的地方导入http包
【5.1.1 漫画Java核心并发编程】钺商科技漫画Java java 开发语言
漫画Java核心并发编程人物介绍小明：对Java并发编程感兴趣的开发者架构师老王：Java并发编程专家，精通各种并发工具Java并发编程基础小明：“老王，Java并发编程为什么这么复杂？”架构师老王：“因为并发编程需要处理多个线程同时访问共享资源的问题！主要挑战包括：线程安全、死锁、性能优化等。但掌握了核心原理，就能写出高效的并发程序。”并发编程核心概念Java并发编程体系|+----------
将 MFC 类封装到 DLL 中
最近需要开发一个可加载皮肤的控件库，需要从MFC中继承若干个类，并封装到DLL中。在这一过程中遇到了很多问题，主要是项目的配置，花了很多时间才搞定，现在写下来和大家一起分享。1.创建一个空的Win32DLL项目，将所有.h和.cpp文件导入到项目中。2.在.h文件中，在要导出的类的声明中加入AFX_EXT_CLASS，如classAFX_EXT_CLASSCSkinDialog:publicCDi
利用反汇编技术将游戏《英雄无敌3》修改为硬盘版安联酋长汇编游戏汇编
最近好不容易找到我最喜欢的游戏《英雄无敌3之埃拉西亚的光复》，可惜是光盘版的，要用虚拟光驱来运行，感觉不爽，网上也找不到免CD补丁，于是决定自己动手。首先感谢这篇文章的作者http://bbs.pediy.com/showthread.php?t=101023是他引领我进入反汇编的大门。这篇文章的第一步，就是找到GetDriveType的调用（GetDriveType就是判断某盘符是光驱、硬盘或网
城乡规划转型GIS开发：数字化浪潮下的职业突新中地GIS开发老师 GIS 地信地理信息科学大学生 webgis 城乡规划 GIS开发
“国土空间规划一张图”“数字孪生城市”“实景三维中国”——近年来，国家政策与科技风口将地理信息技术（GIS）推向热潮。反观城乡规划行业：传统规划设计院缩编降薪，地产行业震荡，考编竞争白热化。当“画图民工”遭遇职业瓶颈，一群城乡规划人正悄悄将目光投向GIS开发赛道。在新中地就有这样一群人，通过城规转型GIS开发成功就业。那么，城规为何能丝滑转型GIS开发？小白怎么转？有哪些注意事项？今天给大家好好聊
【RTSP从零实践】4、使用RTP协议封装并传输AAC
博客主页：https://blog.csdn.net/wkd_007博客内容：嵌入式开发、Linux、C语言、C++、数据结构、音视频本文内容：介绍怎么使用RTP协议封装并传输AAC金句分享：你不能选择最好的，但最好的会来选择你——泰戈尔⏰发布时间⏰：2025-07-0118:43:18本文未经允许，不得转发！！！目录一、概述二、实现步骤、实现细节✨2.1、实现AAC文件读取器✨2.2、实现AAC
在dify中通过http请求neo4j时为什么需要将localhost变为host.docker.internal 隆里卡那唔 AI问题解决 http neo4j docker
在dify中通过http请求neo4j时为什么需要将http://localhost:7474/db/neo4j/tx/commit变为http://host.docker.internal:7474/db/neo4j/tx/commit在Dify中通过HTTP请求访问Neo4j时，将http://localhost:7474改为http://host.docker.internal:7474的原
Debian-10-standard用`networking`服务的`/etc/network/interfaces`配置文件设置多网卡多IPv6 kfepiza 网络通讯传输协议 IP TCP UDP 物联 #Linux debian 运维网络 linux
Debian-10-buster-standard用networking服务的/etc/network/interfaces配置文件设置多网卡多IPv6Debian-10-buster-standard用networking服务的/etc/network/interfaces配置文件设置多网卡多IPv6250703_123456三块网卡:enp0s3,enp0s8,enp0s9/etc/netwo
ubuntu 安装neo4j 欧阳秦穆知识图谱 ubuntu 数据库 linux
在Ubuntu上安装Neo4j可以按照以下步骤进行。Neo4j是一个高性能的图数据库，用于存储和查询复杂的数据结构。以下是详细的安装步骤：1.下载Neo4j安装包首先，从Neo4j的官方网站下载最新版本的Neo4j安装包。你可以访问以下链接获取安装包：[Neo4j下载页面](https://neo4j.com/download-center/#community)下载适合你操作系统的版本，通常是.
面试必问之JVM原理 teayear 面试 jvm 职场和发展
1：什么是JVMJVM是JavaVirtualMachine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以
SIMULINK开发项目实例 1000 例专栏之第663例：基于simulink的SVPWM技术的研究的三相电压源逆变器建模仿真 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 matlab simulink
目录准备工作步骤详解第一步：创建Simulink项目第二步：选择并添加合适的库组件第三步：构建基本的三相电压源逆变器模型第四步：实现SVPWM算法第五步：仿真与调试第六步：结果分析第七步：优化与改进第八步：导出与部署总结三相电压源逆变器（VoltageSourceInverter,VSI）在电力电子中是将直流电转换为交流电的一种重要设备，广泛应用于电机驱动、不间断电源（UPS）、可再生能源系统等领
JVM架构原理 cocoon-breaking jvm 架构 java
一、简介虚拟机是物理机的软件实现。Java的设计理念是WORA（WriteOnceRunAnywhere，一次编写随处运行）。编译器将Java文件编译为Java.class文件，然后将.class文件输入到JVM中，JVM执行类文件的加载和执行的操作。请看以下的JVM架二、JVM是如何工作的？如上面架构图所示，JVM分为三个主要子系统：类加载器子系统（ClassLoaderSubsystem）运行
Spring Boot Starter深度解析：从入门到自定义，一篇搞定！码不停蹄的玄黓 spring boot 后端 java starter
引言SpringBootStarter是SpringBoot生态中简化依赖管理和自动配置的核心机制，旨在帮助开发者快速集成常用功能，避免手动配置大量依赖和样板代码。以下从核心概念、工作原理、分类、自定义开发到最佳实践，全面解析SpringBootStarter。一、Starter到底是啥？为啥它是SpringBoot的“开发神器”？1.1一句话定义：依赖的“全家桶”+自动的“配置管家”Starte
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
构建智能企业知识管理平台：动态知识图谱与语义检索系统 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据知识图谱人工智能 ai
构建智能企业知识管理平台：动态知识图谱与语义检索系统关键词：知识管理平台、动态知识图谱、语义检索、知识图谱构建、语义检索算法摘要：本文详细探讨了构建智能企业知识管理平台的核心技术，重点介绍了动态知识图谱和语义检索系统的原理与实现。通过分析知识图谱的构建方法和语义检索算法，结合实际案例，展示了如何利用这些技术提升企业的知识管理水平。文章内容包括背景介绍、核心概念、算法原理、系统架构设计、项目实战以及
基于DeepSeek × 数据治理如何落地？这套解决方案可参考！
Q：数据治理困局怎么破？3步落地DeepSeek实战方案导语："每天处理10亿条数据，却找不到关键业务指标？""数据部门80%时间在'找数据-洗数据-背锅'的死循环？"这不是危言耸听——国内83%的企业正困在数据沼泽中（IDC最新数据）。今天揭秘某头部电商企业如何用DeepSeek方案，3个月实现数据治理自动化，让数据真正成为资产！一、数据治理的三大致命误区（90%企业正在踩坑）"工具万能论"：买
Node.js v22.5+ 官方 SQLite 模块全解析：从入门到实战红衣大叔 nodejs帮助文档 node.js sqlite 数据库
在Node.jsv22.5.0及更高版本中，node:sqlite模块作为内置模块被引入，为开发者提供了与SQLite数据库交互的官方支持。以下是关于node:sqlite模块的详细介绍：一、模块启用与导入启用方式：node:sqlite模块目前处于活跃开发阶段，需要通过--experimental-sqliteCLI标志来启用。导入方式：使用import语句从node:sqlite模块中导入所需
ps给图层填充颜色红衣大叔 ps photoshop
在Photoshop（简称PS）中给图层填充颜色，有多种方法可以实现，具体取决于你的需求和偏好。以下是一些常用的方法：1.使用快捷键填充前景色填充：按下Alt+Delete（Windows）或Option+Delete（Mac）可以将当前设置的前景色填充到当前选区或图层中。背景色填充：按下Ctrl+Delete（Windows）或Command+Delete（Mac）可以将当前设置的背景色填充到当
DeepFM算法原理及应用场景
DeepFM（DeepFactorizationMachine）是一种结合了因子分解机（FactorizationMachines,FM）和深度神经网络（DNN）的混合模型，主要用于处理高维稀疏数据（如推荐系统中的点击率预测）。其核心思想是同时捕捉低阶（线性）和高阶（非线性）特征交互。1.算法原理模型结构如下：FM部分：负责捕捉低阶特征交互（如一阶和二阶特征组合）。一阶项：线性特征权重。二阶项：通
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

数据产品的一些思考

滴滴开源夜莺Nightingale：企业级监控解决方案 | 滴滴业务研发的精益实践

你可能感兴趣的:(数据产品的一些思考)