iFlyAI

全栈式深度学习(概括实讲解）

人工智能学习离不开实践的验证，推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛，以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例，支持算法能力变现以及快速的迭代算法模型。

Setting up Machine Learning Projects

Overview

Pieter Abbeel说，深度学习更像是一门艺术，而不是科学。虽然目前深度学习很多方面缺乏坚实的理论支撑，但并不妨碍在各个业务领域深度学习的应用蓬勃发展。所以在探究深度学习理论原理的同时，我们同样可以在工程化的方向探索算法应用如何借鉴软件工程的思想，使得其应用落地有迹可循，逐渐形成一系列的规范和最佳实践。

算法项目很多还是没有脱离研究性质，有数据表明，85%的AI项目会失败。有各种可能原因：

技术可行性：基于数据统计学习构建的模型，在实际使用中有很多限制。
项目范围：对于AI技术有过高的期望，容易导致项目需求设定方面失去控制，最终难以达成。
目标定义：对于是否成功交付的定义不明确，或者定义的目标与实际业务没有很好的挂钩。
从实验室到生产环境：机器学习建模过程偏研究性质，没有为实际业务落地做足够的准备。
组织变革：在技术和产品层面外，对于流程，组织都有一定要求，执行推进难度较大。

Lifecycle

整个机器学习的项目基本流程大家应该都很熟悉，值得注意的是这个流程并不是线性关系，会反复迭代跳转。所以遇到问题时不要把自己的思维局限在当前这个点上，要把目光放到整个项目流程上来寻找机会点。

计划立项：明确需求和目标，项目资源的准备，项目排期等
数据收集：数据系统和流程的梳理，训练数据的收集，数据质量监控
- 发现数据太难获取，或者有更容易收集的其它数据，需要回到立项阶段重新评估
建模与调优：构建baseline模型，尝试使用SoTA模型，debug模型并迭代优化
- 优化过程中发现数据质量不足，数据量不够，都需要回到数据收集阶段优化
- 任务难度过大，或者项目目标之间相互制约，需要回到计划立项步骤重新权衡
测试与部署：内部/小范围试点，添加各类测试，监控，部署上线，应用推广
- 实验室pilot时发现模型效果不达标，需要回到训练调优阶段
- 训练数据与实际上线数据的不一致，或情况更复杂，需要回到数据收集阶段进一步优化
- 优化目标与最终业务价值有出入，或者现实情况下的结果没有达到既定目标，需要重新评估项目

另外还有跨项目的基础架构，包括团队和组织，支持框架和工具（后续会介绍）。

Prioritizing

考虑项目影响力和可行性两个维度。

项目影响力方面，参考《AI极简经济学》及Karpathy的一些观点：

寻找能通过低成本的预测/自动化能力，对整个复杂业务流程带来较大的价值的环节。
Software 2.0，从先前指定规则和具体流程，到指定目标，让算法从数据中自动学习。寻找那些复杂的规则系统，看是否有机会通过自动学习来替代他们。

可行性：

问题的难度，是否有成熟的技术和方案，对算力需求等。可以从输出复杂度，可靠性需求和泛化需求等方面来评估。
准确率的需求，模型给出错误预测的代价有多高，预测准确率对系统可用性影响有多大。准确率越高，需要投入的调优精力会越大，例如对rare case数据的需求。
数据的可用性，获取数据的难度，数据量的需求，数据标签是否容易获得。一般也是可行性方面最大的障碍。

Archetypes

在公司的各种业务场景中，如何找到适合使用机器学习来提效的机会点并构建原型尝试呢？有如下几种模式可以参考：

现有流程的效果提升，例如从规则推荐，到模型推荐系统
- 模型是否能提升目前的效果
- 效果提升是否产生业务价值
- 是否能形成“数据飞轮”
人工流程的增强智能辅助，例如Email的自动补全功能
- 智能系统需要达到什么程度才对人有帮助？
- 需要多少数据量达到这个智能程度？
人工流程的自动化，例如自动驾驶，智能客服
- 系统可接受的失败率如何？
- 如何保证系统的失败率不会超过界限？
- 训练数据是否能容易获得？

已有流程的提升项目，需要提升impact，比如思考整个流程的优化能否提升数据流的效率，不断在这个任务上提升效果。而带来的更多数据，有机会给下游业务的优化提升构建更好的基础。

人工流程的增强辅助，可以通过更好的产品设计以提升整体的可行性，尽早发布good enough的版本，获取用户反馈。比如友好的交互方式，让用户自己决定是否采纳，对于模型的精度需求会有所降低。

人工流程的自动化需要提升可行性，一方面是引入human-in-the-loop的思想，另一方面，控制项目scope适用范围等。自动驾驶方面有很多这类例子，例如需要人工关注的自动驾驶，或者在特定环境中达到无需人类干预的状态。

Metrics

对于算法来说，有一个唯一的可量化的优化指标是非常重要的。但现实业务场景中的需求往往有多个优化目标，需要一些方法来综合这些指标由模型来进行优化。

简单的指标加权平均。
把对模型输出敏感度不高，或者较容易达到预期的指标，设置为threshold形式。
根据实际业务来设计更复杂的优化指标，例如M5 competition里的复杂多层级指标的加权。

需要不时的评估你的metrics，达成情况，与实际业务的联系程度等，并根据实际情况来做出调整。

Baselines

模型基线的选择很重要，可以帮助评估项目可行性和目标设置。一般有两种构建baseline的方式：

外部基线：业务需求，公开研究的成果等
内部基线：使用规则或简单模型，目前业务中的人工水平

Infrastructure and Tooling

Overview

算法应用的理想状态是，提供更多数据，然后系统自动训练提升模型效果。但实际上需要引入的系统组件和工具非常多，需要把各个环节的infra基础打好，后续才有可能实现更高效率的一体化自动化系统。

Software Engineering

语言选择，基本没有异议，Python。

IDE支持，VS Code和PyCharm都不错，个人更喜欢后者。两者都支持远程执行和debug，很实用的功能。

Linters and Type Hints，Python还是挺需要各类代码检查和类型提示的支持的，可以预防很多问题，提升开发效率。

Jupyter Notebook，比较适合探索开发。Netflix把整个数据科学流程构建在notebook之上，做了很复杂的二次开发，作者觉得不值得。我个人一般也是notebook的draft后续会在IDE中重新组织编写。Notebook原生的一些缺点有，难以版本管理，缺乏IDE支持，难以测试，执行顺序混乱，长时间运行任务支持差等。

Streamlit，一个快速构建data app的工具，个人没有用过。

Computing and GPUs

深度学习领域有很多进展都得益于强大的计算能力，当然除了“暴力美学”，如何利用少量资源来达到同样的效果也是非常值得投入研究的。

GPU方面基本上也是没有悬念，选NVIDIA。具体购买建议方面，V100是目前server端最强大的选择。Consumer card其实性价比很高，如1080Ti, 2080Ti等。Kepler，Maxwell架构太老了，不建议选购。

云服务方面建议选购AWS或GCP，作者还黑了下Azure……另外Paperspace和Lambda Labs等也可以考虑。如果架构设计上允许，spot instance会便宜很多。

目前最划算的还是自己买GPU机器。从成本分析来看，5-10周的使用量以上，就是自建的成本更低了。云服务的优势主要在可扩展性，运维成本更低等。

Resource Management

需求：多个用户，使用多台机器，来运行各自的workload。

最简单的解决方案，使用各类电子表格来登记管理。

用软件管理的方式，如SLURM Workload Mananger。

现在比较流行的方案，用Docker + Kubernetes来管理环境和集群资源。以及在此基础上提供更完善功能的Kubeflow，Polyaxon等。

Frameworks and Distributed Training

除非有特殊的理由，否则建议使用TensorFlow或PyTorch。这两者的很多功能特性也在逐渐趋于一致，例如TF 2.0里把eager execution设置为默认模式，使其更易于交互式开发。而PyTorch中也利用TorchScript增加对生产环境部署的支持度。另外fast.ai库也非常值得一试。目前研究领域PyTorch更火，工业界TensorFlow/Keras应用更多一些。

数据并行化是目前实践中更常用的做法。模型并行更加复杂，只有单模型无法在单卡上保存时才会考虑。尽可能利用更多RAM的GPU来避免这种情况。

分布式训练可以考虑的一些库：Ray，Horovod等。

Experiment Management

知乎上Deep Learning效率神器问题下，很多回答都提到实验管理方面的工具。

这里提到的一些工具：Spreadsheet，TensorBoard，Losswise，Comet.ml，Weights and Biases，MLflow。

Hyperparameter Tuning

前面AutoML的文章里有提到很多具体的原理和技术。

这里提到的一些工具：Hyperopt(Hyperas)，SigOpt，Ray Tune，Weights and Biases。

All-in-one Solutions

组合了上面提到的一系列的功能点的全功能软件平台，提供包括模型开发，分布式训练，实验记录，模型版本，模型发布，模型监控等功能的一站式服务。

举例：FBLearner Flow，Michelangelo，TFX，Amazon SageMaker，Neptune，FloydHub，Paperspace，Determined AI，Domino Data Lab（进入了Gartner DSML魔力四象限）。

Data Management

Overview

数据太重要了，为什么叫Data Scientist而不是Model Scientist是有原因的：）

业界对这方面的重视也在快速提升，因为实际工作中对于数据方面能做的空间和回报都非常大。研究领域受到benchmark等因素影响，往往只能使用相对固定的数据集来做模型方面的工作。

Sources

大多数的深度学习应用都需要大量的训练数据。

可以使用公开数据集作为开始，然后通过产品构建起data flywheel。

半监督学习也是近期热门方向，可以减轻给数据打标的人工开销。

数据增强在CV领域是一个非常普遍应用的技术，其它领域的应用会困难些。对于表格数据，可以随机删除一些cell来形成更多的数据。自然语言处理方面也有一些类似尝试，例如替换近义词，改变词语顺序等。总体思路还是把一些领域知识通过变换，或者噪音的方式进行添加，使得模型更加稳定和通用。

生成数据，CV领域的应用比较多一些，比如可以在仿真场景中训练自动驾驶系统。

Labeling

数据打标方面，需要使用打标工具，制定相应规则来让打标人员来正确高效的进行数据标记。相比使用公司内部人力，crowdsourcing和外包是更常见的方式。其中比较关键的是需要先自己做一些打标工作，了解其中的复杂度，设计好规范和质量检查点。

打标服务公司：FigureEight，Scale.ai

打标软件举例：Hive，Prodigy等。除了用户交互的便利性，还可以使用active learning等技术来提高效率。

Storage

数据存储的各种形式：文件系统，对象存储，数据库，data lake等。

Binary data一般会以object store形式存储。

系统元数据以数据库形式存储较为常见。

非结构化的数据存储在data lake中，到使用时再进行后续处理。

训练时的数据读写一般会在文件系统中进行，提供了较为完整的POSIX API。

对于结构化数据的处理，SQL是最合适的方式。

Feature store在数据存储上一层进行了一些封装，在原始数据基础上做了transformation，后续在使用时可以直接进行调用。Uber，airbnb等实践了这个方案，而netflix反对这个想法，业界看起来还没有较为统一的认知。

Versioning

Level 0: 无版本管理。

Level 1: 用snapshot方式在训练时产生相应的版本。

Level 2: 使用assets和代码混合的方式进行版本管理。大致的做法就是把数据相关的元信息也在代码里进行管理。

Level 3: 使用专门的管理工具来做数据版本管理，例如DVC，Pachyderm，Quill，Dolt等。

另外Delta Lake也是一个值得关注的框架。

Processing

工作流的编排和运行。最简单的做法，使用makefile，但是有很多使用限制。在这方面使用最广泛的框架是Apache Airflow。其它有很多专注在数据科学领域的框架，例如MLflow，metaflow等，为算法实验，问题排查等提供了很多功能支持。

不要过度工程，使用简单的技术手段满足目前的需求，当碰到无法解决的复杂情况时再考虑引入其它工具框架。一旦引入框架，出现问题时不止要排查项目代码，还需要排查工具框架层面的问题 :)

Machine Learning Teams

Overview

管理技术团队有很多挑战，对于机器学习组织，在技术团队困难的基础上还引入了更多的挑战：

机器学习的人才昂贵且稀缺
机器学习团队的角色更加多样化
机器学习项目往往难以制定明确的时间线，产出也有高度不确定性
机器学习领域变化迅速，且更容易积累技术债
作为新兴方向，领导层往往不理解机器学习的运作方式和特点

Roles

ML产品经理：制定任务优先级，推进项目进展
DevOps工程师：部署和运维线上系统
数据工程师：构建data pipeline，数据存储基础，相关监控等
机器学习工程师：训练和部署模型
机器学习研究员：更面向未来的算法技术调研和前沿探索
数据科学家：一个非常广义的职位，总体来说会更偏向算法，数据分析与业务连接部分

X轴是机器学习技术的需求，Y轴是计算机工程技术的需求，圆圈的大小表示沟通/技术协作能力的需求。

这个session的QA部分也有很多信息量。比如构建机器学习组织的时候，优先从哪种类型的角色开始。各个角色的职业发展等。

Team Structure

Ad-Hoc ML：没有专职的ML工程师，以ad-hoc的方式来做一些基础的机器学习应用，很多中小型公司的做法。主要的问题是ML项目缺乏支持，也比较难招聘和留住相关人才。
ML R&D：在研发部门中融入机器学习相关职能岗位，是更大一些的能源，制造，电信行业公司的做法。主要问题，数据难以获取，机器学习项目也很少实际上线产生价值，因此后续投入也比较少。
Embeded ML：在业务/产品部门中融入机器学习职能，大多数的软件科技类公司，金融服务公司的做法。主要问题是比较难吸引和培养出top级别的人才。另外软件工程的管理和发布节奏与机器学习项目的管理发布节奏容易有冲突。而且长周期的项目难以发展。
Independent ML：有独立的ML部门，直接汇报给CEO/CTO层级，有一些大型的金融服务公司会使用这种做法。这种做法的问题是与业务部门的交流合作会有一些gap，需要业务方认可和积极的合作，学习模型的使用方式，给出快速的反馈等。
ML-First：ML部门会专注于有挑战的，长周期投入的项目，而且在各个业务线也会有ML专家寻求算法快速落地，产生业务价值的机会，一般超大型的科技公司或者专注于机器学习领域的创业公司会采用这种方式。主要挑战是这个形式非常难达到，比如招聘足够的人才，公司文化的转变等。

Design choices:

QA里有个彩蛋，想做ML方面的话，读数学博士还是计算机科学博士更好？讲师毫不犹豫的回答：计算机科学。

Managing Projects

机器学习项目的管理太难了。

事先无法评估问题的难度
项目进度往往是非线性的
Research和engineering之间的文化差异
管理层对机器学习的理解有限

上图是一个kaggle比赛的例子，整个比赛中的效果提升大部分是在第一周达到的。

一些解决方案。使用概率性的方式来管理项目，令人震惊！

需要在项目过程中尝试多组方案，每组方案预估成功概率，根据进展及时调整。
评估组员产出时，根据他们的输入，例如做了哪些尝试，得出什么结论。而不是直接用最终结果来评估。
先快速构建起end-to-end的pipeline，再不断迭代。Rules of ML中也强调了这点。
对于管理层，需要对他们进行机器学习项目不确定性的教育。

Hiring

作为manager，需要明确招聘目标的画像，必需的技能点等。建议招聘对机器学习有兴趣的软件工程师。

里面还提到了不少招聘，建联渠道，如何吸引ML人才等，例如：

明确公司的愿景和产品的潜在影响力
在工具链和基础设施方面加大投入提升工作便捷度
构建学习型组织氛围
利用高人才密度来吸引更多的人才

另外对于招聘面试流程，以及求职方面的指导，session中也给出了一些建议，可供参考。

Training and Debugging

Overview

模型开发优化的过程中，80-90%的时间会花在debugging和tuning上，只有10-20%的时间在做implementation。

模型结果的复现很有难度，包括确保实现没有bug，超参的选择，数据的构建，模型是否适合对应的数据集等挑战。

总体策略：

Start Simple

选择从简单的网络结构开始
- 图像问题：LeNet/ResNet
- 序列问题：LSTM/temporal convs
- 其它问题：fully-connected with one hidden layer
选择常见的默认超参
- 优化器：adam with lr 3e-4
- 激活函数：ReLU for MLP and conv nets，tanh for LSTM
- 参数初始化：He init for ReLU，Glorot for tanh
- 先不添加regularization和normalization
添加input normalization
简化问题
- 用少量数据/仿真数据来实验
- 使用固定数量的类别，input size等设置

Debug

5个最常见的bug：

tensor shape错误
输入的预处理不正确
Loss function的输入错误
没有设置正确的train mode
数值处理问题导致出现inf/NaN，例如不正确的exp使用, divide by zero等

实现模型的3个建议：

从一个轻量级的实现开始，一般少于200行代码
使用成熟库中的默认实现，例如Keras中的自带方法
后续再实现复杂的数据pipeline

开发中的第一步，让模型跑起来：

Shape mismatch或casting之类的问题，可以用ipdb, tfdb等方法来做断点调试
Out-of-memory问题，可以逐个排除消耗内存较大的操作来定位
其它问题，Google/StackOverflow驱动开发……

第二步，在一个batch上过拟合：

Error不降反升，可能有地方符号用反了
Error爆炸，一般是数值处理问题，也可能是learning rate太大
Error震荡，先降低learning rate，再看看是不是label跟数据没对上，或者错误的augmentation
Error保持在一个中间状态不下降，可以尝试提高learning rate，移除regularization。后续还可以检查一下loss function的实现，以及数据pipeline的正确性

第三步，与已知结果比较：

例如与一个官方模型实现进行比较，把相同的数据集用到你实现的模型上
也可以尝试与非官方实现比较，不过很多github上的实现都有bug，要注意
或者直接与论文中提到的准确率比较
最后，可以与简单的baseline比较，包括规则，简单模型等

Slides中有更多细节，感觉总结的挺好。

Evaluate

使用经典的bias variance decomposition来对模型进行评估。

Improve

解决under-fitting问题

增加模型复杂度
降低regularization
Error analysis
使用更复杂的架构
超参调优
添加特征

解决over-fitting问题

增加训练数据
添加normalization（当前比regularization更流行）
数据增强
增强regularization
Error analysis
使用更复杂的架构
超参调优
Early-stopping
特征选择
减少模型参数

解决distribution shift问题

分析test-validation error，进而收集/生成更多训练数据
使用domain adaptation技术

Error analysis的时候，需要对各类错误的优先级进行评估排序，这部分跟《Machine Learning Yearning》里内容类似。

最后，可以考虑rebalance数据集。例如validation集上的表现明显比test集好，可能需要考虑重新选择一下validation/test集。

QA中提到，调优RL算法的时候，random seed也应该视为超参中的一部分 :)

Tune

不同的参数对模型效果的敏感度不同：

低敏感度：optimizer，batch size，non-linearity
中敏感度：参数初始化，模型深度，layer parameters，regularization
高敏感度：learning rate，learning rate schedule，loss function，layer size

参数优化的方法：手动调参，grid search，random search，coarse-to-fine search，贝叶斯优化等。

Testing and Deployment

Project Structure

给出了项目结构中不同类型的测试，与传统的测试金字塔里的分类很不一样。

ML Test Score

我的专栏文章中之前也写过这两篇经典的论文，最近几年好像也没有见到新的相关文章出来。

CI/Testing

单元测试，集成测试，持续集成的一些基本概念，与软件工程中基本一致。CD4ML中有更详细的阐述。

一些工具介绍：CircleCI，Travis CI，Jenkins，Buildkite等。

Docker

简单介绍了Docker的使用场景，原理，使用方式等。后面简单提了下容器编排相关的工具，如kubernetes等。

有经验的同学可以直接跳过。

Web Deployment

一般模型预测会以RESTful API的方式对外进行服务。几种部署方式：

在虚拟机上部署，通过添加intance来scale
在container上部署，通过k8s之类的编排软件来scale
通过serverless的方式部署（AWS Lambda，Google Cloud Functions，Azure Functions），自动扩展，自带负载均衡，监控等服务
通过模型服务来部署（TF Serving，Model Server for MXNet，Clipper，Seldon或其它SaaS服务）

如果使用CPU inference，一般会使用Docker部署或者serverless形式。

如果使用GPU inference，TF Serving，Ray Serve之类的模型服务中提供adaptive batching等功能会很有用。

Monitoring

这一节同样参考《The ML Test Score》。

Serving systems, training pipelines, and input data，这几块都需要监控。出问题时发出alarm，并记录下来方便后续调查调优。
所有可以被日志记录的内容，都可以被监控，所以当你设计info/warning/error log时，同时考虑下是否要触发监控告警机制。
数据分布监控方面的现成服务或方案比较少。
除了技术层面的监控，对于业务，终端用户的监控同样非常重要。
Closing the Flywheel，一个需要思考的点。

Hardware/Mobile

在mobile上部署模型会遇到计算资源受限的问题，一般解决方法：减小模型大小（类似MobileNet），quantizing weights，知识蒸馏（例如DistillBERT）等。

一些工具框架介绍：TensorFlow Lite，PyTorch Mobile，CoreML，MLKit，FritzAI等。ONNX可以作为中间层，再部署到各种硬件平台上。对于嵌入式系统，最好的解决方案是NVIDIA for Embeded。

Research Areas

Pieter Abbeel介绍了few-shot learning，RL，imitation learning，domain randomization，NAS，unsupervised learning等几个方面的话题，主要还是集中在他比较擅长的强化学习和机器人应用领域。不过没看出跟课程主题之间的特别关系，可能主要是扩展一下大家的视野，尤其是有些问题通过了解学术领域的解决思路，SoTA水平等，对于解决工业界的问题也有一定借鉴意义。另一方面是建立起两者之间的连接，让工业界的同学也大致了解如何follow学术界的一些研究思路和最新进展，给出了一些参考建议。

Labs

一共有8个lab，感兴趣的同学可以跟着一起深入了解实践一下。

Guest Lectures

邀请了十位业界大咖，例如阿里的

@贾扬清

大神，fast.ai的Jeremy Howard，Tesla的Andrej Karpathy等来给大家做演讲。每个session在40-60分钟，大致感受如下：

Xavier Amatriain (Curai) 之前在Netflix，Quora工作过，分享的内容还是相当有趣且实用的，大多数还给了相关论文做进一步参考，推荐一看。印象比较深的一点是举了一个学术界的数据集从提出到应用到工业界，平均要3年，而算法模型从提出到应用到工业界，平均要18年。
Chip Huyen (Snorkel) 主要介绍了算法面试相关的内容，挺实在，值得一看。讲座中举了个比较有意思的数据，统计公司on-site和offer的比例，以及candidate最后接offer的概率。
Lukas Biewald (Weights & Biases) 作者的背景是之前FigureEight的创始人，讲座中有不少内容强调了数据的重要性，以及算法与人工结合的实践。很多内容在Xavier的session里也有提到。
Jeremy Howard (fast.ai · Making neural nets uncool again) 前面重点介绍了augmented ML的概念，结合人类和模型的长处来更好的构建模型。后面的部分主要介绍了fast.ai库中提供的各种高效的训练神经网络的手段，包括test-time augmentation，progressive resizing，1cycle，AdamW，gradient clipping等。
Richard Socher (Salesforce) 主要介绍了decaNLP，用QA形式来统一多种NLP任务的benchmark框架，另外也介绍了他们的MQAN网络结构。比较适合对NLP感兴趣的同学观看学习。
Yangqing Jia (Alibaba) 介绍了深度学习框架的发展历史，框架特性，选择的一些思考框架。后续扩展到应用层，library层，runtime, compilers, optimizers层等进行了整体的介绍。最后总结了一些行业趋势和思考，例如实验管理方面的投入，将更多的计算机科学方面的思想应用到机器学习领域等。
Andrej Karpathy (Tesla) 介绍了他的software 2.0的概念，利用数据，指定目标后，通过训练来生成可以执行的程序。前半部分讲了他在Tesla碰到的各种数据部分的挑战，后面一部分对software 2.0的IDE，github等做了一些畅想。
Jai Ranganathan (KeepTruckin) 介绍了他在Uber时负责的COTA平台中使用机器学习技术的end-to-end案例，包括探索，问题定义，到后面的模型开发，上线，监控等环节。跟课程内容还挺贴近的。

你可能感兴趣的:(人工智能竞赛,人工智能,全栈式深度学习,自然语言处理,深度学习,机器学习,pytorch,神经网络)

求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
NGS测序基础梳理02-簇生成（Cluster Generation）及flow cell介绍 qq_21478261 #生物信息生物信息学
本文图解Illumina测序平台，flowcell表面簇生成（ClusterGeneration）过程。写作时间：2020，有问题可留言或者我的公众号。本文将了解到什么？1flowcell2簇生成为何要进行簇生成？簇生成步骤1）文库与flowcell表面P5杂交与互补链合成2）双链变性3）桥式PCR扩增4）反链切除5）DNA链3'封闭参考资料：1flowcell为何要先介绍flowcell？因为簇
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
Topview Avatar 2深度实测：AI数字人带货的新高度，还是又一个营销噱头？神码小Z AI工具人工智能
在AI数字人赛道越来越卷的今天，各家产品都在宣传自己的"独门秘技"。最近，TopviewAI推出的Avatar2引起了我的注意——号称突破了产品尺寸限制，实现了"万物皆可带"。作为一个经常需要制作营销视频的内容创作者，我决定亲自上手测试一番，看看这款工具是否真的像宣传的那样强大。TopviewAvatar2是什么？革命性升级还是渐进式改良？TopviewAvatar2是TopviewAI推出的第二
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
GoView 强势入驻 GitCode：拖拽低代码，打造高颜值数据大屏 GitCode 代码君 gitcode 低代码开源
信息可视化时代，数字大屏日益成为展示核心KPI、运营状态、监控预警的主流形式。然而，用传统方式开发一个定制化数字大屏需要解决多少问题？1.繁复的数据源集成，各种不同的协议和格式……2.让人晕头转向的可视化逻辑，调动艰难的样式、布局、动画，和往往难以统一的风格3.牵一发而动全身的代码结构，就想换个主题色结果开启的全局CSS大冒险……现在，一个开源项目即可搞定上述问题——拖拽式低代码数字可视化平台Go
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Spring WebFlux 响应式编程原理与实战指南
SpringWebFlux响应式编程原理与实战指南一、技术背景与应用场景随着微服务与高并发的迅速发展，传统的阻塞式编程模型在处理大量并发请求时容易导致线程资源耗尽、响应延迟增高。SpringWebFlux基于ReactiveStreams规范，通过非阻塞、背压机制，实现高吞吐、低延迟的Web服务。典型应用场景包括：实时数据推送：WebSocket或Server-SentEvents场景。高并发AP
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep