人工智能学家

Jeff Dean | 回顾2021：除了超大的AI模型，谷歌还有啥？

来源：新智元

作者：Jeff Dean 谷歌AI掌门人

新年伊始，谷歌AI掌门人Jeff Dean的年度总结「虽迟但到」，这篇万字长文系统回顾了过去一年来机器学习领域的五大趋势。除了超大AI模型，谷歌去年还做了啥？

2021年，谷歌在机器学习领域可谓是十分高产。毕竟，这帮人在NeurIPS 2021上就投了177篇论文。

1月11日，Jeff Dean终于用一篇万字长文完成了总结。

趋势 1：功能更强大、

通用的机器学习模型

研究人员正在训练出比以往任何时候更大、功能更强大的机器学习模型。近几年，语言领域的模型规模迅速增长，参数数量从百亿级（例如110亿参数的T5模型）发展到现在的数千亿级（如 OpenAI 的 1750亿参数的GPT-3模型和 DeepMind 的 2800亿参数的Gopher模型。在稀疏模型方面，如Google的GShard模型参数为6000亿，GLaM模型参数更是达到了1.2万亿）。

数据集和模型规模的扩大，使得各种语言任务的准确性显著提高，标准自然语言处理（NLP）基准任务性能获得全面改进。

这些高级模型中，很大一部分模型专注于书面语言的单一但重要的模态，并在语言理解基准和开放式会话能力方面达到了最先进的结果。此外，这些模型可以在训练数据相对较少的情况下泛化到新的语言任务中，有时甚至不需要新的训练样本。比如Google的的LaMDA模型就可以进行开放式对话，并在多轮对话中保留重要的上下文语境信息。

用于图像识别和视频分类的Transformer在许多基准测试中取得了SOTA。与单独的视频数据相比，在图像数据和视频数据上共同训练模型可以提高视频任务的性能。

我们为图像和视频Transformer开发了稀疏的轴向注意力机制，为视觉Transformer模型找到了更好的标记图像的方法，并通过研究视觉Transformer方法与卷积神经网络相比如何运作，提高了对视觉Transformer的理解。Transformer与卷积操作的结合，在视觉以及语音识别任务中均表现出明显优势。

生成式模型的输出也在大幅提高。尤其是图像生成模型。最近的模型已经具备这样的能力：只给定一个类别的逼真图像，模型就可以对低分辨率的图像进行「填充」，生成自然的高分辨率对应图像，甚至可以生成自然的任意尺度的自然场景。图像甚至可以被转换为一串离散的标记，然后用自回归生成模型实现高精度合成。

除了先进的单模态模型外，大规模的多模态模型开始兴起。它们可以接受多种不同的输入模式（语言、图像、语音、视频），并且在某些情况下产生不同的输出模式，比如从描述性句子或段落生成图像，或用人类语言描述图像的内容。

基于自然文本描述生成的图像

与现实世界一样，在多模态数据中有些东西更容易学习。因此，将图像和文本配对可以帮助完成多语言检索任务，以及更好地理解如何将文本和图像输入配对，可以为图像字幕任务带来更好的结果。同样，对视觉和文本数据的联合训练也有助于提高视觉分类任务的准确性和鲁棒性，而对图像、视频和音频任务的联合训练可以提高所有模态的泛化性能。

基于视觉的机器人操作系统示例，可以完成从「将葡萄放进碗」到「将瓶子放进托盘」的任务泛化

这些模型一般都是使用自监督学习方法训练的。自监督学习允许大型语音识别模型以匹配之前的语音搜索自动语音识别（ASR）基准准确度，同时仅使用 3% 的带注释训练数据。这可以大大减少为特定任务启用机器学习所需的工作量，并使在更具代表性的数据上训练模型变得更容易。

所有这些趋势都指向训练功能强大的通用模型的方向，这些模型可以处理多种数据模式并解决数千或数百万个任务。通过构建稀疏性，以便为给定任务激活的模型的唯一部分是那些已经为其优化的部分，这些多模态模型可以变得高效。

在接下来的几年中，我们将在称为Pathways的下一代架构和总体努力中追求这一愿景，并有望望在这一领域看到实质性进展。

趋势 2：机器学习模型效率持续提升

计算机硬件设计、机器学习算法和元学习研究的进步推动机器学习模型的效率和性能提升。过去一年里，机器学习模型从训练和硬件、到架构的各个组件，都实现了效率的不断优化，同时保持整体性能不降低，甚至提升，大大降低了计算成本，提升了效率。

机器学习加速器性能持续提升

每一代机器学习加速器都在前几代的基础上实现性能提升，去年，谷歌发布了TPUv4 系统，这是谷歌的第四代张量处理器，比 TPUv3 的性能测试结果提高了2.7 倍。

每个 TPUv4 芯片的峰值性能是 TPUv3 芯片的约 2 倍，每个 TPUv4 pod 的规模为 4096 个芯片（是 TPUv3 pod 的 4 倍），每个 pod 的性能约为 1.1 exaflops。拥有大量芯片并通过高速网络连接在一起的 Pod 可以提高大型模型的效率。移动设备上的机器学习能力也在大幅提升。Pixel 6 手机采用全新的Google Tensor 处理器，该处理器集成了强大的机器学习加速器，以更好地支持重要的设备端功能。

机器学习编译和负载优化性能持续提升

即使硬件不变，编译器的改进和机器学习加速器系统软件的其他优化也可以大大提高效率。

《A Flexible Approach to Autotuning Multi-pass Machine Learning Compilers》展示了如何使用机器学习来执行编译设置的自动调整，以获得 5-15% 的全面性能提升（有时甚至高达2.4 倍改进）用于同一底层硬件上的一套机器学习程序。

在上个月谷歌的题为《神经网络的通用和可扩展并行化》的博客中，描述了一种基于XLA 编译器的自动并行化系统，该系统能够将大多数深度学习网络架构扩展到加速器的内存容量之外，并已应用于许多大型模型，例如GShard-M4、LaMDA、BigSSL、ViT、MetNet-2和GLaM，在多个领域实现了SOTA。

通过在 150 个 ML 模型上使用基于 ML 的编译器自动调整实现端到端模型的加速

人类驱动的更高效模型架构的发现

模型架构的持续改进大大减少了为许多问题实现给定精度水平所需的计算量。Transformer架构能够提高几多个 NLP 和翻译基准的最新技术水平，大大降低计算量，同样，尽管使用的计算量比卷积神经网络少 4 到 10 倍，但Vision Transformer能够在许多不同的图像分类任务上实现最先进的结果。

机器驱动的更高效模型架构的发现

神经架构搜索（NAS）可以自动发现对给定问题更有效的新机器学习架构。

NAS 的一个主要优点是可以大大减少算法开发所需的工作量，因为它只需要每个搜索空间和问题域组合的一次性工作量。此外，虽然执行 NAS 的初始工作在计算上可能很昂贵，但由此产生的模型可以大大减少下游研究和生产设置中的计算，从而大大降低总体资源需求。

最近发现了一种更高效的NAS架构，称为Primer（也已开源），与普通的 Transformer 模型相比，它可以将训练成本降低75%。

NAS 还被用于在视觉领域发现更高效的模型。EfficientNetV2模型架构是一个神经结构的搜索，对模型的准确性，模型的大小，并且训练速度联合优化的结果。

在 ImageNet 基准测试中，EfficientNetV2 将训练速度提高了 5 到 11 倍，同时比以前的最先进模型显著减小了模型大小。

使用稀疏性

稀疏性，即模型具有非常大的容量，但对于给定的任务、示例或令牌，只有模型的某些部分被激活，这是又一个可以明显提高效率的算法进步。

2017 年，我们引入了稀疏门控混合专家层，该层在各种翻译基准上展示了更好的结果，同时计算量比以前最先进的密集 LSTM 模型下降了90%。

最近，Switch Transformers实现了将混合专家风格的架构与 Transformer 模型架构的结合，与密集的T5-Base Transformer 模型相比，训练效率提高了 7 倍。GLaM模型将转换器和混合专家风格的层结合起来，在 29 个基准测试中平均超过 GPT-3 模型的准确性，而训练所需的能量减少了三分之二，推理计算量减少了一半。

稀疏性的概念也可以用于降低核心 Transformer 架构中注意力机制的成本。

在模型中利用稀疏性，是一种在计算效率方面具有非常高的潜在回报的方法，目前我们在这个方向上的尝试才刚刚开始。

趋势 3：机器学习造福个人和社区

随着机器学习模型、算法和硬件的创新，移动设备已经能够持续有效地感知周围的环境。这些技术进步提高了机器学习技术的可用性和易用性，也提高了算力。这对于手机拍照、实时翻译等流行功能至关重要。同时，用户也能获得更加个性化的体验，并加强了隐私保护。

现在，人们比以往任何时候都依靠手机摄像头来记录日常生活。机器学习技术不断提升手机摄像头的功能，拍出更高质量的图像。

比如 HDR+、提升在极弱光下拍照的能力、更好地处理人像，拍摄出更符合摄影师视觉的照片。Google Photos 现在提供的基于机器学习的强大工具进一步改进拍摄品质。

HDR+ 可以将多张曝光不足的原始图像进行合并，合并后的图像减少了噪点并增加了动态范围，获得更高质量的最终图像（右）

手机除了拍照之外，还是重要的实时沟通工具，用户可以使用实时翻译和实时字幕进行电话通话。由于自监督学习等技术的进步，语音识别的准确性不断提高，对于重音、嘈杂的条件或重叠语音的环境以及多种语言都有明显改善。

由于文本—语音合成技术的进步，信息能够更容易跨越形式和不同语言的障碍。在 Lyra 语音编解码器和更通用化的 SoundStream 音频编解码器中，研究人员将机器学习与传统编解码器方法相结合，能够可靠地传达更高保真度的语音、音乐和其他声音。

Duplex 技术的进步，让自动呼叫筛选等功能更加强大，日常交互变得更自然。即使是用户可能经常执行的简短任务，也已通过智能文本选择等工具得到改进。该工具会自动选择电话号码或地址等实体，便于复制粘贴。

最近的研究表明，用户是否「凝视」屏幕，是衡量精神疲劳的重要生物标志物。

Screen Attention机制可防止手机屏幕在用户注视时变暗。机器学习技术还支持了更多确保人员和社区安全的新方式，比如对可能的网络钓鱼攻击的警报、更安全的路由检测手段等。

鉴于这些新功能背后的数据具有潜在的敏感性，因此必须将它们默认设计为私有的。它们中的许多都在Android的私有计算核心内运行——这是一个与操作系统的其余部分隔离的开源安全环境。

Android确保在私有计算核心中处理的数据不会在用户未采取操作的情况下共享给任何应用程序，还要阻止私有计算核心内的任何功能直接访问网络。研究人员利用包括联邦学习在内的隐私技术，联合分析和私人信息检索，在确保隐私的同时实现学习。

「联邦重建」是一种局部联邦学习新技术

这些技术对于发展下一代计算和交互范式至关重要，个人或公共设备可以在不损害隐私的情况下学习并有助于训练世界的集体模型。

过去一段时间里，机器学习系统的交互变得更加直观，更像是一个社交实体而不是机器。只有对目前的技术堆栈（从边缘到数据中心）进行深度变革，才能广泛而公平地访问这些智能接口，更好地支持神经计算。

趋势 4：机器学习在科学、

健康和可持续发展方面的进步

近年来，机器学习在基础科学领域的影响越来越大，从物理学到生物学，甚至是医学。

随着ML变得更加强大和完善，它在现实世界中的应用范围和影响力也将持续扩大，为解决一些最具挑战性的问题提供帮助。

大规模的计算机视觉应用

过去十年来，计算机视觉的进步使计算机能够被用于不同科学领域的各种任务。在神经科学领域，自动重建技术可以从高分辨率的脑组织薄片的电子显微镜图像中恢复脑组织的神经连接结构。去年，谷歌与哈佛大学的Lichtman实验室合作，分析了脑组织样本，并制作了人类大脑皮层中突触连接的第一个大规模研究，跨越了大脑皮层各层的多种细胞类型。这项工作的目标是产生一种新的资源，以协助神经科学家研究人类大脑惊人的复杂性。

一个成年人类大脑中大约860亿个神经元中的6个神经元

另外，谷歌提出了一种基于深度学习的天气预报方法。使用卫星和雷达图像作为输入，并结合其他大气数据，从而让产生的天气和降水预报比传统的基于物理学的模型更准确，预报时间长达12小时。不仅如此，机器学习还可以比传统方法更快地产生更新的预测，这在极端天气的时候可能是至关重要的。

2020年3月30日科罗拉多州丹佛上空0.2毫米/小时降水的比较（左：来自MRMS的基准真相；中：由MetNet-2预测的概率图；右：基于物理学的HREF模型预测的概率图。）

MetNet-2能够在预测中比HREF更早地预测风暴的开始，以及风暴的起始位置，而HREF错过了起始位置，但很好地捕捉了它的增长阶段。将计算机视觉技术应用于卫星图像可以帮助识别大陆范围内的建筑边界，进而提供自然灾害后的快速损害评估。

目前，谷歌已经在「开放建筑」数据集中开源，其中包含了5.16亿栋建筑的位置和足迹，覆盖了非洲大陆的大部分地区。

卫星图像中建筑物的分割实例（左：原始图像；中：语义分割，每个像素都有一个置信度分数，即它是建筑物还是非建筑物；右图：实例分割，通过阈值处理和将相连的组件组合在一起获得。）

这些案例中的一个共同主题是，ML模型能够在分析现有视觉数据的基础上高效、准确地执行专门任务，支持高影响的下游任务。

自动设计空间探索

让ML算法以自动化的方式探索和评估一个问题的设计空间，也在许多领域产生了出色结果。

比如，一个基于Transformer的自动编码器学会了创建美观并实用的文档布局，同样的方法可以扩展到家具装修的布局探索上。

变量Transformer网络（VTN）模型，能够提取布局元素之间的有意义的关系，以生成现实的合成文件

或者是让机器学习自己去探索计算机游戏的规则，通过调整设计来提高游戏的可玩性，帮助人类游戏设计师能够更快地创建优秀的游戏。

此外，谷歌还将ML用于快速创建ASIC芯片的设计布局，不仅将时间从几周缩短到几小时，而且甚至比人类专家给出的结果更好。在即将推出的TPU-v5芯片的设计中，就利用了这种自动布局方法。

在健康方面的应用

除了推动基础科学的发展，ML还可以更广泛地推动医学和人类健康的进步。以基因组学领域为例，计算从一开始就对基因组学很重要，但ML增加了新的能力并颠覆了旧的模式。

对于新开发的测序仪，它们更准确、更快速，但也带来新的推断挑战。谷歌发布的开源软件DeepConsensus以及与UCSC合作的PEPPER-DeepVariant，用最先进的信息学支持这些新仪器。

DeepConsensus的Transformer架构示意图，它可以纠正测序的错误

在处理测序仪数据之外，由广泛的表型和测序个体组成的大型生物库可以彻底改变理解和管理疾病遗传倾向的方式。其中，谷歌提出的DeepNull方法更好地利用大型表型数据进行遗传发现。

生成大规模的解剖学和疾病特征量化的过程，以便与生物库中的基因组数据相结合

正如ML可以看到基因组学数据的隐藏特征一样，它也可以从其他健康数据类型中发现新的信息和见解。疾病的诊断往往是关于识别一个模式，量化一个相关性，或识别一个更大类别的新实例，而这些都是ML擅长的任务。

ML辅助的结肠镜检查程序就是一个特别有趣的例子。在这一领域，谷歌证明了ML可以帮助检测难以捉摸的息肉。在与耶路撒冷Shaare Zedek医疗中心的合作中，平均每次手术可以检测到一个本来会被遗漏的息肉，使每次手术的错误警报少于4次。

A：一般异常情况；B：结核病；

C：COVID-19的真阳性，真阴性，假阳性，假阴性的胸部X光片样本。

在每张CXR上，红色的轮廓表示模型集中识别异常的区域，黄色的轮廓指的是由放射科医生识别的区域。另一个雄心勃勃的医疗保健计划，Care Studio，使用最先进的ML和先进的NLP技术来分析结构化数据和医疗笔记，在正确的时间向临床医生提供最相关的信息。

此外，现在谷歌也将ML的应用集成到智能手机当中。

例如手机摄像头评估心率和呼吸率，在不需要额外硬件的情况下，让用户更好地了解夜间的健康状况。

用于非接触式睡眠传感的定制ML模型自动计算用户存在的可能性和清醒状态（醒着或睡着）的概率

趋势 5：对机器学习更深更广的理解

随着ML在技术产品和社会中被更广泛地使用，研究人员必须确保技术的公平和公正，并且使其能够惠及到所有人。其中一个重点领域是基于用户在在线产品中活动的推荐系统。

由于这些推荐系统通常由多个不同的组件组成，理解它们的公平性往往需要对单个组件以及单个组件在组合在一起时的行为进行观察。

此外，当从隐含的用户活动中学习时，推荐系统以无偏见的方式学习也很重要。因为从以前的用户所展示的项目中学习的直接方法表现出众所周知的偏见。

https://research.google/pubs/pub49284/

与推荐系统一样，背景知识在机器翻译中也很重要。因为大多数机器翻译系统都是孤立地翻译单个句子，从而让与性别、年龄或其他领域有关的偏见进一步加强。

去年谷歌发布了一个数据集，以研究基于维基百科传记的翻译中的性别偏见。

https://storage.googleapis.com/gresearch/translate-gender-challenge-sets/Readme.html

部署机器学习模型的另一个常见问题是分布性转变：如果模型所训练的数据的统计分布与模型作为输入的数据的统计分布不一样，那么模型的行为有时会无法预测。

对此，谷歌采用了Deep Bootstrap框架来比较一个模型在现实世界和「理想世界」中的表现，前者有有限的训练数据，后者有无限的数据。由此可以帮助开发出能更好地概括新环境的模型，并减少对固定训练数据集的偏见。

https://arxiv.org/pdf/2010.08127.pdf

尽管关于ML算法和模型开发的工作得到了极大的关注，但数据收集和数据集的策划往往得到的关注较少。

这是一个重要的领域，因为训练ML模型的数据可能是下游应用中偏见和公平问题的潜在来源。而分析ML中的这种数据级联可以帮助评估整改项目的生命周期，从而对结果产生实质性影响。

不同颜色的箭头表示各种类型的数据级联，

每一种级联通常起源于上游，在ML开发过程中复合，并体现在下游

更好地理解数据的总体目标是ML研究的一个重要部分。因为错误标记的数据或其他类似的问题会对整个模型行为产生巨大的影响。

谷歌为此建立了「了解你的数据」（Know Your Data）工具，以帮助ML研究人员和从业人员更好地了解他们的数据集的属性。

Know Your Data显示了描述吸引力的词和性别之间的关系

同样，了解基准数据集的使用动态也很重要，因为它们在ML作为一个领域的组织中发挥着核心作用。尽管对单个数据集的研究已经越来越普遍，但对整个领域的数据集使用动态的研究仍然没有得到充分探索。

因此谷歌发表了第一个关于数据集创建、采用和重用动态的大规模经验分析。这项工作为实现更严格的评估，以及更公平和社会化的研究提供了深入的见解。

https://arxiv.org/pdf/2112.01716.pdf

创建更具包容性和更少偏见的公共数据集是帮助为每个人改善ML领域的一个重要途径。

2016年，谷歌发布了开放图像数据集，这是一个约900万张图像的集合，其中有横跨数千个对象类别的图像标签和600个类别的注释。去年，谷歌在Open Images Extended集合中引入了More Inclusive Annotations for People（MIAP）数据集。该集合中每个注解都标有公平性相关的属性，包括感知的性别和年龄范围。

https://storage.googleapis.com/openimages/web/extended.html

解决网上各种形式的滥用行为，如有毒语言、仇恨言论和错误信息，是谷歌的一个核心优先事项。

能够可靠、高效、大规模地检测出这些形式的滥用行为，对于确保我们的平台安全，以及避免通过语言技术以无监督的方式从在线话语中学习到这些负面特征的风险，都是至关重要的。

谷歌通过Perspective API工具开创了这一领域的工作，但大规模的检测所涉及的细微差别仍然是一个复杂的问题。

https://www.perspectiveapi.com/case-studies/

在最近的工作中，谷歌与不同的学术伙伴合作，引入了一个全面的分类法来推理网络仇恨和骚扰的变化情况。

此外，通过定性研究和网络层面的内容分析，谷歌的Jigsaw团队与乔治华盛顿大学的研究人员合作，研究了虚假信息是如何在社交媒体平台上传播的。

https://medium.com/jigsaw/hate-clusters-spread-disinformation-across-social-media-995196515ca5

另一个潜在的担忧是，ML语言理解和生成模型有时也会产生没有适当证据支持的结果。为了解决问题回答、总结和对话中的这个问题，谷歌开发了一个新的框架来衡量结果是否可以归于特定的来源。

https://arxiv.org/pdf/2112.12870.pdf

模型的互动分析和调试仍然是负责任地使用ML的关键。

谷歌利用新的能力和技术更新了语言可解释性工具，包括对图像和表格数据的支持，从之前What-If工具中延续下来的各种功能，以及通过用概念激活矢量测试技术对公平性分析的支持。

https://pair-code.github.io/lit/

此外，ML系统的可解释性也是一个重点问题。

在与DeepMind的合作中，谷歌在理解人类象棋概念在自监督训练的AlphaZero象棋系统中的获得方面取得了进展。

探索AlphaZero在下棋方面可能学到的东西

随着ML模型变得更有能力并在许多领域产生影响，保护ML中使用的私人信息就变得尤为重要了。

而谷歌在最近的一些工作中，既强调了训练数据有时可以从大型模型中提取，又指出了如何在大型模型中保障隐私。

https://arxiv.org/pdf/2108.01624.pdf

此外，谷歌也在利用其他的ML技术来确保差异化的隐私，例如私有聚类、私有个性化、私有加权采样等。

差异化私有聚类算法

结论

研究通常是一个持续多年的旅程。而谷歌近几年的研究工作已经逐渐开始对其产品，甚至整个世界产生影响了。

例如，在TPU等ML硬件加速器以及TensorFlow和JAX等软件框架的投资已经取得了成果，而ML模型在谷歌的产品和功能中越来越普遍。

对创建Seq2Seq、Inception、EfficientNet和Transformer的模型架构的研究或批量规范化和蒸馏等算法研究正在推动语言理解、视觉、语音和其他领域的进展。

Jeff Dean表示，现在是机器学习和计算机科学真正令人兴奋的时代。计算机通过语言、视觉和声音理解周围世界并与之交互的能力在不断提高。

由此，也开辟了一个让计算机帮助人类完成现实世界工作的全新疆域。（完）

参考资料：

https://ai.googleblog.com/2022/01/google-research-themes-from-2021-and.html

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）大脑研究计划，构建互联网（城市）大脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

你可能感兴趣的:(大数据,编程语言,python,计算机视觉,神经网络)

Python代理池的构建与应用：实现高效爬虫与防封禁策略程序员威哥 python 爬虫开发语言
在进行大规模网络数据抓取时，IP封禁是最常见的反爬虫手段之一。为了应对这一挑战，代理池成为了一个重要工具。通过构建代理池，爬虫程序可以随机切换代理IP，避免同一IP被频繁访问而导致封禁，确保数据抓取任务的稳定性和持续性。本文将详细介绍如何使用Python构建一个高效的代理池，并结合实际应用场景，讲解如何使用代理池提升爬虫的抓取能力和防封禁策略。一、代理池的工作原理代理池的基本工作原理是，爬虫请求时
Python爬虫实战：用Tushare和Baostock爬取股票历史数据及K线图与技术指标计算
在金融数据分析和量化交易中，股票历史数据的获取是进行技术分析、回测和策略研究的第一步。传统上，投资者需要依赖付费数据服务，然而如今，借助Python强大的爬虫工具和开源数据接口，我们能够轻松地爬取免费的历史股票数据，并结合K线图与技术指标来进行深入分析。Tushare和Baostock是两个非常流行的开源金融数据接口。Tushare提供了丰富的国内外金融数据，特别是A股市场的历史数据和实时数据，而
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现1.背景介绍1.1图像处理的重要性在当今数字时代,图像处理技术在各个领域都扮演着重要角色。无论是在计算机视觉、模式识别、医学影像、遥感探测还是多媒体处理等领域,图像处理都是不可或缺的核心技术。通过对图像进行预处理、增强、分割、特征提取等操作,可以从图像中获取有价值的信息,为后续的分析和决策提供支持。1.2图像倾斜问题及其影响在实际应用中,由于
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
Python_计算两个省市之间的直线距离_2506 夏天里的肥宅水 PYTHON python spring 开发语言
更新代码上一版链接importpandasaspdimporttimeimportpickleimportosimportsysfromgeopy.geocodersimportNominatimfromgeopy.distanceimportgeodesicfromtqdmimporttqdm#ConfigurationINPUT_FILE=r"距离.xlsx"#输入文件路径OUTPUT_FIL
python中的*args 和 **kwargs Hi_kenyon python python
简单来说，它们允许一个函数接收不定数量的参数。这在我们预先不知道会传递多少个参数给函数时非常有用。*args(任意数量的位置参数)*args用于在一个函数中接收任意数量的位置参数(positionalarguments)。当你在函数定义中使用*args时，Python会将所有传入的多余的位置参数收集到一个元组(tuple)中。这个名字args只是一个约定俗成的惯例(arguments的缩写)，你也
用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
Python的一点基础教程------文件读写卡提西亚 python 开发语言
最近在看大佬写的Python教程自学,但是感觉有点头痛,因为大佬讲了一些底层的结构和原理,但是又没那么详细,然后作为一个初学者自学的情况下,看的很费劲.看完就有感而发,想写一篇更基础的教程,教会大家怎么去用它,尽量少的去讲原理.但是当然,你也需要有一定的编程语言基础,了解基本的语法和函数等功能.正所谓师傅领进门,修行在个人,有时候我们学了一个东西,如果觉得很有趣,自然就会去了解关于它的更多信息,但
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
动手学Python：从零开始构建一个“文字冒险游戏” network爬虫 python python 开发语言
动手学Python：从零开始构建一个“文字冒险游戏”大家好，我是你的技术向导。今天，我们不聊高深的框架，也不谈复杂的算法，我们来做一点“复古”又极具趣味性的事情——用Python亲手打造一个属于自己的文字冒险游戏（TextAdventureGame）。你是否还记得那些在早期计算机上，通过一行行文字描述和简单指令来探索未知世界的日子？这种游戏的魅力在于它能激发我们最原始的想象力。而对于我们程序员来说
鸿蒙HarmonyOS应用开发 | 深入解析 HarmonyOS Next 中的仓颉语言一键难忘 harmonyos 华为仓颉语言鸿蒙 HarmonyOS
鸿蒙HarmonyOS应用开发|深入解析HarmonyOSNext中的仓颉语言在HarmonyOSNext的开发中，仓颉语言作为一种强大的编程语言，为开发者带来了全新的开发体验。本文将深入探讨仓颉语言的特点，并通过代码实例展示其在HarmonyOSNext开发中的应用。一、仓颉语言简介仓颉语言是专为HarmonyOSNext设计的编程语言，它具有简洁、高效、易读易写等特点。仓颉语言借鉴了多种现代编
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
树莓派中 Python+opencv打开摄像头 68lizi 光电设计 python
树莓派中Python+opencv打开摄像头注意不要使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)，我在树莓派使用这个的时候会报错，在windows不会报错，具体原因不清楚cap=cv2.VideoCapture(0)#使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)会报错whileTrue:status,img=cap.read()i
python实现读取文件的指定某行内容 Fitz1318 Python3学习 python
python实现读取文件的指定某行内容最近有一个需求就是读取一个文件中的指定某行的内容，现将方法记录如下importlinecache#这里填写你自己的文件位置和行号text=linecache.getline("../TestFile/test_C1.json",2)print(text)
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
Go语言--包(Package) yunfan188 #Go语言学习笔记 go go语言 golang package
1命名空间和作用域1.1命名空间命名空间（Namespace）在编程语言中常用来表示标识符（identifier）的可见范围。编程语言借助命名空间来解决标识符不能同名的问题，命名空间实际上相当于给标识符添加了标识前缀，使标识符变得全局唯一。另外，命名空间是程序组织更加模块化，降低了程序内部的耦合性。一个标识符可以在多个命名空间中定义，它在不同命名空间中的含义是不互相干的。新的命名空间中可定义任意的
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
程序化交易系统中如何精准获取MACD、KDJ、BOLL等基础指标的值？股票程序化交易接口量化交易股票API接口 Python股票量化交易程序化交易系统 macd指标 kdj指标 boll指标股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>基础指标在程序化交易系统中的重要性基础指标对交易决策的指导意义MACD、KDJ、BOLL等基础指标在程序化交易系统中扮演着重要角色。MACD可以帮助判断市场的趋势和买卖信号，通过分析其快线和慢线的交叉情况，能为投资者提供入场和出场的参
股票程序化交易软件如何选择？这些要点你知道吗股票程序化交易接口量化交易股票API接口 Python股票量化交易区块链股票程序化交易软件功能特性稳定性成本股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>了解软件功能特性基础交易功能基础交易功能是股票程序化交易软件的核心。它应具备快速下单、撤单等基础操作能力。比如在行情快速变化时，能让投资者迅速抓住机会下单，或者及时撤单避免损失。软件的交易界面要简洁明了，方便投资者操作。还应支持多种交
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python实战：自动在知乎回答点赞并采集内容的高阶爬虫教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 okhttp 学习
✨写在前面：为什么做知乎自动化操作？知乎作为中国领先的知识问答平台，拥有大量结构化内容。对于研究舆情分析、情绪识别、用户画像，甚至产品舆情反馈采集的用户来说，如何自动获取知乎内容并进行交互行为（如点赞、回答），是一个非常实用的能力。本文将手把手带你用Python完成以下目标：✅自动登录知乎✅自动搜索某个关键词下的热门问题✅自动点赞高质量回答✅自动采集回答内容（文本、点赞数、评论数等）✅自动保存为本
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =