读芯术

在人工智能的角逐中，仿真数据是重要的平衡力量吗？

全文共6085字，预计学习时长18分钟

图源：Unsplash

人工智能的角逐

人类正处于争夺人工智能统治地位的激烈角逐之中。美国五大科技公司（谷歌、亚马逊、脸书、苹果和微软）正将大量资金投入到图像识别、语音识别和情感分析等领域的研究和开发之中，并以前所未有的速度对人工智能技术初创公司进行收购。

在中国，百度、阿里巴巴、腾讯和小米在政府的支持下，正在迅猛发展，以期望在2025年成为人工智能领域的全球领导者。这一新型的军备竞赛尤为紧张激烈，因为似乎结局会是赢家垄断人工智能行业，通吃一切（这点下文会详细说明）。

为何数据至关重要

人工智能的进步依靠三个重要部分共同协作：算法创新、计算能力和数据。最先进的深度学习算法是推进人工智能技术发展的首个重要部分。随着大量财力流入学术实验室和大型科技公司，这些算法正在迅速完善。自2010年以来，最直接的结果就是学术研究呈爆炸式增长。例如，从2014年至2017年，有关神经网络的研究报告数量的复合年增长率达37%。同样，近期在首尔举行的国际计算机视觉大会，也见证了2017年到2019年研究报告递交量的翻倍增长。值得庆幸的是，学术研究人员开放了大多数的研究，以期望能和人工智能团体分享自己的进展成果，而大型技术实验室则渴望从世界范围内吸引最优秀的研究人员。

人工智能指数2018年度报告

计算能力是推进人工智能的第二个关键因素。在该领域，人们不断取得大量进展，在2012年到2018年间，见证了计算领域高达300000倍的增长。呈指数的增长的计算能力超越了之前每18个月翻一番的摩尔定律。有理由相信，随着Cerebras、Graphcore及HorizonRobotics等新的硬件初创公司开发出专门针对人工智能的芯片，实现FLOPS/Watt（还有TPU）的实质性增长，这一趋势仍会持续。性能的提升也伴随着计算成本(FLOPS/$)的下降，再加上分布式云计算，这将会让人工智能更加容易上手。

人工智能方程式的第三个，也是最后一个重要部分，就是数据。尽管有大量的算法创新，但数据依然尤为重要，因为如今的算法对数据有着极大的要求。为了达到更深层次的见解。人工智能算法需要用大量的数据集进行训练，并且需要用更多的数据集进行验证。数据能让人工智能算法更好运作，更快学习，更加强大。事实上，一个拥有更多数据的简单算法往往胜过一个拥有较少数据的复杂算法。除此以外，许多算法都出现了边际性能的衰退，也就意味着需要对其输入更多数量级的数据，以取得输出准确性的小幅改善。

一个叫做Allegro的人工智能计算机视觉平台演示了回报下降的实例。通过使用一个含超过20万张打了标签的图像 (COCO) 的公共数据集，Allegro训练了两个对象检测算法，以自动识别80个不同类别的目标图像（比如，狗、猫、汽车、自行车）。实验的结论是，在识别大约前1万张图像时，算法的平均精确度迅速增加，之后就开始放缓，因此完全体现了回报下降的规律。

读者可能会对这一点感到困惑，因为如今世界上有着大量的数据。显然，每日产生的数据量是巨大的。2018年，这个数字是每天2.5万兆字节，其中90%的数据是在前两年产生的。这一增长仅随着物联网的增长而加速，而物联网会让人们的家更智能，让健康更持久，让生活更便捷。

然而，这个数据宝藏背后，是不可忽视的事实：数据分布不均匀。更具体地说，许多大型科技公司拥有大部分生成的数据。这些公司主要是美国的5家和中国的4家。比如，每天有3.5千万张图像上传到脸书上，650亿条信息在WhatsApp上被发送，35亿个搜索词条在谷歌上产生。

获取数据的不公平意味着数据已成为进入科技世界的新壁垒。正如佩德罗·多明戈斯 (Pedro Domingos) 在《终极算法》(The Master Algorithm) 中所言：“谁拥有最多的客户，就能积累最多的数据，学习最优秀的模型，获得更多最新的客户，从此往复，良性循环——但对竞争对手来说，则是恶性循环。”在这场科技巨头企业的新型斗争中，较小的科技初创公司和非科技公司难以与之抗衡。但一切都随合成数据的出现而改变。

合成数据能使这一竞赛变得公平吗？

在说明合成数据为什么能成为游戏规则改变者的原因之前，先解释一下合成数据是什么，还是很重要的。合成数据，亦或是仿真数据，顾名思义，是指由计算机生成的，而非从真实活动中抓取的数据。换言之，这是一种在算法上创造的数据，复制了真实数据的统计部分。尽管合成数据在90年代就已出现，随着储存成本的下降，生成对抗网络等新算法的出现以及计算能力领域的大量进展，人们对合成数据的兴趣重新燃起。

合成数据广泛运用于多个领域，包括为新产品、模型验证以及最重要的人工智能模型训练测试数据。就和每个行业都要收集真实数据一样，合成数据可在广泛的行业中生成。它可应用于临床科学实验，以避免涉及由健康数据造成的隐私问题（见MDClone）。它可运用于敏捷开发和开发运行，以加速测试和质量保证的循环。金融机构可以使用合成数据来测试和训练欺诈检测系统。最后同样重要的是，它可以用来训练计算机视觉算法。

此文将着重讲述合成数据如何作用于计算机视觉领域的，这是一个训练计算机通过图像和视频识别理解世界的研究领域。尽管60多年前这一领域起步于训练计算机分辨三角或方形等形状，计算机视觉的终极目标是训练计算机和人类一样理解世界。

人工智能驱动的检测平台StandardCognition展示了其如何分辨顾客挑选的商品。（图源：StandardCognition）

计算机视觉研究人员正在解决一些当下最重要的问题。应用实例包括医学成像（见Aidoc）、无人驾驶汽车、智能商店（见Standard Cognition）、无人机，增强现实技术 (AR) 和虚拟现实技术(VR)。所有这些应用包括训练计算器识别不同事物，以发现癌症，避免交通事故，或是带上AR和VR耳机看世界。这些应用实例都要求用大量数据对算法进行训练。比如，需要给算法提供数以百万的癌症扫描影像，以获得如今能超过放射科医生的精确诊断。类似地，训练一辆汽车识别障碍，避开障碍，或在恰当的时机停下来，也需要大量图像，以打造出比人为驾驶汽车更安全的无人驾驶汽车。问题在于，对这些数据的获取成为了增强所有这些人工智能模型精确度的障碍。合成数据能解决这一主要瓶颈问题，并且相比真实数据，具有更加显著的优势。

可扩展

现在应该很清楚了，合成数据的主要优势是可扩展。由于合成数据是通过算法创建的，因此字面上来说，人们可以根据所需为算法训练创造出足够多的数据。例如，在另一个医学案例中，多伦多大学的研究人员创造了合成X射线，该X射线用来模拟特定的罕见情况。他们把真实的X射线与这些情况结合，以获得足够大的数据库来训练神经网络，从而辨别罕见病症。这一案例是个多方面的重大突破，也为那些缺乏用来重要数据来改进算法的科技公司带来了良机。

避免统计问题

除了可扩展，合成数据还可以避免很多在从真实数据中抽样时会碰到的统计问题。有关这一问题最常见的例子就是抽样偏差。公司很难获取到一些真实数据，而这些数据需要涵盖足够大的差异，以代表世界上事物的广泛分布。人类就是个很好的例子。正如最近《财富》杂志所言，即使对谷歌这样的大公司来说，收集涵盖足够多的不同种族的面部数据，都是很大的挑战。这是一个巨大的问题，因为在偏置数据上训练算法，会导致算法在面对用户时的“表现”出现偏差。为了解决这一问题，DataGen 这样的公司正在使用差异性较大的数据打造完全合成的人脸，以确保对算法的训练能在涵盖更真实世界人口分布的人脸基础上进行。

DataGen用高差异性打造的完全合成的人脸实例（图源：DataGen）

模拟边缘情况

和真实数据的统计问题联系起来的话，合成数据的生成能够用来解决现实生活中的罕见情况。这些黑天鹅事件在现实生活中难以掌控，亦或是说在某些情况下甚至根本不值得去处理（比如，危险事件）。例如，在目标检测领域，抓取有关交通事故或者野生动物横穿马路的数据是很困难的。然而，对自动驾驶汽车来说，了解交通事故的状况或是避开野猪横穿高速公路的情况是至关重要的。这就是即使特斯拉每月通过自动驾驶汽车车队抓取了大量真实图像，它还是在市场上建立了一个最先进的模拟器，以合成数据与真实数据相结合的方式来训练其人工智能模型的原因。

较低的成本

合成数据的另外一个好处就是成本更低。总的来说，人工收集和标注真实数据的成本是非常昂贵的（而且非常耗时）。基于应用案例，一旦算法投入生产，收集和标注数据至少会耗费成百上千的美元。更不用说收集和标注的过程要花费数周或数月了，这无疑大大减缓了人工智能研究人员取得进展的速度。最重要的是，有些数据的收集非常困难，因为这些数据难以获取。比如，收集来自战争地区的数据是很困难的，或者，去到山区或深海环境获取数据也是很难的。因此，合成数据为克服收集数据需要大量成本这一缺点带来了巨大的机遇。

员工们正在给一家标注公司手工标注图像（图源：纽约时报）

当需要更改硬件和摄像设备，大范围跨越数组进行真实数据抓取时，这一成本就会相当高。这是科技公司不断发布含内置摄像头的新产品遇到的情况。每一台新手机、监控摄像头、机器人或无人机都有透镜参数，它会曲解先前算法的训练方式。这些算法一开始经常遇冷，需要用新数据以正确的参数进行重新训练。差异越大，新产品所需的数据就越多，比如，如果旧算法是用视平线高度的数据训练的，那么一台新扫地机器人就需要全新的数据。在所有这类情况下，使用合成数据能够轻而易举地转换摄像头的内外参数，从而提取出完美适合每种应用情况的数据。

模拟

机器人技术是合成数据能够产生巨大影响的又一领域。机器人专家正致力解决非常困难的问题，同时也面临训练数据稀缺的挑战。许多机器人训练使用深度强化学习的算法，这些算法通过自我探索学习新技能。这就需要成千上万的样本以获得改善。由于机器人资金耗费巨大，这一过程成本过高，几乎不可能在现实实验中通过人力的迭代来完成。然而，在合成环境中用上“代理”则是训练机器人的完美沙盒。

隐私

合成数据的另一关键优势就是保护隐私。如果说《通用数据保护条例》的出现带来了什么启示，那就是政府有关隐私的立法对科技行业产生了重大影响。科技公司需要转变其收集的数据的方式和类型。如今，收集人脸、人体全身甚至人家中的数据是个相当敏感的话题。然而，如果人们想要继续解决围绕在人类和环境四周的巨大挑战，就需要继续为训练人工智能算法收集这类数据。为什么不合成完全没有隐私风险的大量现实人脸或室内环境图片，来取代从人们的家中抓取数据这一行为呢？

DataGen创造的完全合成的室内环境实例（图源：DataGen）

更深层次的能力

最后，合成数据的另一个关键优势是，它包含了比人工收集标注真实数据更丰富的信息。一方面，合成数据提供了完美真相，而传统的人工标注的数据总是存在一定程度误差。这一点本身就为训练人工智能算法带来了巨大的价值。然而，其真正的超能力在于，它有提供3D标注之类更深层面信息的能力。众所周知，由于人工标注的固有限制，3D标注很难扩展。使用合成数据，就可以涵盖所有3D几何图形信息、3D语义元数据、物理参数，甚至其他真实数据无法提供的类别。例如，合成数据可以包括有关深度、物质、物理学（比如物体质量或折射）的数据，甚至其他语义参数。为了解释得更清楚，下面请看两个具体实例：合成人眼和抓取东西的合成手掌。

科技公司需要人眼数据训练人工智能算法是有很多原因的：情绪识别、AR和VR技术，甚至医疗设备。使用合成人眼，就可以获得红绿蓝 (RGB) 颜色数据、红外线数据、景深图、分割图和一些细节，比如人眼实际注视方向或人眼上和人眼周围的各种折射参数。

对合成人眼的额外标注实例（图源：DataGen）

在用手抓取物品的情况下，可以使用以上信息，但也要涵盖物体质量和材质数据，以及物体可被抓取的位置，或是手实际抓取物体时的变形参数等语义环境数据。当在训练算法识别人在抓取什么东西（智能商店）或如何抓取物体（机器人）时，这些额外的变量都至关重要。

对人手抓取物体进行的额外分割实例（图源：DataGen）

现在应该清楚了，合成数据为解决数据缺陷和进一步加速人工智能算法的学习曲线提供了绝好机会。然而，与所有软件一样，合成数据的能力只同步于其所建立的模型。为了生成良好的结果，合成数据需要较高的质量，要能够完美应用到现实世界。正如OpenAI 的研究科学家乔什·托宾(Josh Tobin) 在埃文·尼塞尔松 (Evan Nisselson)发表于TechCrunch的一篇文章中所言：“打造一台精确的合成数据模拟器真的非常困难。在由合成数据完美训练的模型和真实数据训练的模型之间，其精确度存在3-10倍的误差。鸿沟仍在。合成数据已经能够不错地完成很多任务，但在要求极度精确的情况下，目前其性能依然差强人意。”

好消息是，有很多初创公司正在着力解决这一难题。其中就包括一个名为DataGen的以色列公司。DataGen的团队正在打造一台合成数据生成引擎，用来大规模生成人物和环境的逼真数据，以训练计算机视觉算法。当笔者第一次了解到该公司时，最令人印象深刻的是其数据的逼真程度。笔者认为，如果合成数据能够到迷惑到一个人，使其信以为真的程度，那么该合成数据就足以用作训练神经网络了。然而之后笔者发现情况并非一定如此，该团队将自己的数据和真实数据进行比较，结果发现合成数据已经超越了真实数据。这就意味着人们已经到达了填补模拟与现实之间鸿沟的程度，而这一鸿沟在过去的十年间击退了无数研究人员和科技公司。

DataGen用算法创造的及其逼真的人手实例（图源：DataGen）

缩小模拟和现实之间的差距意义重大。合成数据会平衡大型科技公司与无法获得同样类型真实数据的小型初创公司之间的竞争。较小的科技公司将会有能力构建出超越强大对手的算法，因此重新平衡激烈的人工智能竞赛。

也就是说，大型科技公司也会将合成数据和真实数据结合起来使用，并将在自己的人工智能算法上见证巨大进步。这一不断增多的竞争对社会将是完全有利的，因为人工智能研究会加速并生成更好的真实成果。

最后，无论是初创公司还是大型科技公司，合成数据都将会引领计算机视觉和人工智能领域带来下一个突破，并激发出永远改变人类历史进程的创新成果。

图源：Unsplash

留言点赞关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

（添加小编微信：dxsxbb，加入读者圈，一起讨论最新鲜的人工智能科技哦～）

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
你可能遗漏的一些C#/.NET/.NET Core知识点追逐时光者 C#.NET DotNetGuide编程指南 c#.net .netcore microsoft
前言在这个快速发展的技术世界中，时常会有一些重要的知识点、信息或细节被忽略或遗漏。《C#/.NET/.NETCore拾遗补漏》专栏我们将探讨一些可能被忽略或遗漏的重要知识点、信息或细节，以帮助大家更全面地了解这些技术栈的特性和发展方向。拾遗补漏GitHub开源地址https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/D
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
python多线程程序设计之一 IT_Beijing_BIT #Python 程序设计语言 python
python多线程程序设计之一全局解释器锁线程APIsthreading.active_count()threading.current_thread()threading.excepthook(args,/)threading.get_native_id()threading.main_thread()threading.stack_size([size])线程对象成员函数构造器start/ru
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n