aiAIman

智能时代-大数据与智能革命重新定义未来（吴军）-核心书摘

本文主要摘录于全书正文，部分解释是博主根据自己生活体验增加的理解，欢迎大家共同讨论更正~

机器学习爱好者交流QQ群：1023 119 142

为新手提供机器学习资料，也欢迎大佬来分享知识。

本书目录

第一章：数据—人类创造文明的基石

现象、数据、信息、知识

数据的作用：文明的基石

第一章：数据—人类创造文明的基石

数据>信息>知识一步一步提炼升华的结果

数据的相关性—发掘信息价值的钥匙

结论D，可以通过数据A,经过B ,C的关联性找到D.这种关联性，有的是常识性的有的是非常识性的。

传统统计学，大的数据量+有代表性的样本得出的结果才有意义。

但获取大量数据和建立代表性数据样本很难

大量数据+多个简单模型组合可以代替一个复杂的模型。

Eg: 德国直接用高制造技术制造高水平镜头，但不能量产。

日本通过过镜头组合可以实现参不多效果，但是可量产，价格更便宜。

模型选择~模型调参对于问题拟合两个比较重要的要素。

切比雪夫不等式（正态分布）

概率论上：当观察到足够多的数据时，随机性和噪声可以忽略不计

第二章：大数据和机器智能

图灵测试，一种对人工智能的定义。

人工智能1.0 鸟飞派主要以模仿人类来设计人工智能进行特征提取

是一个专家的时代，并且某些特征覆盖并不是很全。

与之对应的是现代的方法，数据驱动。

机器智能最重要的是能够理解人脑解决的问题，而不在于是否采用和人一样的方法。

贾里尼克区别于传统特征提取方法，把语音识别作为一个通信问题

人脑发声—信息源声波空气传播—信道耳朵接受—解码

使用马尔科夫模型描述信源和信道，使用数据驱动，而不是传统的语言学家根据经验进行特征提取，随着数据量加大，系统就会更好。

数据驱动，数据的重要性就相当大。

现在深度学习的感觉其实也是一种结合，神经网络也有一定的仿生意味，加上了大量的数据训练，得到的结果远远好于传统方式。数据驱动激活了神经网络。

在CV ,NLP领域，通过技术进步，每年大约能改进0.5%

大数据特征

多样性-多维度 是数据有效的，有信息量，有价值的关键

（大数据驱动区别于传统问卷调查更具有真实性，因为人们是在没有压力情况下主动提供的数据）

大量-完备性 大数据可以做到样本即是全集，通过覆盖面，让数据更精准

（预测美国大选，有个最无脑的方法，就是知道每个州每个人在想什么。可以通过互联网爬取相关信息，进行统计，只要知道了大概比例（抽样的思想，但比问卷更真实），就可以推断结果）

及时性 不是必须，但在特定领域（智能交通）等方便很重要

NLP领域，难回答的问题是 WHY,HOW. 容易的是WHAT WHERE WHEN WHICH WHO

第三章：思维的革命

从信息论的角度，数据中的信息可以消除不确定性，数据之间的相关性可以取代原来的因果性。

机械思维，逻辑推理，让人们感到确定性的放心，一种自信。

托勒密方法论：

找到一个数学元模型，这个模型要和历史数据吻合。

缺陷，整体模型复杂，因为用了基础的圆来拼接模型

确定性假设，一旦模型确定，即认为真理。

笛卡尔方法论，大胆假设，小心求证。（很科学）

这个也是目前科学还在沿用的。

牛顿的机械思维：

1世界变化规律是确定的

2可以用简单的公式和语言描述

3这种规律应该是通用的

也就是科学是一层一层推理出来的。

获取数据信息知识，这个过程需要很多代人的积累。

机械思维取得巨大成就，第一次工业革命，蒸汽。第二次工业革命，电力。极大的推动了人类社会的进步。

看问题要看本质，瓦特改良蒸汽机的动机不仅仅是设计一个机器，而是要通用的为工业提供动力。

机械思维的核心：确定性和因果性。

因果性：

医学药理上，找到真正的致病原因，然后针对这个原因找到解决方案。

分析找到原因，根据原因找到结果。

问题出现：

并不是所有的事情都是可以用简单的原来描述。

在目前信息时代，简单的因果规律都已经被发现了，想要和以前一样找到简单的因果关系，很难。

不确定性的时代：

不确定性原因：

确定世界里相关因素过多，无法全部考虑进来，也变成不确定
客观世界自己的不确定性，例如微观世界

信息论：信息熵

信息的度量就等于不确定性的多少。

把智能问题转化为消除不确定性的问题。数据的关联性，提供信息，帮助消除不确定性。

交叉熵常用来度量一致性

从因果关系到强相关关系

医药行业，由于研发周期长，投入大，但有效的专利保护期相对较短，导致特效药很贵。

强相关思维，现有处方药和现有疾病进行一一匹配，如果A药对B病有效，再进入验证期，如果通过验证期，时间3年左右，开发成本只是传统的1/10.只要保证验证合格就行。

例如以前治心脏的药，反而能治疗男性疾病。

大胆假设，小心求证的思想。

这种思维，前提是需要有足够多的数据支持。

数据发掘出强相关性 ≈ 因果性

非确定世界确定世界

辩证看因果和强相关的关系

能找到直接因果当然更好，不是否定因果。只是有时发现因果需要一定的灵感和运气（比如牛顿，爱因斯坦发现的物理学公理，又有多少人可以发掘）

能通过机械思维直接发现 确定性和因果性当然是最好的，只是数据驱动提供一种补充。

数据驱动的强相关关系，相当于一种捷径，让我们不会因为运气而被问题难倒。

第四章：大数据和商业

关注原来无法关注的细节，主要原因是原理人工关注成本太高，然后从数据中发现异常。

（具体用电细节监控，帮助美国发现室内种植大麻的房子。帮助发现偷税漏税）

数据也能够帮助发现特殊行为，比如商家通过数据分析，精准向孕妇群体推送不同时段所需的商品。

通过牺牲现在有的计算资源，重新认识穷举法的意义，也是大数据完备性的意义。

谷歌无人汽车有个细节，就是在街景收集过的地方表现得会更好，前往一段未知的路，就会表现差。因为在通过已有街景数据的道路时，大部分数据已经提前处理过。实时只需要处理少部分信息即可。如果全部靠实时采集数据再处理，计算量过大，实时性可能无法保障。

这种方式就是通过事前提供完备性来解决一些难题。虽然只能走在走过的路很傻，但现在的技术水平以及道路水平，是支持收录所有道路数据的，这也就是穷举法的一个应用吧。这就是机械思维下暂时找不到完美解，但通过数据可以弥补这个不足。

现有产业 + NEW = 新产业

现有产业 + 大数据 = 新产业

现有产业 + 机器智能 = 新产业

大数据现在其实分两部分，一部分是在大量数据下，通过传统方法进行数据分析，发掘数据价值。另一部分是，只是把大数据整理成养料，来投喂给机器智能，训练发掘出新的能力。

安迪-比尔定律：比尔要拿走安迪所给的。软件功能的增加和改进要不断吃掉硬件性能的提升，整个行业才能平稳发展下去。

+大数据等于很多新产业

小米前期卖手机给自己的定位就不是制造企业而是互联网企业。小米卖手机并不是只满足于挣卖手机的钱，而是吸纳用户，从用户身上获取长久的收益。

第五章：大数据和智能革命的技术挑战

每一次技术革命除了生产力的发展，还需要很多技术准备，只有这些技术都成熟了，技术革命才可能成功。

目前的现状

1数据的产生：目前数据增量很大

1电脑本身

2传感器

3现存的数据，包括非数字化数据。

2信息的存储：

一个是容量问题，一个是读写速度（数据量大了后的检索速度问题）

SSD的出现暂时满足了需求。

3传输的技术：

数据从采集端到收集端的通信问题。

目前5G已经有很好的解决

4信息的处理：

大数据情况下，计算量将相当庞大。相对于莫尔定律的硬件速度增加，简单的检索NLOGN会随着数据大量增加，让计算能力远远跟不上。

目前解决方案，分布式计算。分布式存储与任务分解运算。

各阶段的技术难题：

数据收集：

大数据的优点在于避免了统计学的采样之苦。

看似简单，但收集到具有多样性和完备性的数据需要很大代价，目前都是大公司通过智能设备收集。

好多廉价的智能设备其实并不廉价，他们都有一个隐藏任务，收集用户使用数据。

数据存储和表示：

目前数据量的增加还是对存储带来很大压力，由于数据安全性考虑，每份数据还不能只留一份，因此数量量尽管通过压缩，但还是要多留4倍，以考虑物理安全性。（没办法，只能硬存）

区别于传统的数据，大数据的多维度让关系型数据库已经不再适合，各种不同的数据结构，失去了数据格式的统一性，给后续调用使用带来很大问题。（开发非关系型数据库，提倡统一的大数据表示格式，例如GOOGLE的 protocol Buffer）

并行计算和实时处理：

并行计算并不是简单机器叠加，有些计算并不具备并行处理特性。

并行比例占95%，通过增加处理器的数量，最多只能加速20倍。

并行比例占50%，最多只能加到2倍。

计算任务成功拆分，由于子任务计算难度也不一样，最后并行计算时间会取决于最后完成的子任务时间。

因此，目前分布式计算主要是解决了规模问题，至少让大模型跑起来，但在时间上，加速有限。

由于分布式计算时间并不是想象中那么短，实际上反而很长，因此事实上对大数据实时处理是几乎做不到的。

数据挖掘：机器智能的关键

从传统网页上的数据，结构不一样，分析起来很难，需要很好的NLP要不根本处理不了。

大数据在使用前含有噪声，通常要进行降噪处理，损失一部分数据，提高信噪比。

由于机器学习都是不断迭代的过程（期望值最大化），不断迭代加上大量数据，导致计算复杂度过高。

在计算能力有限的时候，采用大数据+浅层模型，小数据+复杂模型，这样才能平衡计算量

从理论上讲，使用大数据加上深度模型，效果一定会很好，但现实计算有限。

在某些特定的问题上，某些机器学习模型确实表现比其他的好，但总体上来讲，大部分机器学习算法是等效的，只有量的差别，没有质的差别，而量的差别可以通过规模计算和数据来弥补。

由于目前机器学习特性，为了机器学习服务将由特定公司提供。这种数据聚集，牵扯出安全问题。

数据安全问题：

好多数据安全事件，制度设计和系统上没有问题，就是人员在实际操作为了方便没有执行

可以通过异常业务流程和行为习惯发现系统是否被他人使用。

保护隐私：

大数据最尖锐的问题之一。

大数据时代，由于大数据的多维度和全面性的特点，简单屏蔽掉很多信息是可以从其他维度利用全面性恢复的。因此需要很多新技术。

搜集信息时对数据进行预处理，达到可以处理数据却看不懂数据。
双向监视

保护隐私最好的方法就是要让侵犯隐私的人拿自己的隐私来换（数据标识使用人信息）

总体上来讲，还是很难的呀，仅仅只能通过协议限制，不能完全技术手段规避。

第六章：未来智能化产业

未来农业：精准用水，精细化管理（只是部分地区会用，毕竟水有些地方不缺，虽然只需要用几十分之一的水，但管理成本可能更高）

未来体育：大数据战略分析，动作分析，协助日常训练

勇士队通过大数据分析，发现进攻型得分效率很低，3分球是最好的得分手段，主力培养神射手库里等）

未来制造业：大量机器人取代人工。

未来医疗：降级医疗成本，包括医生和药物的资源。

医生上，通过人工智能辅助，帮助提高效率。合理分配医生资源，让最紧急的病人得到最需要的医生，而不是医疗资源（专家号）被小病患者占据。有限制的医疗诊断机器人也能在一定程度上解决偏远地区，医疗资源少地区的医疗问题。机器人医疗机器人—达芬奇手术台，有些操作比人类还精细，能大大提高顶级外科医生的数量。

药物上，特别是目前绝症的治疗上，通过大数据穷举，降低个性化医疗的成本。

对于癌症，关键是杀死癌细胞。但癌细胞是因为基因错误复制产生，有第一次就有可能第二次，这种针对性药物可能就突然失效。

理论上，只有新药的研制速度快于癌细胞的变异速度，人就可以和癌细胞长期共存。但事实上在传统医药行业，新药开发时间长，成本高，世界上没有几个人能享受这样的资源。

利用大数据的无穷理解。所有可能的恶性基因复制错误和癌症的组合，不过几百万到上千万的可能，这个数量级在IT领域是很小的，但在医学上几乎无穷大。如果能为每种组合找到一种对应的药物编上号，以后只有检测出病变方向，就可以很简单的使用药物治疗。

药物上可以摆脱以前大众药才能审批通过的思想，就算药只对部分人有用，能够找到具体的受用人群，他也是有价值的。

未来律师，记者，编辑都会受到挑战。

第七章：智能革命和未来社会

智能化社会，智能交通等

（有些明显改善用户体验的方向可以研究，比如出现早出发5分钟，可以早到半小时；晚出发半小时，也只会晚到5分钟）

借助RFID识别出校园外来人员，用在更大区域可以用来反恐。

区块链用来追踪每一次交易，用来防伪。

从标准化到个性化服务，更好的利用资源。

隐私的重要性：

可能简单的数据使用就是推荐产品，有的人可能说我又不做坏事，数据拿去没用。

公司拿数据进行大数据杀熟还能接受的话，涉及到自己的医疗和健康就会让很多人失去公平的医疗资源。比如保险公司用数据分析觉得你未来得重病几率接近100，他就会给你拒保。但这样的话，医疗保险存在就没有任何意义了，只是保险公司挣钱的工具。

人们为什么会忽略大数据对个人隐私的威胁：

1不知道大数据的威力

2 把隐私的保护寄托给公司的善意

大数据可能会产生一个老大哥，即超级权利体。

工业革命受益人

第一：企业，精英阶级

第二：中心区域

第三：全球

工业革命会带来很大的副作用，需要半个世纪消化。

信息时代在美国普通家庭收入增加并不大，大的是TOP5%的人。

工业革命造成的剩余劳动力，只能慢慢等待他们退出劳动力市场，一般能加入新行业的比例极低。为了国家稳定，一般就是国家出钱养着这些人。有些国家不肯淘汰过剩产能，就是为了消化这些无所事事的人，根本解决路径就是耗。耗上两代，社会问题就解决啦。

信息时代更难受，不像前两次工业革命，可以开拓新的市场。如今的全球化，很少有市场可以开拓（非洲？）。

虽然现在的人工智能很傻，不能达到人的那种状态，但在某些领域甚至能达到专家水平，这就不仅仅是取代一些体力劳动者，部分脑力劳动者也会有危险（为了社会稳定，估计也是和专家辅助配合，消化劳动力）

当社会不去创造财富而只考虑分配财富，经济就开始衰退。社会公平只能体现在机会平等，而不是结果的平等，只要还有上升途径，就要努力加入他们而不是天天抱怨。

你可能感兴趣的:(大数据,人工智能)

基于TableStore的海量气象格点数据解决方案实战阿里云云栖号数据存储与数据库 exception Java核心技术
前言气象数据是一类典型的大数据，具有数据量大、时效性高、数据种类丰富等特点。气象数据中大量的数据是时空数据，记录了时间和空间范围内各个点的各个物理量的观测量或者模拟量，每天产生的数据量常在几十TB到上百TB的规模，且在爆发性增长。如何存储和高效的查询这些气象数据越来越成为一个难题。传统的方案常常采用关系型数据库加文件系统的方式实现这类气象数据的存储和实时查询，这种方案在可扩展性、可维护性和性能上都
大数据与物联网（IoT）的完美融合：驱动智能新时代 Echo_Wish 大数据高阶实战秘籍大数据物联网 python 人工智能
大数据与物联网（IoT）的完美融合：驱动智能新时代大家好，我是你们的大数据探索者Echo_Wish。今天，我们将深入探讨大数据与物联网（IoT）整合的重要性及其在现代科技中的应用。物联网通过连接大量智能设备，生成海量数据；而大数据技术则赋予我们从这些数据中提取有价值信息的能力。当两者结合在一起时，能够为各行各业带来革命性的变化，推动智能时代的到来。一、大数据与物联网的基本概念1.物联网（IoT）物
具身智能行业 [shenhonglei] 具身觉醒：智能进化的未来之路人工智能机器人
具身智能行业综合分析资源下载-具身智能导图.xmind资源下载-具身智能导图.xmind一、行业概况定义与核心特征具身智能（EmbodiedAI）指通过物理实体（如机器人、自动驾驶设备等）与环境的动态交互，实现感知、认知和行动控制的智能系统。其核心特征是“知行合一”，强调通过实际交互提升智能水平，而非仅依赖数据训练。技术融合：结合人工智能（AI）、机器人技术、多模态大模型
【AGI】中国大模型扛把子：通义家族 LeeZhao@ AIGC重塑生活神器 agi 人工智能 AIGC 面试自然语言处理语言模型
中国大模型扛把子：通义家族引言一、通义千问的技术架构与模型谱系二、技术突破与性能优势三、开源生态与行业影响四、未来展望：从“千问时代”到通用智能五、通义家族大模型列表（1）多模态大模型（2）大语言模型结语引言在人工智能大模型领域，中国科技企业正以惊人的速度突破技术边界。阿里云推出的**通义千问（Qwen）**系列大模型，凭借其多层次的技术架构、多样化的模型生态及开源战略，已成为全球AI领域的重要标
探索数据仓库自动化：ETL流程设计与实践 Echo_Wish 大数据高阶实战秘籍数据仓库自动化 etl
探索数据仓库自动化：ETL流程设计与实践在大数据时代，数据仓库已成为企业数据管理和决策支持的核心工具。如何高效地提取、转换和加载数据（ETL），是数据仓库建设中的重要环节。本文将围绕数据仓库自动化的ETL流程设计展开，结合实际代码示例，探讨如何构建高效、稳定和可扩展的ETL解决方案。什么是ETL？ETL（Extract,Transform,Load）是指数据抽取、转换和加载，是数据仓库建设的重要步
大语言模型对程序员行业的影响及未来发展走势分析 Hello kele 人工智能 java 人工智能 AI编程
随着人工智能技术的快速发展，特别是大语言模型（如DeepSeek、OpenAI、Grok等）的出现，对程序员这个行业产生了深远的影响。在这篇文章中，我们将探讨这些变化，分析影响，并展望未来的发展趋势。一、当前影响1.自动化代码生成大语言模型的一个直接影响是代码自动化的能力。这些模型可以理解代码上下文，并生成功能性代码。例如，GitHubCopilot已经成为许多开发者的辅助工具，能够根据注释或部分
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
企业信息查询系统的技术实现路径探析——以某大数据平台为例探熵科技大数据
引言在数字化转型加速的背景下，企业信息服务领域正经历着从传统工商查询向智能决策支持的演进。本文将以某企业信息查询系统为研究样本，解析其技术架构与实现路径，探讨大数据技术在企业服务场景中的落地应用。一、行业技术现状分析当前企业信息服务面临三大技术挑战：多源异构数据整合：需聚合工商数据（结构化）、招投标公告（半结构化）、企业新闻（非结构化）等差异化数据源数据实时性要求：企业经营状态变更、联系方式更新等
大数据面试系列之——Hadoop 潜心_守道大数据面经面试大数据 Hadoop
Hadoop的三个核心：HDFS（分布式存储系统）MapReduce（分布式计算系统）YARN(分布式资源调度)1.Hadoop集群的几种搭建模式1.单机模式：直接解压安装，不存在分布式存储系统2.伪分布式：NameNode和DataNode安装于同一个节点，无法体现分布式处理的优势。3.完全分布式：一个主节点，多个从节点，存在如果主节点宕机，集群就无法使用的缺点。4.高可用模式：多个主节点，多个
人工智能开发趋势光影少年人工智能
人工智能开发趋势：未来技术的演进与创新引言人工智能（AI）正在以惊人的速度发展，并在各行各业中发挥越来越重要的作用。从自然语言处理到计算机视觉，从自动化决策到自主学习，AI的发展方向正变得更加智能化、自动化和人性化。本文将探讨当前AI开发的最新趋势，并展望未来的发展方向。1.生成式AI的崛起近年来，生成式AI（如ChatGPT、StableDiffusion、DALL·E）展现出强大的内容创作能力
LLM辅助编程：代码自动生成与优化 AI智能涌现深度研究计算机软件编程原理与应用实践 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
LLM,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化，程序员面临着越来越高的开发压力和效率要求。传统的编程方式依赖于手动编写代码，这不仅耗时费力，而且容易出现错误。近年来，随着深度学习技术的快速发展，基于大型语言模型（LLM）的代码生成和优化技术逐渐成为软件开发领域的新兴热点。LLM是一种强大的人工智能模型，能够理解和生成人类语言。通过训练大量
python和java的优缺点-java有哪些python没有的优点? weixin_37988176
Java和Python都是目前最火的后台语言。Java的使用时间更久，更成熟，Python语言更年轻，更便捷。两者各有各的优势：Python的优势：1.学起来简单，开发效率高，同样的功能用Java开发可能需要写200条代码，但是用Python只需要30~50条;2.在大数据挖掘方面有突出优势，是大数据分析首选的编程语言，Python可以让开发人员轻松表达概念，程序员维护和更新代码库更容易;3.Py
Oumi ：AI开发的未来？人工智能开源
Oumi：AI开发的未来？前言在人工智能领域，开源技术正以前所未有的速度推动着创新和变革。今天，我们将聚焦一个备受瞩目的开源AI平台——Oumi。它不仅以其强大的功能和灵活的架构吸引了全球开发者和企业的目光，还通过简化AI开发的整个生命周期，为用户提供了前所未有的便利。github地址：https://github.com/oumi-ai/oumi官网地址：https://oumi.ai/什么是O
关于采用源始经为底层框架开发中文编程系统的可能性太翌修仙笔录 deepseek 超算法认知架构第三代人工智能算法人工智能
用中文写代码和Python哪个有前景在编程语言选择方面，**Python的发展前景明显优于中文编程语言**。以下是具体分析：---###一、核心结论**优先选择Python**，因为：1.**全球通用性**：Python是国际主流编程语言，适用于跨国协作和开源项目2.**就业市场需求**：Python在人工智能/大数据/Web开发等领域的岗位需求持续增长3.**技术生态优势**：拥有超过30万个第
【免费收藏】清华大学DeepSeek使用手册合集 600页完整版周师姐 AI写作学习人工智能 pdf
DeepSeek资料链接：https://pan.quark.cn/s/c927326f70c5在人工智能席卷全球的当下，DeepSeek作为前沿深度学习技术，正推动着全面AI时代的到来。今日，特别为大家推荐《DeepSeek：从入门到精通》，本书由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心编写。它深度解析DeepSeek的技术核心，详尽阐释其应用场景与操作方法，尤
CES Asia 2025：科技盛宴助力中国数字经济腾飞 CES_Asia 科技机器人人工智能智能音箱智能电视
备受瞩目的CESAsia2025第七届亚洲消费电子技术贸易展（赛逸展）将在首都北京盛大开幕。本届展会以“科技新视界，创新赢未来”为主题，聚焦人工智能、5G、物联网、元宇宙等前沿科技领域，集中展示全球消费电子行业的最新创新成果，为行业发展注入新动能。政策东风助力，CESAsia2025亮点纷呈近年来，中国高度重视数字经济发展，出台了一系列政策措施，为消费电子产业创造了良好的发展环境。CESAsia2
芯科科技通过全新并发多协议SoC重新定义智能家居连接电子科技圈 Silicon Labs 智能家居边缘计算 mcu 物联网 iot 人工智能机器学习
MG26系列SoC现已全面供货，为开发人员提供最高性能和人工智能/机器学习功能致力于以安全、智能无线连接技术，建立更互联世界的全球领导厂商SiliconLabs（亦称“芯科科技”，NASDAQ：SLAB），日前宣布其MG26系列无线片上系统（SoC）现已通过芯科科技及其分销合作伙伴全面供货。作为业界迄今为止最先进、高性能的Matter和并发多协议解决方案，MG26SoC的闪存和RAM容量是芯科科技
【大模型系列篇】Vanna-ai基于检索增强(RAG)的sql生成框架木亦汐丫大模型语言模型 sql agi ai 数据库人工智能 embedding
简介Vanna是基于检索增强(RAG)的sql生成框架Vanna使用一种称为LLM（大型语言模型）的生成式人工智能。简而言之，这些模型是在大量数据（包括一堆在线可用的SQL查询）上进行训练的，并通过预测响应提示中最有可能的下一个单词或“标记”来工作。Vanna优化了提示（通过向量数据库使用嵌入搜索）并微调LLM模型以生成更好的SQL。Vanna可以使用和试验许多不同的LLM，以获得最准确的结果。V
中国人工智能大赛成果发布会 | 代码安全智能体让研发安全又高效安全
2024年12月20日，由厦门市人民政府主办，以“融新汇智竞促发展”为主题的第五届中国人工智能大赛成果发布会在厦门成功举办。人工智能安全论坛于成果发布会期间举办，重点聚焦人工智能安全技术专家，共同探讨安全治理的实践经验，探索智能体安全、大模型安全、数据安全、内容安全等方面面临的挑战和解决方案。百度安全技术委员会主席包沉浮受邀出席，分享了智能体技术在代码安全应用上的最新实践经验。百度安全技术委员会主
重磅发现！DeepSeek R1方法成功迁移到视觉领域，多模态AI迎来新突破！ zhangjiaofa DeepSeek R1&AI人工智能大模型人工智能 DeepSeek R1 多模态
一、引言在当今人工智能飞速发展的时代，多模态AI技术正逐渐成为研究与应用的焦点。近日，一项令人瞩目的成果引发了广泛关注——VLM-R1开源项目成功将DeepSeek的R1方法从纯文本领域迁移至视觉语言领域，为多模态AI的发展开辟了新的道路，极大地拓展了多模态领域的想象空间。本文将深入探讨这一创新性成果，从其灵感来源、验证结果、实际案例、带来的新思路以及开源资源等多个方面进行剖析，带您全面了解这一前
《从信息论视角：DataWorks平台下人工智能探寻最优数据编码的深度剖析》程序猿阿伟人工智能
在数字化时代，数据如汹涌浪潮般不断涌现，其规模之大、增长速度之快超乎想象。企业和组织每天都要面对海量数据的存储与传输挑战，如何在有限的资源条件下高效处理这些数据，成为亟待解决的关键问题。此时，信息论与人工智能算法为我们开辟了一条新的探索路径，尤其在DataWorks这样强大的大数据平台上，二者的结合蕴含着巨大的潜力。信息论，作为一门研究信息的度量、传输、存储和处理的学科，为理解数据的本质提供了深刻
《从信息论视角：DataWorks平台下人工智能探寻最优数据编码的深度剖析》人工智能深度学习
在数字化时代，数据如汹涌浪潮般不断涌现，其规模之大、增长速度之快超乎想象。企业和组织每天都要面对海量数据的存储与传输挑战，如何在有限的资源条件下高效处理这些数据，成为亟待解决的关键问题。此时，信息论与人工智能算法为我们开辟了一条新的探索路径，尤其在DataWorks这样强大的大数据平台上，二者的结合蕴含着巨大的潜力。信息论，作为一门研究信息的度量、传输、存储和处理的学科，为理解数据的本质提供了深刻
「AI」人工智能的发展阶段：ANI、AGI与ASI 何曾参静谧「AI」人工智能人工智能 agi
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
对深度学习中的基本概念—梯度的理解 Humingway 深度学习深度学习人工智能
本文讨论一下对“梯度”的理解。“梯度”是深度学习中基本又非常核心的概念，没有它就没有人工智能的今天。然而，即使抛开令人眼花缭乱的术语（比如sgd、ada、moment、adam）不谈，即使最简单的“梯度”本身，也值得讨论一下。1.提出问题该如何理解梯度？让我们结合具体的例子来体会一下。2.定义例子首先，我们定义一个简单的例子，来模拟一下深度学习的学习过程。已知：有一个正确的数据对（或者叫样本），(
机器学习平台系列（一） - 初探 Jupyter Notebook 认证机制窝窝和牛牛机器学习平台 Python Jupyter Notebook JupyterHub 安全多租户
最近准备调研下JupyterNotebook的单用户安全机制（认证）以及如何实现多租户，以便集成到公司的云平台，进而作为基于大数据平台的机器学习平台的一部分。1.问题分析数据分析以及算法团队的同学使用JupyterNotebook进行数据分析和建模等工作，其工作流程如下所示：业务部门以组为单位申请一台物理服务器搭建Python环境，启动JupyterNotebook，每个同学创建自己的工程，进行代
网络安全就业形式怎么样？网络安全Ash web安全安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快随着人工智能、物联网、5G等技术的普及，网络安全问题变得越来越复杂和多样化，因此企业越来越重视网络安全，政府也出台了相关政策支持网络安全建设，进一步推动了网络安全行业的发展，那么网络安全就业前景如何?这是大家关心的重点，我们来探讨一下。网络安全就业前景可以说是一片光明，是一个不错的行业。没有网络安全就没有国家安全，可想网络安全有多重要。而
11页PDF | DeepSeek平民化：AI助力数据治理整体方案（附下载） Leo.yuan 大数据人工智能
一、前言这份报告介绍了一种基于人工智能（AI）的智能数据治理整体方案，旨在通过AI的自然语言处理、学习能力、理解与推理能力等技术手段，解决传统数据治理中存在的问题，提升企业数据管理能力和效率。方案以高质量数据资产知识库为基础，结合智能化技术工具箱，针对数据治理中的痛点场景（如文档编写、元数据管理、数据标准、数据质量、数据安全、数据资产盘点等）提供智能化解决方案。通过AI技术的应用，方案能够实现数据
深度 | 车载语音群雄并起共争智能座舱新高地数据堂官方账号分享人工智能语音识别
不论是苹果公司iOS系统中的智能语言助手“Siri”，还是微软Windows系统中的“Cortana”，智能语音交互早已融入我们生活之中。随着汽车产业的发展，用户消费形态的改变，自动驾驶、智能座舱、新能源这些概念已经逐渐落地成为现实，智能语音交互与汽车之间也擦出了别样的火花。由于驾驶汽车无法解放双手，对于人机互动的需求，则更多需要通过语言来实现。因此，结合了人工智能的车载语音交互系统作为汽车智能网
Trae国内版发布，中国首款AI 原生IDE 正式上线，配置Doubao-1.5-pro，支持切换满血版DeepSeek 模型荣华富贵8 程序员的知识储备1 程序员的知识储备2 程序员的知识储备3 人工智能 ide
标题：Trae国内版发布：开启AI原生IDE的全新时代正文：在当今软件开发领域，人工智能正在逐渐改变开发者的日常工作方式。作为中国首款真正从底层深度融合AI技术的原生IDE（集成开发环境），Trae国内版正式上线，成为国内开发工具领域的里程碑式创新。这一产品不仅标志着中国开发者生态的智能化迈出关键一步，更通过其先进的技术和灵活的AI模型支持，为开发者提供了全新的编程体验。什么是AI原生IDE？为什
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "xxx@xx.com" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(