零食i

《机器学习》（周志华）第一章课后习题参考答案

《机器学习》（周志华）第一章课后习题参考答案
- 1.1 求版本空间
- 1.2 求假设空间大小
- 1.3 归纳偏好设计
- 1.4 “没有免费的午餐定理”拓展证明
- 1.5 试述机器学习能在互联网搜索的哪些环节起作用

1.1 求版本空间

题目：表1.1中若只包含编号为1和4的两个样例，试给出相应的版本空间。
P5：与训练集一致的“假设集合”我们称之为版本空间。本题即在假设空间中搜索包含正例且不包含反例的所有假设。（详细说明见后思考）
首先，用一个六位二进制数将整个假设空间表示出来，每两位描述一个属性。前两位取01表示色泽的取值为“青绿”，10表示色泽取值为“乌黑”，11表示色泽取值为 *。后四位分别表示根蒂与敲声的取值，以此类推.注意题中只包含1和4两个样例，因此假设空间中色泽的取值范围为：* ，乌黑、青绿；根蒂的取值范围为：*，蜷缩、稍蜷；敲声的取值范围为：*，浊响、沉闷。

假设空间

序号	色泽	根蒂	敲声	二进制表示
1	*	*	*	111111
2	*	*	浊响	111101
3	*	*	沉闷	111110
4	*	蜷缩	*	110111
5	*	稍蜷	*	111011
6	青绿	*	*	011111
7	乌黑	*	*	101111
8	*	蜷缩	浊响	110101
9	*	蜷缩	沉闷	110110
10	*	稍蜷	浊响	111001
11	*	稍蜷	沉闷	111010
12	青绿	*	浊响	011101
13	青绿	*	沉闷	011110
14	乌黑	*	浊响	101101
15	乌黑	*	沉闷	101110
16	青绿	蜷缩	*	010111
17	青绿	稍蜷	*	011011
18	乌黑	蜷缩	*	100111
19	乌黑	稍蜷	*	101011
20	青绿	蜷缩	浊响	010101
21	青绿	蜷缩	沉闷	010110
22	青绿	稍蜷	浊响	011001
23	青绿	稍蜷	沉闷	011010
24	乌黑	蜷缩	浊响	100101
25	乌黑	蜷缩	沉闷	100110
26	乌黑	稍蜷	浊响	101001
27	乌黑	稍蜷	沉闷	101010

若两个假设的二进制表示分别为A和B，则 A | B==A ⇒ B⊂A，A&B==B ⇒ B⊂A.（任意一个等式都可以判断出假设A是否包含假设B）
设P为假设1（正例），N为假设4（反例），假设H只要满足H | P==H && H | N != H为真，那么假设H就应该被包含在版本空间内。遍历假设空间内的所有假设进行上述判断，就可以获得版本空间内的所有假设。

#include

int hypo_const[27] = {0x3f,0x3d,0x3e,0x37,0x3b,0x1f,0x2f,0x35,0x36,0x39,0x3a,0x1d,0x1e,0x2d,0x2e,
                      0x17,0x1b,0x27,0x2b,0x15,0x16,0x19,0x1a,0x25,0x26,0x29,0x2a};

void main()
{

    int sample[2] = {0x15,0x2a},sum=0;
    for(int i=0;i<27;i++)
    {
        if( (hypo_const[i] | sample[1] ) != hypo_const[i] && (hypo_const[i] | sample[0]) == hypo_const[i] )  
        {
            sum++;
            printf("%x %d\n",hypo_const[i],i+1);
        }
    }
    printf("\nsum:%d\n\n",sum);
}

求得版本空间为假设2、4、6、8、12、16、20.

版本空间

序号	色泽	根蒂	敲声	二进制表示
2	*	*	浊响	111101
4	*	蜷缩	*	110111
6	青绿	*	*	011111
8	*	蜷缩	浊响	110101
12	青绿	*	浊响	011101
16	青绿	蜷缩	*	010111
20	青绿	蜷缩	浊响	010101

思考：书中P5提到，版本空间的求法为遍历假设空间，不断删除与正例不一致的假设和（或）与反例一致的假设。按照我的理解，版本空间有以下3种不同的求法。

删除不能包含所有正例以及包含任意反例的假设

删除不能包含所有正例的假设

删除包含任意反例的假设

本题使用了第一种方法来求版本空间，三种求法的选择应该属于归纳偏好的范畴。

1.2 求假设空间大小

题目：与使用单个合取式来进行假设表示相比，使用“析合范式”将使得假设空间具有更强的表示能力。若使用最多包含k个合取式的析合范式来表达表1.1西瓜分类问题的假设空间，试估算有多少种可能的假设。
分析：本题可以延续上一题的假设表述方法，每个合取式用一个8位二进制整数来表示，则一共有48个数待选。遍历C(48,k)种可能的选取组合，求出每种组合中k个合取式的合并结果，再去掉重复和冗余的情况，就是包含k个合取式的析合范式所能表达的假设空间大小。请注意，题目所述为“最多包含k个合取式的析合范式”，也就是说1,2,3…k个合取式组成的析合范式都满足条件，而不是仅考虑k个合取式组成的析合范式。
难点：
1. 假设空间太大，穷举所有组合不现实。
2. 合取式的合并结果（析取式）如何求，如何用一个整数表示。

先来看难点2
前文所述的表示方法，合取式的合并算法十分低效，因此有必要定义一种新的表达方式。在48个基本假设（基本合取式）中，有2*3*3=18个叶子假设（叶子合取式）：每个特征的取值都为具体值。任何合取式、析取式都可以用这18个叶子合取式的组合来表示。因此可以用一个18位的二进制整数来表示任意假设：将18个叶子合取式编号，若某假设包含序号为1的叶子合取式，则该假设第一位为1，否则第一位为0。其它位类推。在这种新的表达方式下，合并合取式（或析取式）A,B，只需作 C=A|B 的按位或运算，C即为表示A、B合并析取式的整数。（C语言按位或运算的速度非常快）
新的表达方式下，代表每个假设整数的求法如下：
1.将48个基本合取式的旧表达式存在数组hypo_old中
2.将18个叶子合取式的旧表达式存在数组hypo_leaf中
3.对hypo_old中的每个元素，循环对hypo_leaf中的18个元素xi作如下判断：若A|xi==A，则Anew中第i位为1，否则Anew中第i为为0.
将新的表达结果（48个整数）存在hypo_const中。
这种表达方式不仅大大提高了合并合取式算法的效率，还让我们有了一个额外发现：本题的最大假设空间大小为262143.为什么会有这个结论呢？原因就是18位二进制整数所能表示的最大范围即262143，又因为析取范式不考虑空集∅，即整数不为0，因此假设空间的大小即262143.这个结论非常重要，甚至一定程度上它就是本道题的答案（k足够大）。

难点1
如图所示，以k=3时为例，遍历C(48,3)中所有组合的情况实际上就是3个标记依次不断向右移动的过程。序号大的标记，总是在序号小的标记的右侧。

在移动过程中，我们总是先确定标记1的位置（初始记为1），然后在标记1的右侧确定标记2的位置（初始记为1+1）……直到确定标记k的位置（初始记为k-1+1，这么写有些奇怪，原因下面会讲）。每确定完一次标记k，就形成一次组合。之后，将标记k自增，若标记k≤48，则又形成新的组合，继续自增；若标记k>48，则标记k越界，转而向前先寻找标记k-1的位置（自增），若k-1也越界（标记k-1>47），继续向前寻找标记k-2位置（自增），直到向前寻得标记k-i自增后不越界（标记k-i≤48-i），此时调转趋势，向后寻找标记k-i+1的位置（递增，值为标记k-i的值+1），直到标记k的位置（标记k-1的值+1）。
确定方式：每个标记有两种可能的确定方式。若是从后面的标记越界返回，则改变方式为自增，若是从前面的标记顺序向下确定，则改变方式为递增（上一个标记的值+1）。额外规定：1.形成一次组合后，标记k的改变方式为自增。2.标记1的改变方式总为自增。
优化方法：
动态申请长度为k的一维数组poslist和hypo_process，poslist用来保存k个标记的位置，hypo_process用来保存前k个合取式合并的结果。用整数posflag来记录当前需要确定的标记序号。
每次确定完标记poslist[posflag]后（自增并通过越界判断），则将前posflag个合取式的合并结果存进hypo_process[posflag],即hypo_process[posflag]=hypo_process[posflag-1]|hypo_const[poslist[posflag]]若hypo_process[posflag]==hypo_process[posflag-1] || hypo_process[posflag]==0x3ffff&&posflag说明出现冗余，当前标记自增，即poslist[posflag]++，先进行越界判断，再进行上述判断。都通过后，posflag++，进而确定下一个标记的位置（递增），直到posflag==k，形成一个组合，将hypo_process[k]验重后计数。注意：计数前应该判断是否重复。因为不同的析取范式，有可能表示同一种假设。比如：(色泽=*，根蒂=*，敲声=浊响)∨(色泽=*，根蒂=*，敲声=清脆)∨(色泽=*，根蒂=*，敲声=沉闷)与(色泽=乌黑，根蒂=*，敲声=*)∨(色泽=青绿，根蒂=*，敲声=*)是同一种假设，它们都表示(色泽=*，根蒂=*，敲声=*)，它们在18位整数的表示方法下，对应的整数是唯一的。因此，只有原先未出现此数（此假设），才能将其记录并且计数值自增。否则重复，不计数。由于难点1中我们发现假设空间大小为262143，因此申请一个大小为262143的数组hypo_appear来记录每个假设出现与否。出现则数组对应元素记为1，未出现为0。（如果没有求出这个数，则每个数字出现与否只能用一个队列来记录，判断重复的算法效率非常底下，这就是此数的重要性）

 
  最后，分析中已经提到，题目中要求的是“最多包含k个合取式的析合范式”，因此在for循环中让k从1变到18，执行18次count，在k增加时，hypo_appear中的内容不清空，且计数n_count不归零，就能包含1，2……k个合取式的情况。 
 代码如下，运行时间在5秒左右： 
  #include

int hypo_old[48] = {0xff,0xf9,0xfa,0xfc,0xcf,0xd7,0xe7,0x7f,
                      0xbf,0xc9,0xca,0xcc,0xd1,0xd2,0xd4,0xe1,
                      0xe2,0xe4,0x79,0x7a,0x7c,0xb9,0xba,0xbc,
                      0x4f,0x57,0x67,0x8f,0x97,0xa7,0x49,0x4a,
                      0x4c,0x51,0x52,0x54,0x61,0x62,0x64,0x89,
                      0x8a,0x8c,0x91,0x92,0x94,0xa1,0xa2,0xa4}; 

int hypo_leaf[18] = {0x49,0x4a,
                      0x4c,0x51,0x52,0x54,0x61,0x62,0x64,0x89,
                      0x8a,0x8c,0x91,0x92,0x94,0xa1,0xa2,0xa4};

int hypo_const[48]= {0};

int new_leaf[18] = {0x20000,0x10000,
                        0x08000,0x04000,0x02000,0x01000,
                        0x00800,0x00400,0x00200,0x00100,
                        0x00080,0x00040,0x00020,0x00010,
                        0x00008,0x00004,0x00002,0x00001};




int count(int n_n,int n_k,int &n_count,int *hypo_appear)
{
// n_count=0;
    int i;
// for(i=0;i<262143;i++)
// hypo_appear[i] = 0; 
    int *poslist,*hypo_process,posflag,trend;
    poslist = new int[n_k];
    hypo_process = new int[n_k];
    for(i=0;i1;
    }
    posflag = 0;
    while(1)//poslist[0] <= n_n-n_k
    {
        if(posflag == 0) //如果是第一个则自增，如果超出则退出,否则直接赋值，赋值后如未达个数提前到0x3ffff跳过该点，否则进入下一轮
        {
            poslist[posflag]++;
            if(poslist[0] > n_n-n_k)
                break;//*****整个循环的退出口*****//
            hypo_process[posflag] = hypo_const[poslist[posflag]]; //直接赋值
            if(hypo_process[posflag] == 0x3ffff && posflag1)//提前到0x3ffff跳过
                continue;
            else
            {
                posflag++;
                trend = 1;//上升趋势
            }
        }
        else //上升趋势递增，下降趋势自增，如果超出则位数下降回滚上一轮，否则加入本轮假设，若无变化则跳过该点，如果未达个数提前到0x3ffff也跳过该点，否则进入下一轮
        {
            if(trend == 1)
                poslist[posflag] = poslist[posflag-1] + 1;
            else
                poslist[posflag]++;
            if(poslist[posflag] > n_n-n_k+posflag)//超出则位数下降
            {
                posflag--;
                trend = 0;
                continue;
            }
            hypo_process[posflag] = hypo_process[posflag-1] | hypo_const[poslist[posflag]];//加入本轮假设 
            if(hypo_process[posflag] == hypo_process[posflag-1] || hypo_process[posflag] == 0x3ffff && posflag1)   //跳过部分
            {
                trend = 0;//跳过等同回滚，自增
                continue;
            }
            posflag++;
            trend = 1;
        }
        if(posflag == n_k)//说明k个析合范式已经全部形成
        {
            posflag--;
            trend = 0; 
            if(hypo_appear[hypo_process[posflag]-1]==0)
            {
                n_count++;
                hypo_appear[hypo_process[posflag]-1] = 1;
            }

            //错误写法：n_count++;
            /* 应该判断是否重复。 不同的析取范式，有可能表示同一种假设。 比如：(色泽=*，根蒂=*，敲声=浊响)∨(色泽=*，根蒂=*，敲声=清脆)∨(色泽=*，根蒂=*，敲声=沉闷) 与(色泽=乌黑，根蒂=*，敲声=*)∨(色泽=青绿，根蒂=*，敲声=*)是同一种假设， 它们都表示(色泽=*，根蒂=*，敲声=*)，它们在18位整数的表示方法下，对应的整数是唯一的。 因此，只有在原先未出现此数（此假设）的情况下，才能将计数值自增。否则重复，不计数。 */
        }
    }
    delete poslist;
    delete hypo_process;
    return n_count;
}

void main()
{
    for(int i=0;i<48;i++)//难点2，形成新表达式
    {
        for(int j=0;j<18;j++)
        {
            if( (hypo_old[i] | hypo_leaf[j]) == hypo_old[i])
                hypo_const[i] |= new_leaf[j];
        }
    }
    int change = 0,temp;               
    int n_count=0;
    int *hypo_appear = new int[262143];
    for(i=0;i<262143;i++)
        hypo_appear[i] = 0;
    for(i=1;i<=18;i++)
    {
        count(48,i,n_count,hypo_appear);
        printf("length %-2d : %-10d\n",i,n_count);
    } 
}
/* length 1 : 48 length 2 : 897 length 3 : 8385 length 4 : 41742 length 5 : 115821 length 6 : 201303 length 7 : 248853 length 8 : 260787 length 9 : 262143 length 10 : 262143 length 11 : 262143 length 12 : 262143 length 13 : 262143 length 14 : 262143 length 15 : 262143 length 16 : 262143 length 17 : 262143 length 18 : 262143 */
 
  可以看到，使用最多包含9个合取式的析合范式，就可以表示整个假设空间。 
 如果对“只包含 k个合取式的析合范式”这个问题感兴趣，那么将27，29，30行的注释去掉即可。答案如下： 
 length 1 : 48 
 length 2 : 865 
 length 3 : 8028 
 length 4 : 39861 
 length 5 : 109686 
 length 6 : 186102 
 length 7 : 216036 
 length 8 : 197362 
 length 9 : 155382 
 length 10 : 106762 
 length 11 : 63004 
 length 12 : 31180 
 length 13 : 12616 
 length 14 : 4048 
 length 15 : 988 
 length 16 : 172 
 length 17 : 19 
 length 18 : 1 
 可以看到表示能力最强的是只包含7个合取式的析合范式，但也不能表示出假设空间中所有的262143个假设。当k=18时，只能选取18个叶子合取式才不会产生冗余，因此只能表示(色泽=*，根蒂=*，敲声=*)这一种假设。k>18就没有意义了，因为必定会产生冗余。 
  1.3 归纳偏好设计 
  题目：若数据包含噪声，则假设空间中有可能不存在与所有训练样本都一致的假设。在此情形下，设计一种归纳偏好用于假设选择。 
 分析：既然数据中包含噪声，最直接的思路就是首先去除噪声。去噪方法：若存在两个样例属性取值都相同，标记却不同，则只保留标记为正例的样例（或标记为反例的样例，也可以考虑更加复杂的筛选方法，比如统计相似样例的标记），在此基础上求出版本空间。 
 也可以考虑其他方法： 
 1.在求版本空间时，只除去与反例不一致的假设。 
 2.求版本空间时，只留下包含了所有正例的假设。 
  1.4 “没有免费的午餐定理”拓展证明 
  题目：本章1.4节在论述“没有免费的午餐”定理时，默认使用了“分类错误率”作为性能度量来对分类器进行评估。若换用其他性能度量l，则式（1.1）将改为 
 试证明“没有免费的午餐定理”仍成立。 
 证明： 
 在证明定理之前，先构造一个引理： 
 引理1：在二分类问题下，对任意性能度量指标 l ， l(h(x)=f(x))+l(h(x)≠f(x))=A,A 为某一常数。 
 证：对于二分类问题，任意性能度量中的正确分类得分与错误分类得分应该是固定的。即： 
   $l (0, 0) = l (1, 1), l (0, 1) = l (1, 0)$  
  
 因此 
   
   $l (0, 0) + l (0, 1) = l (1, 1) + l (1, 0)$  
  
 设 
   
   l(0,0)+l(0,1)=l(1,1)+l(1,0)=A  ，即可得： 
   
   $l (h (x) = f (x)) + l (h (x) \neq f (x)) = A$  
  
 证毕. 
  
 现在证明定理： 
  
 
   
  
 上式说明度量结果与学习算法εa无关，“没有免费的午餐定理”仍然成立。 
  
 证明完毕。 
  
 
  关于证明的补充说明：本文的引理没有考虑第二章2.3节中的代价敏感错误。若本题中考虑代价敏感错误，则各种不同代价错误出现的概率也是满足平均分布的，引理1仍然成立，但是证明过程会更加复杂。 
  
 
  思考： NFL定理证明过程中假设了f均匀分布，并且目标是学习所有的真实函数f。现实生活中，具体的学习算法无需学习所有的真实函数，因为所有真实函数在现实中的映射即天底下所有问题都可以用相同的这一组特征来描述，这是不现实的。若用同一组特征来描述所有问题，那么分类结果必将杂乱无章没有任何规律可言，这也是书中假设f满足均匀分布的原因。真实情况下，也许没有任何一种分布能够描述其特征。因此NFL并不意味着好的学习算法没有意义。 
   
  1.5 试述机器学习能在互联网搜索的哪些环节起作用 
  1.在向搜索引擎提交信息的阶段，能够从提交文本中进行信息提取，进行语义分析。 
 2.在搜索引擎进行信息匹配的阶段，能够提高问题与各个信息的匹配程度。 
 3.在向用户展示搜索结果的阶段，能够根据用户对结果感兴趣的程度进行排序。

LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
【数据攻略】字节面试真题（含答案）+100道面试题库六哥（数据攻略）面试数据分析 java
整理了一套字节的面试真题，还有100道PDF版的面试题库一、SQL题面试真题1：抖音电商平台，现有一张订单表（order_info），有以下字段：order_idgoods_idorder_amt请统计销量金额前10的商品信息。▼参考答案：此题考察的知识点较为简单，主要是考察GROUPBY和窗口函数。面试真题2：现有一张用户登录表（user_login_log），请统计2021.9.1之前活跃过，
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
单片机原理及应用——C51语言版（第2版，林立、张俊亮编著）课后习题及答案
第一章习题1.1单项选择题（1）单片机又称为单片微计算机，最初的英文缩写是____。答案(D)A.MCPB.CPUC.DPJD.SCM（2）Intel公司的MCS-51系列单片机是______的单片机。答案(C)A.1位B.4位C.8位D.16位（3）单片机的特点里没有包括在内的是______。答案(C)A.集成度高B.功耗低C.密封性强D.性价比高（4）单片机的发展趋势中没有包括的是______
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
智能产品经理的核心能力 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
智能产品经理的核心能力1.背景介绍在当今快节奏的数字时代,产品经理扮演着至关重要的角色,他们负责确保产品满足用户需求,实现商业目标,并保持竞争优势。随着人工智能(AI)和机器学习(ML)技术的不断发展,智能产品经理的概念应运而生。智能产品经理需要将传统的产品管理技能与新兴技术相结合,以创建具有创新性和智能化的产品体验。智能产品不仅需要满足功能需求,还需要提供个性化、智能化和无缝的用户体验。这对产品
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
堡垒机操作行为异常检测的机器学习算法应用
一、传统检测模式的困境与机器学习的破局价值在数字化转型浪潮中，堡垒机作为运维安全的核心防线，面临着操作行为复杂度激增与检测能力滞后的双重挑战。传统检测手段主要依赖静态规则库与统计模型，存在三大致命缺陷：规则固化与误报泛滥：某金融机构曾因规则库未及时更新，导致运维人员正常批量操作被误判为“暴力破解”，单日误报量超2000次，消耗安全团队60%的精力。动态行为适应性弱：微服务架构下，运维人员访问路径呈
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
95%程序员不知道的JVM调优技巧：让GC时间从2秒降到50ms的实战案例小筱在线 jvm 测试工具
前言：为什么JVM调优如此重要？在现代Java应用开发中，JVM调优是提升应用性能的关键环节。一个经过精心调优的JVM可以显著减少垃圾回收(GC)停顿时间，提高吞吐量，从而为用户提供更流畅的体验。本文将分享一个真实案例，展示如何通过系统化的调优方法，将GC时间从2秒降低到50ms，提升近40倍的性能表现。第一章：理解JVM内存结构与GC机制1.1JVM内存结构详解（JDK1.8）Java虚拟机内存
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
机器学习与光子学的融合正重塑光学器件设计范式 m0_75133639 光电智能电视二维材料电子半导体人工智能顶刊 nature
Nature/Science最新研究表明，该交叉领域聚焦六大前沿方向：光子器件逆向设计、超构材料智能优化、光子神经网络加速器、非线性光学芯片开发、多任务协同优化及光谱智能预测。系统掌握该领域需构建四维知识体系：1、基础融合——从空间/集成光学系统切入，解析机器学习赋能光学的理论必然性，涵盖光学神经网络构建原理2、逆向设计革命——通过AnsysOptics实战，掌握FDTD算法与粒子群/拓扑优化技术
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
全球人工智能与机器学习大会PPT a flying bird 论文解读和大咖技术号记录人工智能
大会演讲PPT合集https://ppt.infoq.cn/list/93PPT分享|ppt|人工智能|aicon|infoq|机器学习PPT分享,前段时间的AICon北京站2021全球人工智能与机器学习大会（https://aicon.infoq.cn/2021/beijing），汇集了很多业界大佬，工业界多个方向的从业人员分享了他们在实际业……https://xw.qq.com/cmsid/2
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
数据挖掘：从理论到实践的深度探索代码老y 数据挖掘人工智能
在当今数字化时代，数据已经成为企业决策的重要依据。数据挖掘作为一门从大量数据中提取有价值信息的技术，已经广泛应用于各个领域，如金融、医疗、零售、互联网等。本文将深入探讨数据挖掘的基本概念、主要技术和实际应用案例，帮助读者更好地理解数据挖掘的价值和应用。一、数据挖掘的基本概念（一）数据挖掘的定义数据挖掘（DataMining）是从大量数据中提取有用信息的过程。它结合了统计学、机器学习、数据库技术和人
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

《机器学习》（周志华）第一章课后习题参考答案

《机器学习》（周志华）第一章课后习题参考答案

1.1 求版本空间

1.2 求假设空间大小

1.3 归纳偏好设计

1.4 “没有免费的午餐定理”拓展证明

1.5 试述机器学习能在互联网搜索的哪些环节起作用

你可能感兴趣的:(《机器学习》（周志华）第一章课后习题参考答案)