linkFly

jQuery源码解读 - 数据缓存系统：jQuery.data

jQuery在1.2后引入jQuery.data（数据缓存系统），主要的作用是让一组自定义的数据可以DOM元素相关联——浅显的说：就是让一个对象和一组数据一对一的关联。

一组和Element相关的数据如何关联着这个Element一直是web前端的大姨妈，而最初的jQuery事件系统照搬Dean Edwards的addEvent.js：将回调挂载在EventTarget上，这样下来，循环引用是不可忽视的问题。而在web前端中，数据和DOM的关系太过基情和紧张，于是jQuery在1.2中，正式缔造了jQuery.data，就是为了解决这段孽缘：自定义数据和DOM进行关联。

文中所说的Element主要是指数据挂载所关联的target(目标)，并不局限于Element对象。

本文原创于linkFly，原文地址。

这篇文章主要分为以下知识

jQuery.data模型
jQuery.1.x中jQuery.data实现
jQuery.2.x中jQuery.data实现
其他实现

jQuery.data模型

模型

凡存在，皆真理——任何一样事物的存在必然有其存在的理由，于我们的角度来说，这叫需求。

一组数据，如何与DOM相关联一直是web前端的痛处，因为浏览器的兼容性等因素。最初的jQuery事件系统照搬Dean Edwards的addEvent.js：将回调挂载在EventTarget上，这样下来，循环引用是不可忽视的问题，它把事件的回调都放在相应的EventTarget上，当回调中再引用EventTarget的时候，会造成循环引用。于是缔造了jQuery.data，在jQuery.event中通过jQuery.data挂载回调函数，这样解决了回调函数的循环引用，随时时间的推移，jQuery.data应用越来越广,例如后来的jQuery.queue。

首先我们要搞清楚jQuery.data解决的需求，有一组和DOM相关/描述Element的数据，如何存放和挂载呢？可能有人是这样的：

使用attributes

HTML：

<div id="demo" userData="linkFly"></div>

javascript：

(function () {
            var demo = document.getElementById('demo');
            console.log(demo.getAttribute('userData'));
})();

使用HTML5的dataset

HTML：

<div id="demo2" data-user="linkFly"></div>

javascript：

        (function () {
            var demo = document.getElementById('demo2');
            console.log(demo.dataset.user);
        })();

为DOM实例进行扩展

HTML：

<div id="demo3"></div>

javascript：

        (function () {
            var demo = document.getElementById('demo3');
            demo.userData = 'demo';
            console.log(demo.userData);
        })();

虽然有解决方案，但都不是理想的解决方案，每个方案都有自己的局限性：

1、只能保存字符串（或转化为字符串类型）的数据，同时曝露了数据，并且在HTML上挂载了无谓的属性，浏览器仍然会尝试解析这些属性。
2、同上。
3、典型的污染，虽然可以保存更强大的数据（Object/Function），但是患有代码洁癖的骚年肯定是不能忍的，更主要，如果挂载的数据中引用着这个Element，则会循环引用。

jQuery.data，则是为了解决这样的自定义数据挂载问题。

模型

一窥模型吧，jQuery.data在早期，为了兼容性做了很多的事情。同时，或许是因为jQuery.data最初的需求作者也觉得太过简单，所以实现的代码上让人觉得略显仓促，早期的数据仓库很是繁琐，在jQuery.2.x后，jQuery.data重写，同时终于把jQuery.data抽离出对象。

jQuery.data模型上，就是建立一个数据仓库，而每一个挂载该数据的对象，都有自己的钥匙，他和上面的代码理念并不同:

上面的方案是：

在需要挂载数据的对象上挂载数据，就好像你身上一直带着1000块钱，要用的时候直接从口袋里掏就可以了。
jQuery.data则是：

建立一个仓库，所有的数据都放在这个仓库里，然后给每个需要挂载数据的对象一把钥匙，读取数据的时候拿这个钥匙到仓库里去拿，就好像所有人都把钱存在银行里，你需要的时候则拿着银行卡通过密码去取钱。

图一张：

我们暂时先不讨论数据仓库的样子，首先我们要关注数据和Element关联的关键点——钥匙，这个钥匙颇具争议，后续的几种数据缓存方式都是在对这个钥匙进行大的变动，因为这个钥匙，不得不放在Element上——即使你把所有的钱都存在银行里了，但是你身上还是要有相应的钥匙，这不得不让那些代码洁癖的童鞋面对这个问题：Element注定要被污染——jQuery.data只是尝试了最小的污染。

jQuery在创建的时候，会生成一个属性——jQuery.expando：

expando: "jQuery" + ( jQuery.fn.jquery + Math.random() ).replace( /\D/g, "" );

jQuery.expando是当前页面中引用的jQuery对象的身份标志（id），每个页面引用的jQuery.expando都是不重复且唯一的，所以这就是钥匙的关键：jQuery.expando生成的值作为钥匙，挂载在Element上，也就是为Element创建一个属性：这个属性的名称，就是jQuery.expando的值，这就是钥匙的关键。虽然仍然要在Element上挂载自己的数据，但是jQuery尽可能做到了最小化影响用户的东西。

当然这里需要注意：通过为Element添加钥匙的时候，使用的是jQuery.expando的值作为添加的属性名，页面每个使用过jQuery.data的Element上都有jQuery.expando的值扩展的属性名，也就是说，每个使用过jQuery.data的Element都有这个扩展的属性，通过检索这个属性值来找到仓库里的数据——钥匙是这个属性值，而不是这个jQuery.expando扩展的属性名。

木图木真相：

jQuery.1.x（截至jQuery.1.11）中，内部数据和外部数据挂载在jQuery.cache不同的地方——内部数据挂载在jQuery.cache[钥匙]下，而用户数据则挂载在jQuery.cache[钥匙].data下，原因是因为内部数据如何是用户数据挂载在一起则会存在相互覆盖的情况，要把数据给隔离开。

jQuery.1.x中jQuery.data实现

这里的jQuery.1.x主要是指jQuery.1.11。

jQuery.acceptData() - 目标过滤

因为jQuery.1.x是兼容低版本浏览器的，所以需要处理大量的浏览器兼容性，在jQuery.1.x中设计的jQuery.data是基于给目标添加属性来实现的，所以这其中找属性找钥匙找仓库很是繁琐，再加上IE低版本各种雷区，简直丧心病狂了已经。找钥匙找仓库还好说，低版本IE的雷区一踩一个爆：所以jQuery单独写了一个jQuery.acceptData用于屏蔽雷区，特别针对下面的情况：

applet和embed：这两个标签都是加载外部资源的，这两个标签在js里可以操作的权限简直就是缩卵了——根本行不通，所以jQuery直接给干掉了，直接让他们不能放标签。
flash：早期的jQuery将所有的Object标签纳入雷区，后来发现IE下的flash还是可以自定义属性的，于是针对IE的flash还是网开一面，放过了IE的flash，IE下加载flash的时候，需要对object指定一个叫做classId的属性，它的值为：clsid:D27CDB6E-AE6D-11cf-96B8-444553540000。

jQuery.acceptData配合jQuery.noData做的过滤：

    jQuery.extend({
        //jQuery.cache对象，仓库
        cache: {},
        noData: {
            //有可能权限不够，所以过滤
            "applet ": true,
            "embed ": true,
            //ie的flash可以通过
            "object ": "clsid:D27CDB6E-AE6D-11cf-96B8-444553540000"
        }
        //其余API代码略
    });

    jQuery.acceptData = function (elem) {
        //确定一个对象是否允许设置Data 
        var noData = jQuery.noData[(elem.nodeName + " ").toLowerCase()],
		nodeType = +elem.nodeType || 1;
        //进行过滤
        return nodeType !== 1 && nodeType !== 9 ?
		false :
        //如果是jQuery.noData里面限定的节点的话，则返回false
        //如果节点是object，则判定是否是IE flash的classid
	!noData || noData !== true && elem.getAttribute("classid") === noData;
    };

internalData() - 挂载/读取数据

挂载和读取数据方法是同一个（下面有分步分析）：首先拿到钥匙，也就是jQuery.expando扩展的属性，然后根据钥匙获取仓库，因为内部数据和用户数据都是挂载在jQuery.cache下的，所以在jQuery.cache下开辟了jQuery.cache[钥匙].data作为用户数据存放的空间，而jQuery.cache[钥匙]则存放jQuery的内部数据，将数据挂上之后，返回的结果是这个数据挂载的空间/位置，通过这个返回值可以访问到这个Element所有挂载的数据。

 function internalData(elem, name, data, pvt /* Internal Use Only */) {
        //pvt：标识是否是内部数据

        //判定对象是否可以存数据
        if (!jQuery.acceptData(elem)) {
            return;
        }
        var ret, thisCache,
              //来自jQuery随机数（每一个页面上唯一且不变的）
		    internalKey = jQuery.expando,
            /*
    		    如果是DOM元素，
		        为了避免javascript和DOM元素之间循环引用导致的浏览器(IE6/7)垃圾回收机制不起作用，
		        要把数据存储在全局缓存对象jQuery.cache中
            */
		    isNode = elem.nodeType,
		    //只有DOM节点才需要全局缓存，js对象是直接连接到对象的
            //如果是DOM，则cache连接到jQuery.cache
		    cache = isNode ? jQuery.cache : elem,
		    //如果是DOM，则获取钥匙，如果是第一次读取，则读取不到钥匙
		    id = isNode ? elem[internalKey] : elem[internalKey] && internalKey;
        //检测合法性，避免做更多的工作，pvt标识是否是内部数据
        if ((!id || !cache[id] || (!pvt && !cache[id].data)) && data === undefined && typeof name === "string") {
            return;
        }
        //没有拿到钥匙，则赋上ID
        if (!id) {
            if (isNode) {
                /*
                   DOM需要有一个全新的全局id，
                   为DOM建立一个jQuery的全局id
                   低版本代码：elem[ internalKey ] = id = ++jQuery.uuid;
                   这个deletedIds暂时忽略，当初jQuery准备重用uuid，后来被guid取代了
                */
                id = elem[internalKey] = deletedIds.pop() || jQuery.guid++;
            } else {
                //对象就不用这么麻烦了，直接挂钥匙就可以了
                id = internalKey;
            }
        }
        //从jQuery.cache中没有读取到，则开辟一个新的
        if (!cache[id]) {
            //创建一个新的cache对象，这个toJson是个空方法
            cache[id] = isNode ? {} : { toJSON: jQuery.noop };
            /*
              对于javascript对象，设置方法toJSON为空函数，
              以避免在执行JSON.stringify()时暴露缓存数据。
              如果一个对象定义了方法toJSON()
              JSON.stringify()在序列化该对象时会调用这个方法来生成该对象的JSON元素
            */
        }

            /*
              先把Object/Function的类型的数据挂上。调用方式 :
              $(Element).data({'name':'linkFly'});
              这里的判定没有调用jQuery.type()...当然在于作者的心态了...
            */
        if (typeof name === "object" || typeof name === "function") {
            if (pvt) {//如果是内部数据
                //挂到cache上
                cache[id] = jQuery.extend(cache[id], name);
            } else {
                //如果是自定义数据，则挂到data上
                cache[id].data = jQuery.extend(cache[id].data, name);
            }
        }
        //调整位置，因为有可能是取数据
        thisCache = cache[id];

        if (!pvt) {
            //如果不是内部数据（即用户自定义数据），则调整到jQuery.chche.data上
            if (!thisCache.data) {
                thisCache.data = {};
            }
           //继续调整位置
            thisCache = thisCache.data;
        }
        /*
             到了这里外面的调用方式是
             $(Element).data('name','value');
        */
        if (data !== undefined) {
            //挂上数据
            thisCache[jQuery.camelCase(name)] = data;
        }
       if (typeof name === "string") {
            ret = thisCache[name];
            if (ret == null) {
                ret = thisCache[jQuery.camelCase(name)];
            }
        } else {
           ret = thisCache;
        }

        //同时处理获取数据的情况
        return ret;
    }

太长看起来恶心？来，我们一点点分析：

1、首先，检测是否可以存放数据，可以的话初始化操作，针对变量id要注意，这里的一直在找上面我们所说的挂载在Element上那个存放钥匙的属性，也就是jQuery.expando的值

        if (!jQuery.acceptData(elem)) {
            return;
        }
        var ret, thisCache,
             //来自就jQuery随机数（每一个页面上唯一且不变的）
		    internalKey = jQuery.expando,
            /*
        	    如果是DOM元素，
		        为了避免javascript和DOM元素之间循环引用导致的浏览器(IE6/7)垃圾回收机制不起作用，
		        要把数据存储在全局缓存对象jQuery.cache中；
		        对于javascript对象有垃圾回收机制
		        所以不会有内存泄露的问题
		        因此数据可以直接存储在javascript对象上
            */
		    isNode = elem.nodeType,
            //如果是Element，则cache连接到jQuery.cache
		    cache = isNode ? jQuery.cache : elem,
		    //如果是Element，则获取钥匙
		    id = isNode ? elem[internalKey] : elem[internalKey] && internalKey;
        //检测合法性，第一次调用$(Element).data('name')会被拦截
        if ((!id || !cache[id] || (!pvt && !cache[id].data)) && data === undefined && typeof name === "string") {
            return;
        }

2、如果没有钥匙(id)，则为目标添加上钥匙，代码如下：

        //没有ID，则赋上ID
        if (!id) {
            if (isNode) {
               /*
                DOM需要有一个全新的全局id
                为DOM建立一个jQuery的全局id
                低版本代码：elem[ internalKey ] = id = ++jQuery.uuid;
                这个deletedIds暂时忽略
                id = elem[internalKey] = deletedIds.pop() || jQuery.guid++;
                */
            } else {
                //而对象不需要
                id = internalKey;
            }
        }

2、根据钥匙，尝试从cache中读仓库的位置，如果仓库中还没有这个目标的存放空间，则开辟一个，这里特别针对了JSON做了处理：当调用JSON.stringify序列化对象的时候，会调用这个对象的toJSON方法，为了保证jQuery.data里面数据的安全，所以直接重写toJSON为一个空方法（jQuery.noop）,这样就不会曝露jQuery.data里面的数据。另外一种说法是针对HTML5处理的dataAttr()（下面有讲）使用JSON.parse转换Object对象，而这个JSON可能是JSON2.js引入的：JSON2.js会为一系列原生类型添加toJSON方法，导致for in循环判定是否为空对象的时候无法正确判定——所以jQuery搞了个jQuery.noop来处理这里。

        //从cache中没有读取到
        if (!cache[id]) {
            //创建一个新的cache对象，这个toJson是个空方法
            cache[id] = isNode ? {} : { toJSON: jQuery.noop };
            /*
                对于javascript对象，设置方法toJSON为空函数，
                以避免在执行JSON.stringify()时暴露缓存数据。
                如果一个对象定义了方法toJSON()
                JSON.stringify()在序列化该对象时会调用这个方法来生成该对象的JSON元素
            */
        }

3、如果是Function/Object，则直接调用jQuery.extend挂数据，把$(Element).data({'name':'linkFly'})这种调用方式的数据挂到jQuery.cache

        /*
          先把Object/Function的类型的数据挂上。调用方式 :
          $(Element).data({'name':'linkFly'});
          这里的判定没有调用jQuery.type()...当然在于作者的心态了...
        */

        if (typeof name === "object" || typeof name === "function") {
            if (pvt) {//如果是内部数据
                //挂到cache上
                cache[id] = jQuery.extend(cache[id], name);
            } else {
                //如果是自定义数据，则挂到data上
                cache[id].data = jQuery.extend(cache[id].data, name);
            }
        }

4、还有其他数据类型（String之类的）没有挂载上，这里把$(Element).data('name','value')的数据挂载上，最后要把这个data作为方法的返回值，这个返回值非常重要，从而实现也可以读取数据的功能。

        //有可能是获取数据，所以开始调整位置
        thisCache = cache[id];
        //调整返回值的位置
        if (!pvt) {
            //如果不是内部数据（即用户自定义数据），则挂到jQuery.chche.data上
            if (!thisCache.data) {
                thisCache.data = {};
            }

            thisCache = thisCache.data;
        }
        /*
                如果是这样调用的：$(Element).data('name','value');
                那么刚好利用上面的thisCache（当前指向要挂载的空间）
                把数据挂上去
        */
        if (data !== undefined) {
            thisCache[jQuery.camelCase(name)] = data;
        }
        //数据全部挂好，调整返回值
        if (typeof name === "string") {
            //如果参数是一个字符串
            //则抓取这个字符串对应的数据
            ret = thisCache[name];

            //抓取失败，转换成驼峰再抓
            if (ret == null) {
            }
        } else {
            //如果参数是Object/Function，则直接返回
            ret = thisCache;
        }

        //最终返回
        return ret;

代码上非常严谨，每一步都尽可能写在最恰当的地方，这里的方法会在jQuery最外层的API中和dataAttr()（下面会讲）方法一起配合来实现挂载/读取数据。

internalRemoveData() - 移除数据

数据移除方法移除数据方便比较简单，但是当仓库中没有相应Element存储的数据的时候，会直接从仓库中删除这个存储空间（下面有分步分析）：

function internalRemoveData(elem, name, pvt) {
        //移除一个data到jQuery缓存中
        if (!jQuery.acceptData(elem)) {
            return;
        }

        var thisCache, i,
		isNode = elem.nodeType,
		cache = isNode ? jQuery.cache : elem,
		id = isNode ? elem[jQuery.expando] : jQuery.expando;
        if (!cache[id]) {
            return;
        }

        if (name) {
            //获取数据
            thisCache = pvt ? cache[id] : cache[id].data;

            if (thisCache) {
                if (!jQuery.isArray(name)) {//如果并不具有数组行为
                    if (name in thisCache) {
                        //检查缓存是否有这个对象
                        name = [name];
                    } else {
                        name = jQuery.camelCase(name);
                        //转换驼峰再次尝试
                        if (name in thisCache) {
                            name = [name];
                        } else {
                            //拿不到
                            name = name.split(" ");
                        }
                    }
                } else {
                    //jQuery.map将一个类数组转转换成真正的数组
                    //注意这里使用了连接，即如果删除失败则采用驼峰命名再次尝试删除，逻辑好严谨
                    name = name.concat(jQuery.map(name, jQuery.camelCase));
                }

                i = name.length;
                //删除缓存
                while (i--) {
                    delete thisCache[name[i]];
                }

                //如果是剩下的缓存中没有数据了，则完成了任务，否则继续
                if (pvt ? !isEmptyDataObject(thisCache) : !jQuery.isEmptyObject(thisCache)) {
                    return;
                }
            }
        }

        //如果不是jQuery内部使用
        if (!pvt) {
            delete cache[id].data;// data也删除
            //检测还有没有数据，还有数据则继续
            if (!isEmptyDataObject(cache[id])) {
                return;
            }
        }

        //如果是Element，则破坏缓存
        if (isNode) {
            jQuery.cleanData([elem], true);
        } else if (support.deleteExpando || cache != cache.window) {
            //不为window的情况下，或者可以浏览器检测可以删除window.属性，再次尝试删除
            //低版本ie不允许删除window的属性
            delete cache[id];
        } else {
            //否则，直接null
            cache[id] = null;
        }
    }

1、和internalData()一样，拿钥匙。

        //移除一个data到jQuery缓存中
        if (!jQuery.acceptData(elem)) {
            return;
        }

        var thisCache, i,
		    isNode = elem.nodeType,
		    cache = isNode ? jQuery.cache : elem,
                //根据jQuery标识拿钥匙
		    id = isNode ? elem[jQuery.expando] : jQuery.expando;
        //如果找不到缓存，不再继续
        if (!cache[id]) {
            return;
        }

2、找到仓库存储数据的位置，然后删除数据，这里充分的考虑了数据命名和Object参数的情况。

if (name) {
            //获取缓存的位置
            thisCache = pvt ? cache[id] : cache[id].data;
            if (thisCache) {
                if (!jQuery.isArray(name)) {//如果并不具有数组行为
                    if (name in thisCache) {
                        //检查缓存是否有这个对象
                        name = [name];
                    } else {
                        name = jQuery.camelCase(name);
                        //转换驼峰再次尝试
                        if (name in thisCache) {
                            name = [name];
                        } else {
                            /*
                              这样都还拿不到，那还是按照自己的方式拿把,
                              也就是说jQuery支持
                            $(Element).removeData('name name2 name 3')
                              这样批量删除数据，真是被jQuery宠坏了...
                            */
                            name = name.split(" ");
                        }
                    }
                } else {
                    //jQuery.map将一个类数组转转换成真正的数组
                    //注意这里使用了连接，即如果删除失败则采用驼峰命名再次尝试删除，逻辑好严谨
                    name = name.concat(jQuery.map(name, jQuery.camelCase));
                    //'name-demo name-demo2'会转换成
                    //'name-demo name-demo2 nameDemo nameDemo2'
                }

                i = name.length;
                //删除缓存
                while (i--) {
                    delete thisCache[name[i]];
                }
                /*
                 如果是剩下的缓存中没有数据了，则完成了任务，否则有不和谐的情况，要继续处理
                isEmptyDataObject专门用来检测用户缓存空间是否是空Data，
                如果缓存空间是这样的{ test:{'name':'value'} }（用户数据挂载的空间[data]是空的），就能通过
                */
                if (pvt ? !isEmptyDataObject(thisCache) : !jQuery.isEmptyObject(thisCache)) {
                    return;
                }
            }
        }

3、如果数据全部删除了，那么仓库存储数据的空间也要被删除，所以接下来针对这些情况进行了处理

        //如果不是jQuery内部使用
        if (!pvt) {
            delete cache[id].data;// 连data也删除
            //检测还有没有数据，还有数据则继续
            if (!isEmptyDataObject(cache[id])) {
                return;
            }
        }

4、因为jQuery.data和jQuery.event事件系统直接挂钩，所以这里特别针对事件系统挂载的数据进行了删除处理，jQuery.cleanData方法涉及jQuery.event，所以暂不解读了。

        //如果是Element，则破坏缓存
        if (isNode) {
            //和jQuery.event挂钩，不分析了...
            jQuery.cleanData([elem], true);
        } else if (support.deleteExpando || cache != cache.window) {
            //不为window的情况下，或者可以浏览器检测可以删除window.属性，再次尝试删除
            delete cache[id];
        } else {
            //否则，直接粗暴的null
            cache[id] = null;
        }

dataAttr()和jQuery.fn.data() - 针对HTML5的dataset和曝露API

dataAttr()是特别针对HTML5的dataset进行处理的方法，用处是读取Element上HTML5的data-*属性转换到jQuery.data中，是针对HTML5的兼容，典型的老夫就是要宠死你的方法：

    function dataAttr(elem, key, data) {
        //针对HTML5做一层特别处理，等下在jQuery.fn.data中和internalData()配合使用将会大放异彩

        /*
              注意这里的一层判定，在jQuery.fn.data调用的时候
              会先调用用internalData()，然后把internalData()的返回值传递到这里，就是data
              如果data为undefined，则进行HTML5处理
        */
        if (data === undefined && elem.nodeType === 1) {
            /*
                rmultiDash = /([A-Z])/g
                针对HTML5，把驼峰命名的数据转换为连字符：
                dataSet转换为data-set
            */
            var name = "data-" + key.replace(rmultiDash, "-$1").toLowerCase();
            data = elem.getAttribute(name);//不用dataset是因为一些比较古老的手机没有被支持，楼主就被折磨过...
            if (typeof data === "string") {
                //各种丧心病狂的转换数据
                //把不同的数据类型给转换成需要的类型
                try {
                    data = data === "true" ? true :
					data === "false" ? false :
					data === "null" ? null :
                    //如果是数字
					+data + "" === data ? +data :
                    //匹配json
					rbrace.test(data) ? jQuery.parseJSON(data) :
					data;
                } catch (e) { }
                //把HTML5的数据挂到jQuery中
                jQuery.data(elem, key, data);

            } else {
                data = undefined;
            }
        }
        //返回这个data，jQuery.fn.data会调用dataAttr()并返回它的值
        return data;
    }

jQuery.data实现很简单......个屁啊，妈蛋啊看起来就是调用internalData()实现，实际上jQuery.fn.data更加的健壮，同时将各种内层的方法都联接的惟妙惟肖，当然这也意味着性能更逊色一点，

jQuery.fn.extend({
        data: function (key, value) {
            var i, name, data,
			elem = this[0],
			attrs = elem && elem.attributes;
            //$(Element).data() - 获取全部数据
            if (key === undefined) {
                //获取
                if (this.length) {
                    data = jQuery.data(elem);
                    //如果没有标志parsedAttrs的数据，则表示没有进行过HTML5的属性转换
                    if (elem.nodeType === 1 && !jQuery._data(elem, "parsedAttrs")) {
                        i = attrs.length;
                        while (i--) {
                            //那么转换HTML5的属性
                            if (attrs[i]) {
                                name = attrs[i].name;
                                if (name.indexOf("data-") === 0) {
                                    name = jQuery.camelCase(name.slice(5));
                                    //配合dataAttr进行转换
                                    dataAttr(elem, name, data[name]);
                                }
                            }
                        }
                        //放上属性parsedAttrs，表示HTML5转换完毕
                        jQuery._data(elem, "parsedAttrs", true);
                    }
                }

                return data;
            }

            //$(Element).data({ name:'linkFly',value:'hello world' });
            if (typeof key === "object") {
                //循环设置
                return this.each(function () {
                    jQuery.data(this, key);
                });
            }

            return arguments.length > 1 ?
            //$(Element).data('name','linkFly')
			this.each(function () {
			    jQuery.data(this, key, value);
			}) :
                /*
                    使用jQuery.data读取数据，如果读取不到，则调用dataAttr()读取并设置一遍HTML5的数据
                */
			elem ? dataAttr(elem, key, jQuery.data(elem, key)) : undefined;
        }
    });

1、针对获取全部数据做处理，同时在内部标识上parsedAttrs，表示这个Element已经被转换过HTML5属性了：

            if (key === undefined) {
                //获取
                if (this.length) {
                    data = jQuery.data(elem);
                    //如果没有标志parsedAttrs的数据，则表示没有进行过HTML5的属性转换
                    if (elem.nodeType === 1 && !jQuery._data(elem, "parsedAttrs")) {
                        i = attrs.length;
                        while (i--) {
                            //那么转换HTML5的属性
                            if (attrs[i]) {
                                name = attrs[i].name;
                                if (name.indexOf("data-") === 0) {
                                    name = jQuery.camelCase(name.slice(5));
                                    //配合dataAttr进行转换
                                    dataAttr(elem, name, data[name]);
                                }
                            }
                        }
                        //放上属性parsedAttrs，表示HTML5转换完毕
                        jQuery._data(elem, "parsedAttrs", true);
                    }
                }

                return data;
            }

2、如果不是读取全部数据，则情况要么是挂载数据，要么是读取数据，但在最后的一段代码比较不错，是internalData()和dataAttr()的配合使用针对HTML5 dataset的兼容：

        if (typeof key === "object") {
                //循环设置
                return this.each(function () {
                    jQuery.data(this, key);
                });
        }

        return arguments.length > 1 ?
            //$(Element).data('name','linkFly')
		this.each(function () {
			jQuery.data(this, key, value);
		}) :
                /*
                    $(Elment).data('name')  
                    这里的代码很有意思：
                    jQuery.data(elem,key)是调用internalData()，而internalData最终会返回要挂载的数据
                    如果用户挂载的数据是空的，则调用dataAttr()尝试转换HTML5的数据返回并且给挂到jQuery.data
                */
        elem ? dataAttr(elem, key, jQuery.data(elem, key)) : undefined;
}

这里重点照顾最后一句，它实现了：

读取数据：$(Element).data('demo');
如果读取不到，读取HTML5的dataset数据并挂载到jQuery.cache中。

如果到了这里，那么调用方式会是：$(Elment).data('name')，这时候的处理方法就是：

jQuery.data底层是internalData()，当第三个参数为空的时候，则是读取数据
internalData()如果读取不到数据，则调用dataAttr()，而dataAttr第三个参数为undefined的时候，则会读取HTML5的dataset，然后再调用jQuery.data()（注意不是jQuery.fn.data）再挂一次数据。

好的各位爷，至此 jQuery.1.x代码已经读完了，要不您老喝点茶看看窗外放松一下消化一下上面的代码？：

jQuery.expando是钥匙的关键，将jQuery.expando的值挂在Element上，就好像在你身上挂了一张银行卡，而银行卡的密码，则是jQuery.guid（累加不重复）。
通过钥匙找到仓库，进行操作。
internalData()的思路很值得借鉴，在挂数据的时候同时取数据，尤其在jQuery.cache这个相对比较复杂的环境里，如何更高效的取数据本身就是一件值得思考的事情。
internalRemoveData()实现了深度删除数据，尽可能让数据仿佛从未存在过，并且尝试了多种删除。
dataAttr()是针对HTML5特别的兼容处理。
internalData()方法非常的严谨，但是它仍然只是为了挂载数据和移除数据而生，非常纯粹而简单的工作着，真正让jQuery健壮的是jQuery.fn.data。

jQuery.2.x中jQuery.data实现

这里的jQuery.2.x主要是指jQuery.2.1。

在jQuery.2.x中，jQuery.data终于决定被好好深造一下了，过去1.x的代码说多了都是泪，jQuery.2.x没有了兼容性的后顾之忧，改写后的代码读起来简直不要太舒适啊。

在jQuery.2.x中，为数据缓存建立了Data对象，一个Data对象表示一个数据仓库——用户数据和内部数据各自使用不同的Data对象，这样就不需要在仓库里翻来翻去的查找数据存储的位置了（jQuery.cache[钥匙]和jQuery.cache[钥匙].data），思路上，仍然和jQuery.1.x一致，采用扩展属性的方式实现，关键点在Data.prorotype.key()上。

Data对象 - 数据仓库

Data对象经过封装以后衍生了这些API：

key：专门用来获取和放置Element的钥匙。
set/get：放置和获取数据
access：通用API，根据参数既然可以放置也可以获取数据
remove：移除数据
hasData：检测是否有数据
discard：丢弃掉这个Element的存储空间

其他的实现都比较简单，我们需要关注钥匙这里，也就是Data.prototype.key()。

Data.prototype.key() - 钥匙

Data.prototype = {
        //获取缓存的钥匙
        key: function (owner) {
            //检测是否可以存放钥匙
            if (!Data.accepts(owner)) {
                return 0; //return false
            }

            var descriptor = {},
                //获取钥匙，还是在Element上挂载jQuery属性
	         unlock = owner[this.expando];
            //如果钥匙没有则创建
            if (!unlock) {
                unlock = Data.uid++;
                try {
                    //把expando转移到Data中，没一个Data实例都有不同的expando
                    descriptor[this.expando] = { value: unlock };
                    //参考：http://msdn.microsoft.com/zh-cn/library/ie/ff800817%28v=vs.94%29.aspx
                    //这个属性不会被枚举
                    Object.defineProperties(owner, descriptor);
                } catch (e) {
                    //如果没有Object.defineProperties，则采用jQuery.extend
                    descriptor[this.expando] = unlock;
                    jQuery.extend(owner, descriptor);
                }
            }
            if (!this.cache[unlock]) {
                this.cache[unlock] = {};
            }
            //返回这个钥匙
            return unlock;
        }
    };

因为用户数据和jQuery内部数据通过Data分离，所以set/get在拿到钥匙之后都比较简单。

access() - 通用接口

在创建Data对象的时候，顺便为jQuery创建了静态方法——jQuery.access：通用的底层方法，既能设置也能读取，它应用在jQuery很多API中，例如：Text()、HTML()等。

var access = jQuery.access = function (elems, fn, key, value, chainable, emptyGet, raw) {
        //元素，委托的方法，属性名，属性值，是否链式，当返回空数据的时候采用的默认值,fn参数是否是Function
        //一组通用（内部）方法，既然设置也能获取Data
        var i = 0,
		len = elems.length,
		bulk = key == null;
        //Object
        if (jQuery.type(key) === "object") {
            //如果是放数据，Object类型，则循环执行fn
            chainable = true;//这里修正了是否链式....
            for (i in key) {
                jQuery.access(elems, fn, i, key[i], true, emptyGet, raw);
            }

            // Sets one value
        } else if (value !== undefined) {
            chainable = true;
            //如果设置的value是Function
            if (!jQuery.isFunction(value)) {
                raw = true;
            }
            //当参数是这样的：access(elems,fn,null)
            if (bulk) {
                if (raw) {
                    //参数是这样的：access(elems,fn,null,function)
                    fn.call(elems, value);
                    fn = null;
                } else {
                    //参数是这样的：access(elems,fn,null,String/Object)
                    bulk = fn;//这里把fn给调换了
                    fn = function (elem, key, value) {
                        //这个jQuery()封装的真是....
                        return bulk.call(jQuery(elem), value);
                    };
                }
            }
            //到了这里如果还可以执行的话那么参数是：access(elems,fn,key,Function||Object/String)
            if (fn) {
                for (; i < len; i++) {
                    //循环每一项执行
                    fn(elems[i], key, raw ? value : value.call(elems[i], i, fn(elems[i], key)));
                }
            }
        }

        return chainable ?
            //如果是设置数据，这个elems最终被返回，而在jQuery.fn.data中这个elems是this——也就是jQuery对象，保证了链式
            elems :

        // Gets
            //如果上面的设置方法都没有走，那么就是获取
		bulk ?//bulk是不同的工作模式，参阅jQuery.css，jQuery.attr
			fn.call(elems) :
			len ? fn(elems[0], key) : emptyGet;
    };

jQuery.fn.data() - 曝露API

相比jQuery.1.x代码更加的细腻了许多，这里配合着上面定义的access()使用，为每一个循环的jQuery项设置和读取数据，阅读起来比较轻松。

jQuery.fn.extend({
        data: function (key, value) {
            var i, name, data,
			elem = this[0],
			attrs = elem && elem.attributes;

            // 获取全部的数据，和1.x思路一致
            if (key === undefined) {
                if (this.length) {
                    data = data_user.get(elem);

                    if (elem.nodeType === 1 && !data_priv.get(elem, "hasDataAttrs")) {
                        i = attrs.length;
                        while (i--) {

                            // Support: IE11+
                            // The attrs elements can be null (#14894)
                            if (attrs[i]) {
                                name = attrs[i].name;
                                if (name.indexOf("data-") === 0) {
                                    name = jQuery.camelCase(name.slice(5));
                                    dataAttr(elem, name, data[name]);
                                }
                            }
                        }
                        data_priv.set(elem, "hasDataAttrs", true);
                    }
                }

                return data;
            }

            // 设置Object类型的的数据
            if (typeof key === "object") {
                return this.each(function () {
                    data_user.set(this, key);
                });
            }
            //调用jQuery.access
            return access(this, function (value) {
                //value则是挂载的数据名（即使外面挂载的Object也会被拆开到这里一个个循环执行）
                var data,
		     camelKey = jQuery.camelCase(key);//转换驼峰
                if (elem && value === undefined) {
                    //拿数据
                    data = data_user.get(elem, key);
                    if (data !== undefined) {
                        return data;
                    }
                    //用驼峰拿
                    data = data_user.get(elem, camelKey);
                    if (data !== undefined) {
                        return data;
                    }
                    //用HTML5拿
                    data = dataAttr(elem, camelKey, undefined);
                    if (data !== undefined) {
                        return data;
                    }
                    return;
                }
                //循环每一项设置
                this.each(function () {
                    //提前设置驼峰的...
                    data_user.set(this, camelKey, value);
                    if (key.indexOf("-") !== -1 && data !== undefined) {
                    //如果有name-name命名再设一边
                        data_user.set(this, key, value);
                    }
                });
            }, null, value, arguments.length > 1, null, true);
        },

        removeData: function (key) {
            return this.each(function () {
                //调用相应Data实例方法移除即可
                data_user.remove(this, key);
            });
        }
    });

各位看官到了这里可以继续小憩一下，后面我们再来谈谈关于这个jQuery.data更多有意思的事情...总结一下， jQuery.2.x的缓存设计理念清晰，最主要的就是封装成了Data对象以后将用户数据和jQuery内部使用的数据隔离开，这是最大的改进。移动端的 Zepto里的Zepto.data是 jQuery.data.2.x的浓缩版。

其他实现

这些实现都是在司徒正美的《javascript框架设计》 - "数据缓存系统"一章里读到的，有必要宣传和感谢一下这本书，了解了很多代码的由来促进了理解。

这些实现其实都是针对钥匙怎么交给Element这个问题上进行的探索。

valueOf()重写

在jQuery.2.x最初设计的jQuery.data中，作者也在为Element挂载这个expando属性作为钥匙而头疼，于是给出了另外一种钥匙的挂载方法——重写valueOf()。 Waldron

在为Element挂载钥匙的时候，不再给这个Element声明属性，而是通过重写Element的valueOf方法实现。

虽然我翻了jQuery.2.0.0 - jQuery.2.1.1都没有找到这种做法，但觉得还是有必要提一下：

    function Data() {
            this.cache = {};
        };
        Data.uid = 1;
        Data.prototype = {
            locker: function (owner) {
                var ovalueOf,
                    unlock = owner.valueOf(Data);
                /*
                owner为元素节点、文档对象、window
                传递Data类，如果返回object说明没有被重写，返回string则表示已被重写
                整个过程被jQuery称之为开锁，通过valueOf得到钥匙，进入仓库
                */
                if (typeof unlock !== 'string') {
                    //通过闭包保存，也意味着内存消耗更大
                    unlock = jQuery.expando + Data.uid++;
                    //缓存原valueOf方法
                    ovalueOf = owner.valueOf;
                    Object.defineProperty(owner, 'valueOf', {
                        value: function (pick) {
                            //传入Data
                            if (pick === Data)
                                return unlock; //返回钥匙
                            return ovalueOf.apply(owner); //返回原valueOf方法
                        }
                    });
                }
                if (!this.cache[unlock])
                    this.cache[unlock] = {};
                return unlock;
            },
            get: function (owner, key) {
                var cache = this.cache[this.locker(owner)];
                return key === undefined ? cache : cache[key];
            },
            set: function (owner, key, value) {
                //略
            }
            /*其他方法略*/
        };

思路上很是新颖——因为在js中几乎所有的js数据类型(null,undefined除外)都拥有valueOf/toString方法，所以直接重写Element的valueOf，在传入Data对象的时候，返回钥匙，否则返回原valueOf方法——优点是钥匙隐性挂到了Element上，保证了Element的干净和无需再考虑挂属性兼不兼容等问题了，而缺点就是采用闭包，所以内存消耗更大，或许jQuery也觉得这种做法的内存消耗不能忍，所以仍未采用——相比较放置钥匙到Element的方式，还是后者更加的纯粹和稳定。

Array.prototype.indexOf()

Array.prototype.indexOf()是ECMAScript 5（低版本浏览器可以使用代码模拟）定义的方法——可以从一组Array中检索某项是否存在？存在返回该项索引：不存在则返回-1。听起来很相似？没错，它就是String.prototype.indexOf()的数组版。

正是因为提供了针对数组项的查找，所以可以采用新的思路：

1、将使用data()方法挂载数据的Element通过闭包缓存到一个数组中
2、当下次需要检索和这个Element关联的数据的时候，只需要通过Array.ptototype.indexOf在闭包中查找到这个数组即可，而闭包中这个数组查找到的索引，就是钥匙。

代码如下：

        (function () {
            var caches = [],
                add = function (owner) {
                    /*

                    //拆开来是这样子的
                    var length = caches.push(owner);//返回Array的length
                    return caches[length - 1] = {};//新建对象并返回
                    */
                    return caches(caches.push(owner) - 1) = {};
                },
            addData = function (owner, name, data) {
                var index = caches.indexOf(owner), //查找索引，索引即是钥匙
                //获取仓库
                    cache = index === -1 ? add(owner) : caches[index];
                //针对仓库放数据即可
            }
            //其他代码略
        })();

这样就不需要在Element上挂载自定义的属性（钥匙）了——然而因为每个使用过data()的Element都会在缓存下来，那么内存的消耗必不可免，相比上一种重写valueOf重写消耗更加的不能直视，这是一个有趣但并不推荐的解决方案。

WeakMap

技术总是层出不穷的，对于目前的我们来说可望不可及的ECMAScript 6定义了新的对象——WeakMap，请参考这三篇：

[译]ECMAScript 6中的集合类型,第三部分:WeakMap
WeakMap - MDN
WeakMap 对象 (JavaScript) - MSDN

WeakMap对象的键值持有其所引用对象的弱引用——当那个对象被垃圾回收销毁的时候，WeakMap对象相应的键值也会被删除。它使用get/set方法将成员添加到WeakMap——简直就是为数据缓存系统/jQuery.data量身定做的。使用它，我们Data.key()方法可以改写成下面的代码：

    (function () {
            var caches = new WeakMap(),//缓存中心
                addData = function (owner, name, data) {
                    //根据Element获取相应仓库存储的空间
                    var cache = caches.get(owner);
                    //如果获取不到，则开辟空间
                    if (!cache) {
                        cache = {};
                        //放到WeakMap对象中
                        caches.set(owner, cache);
                    }
                    //挂数据
                    cache[name] = data;
                    return cache;
                },
                removeData = function (owner, name) {
                    var cache = caches.get(owner);
                    //name为undefined的时候返回全部data，否则返回name指定的data
                    return name === undefined ? cache : cache && cache[name];
                }
            //其他代码略
        });

引用

手抄源码（有注释）：jQuery.data.js
参考书籍：司徒正美 - 《javascript框架设计》第8章：数据缓存系统

作者：linkFly

原文： http://www.cnblogs.com/silin6/p/jQuery_data.html

出处： www.cnblogs.com/silin6/

声明：嘿！你都拷走上面那么一大段了，我觉得你应该也不介意顺便拷走这一小段，希望你能够在每一次的引用中都保留这一段声明，尊重作者的辛勤劳动成果，本文与博客园共享。

如果你觉得这篇文章不错，请随手点一下右下角的“推荐”，举手之劳，却鼓舞人心，何乐而不为呢？

你可能感兴趣的:(jQuery源码解读 - 数据缓存系统：jQuery.data)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修