只会helloworld

山东大学web数据管理知识点整理

根据老师周三画的重点总结的

第三章前期不考

所有的开源工具

填空，名词解释，简答

所有的开源工具

填空，名词解释，简答

第一章

Web数据管理：在web环境下，对复杂信息的有效组织和集成，方便而准确的信息查询，集成与发布。

第二章 craw

爬虫:①一种自动获取网页内容的程序②搜索引擎的重要组成部分③通过html源码解析来获得想要的内容

过程：①从一个或者若干个初始网页的url开始

②在抓取网页的过程中，不断地从当前页面上抽取新的url放入队列

③直到满足系统的一定停止条件

功能：礼貌性，鲁棒性，分布式，可拓展性，性能和效率，新鲜度，功能可拓展性

搜索策略：广度优先和深度优先

访问标记（哈希）

常见的开源爬虫：java：webcollector，heritrix，nutch

c++：karbin

Python：pyspider，scrapy

正则表达式：定义：又称规则表达式，是对字符串操作的以重逻辑公式，就是用事先定义好的一些特定字符及这些特定字符的组合，组成一个规则字符串，用来表达一种过滤逻辑。

匹配特点：①匹配速度快②表达能力弱，只具有正规文法的表达能力

流程：1）在获取数据前应尽量去除无用部分。

提取网页内的链接

3）提取网页标题

4）提取网页内的文本

dom树：DOM将HTML视为树状结构的元素，所有元素以及他们的文字和属性可通过DOM树来操作与访问。

开原html解析器：java：htmlparser，jsoup

c++：htmlcxx

Python：beautiful soup

C#: Winista.Htmlparser.Net

两种方法比较:

正则表达式匹配

正则表达式匹配速度快，但表达能力较弱，只具有正规文法的表示能力。

在对网页内容的信噪比要求不高的情况下可以使用基于正则表达式匹配的爬取程序

HTML DOM树

提取HTML DOM树提取在解析HTML时速度较慢，但其表达能力相当于上下文无关文法。

在网页自动分类等需要进行网页去噪处理的情况时使用基于HTML DOM树的爬取程序。

元搜索:又称多搜索引擎，通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作，是对分布于网络的多种检索工具的全局控制机制。

反爬取博弈:

网站防爬取措施：①robot协议（篡改user-agent）②ip屏蔽（使用代理服务器，多ip并行，增大爬取时间间隔）③登陆④js渲染

解决方案:模拟浏览器工作

图片滑动验证码:1，判断验证码在什么时候出现。

2，验证码出现时，判断何时加载完成。

3，确定验证码的位置。

4，用鼠标模拟拖动验证码。

5，检验本次操作是否成功。

web数据抽取定义：Web 数据抽取是指从页面中将用户感兴趣的数据利用程序自动抽取到本地的过程。

过程：①将web网页进行预处理

②用一组信息模式描述所需要抽取的信息

③对文本进行合理的语法句法以及语义分析，包括识别特定的名词短语和动词短语。

④使用模式匹配方式识别指定的信息模式的各种部分。使用模式匹配方法识别指定的信息模式的各个部分。

⑤进行上下文分析和推理，确定信息的最终形式。

⑥将结果输出成结构化的描述形式以便由网络集成系统进行查询分析。

Web数据抽取方法：人工抽取：人工分析出页面模板

半自动抽取：由计算机应用页面模板抽取数据生成具体包装器，而页面模板的分析仍然需要人工参与。

自动抽取:仅仅需要很少的人工参与或者完全不需要人工参与，更加适合大规模、系统化、持续性的Web数据抽取

评价标准：

召回率(Recall):也称为查全率，指抽取到的正确结果与要抽取页面的全部结果的比。即R=|Ra| / |R|

准确率(Precision):也称为查准率，指抽取到的正确结果与抽取到的全部结果的比。即P=|Ra| / |A|

包装器是针对某一类特定的网页、计算机可以理解并执行的程序或抽取规则，其任务就是负责将HTML格式的数据抽取并转化为结构化的格式。

核心是抽取规则：抽取规则是基于HTML文档格式的，用于从每个HTML文档中抽取相关信息。

抽取规则也可以分为：

基于分界符(或界标符)的规则:将HTML文档看作字符流，给出数据项的起始和结束分界符，将其中的数据抽取出来(基于正则表达式的网页分析)
基于树路径的规则:是将文档看作一个树结构。所抽取的数据存储在树节点中，因而可根据其路径来定位。（基于DOM树的网页分析）

数据记录抽取：在网页中，一个数据记录对应着现实世界的一个实体。如果把一个网页解析成DOM树结构，一个数据记录则对应着一棵子树或多棵相邻的子树。

多记录数据型页面抽取步骤：

（1）从网页中识别数据记录的边界，抽取数据记录

（2）从数据记录中抽取出其中的数据项

抽取数据型网页的两种方法：①针对多记录的数据型网页②针对单记录数据型网页

数据记录抽取步骤：(1) 数据记录的定位问题

(2) 计算数据记录的边界

(3) 去除噪声数据记录

规则：1关键字频率规则 2 共同路径规则 3 HTML 标签序列相似性规则 4模板项分布规则 5 关键字分布规则 6 HTML 路径规则 7 :出现路径规则(OR) 8 : 视觉规则(VR)

9 :上下文信息规则 10: 文本特征规则

增量式抽取：连续性数据抽取，即从多个连续页面中抽取同结构的记录，以增量方式推导网页模板。

单文档型页面抽取：1结合视觉信息的抽取方法 2 改进的自适应数据抽取方法

爬虫数据存储：非结构：①txt②加载到hdfs

结构化：（1）文件①json②xml③csv④excel （2）数据库（3）索引结构

Csv：（比较流行）以逗号间隔的文本文件

优点：

①被Excel和很多的应用程序支持。

②用来做数据存储容量小

③很多数据集采用格式

Json：是轻量级的文本数据交换格式

常用的格式是对象的键值对

有两种结构：对象和数组

比csv大，比xml更小，更快，更易解析

Xml：可扩展标记语言

用来存储，携带，交换数据的

半结构化集成数据

数据清洗：对数据进行重新审查和校验的过程，

目的：删除重复信息、纠正存在的错误，并提供数据一致性。

缺失值处理：

1. 直接删除（常用）；

2. 或者进行插值处理（Interpolate）；

异常值/错误值处理：

1. 直接删除；

2. 极值处理到一个正常区间（推荐）；

数据挖掘工具：weka

机器学习工具：sklearn

第八章：

信息检索：从大规模非结构化数据的集合中找出满足用户信息需求的资料的过程

搜索引擎原理步骤：①爬行和抓取②建立索引③搜索词处理④排序

评价标准：覆盖面，更新周期，响应速度，排序结果是否满足用户的查询需求

核心技术： 网页爬取，网页预处理，文本处理，建立索引，查询，Rank，用户反馈

文本处理：对查询和文本进行的预处理操作（包括词项词典（词干还原，停用词消除）和中文分词）

词干还原(Stemming)：去除单词两端词缀的启发式过程。（能够提高召回率，但是会降低准确率）

词形归并（Lemmatization)：利用词汇表和词形分析来减少屈折变化的形式，将其转变为基本形式。

区别：词干还原在一般情况下会将多个派生相关词合并在一起，

而词形归并通常只将同一词元的不同屈折形式进行合并。

消除停用词：优点：①停用词消除可以减少term的个数，②缩小搜索范围，

③提高搜索的效率，④机器学习文本分类算法的文档的预处理

缺点：有时消除的停用词对检索是有意义的。

消除方法：查表法和基于文档频率

构造停用词的方法：①语法剔除②利用词频③搜集网络上一些公开的停用词表

自然语言处理工具包：NIKT

中文分词定义：将一个汉字序列切分成一个一个单独的词。

方法：①基于理解的分词方法（NLP）

②基于字符串匹配的分词方法

③基于统计的分词方法

统计语言模型：S 的概率 P(S)等于每一个词出现的概率相乘。词Wn 的出现概率取决于它前面所有词。

语言模型的应用：拼写纠错语音识别音字转换文本生成机器翻译

隐马尔可夫模型（HMM）：用来描述一个含有隐含未知参数的马尔可夫过程

HMM模型是一个五元组:

StatusSet: 状态值集合

ObservedSet: 观察值集合

TransProbMatrix: 转移概率矩阵

EmitProbMatrix: 发射概率矩阵

InitStatus: 初始状态分布

HMM模型用途：①评估观察序列概率②预测问题，也称为解码问题③模型参数学习问题

HMM模型应用：股票预测模式识别语音识别分词

两种分词模型：N-Gram语言模型，LM模型

Viterbi算法（维特比算法）：一种动态规划算法，它用于寻找最有可能产生观测事件序列的维特比路径——隐含状态序列。

过程： 主要是利用贝叶斯公式和动态规划以及路径回溯得到最佳路径

①声明wight[4][n]数组，4代表bmes四个状态，n代表数字个数，然后利用贝叶斯公式初始化wight[i][0]（状态值集合为(B, M, E, S): {B:begin, M:middle, E:end, S:single}）

②然后利用动态规划求出整个weight数组，path数组用来存每个点的路径的前一个点

③确定边界条件和路径回溯： weight[1(E)]和 weight[3(S)]最后一个数的大小，选择大的，然后根据path回溯

开源分词软件：StandardAnalyzer ICTCLAS 庖丁解牛分词 IKAnalyzer

信息检索模型的分类：①基于内容的信息检索模型②结构化模型③浏览型模型

布尔模型：一种简单的检索模型

建立在经典的集合论和布尔代数的基础上

遵循两条基本规则: 每个索引词在一篇文档中只有两种状态：出现或不出现，对应权值为 0或1。

文档：索引词（0或1）的集合

布尔模型的实现：事先给文档建立索引，如果文档包含某个词，则对应项为1，否则为0

优点：①查询简单，方便理解②通过使用复杂的布尔表达式，可方便地控制查询结果③相当有效的实现方法④用户经过训练方便容易的写出查询式

缺点：①精确匹配导致信息需求表达能力不足，不能输出部分匹配②无权重设计，无法排序

③检出的文档或者太多或者太少④难以进行自动的相关反馈

排序检索的基本——评分：希望根据文档对查询者的有用性大小顺序排序

词项频率tf：词项t在文档d中出现的次数，记为tft,d

文档频率 (Document frequency，df):出现词项的文档数目

dft 文档集合中包含t的文档数目，与词项t包含的信息量成反比dft<= N (N是文档的总数)

idf (inverse document frequency)逆文档频：idft = log10(N/dft)

idft 是反映词项t的信息量的一个指标，用log (N/dft) 代替N/dft 来抑制idf的作用

tf-idf：词项t的tf-idf 由它的tf和idf组合而成wt,d=(1+log tft,d) × log10(N/dft)

向量空间模型特点：

①维度非常高：特别是互联网搜索引擎，空间可能达到千万维或更高

②向量空间非常稀疏：对每个向量来说大部分都是0

向量间相似程度的不同度量方法：

①Inner product (内积）

②Dice coefficient

③Cosine coefficient (余弦)

④Jaccard coefficient (雅各比）

归一化：一个文档向量除以它的L2 范数就是给这个文档进行了长度归一化，文档x的L2范数为：

开源全文检索引擎：Lucene Sphinx Nutch

链接分析排序算法： Pagerank 算法 Hits 算法

PageRank 的核心思想 :vote

反向链接数 (单纯的意义上的受欢迎度指标)

反向链接是否来自推荐度高的页面 (有根据的受欢迎指标)

反向链接源页面的链接数 (被选中的几率指标)

PageRank算法和HITS算法比较：

都是基于链接分析的搜索引擎排序算法，并且在算法中两者都利用了特征向量作为理论基础和收敛性依据。
HITS算法计算的authority值只是相对于某个检索主题的权重，因此HITS算法也常被称为Query-dependent算法；
而PageRank算法是独立于检索主题，因此也常被称为Query-independent算法。

Search Engine Optimization 搜索引擎优化：是指在了解搜索引擎自然排名机制的基础上，对网站进行内部及外部的调整优化，改进网站在搜索引擎中的关键词自然排名

基于内容的图像检索（CBIR技术）：允许用户输入一张图片，以查找具有相同或相似内容的其他图片。（CBIR属于基于内容检索（CBR）的一种）

基于内容的图像检索的核心图片特征提取（低级特征：颜色，纹理，形状）

特征匹配（相似度计算）

颜色直方图（ColorHistogram）：在颜色空间中采用一定的量化方法对颜色进行量化，然后统计每一个量化通道在整幅图像中所占的比重。

描述的是不同色彩在整幅图像中所占的比例

统计分布特性

具有平移、尺度、旋转不变性

特别适于描述那些难以进行自动分割的图像。

颜色相关图(ColorCorrelogram)：用颜色对相对于距离的分布来描述信息，它反映了像素对的空间相关性，以及局部像素分布和总体像素分布的相关性。

颜色矩(ColorMoment)：在颜色直方图的基础上计算出每个颜色的矩估计，颜色信息主要分布于低阶矩中：

一阶矩(均值,mean) 二阶矩(方差,viarance) 三阶矩(斜度,skewness)

用这些统计量替代颜色的分布来表示颜色特征。它具有特征量少，处理简单的特点。

优点：不需要颜色空间量化，特征向量维数低；

但实验发现该方法的检索效率比较低，因而在实际应用中往往用来过滤图像以缩小检索范围

感知哈希算法 Perceptual hash algorithm对每张图片生成一个"指纹"（fingerprint）字符串，

然后比较不同图片的指纹。结果越接近，就说明图片越相似

优点：简单快速，不受图片大小缩放的影响，

缺点：是图片的内容不能变更。如果在图片上加几个文字，它就认不出来了

纹理特征：纹理特征也是一种全局特征，它也描述了图像或图像区域所对应景物的表面性质。

与颜色特征不同，纹理特征不是基于像素点的特征，它需要在包含多个像素点的区域中进行统计计算。

优点：作为一种统计特征，纹理特征常具有旋转不变性，并且对于噪声有较强的抵抗能力

缺点：当图像的分辨率变化的时候，所计算出来的纹理可能会有较大偏差。

由于有可能受到光照、反射情况的影响，从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。

纹理特征提取：1灰度差分统计法

2基于灰度共现矩阵的纹理特征（常用统计量：对比度、相关度、方差、熵等）

3 Tamura等定义的6个心理学特征（稀疏度、对比度、方向性、线状性、规则性及粗糙度）

4基于邻域灰度差别矩阵的纹理特征（包括稀疏度、繁忙度、纹理力度等5个特征）

灰度共生矩阵：

1能量（角二阶矩）ASM：反映了图像灰度分布均匀程度和纹理粗细度。是灰度共生矩阵元素值的平方和。大则纹理粗

2.对比度CON：反映了图像的清晰度和纹理沟纹深浅的程度。con小则沟纹浅，效果模糊

3.自相关（correlation）度量空间灰度共生矩阵元素在行或列方向上的相似程度，反映了图像中局部灰度相关性，图像纹理的一致性。当矩阵元素值均匀相等时，相关值就大;

4.熵（ENT）：它表示了图像中纹理的非均匀程度或复杂程度。当共生矩阵为稀疏矩阵（大部分为0时），熵趋向于0;若矩阵中的元素几乎相等时，说明图像中有许多细纹理，熵较大。

5.逆差矩（IDM）反映图像纹理的同质性，度量图像纹理局部变化的多少。如果灰度共生矩阵对角元素有较大值，IDM就会较大

滤波是在傅立叶基础上加了一个窗口，小波窗口可变

Gabor变换:当窗函数取为高斯窗时一般称为Gabor变换 ,是最优的STFT.Gabor变换的本质上还是对二维图像求卷积。Gabor变换在一定程度上解决了局部分析的问题，但对于突变信号和非平稳信号仍难以得到满意的结果。

缺陷：1）Gabor变换的时频窗口大小、形状不变，只有位置变化，而实际应用中常常希望时频窗口的大小、形状要随频率的变化而变化，

2）Gabor变换基函数不能成为正交系，因此为了不丢失信息，在信号分析或数值计算时必须采用非正交的冗余基，这就增加了不必要的计算量和存储量。

LBP特征：局部二值模式是结合了纹理图像结构和像素统计关系的纹理特征描述方法

作用：一种有效的纹理描述算子：度量和提取图像局部的纹理信息，记录像素点与其周围像素点的对比信息。

优点：对光照具有不变性。具有旋转不变性。灰度不变性等

形状描述符应具备：独特性完备性可计算性几何不变性灵活性抽象性鲁棒性

前期工作：图像增强图像分割物体检测形状识别

形状的描述符大体可以分为两大类：

（1）是描述形状目标区域边界轮廓的像素集合，称为基于轮廓的形状描述符；

（2）称为基于区域的形状描述符，是对形状目标区域内所有像素集合的描述；

链码 chain code：形状描述符中最常用的方法之一，用一串数字表示图像中目标的边界
优点：链码可以有效的描述轮廓形状而且可以大大减少边界所需要的数据量

缺点：链码对起始点要求很高；链码本身不具有旋转不变性；对噪声和边界线段的缺陷也很敏感，

基于网格的方法：将图像形状边界映射到一个标准的网格上，并将该形状边界调整到网格左上角，然后从左向右，从上到下扫描网格，若某个单元格被形状边界全部或者部分覆盖，则赋值1，否则赋值0，这样就得到了一个0.1组成的串，用来表征形状特征。

该方法具有平移不变性，但是不具有旋转和尺度不变性

傅立叶描述子：傅立叶级数中的一系列系数z(k)是直接与边界曲线的形状有关的

优点：①仅用一些低频分量就可以近似的描述轮廓形状，

②具有易于计算、容易归一化、匹配简单

③易获得全局和局部特征等许多优点；

缺点：①是对轮廓上感兴趣的部分，如有无遮挡，由于映射到全部系数中而看不到了。

②对于轮廓有较锐的变化或被区分对象仅有微小差别的识别问题来说，这种方法就不理想了。

基于区域的形状描述符：几何参数，密度参数，区域的二维变换系数或者能量谱等

局部特征为什么重要：全局特征区分度不强，所以要用局部特征

hog特征定义：一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。通过计算和统计图像局部区域的梯度方向直方图来构成特征。在行人检测中获得了极大的成功。

HOG主要思想： 在一副图像中，局部目标的表象和形状（appearance and shape）能够被梯度或边缘的方向密度分布很好地描述。

本质：梯度的统计信息，而梯度主要存在于边缘的地方。

HOG特征提取算法的实现过程：1）灰度化2）归一化3）计算图像每个像素的梯度

4）将图像划分成小cells 5）统计每个cell的梯度直方图6）将每几个cell组成一个block（不是连起来的）7）将图像image内的所有block的HOG特征descriptor串联起来

优点： 它对图像几何的和光学的形变都能保持很好的不变性。可以容许行人有一些细微的肢体动作，这些细微的动作可以被忽略而不影响检测效果。

SIFT特征：在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量。

应用范围：物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对

SIFT算法四个步骤：1.建立尺度空间2.在尺度空间中检测极值点，并进行精确定位和筛选

3.特征点方向赋值4.计算特征描述子

优点：SIFT特征对旋转、尺度缩放、亮度等保持不变性

缺点：相对来说实时性还不够高。有时特征点较少。对边缘光滑的目标无法准确提取特征点。计算量大

你可能感兴趣的:(山东大学web数据管理知识点整理)

网络爬虫再深入——对抗指纹检测、分布式架构与智能解析实战 rooney2024 爬虫
目录一、深入反爬：浏览器指纹检测与对抗（配图1）1.高级指纹检测原理2.对抗方案与实战二、分布式爬虫架构深度设计（配图2）1.容错与弹性设计2.智能限流算法三、智能解析：LLM与计算机视觉的融合（配图3）1.LLM解析非结构化文本2.视觉辅助定位元素四、法律与伦理：爬虫工程师的自我修养1.关键法律边界2.道德实践框架五、未来战场：Web3.0时代的爬虫技术演进1.去中心化网络挑战2.AI驱动的自适
如何搭建MySQL主从同步架构：实现数据库高可用与读写分离 Cloud_Begin adb
前言：在现代Web应用中，数据库往往是性能瓶颈所在。MySQL主从复制(Master-SlaveReplication)是一种常见的数据同步方案，它不仅能提高系统的读取性能，还能增强数据安全性并提供故障转移能力。本文将详细介绍如何从零开始搭建一个MySQL主从同步架构。一、主从复制原理简介MySQL主从复制基于二进制日志(binlog)实现，其核心流程如下：主库(Master)将所有数据更改操作记
Nacos动态线程池完整实现方案
Nacos动态线程池完整实现方案1.依赖配置(pom.xml)com.alibaba.cloudspring-cloud-starter-alibaba-nacos-config2.2.9.RELEASEorg.springframework.bootspring-boot-starter-web2.Nacos配置(bootstrap.yml)spring:application:name:big
视频直播源码在Android端实现1对1音视频实时通话程序员老舅音视频开发进阶音视频 android studio 视频编解码 webrtc 实时音视频
我们要使用WebRTC进行音视频互动时需要申请访问硬件的权限，至少要申请以下三种权限Camera权限RecordAudio权限Intenet权限在Android中，申请权限分为静态权限申请和动态权限申请，这对于做Android开发的同学来说已经是习以为常的事情了。下面我们就看一下具体如何申请权限：静态权限申请在Android项目中的AndroidManifest.xml中增加以下代码:视频直播源码
推荐：React与WebRTC构建的1对1视频聊天应用潘俭渝Erik
推荐：React与WebRTC构建的1对1视频聊天应用去发现同类优质开源项目:https://gitcode.com/在这个数字化的时代，实时通信技术为我们提供了无限的可能性，而WebRTC（WebReal-TimeCommunication）正是其中的佼佼者。今天，我们向您推荐一个基于React框架实现的简单1对1视频聊天室示例项目，它集成了WebRTC和屏幕共享API，为学习和实践WebRTC
WebRTC_iOS: 革新的 iOS 实时音视频通信解决方案潘俭渝Erik
WebRTC_iOS:革新的iOS实时音视频通信解决方案去发现同类优质开源项目:https://gitcode.com/1、项目介绍在当今的移动应用世界中，实时通信能力已经成为许多应用程序的核心竞争力。WebRTC_iOS是一个专为iOS设备设计的开源项目，它利用了Google的WebRTC技术，为您提供了一套完整的音视频通信框架。这个项目的目标是简化开发者在iOS应用中集成高质量、低延迟的音视频
ERP II david_lv 大数据 java 人工智能区块链物联网
（1）ERPIIERPII是SAP在2000年时提出的一个概念。ERP是为单个企业内部管理管理用的。这个，大家都很明白。但是，企业和企业之间总有上下游关系。在ERP模式下，这些上中下游的企业都各买各用各的ERP，上中下游的企业和企业之间的协作，主要通过QQ+EXCEL来同步信息。再牛一点的行业巨头，则会定义自己的上下游IT接口标准，然后让自己的战略合作上下游企业按照接口标准接入进来，大家通过Web
Android音视频探索之旅 | Webrtc 1对1音视频通话核心流程分析慢行的骑兵音视频 android 音视频 webrtc
一.前言使用Webrtc实现1对1的音视频通话，先从Web端进行学习要比直接从Android端进行学习要轻松许多（若没有JS和Html以及Node基础，查找相关基础教程，能梳理代码的逻辑即可）。本文Android端接入Webrtc是通过引入官方的sdk来实现的。本文涉及到的Demo代码包含三部分，服务器端、Web端、Android端。服务器端使用的是Node，Web使用的是Html和JS，Andr
基于Web的安全漏洞分析与修复平台设计与实现计算机毕业设计指导前端
基于Web的安全漏洞分析与修复平台设计与实现摘要随着信息化进程的加快，Web系统和企业IT架构愈发复杂，安全漏洞频发已成为影响系统安全运行的主要因素。为解决传统漏洞扫描工具定位不准确、修复建议不完善、响应周期长等问题，本文设计并实现了一套基于Web的安全漏洞分析与修复平台。平台集成漏洞检测、漏洞情报分析、可视化报告生成及自动修复建议模块，支持对网站、服务器、代码仓库等多类型目标进行统一管理与评估。
《Vue.js 核心概念：前端魔法世界的奇幻基石》 Muai木离前端 vue.js flutter
在当今数字化浪潮汹涌澎湃，Web应用如梦幻仙境般绚烂多彩且变幻无穷的时代，Vue.js仿若一位神秘而强大的魔法画师，其核心概念则是绘制出震撼人心的Web开发魔法画卷的神来之笔。这些概念宛如星空中最耀眼、最具魔力的星座，不仅赋予Vue.js令人心醉神迷的独特魅力与蓬勃无尽的创造力，更为构建灵动如仙、性能超凡且用户体验犹如置身奇幻梦境的Web应用勾勒出清晰可见的魔法蓝图。对于那些心怀对前端开发领域的炽
vue中实现验证码输入结城 vue 验证码 vue输入框
vue验证码input输入解决焦点切换有点晚了就不吐槽了，咱还是把代码上了，赶紧洗澡，养好精神明天努力上班！！！想学node,想学react,想精进webpack,想vue学的更好一点，了解底层代码，学算法，学计算机原理，想写自己的博客网站…这是一条学无止境的路，没办法要恰饭效果html部分js部分exportdefault{props:{inputNums:{type:Number,defaul
vue3 路由设置滚动条置顶开源字节 vue 大前端 vue router route
constrouter=createRouter({history:createWebHistory(),routes,//跳转路由后导航栏置顶scrollBehavior(to,from,saveScrollPosition){return{left:0,top:0};},});
超简单linux上部署Apache 悟空骑猪看电影 apache linux 运维网络
1.Apache是什么？Apache是世界上最流行的开源Web服务器软件，由Apache软件基金会维护。主要功能：接收客户端（如浏览器）的HTTP请求，返回网页、图片等静态/动态资源。特点：跨平台（Linux、Windows、macOS）模块化设计（按需加载功能）支持多语言扩展（PHP、Python等）高稳定性和安全性2.核心架构与工作原理多进程模型（MPM）Prefork：多进程模式，每个请求由
入门指南：Vue.js的基本概念和用法是小韩呀 vue.js javascript 前端
引言：Vue.js是一种流行的JavaScript框架，用于构建现代化的Web应用程序。它以其简洁易用的API和响应式的数据绑定而闻名，使得开发人员能够更轻松地构建交互性强大的用户界面。本文将介绍Vue.js的基本概念和用法，帮助初学者快速入门。一、Vue.js是一个轻量级、渐进式的JavaScript框架，用于构建用户界面。它的设计目标是通过尽可能简单的API，让开发者能够更高效地开发交互性强大
时序数据库的工业级对决：对比 Apache IoTDB 和 InfluxDB 时序数据说时序数据库 apache iotdb 数据库大数据开源
在数字化浪潮中，物联网（IoT）与工业大数据领域蓬勃发展，时序数据呈爆发式增长。时序数据库作为管理这类数据的核心工具，其性能、功能和适应性直接影响到整个系统的运行效率与价值实现。ApacheIoTDB和InfluxDB作为时序数据库领域的佼佼者，被广泛应用于各类场景。深入剖析二者区别，对开发者、企业架构师和数据管理者而言，不仅能为项目选型提供科学依据，还能助力挖掘数据的最大价值。一、诞生背景与社区
nodejs关于后端服务开发的探究墨水白云 node.js
前提在当前的环境中关于webserver的主流开发基本上都是java、php之类的，其中javaspring系列基本上占了大头，而python之流也在奋起直追，但别忘了nodejs也是可以做这个服务的，只是位置有点尴尬，现在就来探究下nodejs做webserver的当前现状。nodejs简介Node.js是一个基于ChromeV8引擎的JavaScript运行环境。Node.js使用了一个事件驱
阿里工程师教你使用 Svelte 构建阅读列表的小技巧 JAVA学习
velte在过去两年中获得了很多赞誉，远非“只是另一个前端框架”。它在2019年JS调查中获得了“年度突破奖”，随后在2020年的满意度评分中名列前茅。它还在StackOverflow2021调查中被评为最受喜爱的Web框架。Svelte以其小包大小、非常好的性能和易用性的组合吸引了开发人员。同时，它还装满了很多好东西。已经提供了一个简单的状态管理解决方案，以及现成的过渡和动画。本介绍性教程将阐明
web第一次作业这日光醉了城. 前端 javascript 开发语言
实现一个登录页面、实现一个注册页面；实现一个主页-登录页面：`login.html`-注册页面：`register.html`-主页：`index.html`要求如下：-主页中，可以点击**注册**或者**登录**能直接在新窗口跳转到对应的页面-登录页面中，输入账号、密码可以点击登录-自动跳转到主页-注册页面中，输入账号、密码、确认密码、昵称，点击注册，注册后自动跳转到登录页面login.html
JavaWeb 文件上传和下载 dawsonenjoy
一、文件上传步骤前端部分1.提供一个post方法的表单，并设置enctype属性（设置请求内容的MIME类型）为multpart/from-data，代表该表单支持文件上传2.提供一个文件上传框：举例：后端部分将内容通过流读取进来，举例：publicvoiddoGet(HttpServletRequestrequest,HttpServletResponseresponse)throwsServl
Apache基础配置 obboda 运维 apache
一、Apache安装#安装apache[root@webserver~]#yuminstallhttpd-y#在防火墙中放行web服务[root@webserver~]#firewall-cmd--permanent--add-service=httpsuccess[root@webserver~]#firewall-cmd--permanent--add-service=httpssuccess
山东大学软件学院2024-2025人工智能导论期末复习简答题整理飘去数星星多元人工智能
写在前面给我的往年题整理引个流嘿嘿山东大学软件学院2024-2025人工智能导论期末回顾-CSDN博客个人观点：这次考试给我的感觉是意料之外又是意料之中，怎么说呢，意料之中的是这次的题跟往年题不一样，因为我们上一级的期末考试题就跟前几年的非常不一样，所以其实还是有所准备的，但是又是意料之外的，因为他考的也太不一样了，考的非常细节，还是招架不太住哈哈哈以下是我自己整理的一些知识点，仅供参考~需要的可
Linux笔记8 web服务器的部署及优化月熊笔记 linux
用户常用关于web的信息www概念www是worldwideweb的缩写，及万维网，也就是全球信息广播的意思通常说的上网就是使用www来查询用户所需要的信息。www可以结合文字、图形、影像以及声音等多媒体，超链接的方式将信息以Internet传递到世界各处去。当你连接www网站，该网站会提供一些数据，客户端要使用可以解析这些数据的软件来处理，那就是浏览器网址URI：UniformResourceI
melody-canvas：实时音频可视化与创意画布
melody-canvas：实时音频可视化与创意画布项目介绍melody-canvas是一个开源项目，致力于为用户提供一个强大的音频可视化与画布编辑平台。通过该平台，用户可以利用Web技术实时地将音频信号转换成视觉元素，同时支持画布上的图像和文本编辑，创作出独一无二的音频艺术作品。项目技术分析melody-canvas的核心功能基于现代Web技术构建，主要包括以下技术组件：WebAudioAPI：
全新开发范式：uni-app X助力全平台原生应用程序媛夏天小白学鸿蒙 uni-app
在2025年数字技术发展的关键节点上，国产操作系统正在经历从愿景走向现实的深刻变革。DCloud于5月12日发布的HBuilderX4.64正式版，标志着uni-appx已实现对鸿蒙、Android、iOS、Web、微信小程序等主流平台的全覆盖，为开发者带来了全新的跨平台开发体验。一、技术革新：Web技术栈与原生性能的完美融合uni-appx的突破性在于其独特的设计理念：“开发态基于Web技术栈，
Agora_Unity_WebGL：实时互动的WebGL解决方案
Agora_Unity_WebGL：实时互动的WebGL解决方案项目介绍Agora_Unity_WebGL是一个开源的UnityWebGL插件，它是对AgoraWebSDK4.x版本的封装。这个项目旨在为开发者提供一种在Unity中轻松集成实时音视频互动功能的方法，特别适用于需要在Web平台运行的Unity项目。通过这个插件，开发者可以快速地实现实时音频、视频通信以及直播等功能。项目技术分析Ago
关于浏览器扩展脚本：remove-web-limits(网页限制解除) vvandre 前端
本文介绍浏览器扩展脚本：remove-web-limits(网页限制解除)实现的功能和安装步骤，还会详细分析脚本的代码，让你对实现原理一目了然。此脚本通杀大部分网站，可以解除禁止复制、剪切、选择文本、右键菜单的限制。脚本基本不影响网页正常功能，如果影响了任何功能，可以暂时禁用脚本解决。脚本已有10年的历史，原作者已经暂停维护。remove-web-limits发布地址一、安装步骤1.安装扩展程序C
Javaweb笔记笙鹿鸣 html 前端 html5
HTMLHTML网页常用基础知识网页结构JavaSEC/SClientserver客户端–服务器JavaWebB/SBroswerServer浏览器–服务器网页的组成部分：内容（结构）、表现、行为HTML:HyperTextMarkupLanguage(超文本标记语言)ALT+F2选择浏览器HTML书写规范：表示整个html页面的开始头信息标题标题body是页面的主体内容页面主体内容表示整个htm
Spring Boot、Spring MVC 和 Spring 有什么区别
spring是⼀个IOC容器，⽤来管理Bean，使⽤依赖注⼊实现控制反转，可以很⽅便的整合各种框架，提供AOP机制弥补OOP的代码重复问题、更⽅便将不同类不同⽅法中的共同处理抽取成切⾯、⾃动注⼊给⽅法执⾏，⽐如⽇志、异常等springmvc是spring对web框架的⼀个解决⽅案，提供了⼀个总的前端控制器Servlet，⽤来接收请求，然后定义了⼀套路由策略（url到handle的映射）及适配执⾏h
Spring, Spring Boot 和Spring MVC的关系以及区别棕豆兔＆面试总结 spring spring boot mvc
一、Spring简单来说,Spring是一个开发应用框架，主打轻量级、一站式、模块化，其目的是用于简化企业级应用程序开发。Spring的主要功能：管理对象，以及对象之间的依赖关系，面向切面编程，数据库事务管理,数据访问，web框架支持等。但是Spring具备高度可开放性，并不强制依赖Spring，开发者可以自由选择Spring的部分或者全部，Spring可以无缝继承第三方框架，比如数据访问框架(H
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found