CSJ_CH3COOK

CS224N Assignment 1: Exploring Word Vectors (25 Points)

最近想自学一下自然语言处理，网上找了 Stanford CS224N 的网课，顺藤摸瓜找了点作业题来坐坐。下载链接：斯坦福 cs224n 课程网站

Part 1: Count-Based Word Vectors (10 points)

之前导入软件包如果出现问题的话，根据所需的包名一个个导入就可以了，推荐使用国内镜像网站，在 Win+R 输入 cmd ，那个窗口输入：

pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple

Question 1.1: Implement distinct_words [code] (2 points)

这道题目的让你获取单词列表的列表中不同单词的，其实就是让你熟悉一下使用 python 。

这里使用集合这个数据结构来实现（集合是 Hash 表存储结构，读取起来更快）。然后每次循环在旧集合与新列表之间取并集即可：

## Question 1.1: Implement distinct_words [code] (2 points)
def distinct_words(corpus):
    """ Determine a list of distinct words for the corpus.
        Params:
            corpus (list of list of strings): corpus of documents
        Return:
            corpus_words (list of strings): list of distinct words across the corpus, sorted (using python 'sorted' function)
            num_corpus_words (integer): number of distinct words across the corpus
    """
    corpus_words = []
    num_corpus_words = -1
    
    # ------------------
    # Write your implementation here.
    corpus_words = set()
    for item in corpus:
        words = set(item)
        corpus_words = corpus_words | words
    num_corpus_words = len(corpus_words)
    corpus_words = sorted(list(corpus_words))
    # ------------------

    return corpus_words, num_corpus_words

测试一下：

>>> --------------------------------------------------------------------------------
	Passed All Tests!
	--------------------------------------------------------------------------------

Question 1.2: Implement compute_co_occurrence_matrix [code] (3 points)

第二个问题是构建一个邻接矩阵。首先先看它需要返回的两个东西：

第一个 word2ind 是由字符作为 key ，这个字符在之前第一小问返回的列表中的索引作为 val 的一个字典结构。根据这个结构，使我们能够在 $O (1)$ 的时间复杂度下获得矩阵的位置。关于怎么创建全 $0$ 矩阵，见底下代码
第二个 M 是一个矩阵，这个矩阵包含了信息：出现在这个词左右的，是什么词。我们只需要对当前字符串进行一次遍历，在每次遍历的时候，注意 window 这个变量，我们需要统计这个词 $\pm w i n d o w$ 这个变量周围的所有单词。

先回顾一下课堂上讲的知识：为什么这个窗口是可行的：这个窗口就是这个单词出现的上下文，因此出现在类似窗口（也即类似上下文）中的两个单词，他们的词意一般是类似的，因此类似意思的两个单词会聚类在一起。

如果忘了 numpy 的使用方法，见：数据可视化学习笔记【一】（numpy包）。

实现代码如下：

## Question 1.2: Implement compute_co_occurrence_matrix [code] (3 points)
def compute_co_occurrence_matrix(corpus, window_size=4):
    """ Compute co-occurrence matrix for the given corpus and window_size (default of 4).
    
        Note: Each word in a document should be at the center of a window. Words near edges will have a smaller
              number of co-occurring words.
              
              For example, if we take the document " All that glitters is not gold " with window size of 4,
              "All" will co-occur with "", "that", "glitters", "is", and "not".
    
        Params:
            corpus (list of list of strings): corpus of documents
            window_size (int): size of context window
        Return:
            M (a symmetric numpy matrix of shape (number of unique words in the corpus , number of unique words in the corpus)): 
                Co-occurence matrix of word counts. 
                The ordering of the words in the rows/columns should be the same as the ordering of the words given by the distinct_words function.
            word2Ind (dict): dictionary that maps word to index (i.e. row/column number) for matrix M.
    """
    words, num_words = distinct_words(corpus)
    M = None
    word2Ind = {}
    
    # ------------------
    # Write your implementation here.
    i = 0
    for key in words:
        word2Ind[key] = i
        i += 1
    M = np.zeros((num_words, num_words))
    for sentence in corpus:
        for i, word in enumerate(sentence):
            for j in range(i - window_size, i + window_size + 1):
                if j < 0 or j >= len(sentence):
                    continue
                if j != i:
                    M[word2Ind[word], word2Ind[sentence[j]]] += 1
    # ------------------
    
    return M, word2Ind

执行：

>>> --------------------------------------------------------------------------------
	Passed All Tests!
	--------------------------------------------------------------------------------

Question 1.3: Implement reduce_to_k_dim [code] (1 point)

这题就是导包，进行 SVD 分解（ $U\Sigma V^{T}$ 其中 $U, V$ 都是酉矩阵， $\Sigma$ 为对角矩阵，且 $rank(\Sigma)=rank(M)$ ），保留奇异值前 k 大的值，然后得到一个降维的矩阵 $U\Sigma$ 。

原来那个 $10 * 10$ 的矩阵被降为一个 $10 * 2$ 的矩阵了。

[0.65480209 		0.78322112]
[5.20200324e-01 		-1.56599893e-15]
[0.70564718 		-0.48405727]
[0.70564718 		0.48405727]
[1.02780472e+00 		1.01204090e-15]
[0.65480209 		-0.78322112]
[0.38225849 		-0.656224  ]
[0.38225849 		0.656224  ]
[1.39420808 		1.06179274]
[1.39420808 		-1.06179274]

为什么要进行这部操作呢？之前课上说到：人是一个三维生物，很难想象到一个高维空间，比如之前那个 $10 * 10$ 矩阵所表示的一个 $10$ 维空间显然超过了人类的理解范围，因此将其降维。（同时有一个小小的推测，这里相当于加上了一个小扰动，是不是为了防止模型会产生过拟合？）

代码实现如下：

def reduce_to_k_dim(M, k=2):
    """ Reduce a co-occurence count matrix of dimensionality (num_corpus_words, num_corpus_words)
        to a matrix of dimensionality (num_corpus_words, k) using the following SVD function from Scikit-Learn:
            - http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.TruncatedSVD.html
    
        Params:
            M (numpy matrix of shape (number of unique words in the corpus , number of unique words in the corpus)): co-occurence matrix of word counts
            k (int): embedding size of each word after dimension reduction
        Return:
            M_reduced (numpy matrix of shape (number of corpus words, k)): matrix of k-dimensioal word embeddings.
                    In terms of the SVD from math class, this actually returns U * S
    """    
    n_iters = 10     # Use this parameter in your call to `TruncatedSVD`
    M_reduced = None
    print("Running Truncated SVD over %i words..." % (M.shape[0]))
    
        # ------------------
        # Write your implementation here.
    handle = TruncatedSVD(k, n_iter = n_iters)
    M_reduced = handle.fit_transform(M)
        # ------------------

    print("Done.")
    return M_reducedython

执行结果：

Done.
--------------------------------------------------------------------------------
Passed All Tests!
--------------------------------------------------------------------------------

Question 1.4: Implement plot_embeddings [code] (1 point)

这题就是做一个图，熟悉一下 matplotlib 这个模组中的功能。

代码如下：

def plot_embeddings(M_reduced, word2Ind, words):
    """ Plot in a scatterplot the embeddings of the words specified in the list "words".
        NOTE: do not plot all the words listed in M_reduced / word2Ind.
        Include a label next to each point.
        
        Params:
            M_reduced (numpy matrix of shape (number of unique words in the corpus , 2)): matrix of 2-dimensioal word embeddings
            word2Ind (dict): dictionary that maps word to indices for matrix M
            words (list of strings): words whose embeddings we want to visualize
    """

    # ------------------
    # Write your implementation here.
    fig = plt.figure()
    plt.style.use("seaborn-whitegrid")
    for word in words:
        point = M_reduced[word2Ind[word]]
        plt.scatter(point[0], point[1], marker = "^")
        plt.annotate(word, xy = (point[0], point[1]), xytext = (point[0], point[1]+0.1))
    # ------------------

执行结果如下：

>>> Outputted Plot:
--------------------------------------------------------------------------------

感觉我做的图比他给的样例好看那么一丁点。

Question 1.5: Co-Occurrence Plot Analysis [written] (3 points)

直接根据他提供的代码进行作图就可以了：

# -----------------------------
# Run This Cell to Produce Your Plot
# ------------------------------
reuters_corpus = read_corpus()
M_co_occurrence, word2Ind_co_occurrence = compute_co_occurrence_matrix(reuters_corpus)
M_reduced_co_occurrence = reduce_to_k_dim(M_co_occurrence, k=2)

# Rescale (normalize) the rows to make them each of unit-length
M_lengths = np.linalg.norm(M_reduced_co_occurrence, axis=1)
M_normalized = M_reduced_co_occurrence / M_lengths[:, np.newaxis] # broadcasting

words = ['barrels', 'bpd', 'ecuador', 'energy', 'industry', 'kuwait', 'oil', 'output', 'petroleum', 'venezuela']

plot_embeddings(M_normalized, word2Ind_co_occurrence, words)

所作的图如下：

同时老师也提出了几个问题：

Q：

What clusters together in 2-dimensional embedding space?
What doesn’t cluster together that you might think should have?

Remark： Note: “bpd” stands for “barrels per day” and is a commonly used abbreviation in crude oil topic articles.

A：

可以看到 “petroleum”，“industry” 很相近，“kuwait”，“ecuador”，“venezuela” 这三个词很相近。
我认为 “bpd” 应该会与上述词较为接近，因为他们描述的是同样的东西。

-------------------------- 第一部分结束了 -----------------------------

Part 2: Prediction-Based Word Vectors (15 points)

这部分数据集的下载最好事先装好，不然非常容易下载失败。

Reducing dimensionality of Word Embeddings

这题是一个比较，比较我们之前写的：利用矩阵 SVD 将其邻接矩阵进行降秩的结果与 GloVe embeddings 本身数据集中的坐标。

因为邻接矩阵是一个非常稀疏的矩阵，而且数据量极大，这里出题者很好心让我们只用 10000 个单词来进行构造。

Question 2.1: GloVe Plot Analysis [written] (4 points)

这里让我们比较用 co-occurrence 矩阵和用 GloVe embeddings 这个数据里，点的坐标是否有不同。

比较的还是对之前那 10 个单词，运行如下代码：

words = ['barrels', 'bpd', 'ecuador', 'energy', 'industry', 'kuwait', 'oil', 'output', 'petroleum', 'venezuela']
plot_embeddings(M_reduced_normalized, word2Ind, words)

得到的结果如下：

接下来回答作者的问题：

What clusters together in 2-dimensional embedding space?
What doesn’t cluster together that you might think should have?
How is the plot different from the one generated earlier from the co-occurrence matrix?
What is a possible reason for causing the difference?

之前的图还得用到，这里把两张图合并一下放一下做对比：

可以看到右上角那一堆都聚集在一起了
仍然，bpd 这个单词还是离那些单词很远。
这张图与之前的不同，之前那张图很明显可以看到有一个右上角往左回拉的一个趋势；新的图却是一个类似凸函数的形状。

两幅图的不同，可能来自这部正则化：

M_reduced_normalized = M_reduced / M_lengths[:, np.newaxis] # broadcasting

确实我不太清楚这个引入的数据集中，这些单词的坐标是怎么来的，只能够通过代码入手。如果没有这部正则化，这张图长这样：

这也只是我的个人推测，如果有不同意见，可以评论讨论，共同商讨一下。

Question 2.2: Words with Multiple Meanings (2 points) [code + written]

这题让我们统计一词多义的情况。两个单词之间词义的相似度是由两个向量之间的内积决定的。（因为之前所有单词的坐标到原点的距离都被正则化为 $1$ ，因此它们之间的内积就是他们之间夹角 $\alpha$ 的 $\cos \alpha$ 值）在这里的处理思路与聚类分析中对距离、相似度的定义是类似的。

这里提示我们使用一个已有的函数：wv_from_bin.most_similar(word) 来完成。这个函数的实现机制是：对所有单词进行求内积，并取内积最大的 $10$ 个单词返回给你。

这题的思路如下：

首先我引入一个概念：组内离差（这在判断马尔科夫链收敛性中也有使用到）。首先有一个集合（相似集）：记录这个单词通过这个 wv_from_bin.most_similar(word) 函数返回的列表。在这个列表中，两两取内积，取其内积最小值，称之为组内离差。

因此，组内离差最小的集合就说明这个单词与两个意思相差很远的单词之间相似度高，也就说明更有可能是一词多义的解。

代码实现如下：

def MultiMeaningWord(M_reduced_normalized, word2Ind):
    wordlst = []
    MultiMeans = ""
    n = len(M_reduced_normalized[0])
    MinVariance = 100
    for word in word2Ind.keys():
        lst = wv_from_bin.most_similar(word)
        cur = 100
        for i in range(10):
            try:
                xy_cur = M_reduced_normalized[word2Ind[lst[i][0]]]
            except KeyError:
                continue
            for j in range(i, 10):
                temp = 0
                try:
                    xy_nxt = M_reduced_normalized[word2Ind[lst[j][0]]]
                except KeyError:
                    continue
                for k in range(n):
                    temp = temp + xy_cur[k] * xy_nxt[k]
                cur = min(cur, temp)
        if cur < MinVariance:
            wordlst = lst
            MinVariance = cur
            MultiMeans = word
    return MultiMeans, wordlst, MinVariance

结果如下：

>>> ('raisonné',
	[('raisonne', 0.6827203035354614),
	('catalogue', 0.6217593550682068),
  	('köchel', 0.5784828662872314),
  	('dictionnaire', 0.5532978773117065),
  	('recueil', 0.538439154624939),
  	('traité', 0.5328050851821899),
  	('hesiodic', 0.5189188718795776),
  	('études', 0.5103318691253662),
  	('etudes', 0.4762265682220459),
  	('encyclopédie', 0.4728423058986664)],
 	-0.9605955556035042)

组间离差为 $- 0.96$ 是一个相当小的值。然后我们再看这个单词的意思：

raisonné 经过推理的，建立在推理基础上的；思考过的

貌似与剩下的词的意思关系都不是很大，这里存疑，希望见者能够解答一下。

经常会产生这样一个结果：这个词的好几个意思都是相近的，因为意思相近的单词聚类了，他们之间的内积接近于 $1$ 因此直接取出意思最相近的 $10$ 个单词很容易造成全部是同义词的情况。

Question 2.3: Synonyms & Antonyms (2 points) [code + written]

这题的主要目的是求同义词和反义词。

具体思路为：

选取一个单词，找到与它内积最大的，这个单词就是其近义词；
找到与它内积较小的，这个单词就是其反义词。（当然也存在用在语境相同的反义词，这点不是很好判断）

python 实现如下：

def Synonyms_Antonyms(word2Ind, w1):
    words = word2Ind.keys()
    far = ""
    furtherness = 100
    for word in words:
        if word == w1:
            continue
        temp = wv_from_bin.distance(w1, word)
        if furtherness > temp:
            furtherness, far = temp, word
            continue
    return wv_from_bin.most_similar(w1)[0], (far, furtherness)

找符合的单词比较麻烦，最终找到单词：“satisfying” ，执行结果如下：

Res = Synonyms_Antonyms(word2Ind, w1 = 'satisfying')
>>> ([('enjoyable', 0.6154831051826477), ('unsatisfying', 0.4698140621185303))

因此：“satisfying” 的近义词是 “enjoyable” ，反义词是 “unsatisfying” 符合我们的认知。

Solving Analogies with Word Vectors

这一块内容讲的是：通过单词向量来解决问题。这里首先介绍了一个函数：

wv_from_bin.most_similar(positive=['woman', 'king'], negative=['man'])
>>> [('queen', 0.6978678703308105),
	 ('princess', 0.6081745028495789),
	 ('monarch', 0.5889754891395569),
	 ('throne', 0.5775108933448792),
	 ('prince', 0.5750998258590698),
	 ('elizabeth', 0.5463595986366272),
	 ('daughter', 0.5399125814437866),
	 ('kingdom', 0.5318052172660828),
	 ('mother', 0.5168544054031372),
	 ('crown', 0.5164473056793213)]

这里返回的是离 positive 中最近，且离 negative 最远的单词。

Question 2.4: Finding Analogies [code + written] (2 Points)

这题让我们实现一个正确的聚类：

pprint.pprint(wv_from_bin.most_similar(positive=['satisfying', 'exciting'], negative=['unsatisfying']))
>>> [('interesting', 0.6445490121841431),
	 ('really', 0.6026532649993896),
	 ('very', 0.6022480726242065),
	 ('excited', 0.596916675567627),
	 ('wonderful', 0.5959773063659668),
	 ('quite', 0.5956001281738281),
	 ('truly', 0.5935688018798828),
	 ('definitely', 0.5903993248939514),
	 ('entertaining', 0.5786590576171875),
	 ('fun', 0.56939697265625)]

Question 2.5: Incorrect Analogy [code + written] (1 point)

这题是让我们输出一个错误的聚类，实际上挺难找的。如果positive 中存在反义词，那就会导致这个聚类不精确。

pprint.pprint(wv_from_bin.most_similar(positive=['output', 'input'], negative=['energy']))
>>>	[('outputs', 0.6508897542953491),
	 ('inputs', 0.6220414638519287),
	 ('voltage', 0.4847225546836853),
	 ('waveform', 0.4809161126613617),
	 ('audio', 0.46772128343582153),
	 ('amplifier', 0.46416085958480835),
	 ('corresponding', 0.45216110348701477),
	 ('impedance', 0.4518190026283264),
	 ('non-inverting', 0.4489710330963135),
	 ('sequential', 0.4211637079715729)]

Question 2.6: Guided Analysis of Bias in Word Vectors [written] (1 point)

这一节是讲偏差分析的。

pprint.pprint(wv_from_bin.most_similar(positive=['woman', 'worker'], negative=['man']))
print()
pprint.pprint(wv_from_bin.most_similar(positive=['man', 'worker'], negative=['woman']))

输出结果为：

>>> [('employee', 0.6375863552093506),
	 ('workers', 0.6068919897079468),
	 ('nurse', 0.5837947130203247),
	 ('pregnant', 0.5363885760307312),
	 ('mother', 0.5321309566497803),
	 ('employer', 0.5127025842666626),
	 ('teacher', 0.5099577307701111),
	 ('child', 0.5096741914749146),
	 ('homemaker', 0.5019455552101135),
	 ('nurses', 0.4970571994781494)]

	[('workers', 0.611325740814209),
	 ('employee', 0.5983108878135681),
	 ('working', 0.5615329742431641),
	 ('laborer', 0.5442320108413696),
	 ('unemployed', 0.5368517637252808),
	 ('job', 0.5278826951980591),
	 ('work', 0.5223963260650635),
	 ('mechanic', 0.5088937282562256),
	 ('worked', 0.5054520964622498),
	 ('factory', 0.4940453767776489)]

这里输出的是：

离男性最远的女性的职业；
离女性最远的男性的职业。

之前看到一篇报道说机器学习是有偏见的，没错，机器学习的结果取决于你的训练集。机器学习产生的偏见实际上就是人类自己本身的偏见。

Question 2.7: Independent Analysis of Bias in Word Vectors [code + written] (1 point)

我们需要寻找更多的偏见，一直说女司机，男司机；我们就来看看两个性别之间对驾驶是否存在偏见：

pprint.pprint(wv_from_bin.most_similar(positive=['woman', 'car'], negative=['man']))
print()
pprint.pprint(wv_from_bin.most_similar(positive=['man', 'car'], negative=['woman']))
>>> [('vehicle', 0.6337087750434875),
	 ('cars', 0.6253966689109802),
	 ('driver', 0.6123777031898499),
	 ('truck', 0.5899932384490967),
	 ('minivan', 0.5488290190696716),
	 ('driving', 0.5473644733428955),
	 ('mercedes', 0.5350144505500793),
	 ('parked', 0.5255646109580994),
	 ('vehicles', 0.521051287651062),
	 ('automobile', 0.5183522701263428)]
	
	[('cars', 0.7136538624763489),
	 ('vehicle', 0.6922875642776489),
	 ('truck', 0.6608046293258667),
	 ('driver', 0.6462159752845764),
	 ('driving', 0.6076016426086426),
	 ('vehicles', 0.5946481227874756),
	 ('motorcycle', 0.5647350549697876),
	 ('drivers', 0.5344247221946716),
	 ('racing', 0.5336049795150757),
	 ('parked', 0.5304452180862427)]

从中可以看到：

数值方面，女性是低于男性的。
从车辆类型来说，女性偏向 “minivan”，“automobile” 这种车型、男性偏向 “racing”，“motorcycle”

Question 2.8: Thinking About Bias [written] (2 points)

之前也稍微提到了一点偏见是怎么来的，这里稍微总结一下：

训练集的偏见。机器学习产生的结果取决于你的训练集。机器学习产生的偏见实际上就是人类写的文章中带有的偏见。如果文章中经常将 racing 和 man 一起出现，那它们之间的距离会非常近，而到 woman 这个单词就会很远。
数据量的不足。因为我们只引入了10000个词汇量，如果数据量更大一点，说不定能够消除偏见。
由于算法设计的原因而导致的偏见。可能有些词的出现拉远了某两个词之间的距离。

BPE（字节对编码）和WordPiece 是什么 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法人工智能 transformer 深度学习
BPE（字节对编码）和WordPiece是什么BPE（字节对编码）和WordPiece是自然语言处理中常用的子词分词算法，它们通过将文本拆分为更小的语义单元来平衡词汇表大小和表达能力。BPE（BytePairEncoding，字节对编码）原理初始化：将文本按字符（或Unicode字节）拆分为最小单元，形成初始词汇表。统计合并：迭代合并最频繁出现的相邻字符对，形成新的子词单元，直到达到预设的词汇表大
自动字幕生成器：Auto-Subtitle — 技术解析与应用指南房耿园Hartley
自动字幕生成器：Auto-Subtitle—技术解析与应用指南在视频内容日益丰富的今天，自动字幕生成工具变得越来越重要，尤其是对于听障人士、非母语者和在嘈杂环境下观看视频的人来说。Auto-Subtitle是一个开源项目，它利用先进的自然语言处理（NLP）技术为你的视频自动生成准确的字幕。本文将深入探讨这个项目的原理、功能、应用场景及特点，以期吸引更多开发者和用户关注并使用。项目简介Auto-Su
NUS：LLM表格数据建模综述
标题：LanguageModelingonTabularData:ASurveyofFoundations,TechniquesandEvolution来源：arXiv,2408.10548摘要表格数据是一种跨领域的流行数据类型，由于其异构性和复杂的结构关系，带来了独特的挑战。在表格数据分析中实现高预测性能和鲁棒性对许多应用程序具有重大前景。受自然语言处理，特别是转换器架构的最新进展的影响，出现了
略说NLP引入公理模型的可行性金井PRATHAMA 知识图谱与NLP 自然语言处理人工智能知识图谱
在自然语言处理（NLP）的深层语义分析中，公理化体系的引入具有理论可行性，但其实际应用仍面临挑战。以下从公理模型的设计思路、关键技术要点及注意事项三个方面展开分析，结合搜索结果的多个相关技术点进行综合说明：一、公理模型在深层语义分析中的设计思路公理的定义与语义形式化公理模型需以形式化逻辑为基础，定义语义分析中的原始概念（如谓词、实体、关系）和推理规则。例如：原始概念：将语义角色（如施事者、受事者）
SBERT、CoSENT和BETR以及transformers的区别和联系 panshengnan NLP nlp transformer
SBERT、CoSENT、BETR和Transformers的区别和联系这几个模型（SBERT、CoSENT、BETR）和框架（Transformers）都是围绕自然语言处理（NLP）的句子嵌入和语义理解任务展开的。它们的联系主要在于基于Transformer架构，并针对特定任务做了优化；区别则在于目标任务、优化策略、训练方法和适用场景等方面。1.联系基于Transformer架构：它们的核心编码
【自然语言处理】文本规范化 2401_84149564 自然语言处理自然语言处理人工智能文本规范化 python 分词词的规范化分句
目录一、引言二、分词三、词规范化四、分句五、文本规范化的Python代码实战六、总结一、引言在自然语言处理的许多任务中，第一步都离不开文本规范化。文本规范化的作用是将使用字符串表示的文本转化为更易于计算机处理的规范形式。文本规范化一般包括3个步骤：分词、词的规范化、分句。本文将分别介绍这3个步骤及Python代码实战。二、分词词是语言的基本单元，人类学习语言的过程也是从理解词开始的。显而易见，自然
ONNX模型使用指南：从零开始掌握跨领域模型部署
ONNX模型使用指南：从零开始掌握跨领域模型部署ONNX模型作为一种开放式的神经网络交换格式，已成为AI模型部署的行业标准。当您获得一个没有使用说明的ONNX模型时，可以通过系统化的分析和部署流程，使其在不同领域发挥作用。本文将详细阐述如何分析模型结构、配置运行环境、准备特定领域输入数据、执行推理并处理结果，同时提供图像分类、自然语言处理、医疗影像分析、金融风控和自动驾驶等领域的具体应用示例，帮助
LLM系统性学习完全指南（初学者必看系列） GA琥珀 LLM 学习人工智能语言模型
前言这篇文章将系统性的讲解LLM（LargeLanguageModels,LLM）的知识和应用。我们将从支撑整个领域的数学与机器学习基石出发，逐步剖析自然语言处理（NLP）的经典范式，深入探究引发革命的Transformer架构，并按时间顺序追溯从BERT、GPT-2到GPT-4、Llama及Gemini等里程碑式模型的演进。随后，我们将探讨如何将这些强大的基础模型转化为实用、安全的应用，涵盖对齐
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
AIGC与自动驾驶：文心一言的车载交互设计 AI天才研究院 ChatGPT 实战计算 Agentic AI 实战 AIGC 自动驾驶文心一言 ai
AIGC与自动驾驶：文心一言的车载交互设计关键词：AIGC、自动驾驶、车载交互、文心一言、自然语言处理、多模态交互、用户体验摘要：本文深入探讨人工智能生成内容（AIGC）技术在自动驾驶领域的创新应用，特别是百度文心一言如何重构车载交互体验。通过解析文心一言的核心技术架构、多模态融合算法、场景化交互模型，结合具体代码实现和数学模型，揭示其在语音交互、情境理解、个性化服务等场景中的技术优势。同时通过项
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
后端领域的自然语言处理技术应用大厂资深架构师 Spring Boot 开发实战自然语言处理 easyui 人工智能 ai
后端领域的自然语言处理技术应用关键词：后端领域、自然语言处理、技术应用、算法原理、实际案例摘要：本文聚焦于后端领域中自然语言处理技术的应用。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述核心概念与联系，通过文本示意图和Mermaid流程图展示其原理和架构。详细讲解了核心算法原理并给出Python源代码示例，同时介绍了数学模型和公式。通过项目实战，展示代码实际案例并进行详细解释。分析了自然语
Char Studio 使用入门：高效构建企业级对话系统的实战指南 charles666666 人工智能产品经理语言模型自然语言处理架构
数字化浪潮推动下，企业与用户的交互模式正经历深刻变革，对话系统作为核心交互手段，其重要性日益凸显。然而，众多企业在构建对话系统时，却深陷诸多困境，难以自拔。一、开篇痛点场景：企业对话系统开发的典型困境企业在自行开发对话系统时，往往面临预算超支、周期漫长以及维护成本居高不下等问题。开发团队需要投入大量时间和精力进行底层技术架构的搭建，例如自然语言处理算法的研究、对话逻辑的设计等，这不仅消耗了大量的人
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
开源人工神经网络库（OpenANN） deepdata_cn 人工智能神经网络
OpenANN（OpenANN，OpenArtificialNeuralNetworkLibrary）是一个开源的人工神经网络库，基于C++编写，依赖Eigen3库进行高效的矩阵运算，使用CMake进行项目构建，支持多种神经网络架构，包括前馈神经网络、卷积神经网络和循环神经网络等，适用于图像识别、自然语言处理、时间序列预测等多种场景。提供数据预处理、模型保存和加载、超参数优化等功能。支持GPU加速
深度神经网络课程设计：从理论到实践 Vita Libre
本文还有配套的精品资源，点击获取简介：深度神经网络是深度学习预测的核心技术，本课程设计项目旨在教授学生如何构建和应用深度神经网络进行各种预测任务，包括图像识别和自然语言处理。学生将通过源代码示例学习从网络架构设计、数据预处理到模型训练与评估的完整流程，并掌握深度学习的基本概念、组件及技巧。1.深度神经网络定义和在深度学习预测中的角色深度神经网络（DeepNeuralNetworks,DNNs）是深
中文大模型的技术债问题大鹏的NLP博客大模型 transformer 大模型
中文大模型的技术债问题摘要随着中文大语言模型（LargeLanguageModels,LLMs）在自然语言处理（NLP）领域的广泛应用，其研发和部署过程中积累的“技术债”（TechnicalDebt）问题日益突出。本文系统性地分析了中文大模型在数据采集、预训练、微调、评估与部署等生命周期各阶段产生的技术债类型，包括代码复杂性、数据隐患、训练流程依赖、工具链碎片化、模型解释性差、隐性资源耦合等问题，
新手向:中文语言识别的进化之路
自然语言处理（NLP）技术正在以前所未有的速度改变我们与机器的交互方式，而中文作为世界上使用人数最多的语言，其处理技术面临着独特的挑战与机遇。本文将全面剖析中文自然语言识别模型的发展历程、核心技术原理、当前应用现状以及未来发展趋势，带您深入了解这一改变人机交互方式的关键技术。一、中文NLP的特殊挑战：为什么中文处理如此困难？中文自然语言处理面临着一系列西方语言所不具备的特殊挑战，这些挑战直接影响了
【AI与数据管理】基于AI大模型的企业元数据管理方案暴躁小师兄数据学院人工智能 ai 语言模型
基于AI大模型的元数据关键解决方案元数据（metadata）是描述数据的数据，例如数据的来源、结构、类型和质量信息。它在数据管理、分析和应用中至关重要。随着人工智能（AI）大模型（如基于Transformer的模型）的发展，这些模型凭借其强大的自然语言处理、模式识别和生成能力，为元数据处理提供了高效、自动化的解决方案。下面，我将逐步解释基于AI大模型的元数据关键解决方案，帮助您理解核心方法、挑战和
AI“大航海”时代：企业人力资源的AI-HR实践与效能提升策略
在数字化浪潮的推动下，人工智能（AI）正以前所未有的速度渗透各行各业，人力资源管理（HR）领域也不例外。AI技术的引入与应用落地，不仅提升HR管理效率，更在深层次上带来人力资源运作模式的变革。什么是AI-HR所谓AI-HR，是指将人工智能技术应用于人力资源管理，并通过机器学习、自然语言处理、数据挖掘等技术，优化招聘、培训、绩效评估、员工关系等人力资源各个业务模块。近年来，随着AI技术的成熟和普及，
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

CS224N Assignment 1: Exploring Word Vectors (25 Points)

CS224N Assignment 1: Exploring Word Vectors (25 Points)

Part 1: Count-Based Word Vectors (10 points)

Question 1.1: Implement distinct_words [code] (2 points)

Question 1.2: Implement compute_co_occurrence_matrix [code] (3 points)

Question 1.3: Implement reduce_to_k_dim [code] (1 point)

Question 1.4: Implement plot_embeddings [code] (1 point)

Question 1.5: Co-Occurrence Plot Analysis [written] (3 points)

Part 2: Prediction-Based Word Vectors (15 points)

Reducing dimensionality of Word Embeddings

Question 2.1: GloVe Plot Analysis [written] (4 points)

Question 2.2: Words with Multiple Meanings (2 points) [code + written]

Question 2.3: Synonyms & Antonyms (2 points) [code + written]

Solving Analogies with Word Vectors

Question 2.4: Finding Analogies [code + written] (2 Points)

Question 2.5: Incorrect Analogy [code + written] (1 point)

Question 2.6: Guided Analysis of Bias in Word Vectors [written] (1 point)

Question 2.7: Independent Analysis of Bias in Word Vectors [code + written] (1 point)

Question 2.8: Thinking About Bias [written] (2 points)

你可能感兴趣的:(自然语言处理,Stanford,CS224N)