小毛驴爱吃肉

【2019-CS224n】Assignment1

Part 1: Count-Based Word Vectors

NLTK下载数据遇到的坑
Part 1: Count-Based Word Vectors（基于计数的词向量）

导包
读取，准备数据
创建字典
构建共现矩阵
降维
可视化
降维之后的共现图分析

Part 2 （待更新。。。）

NLTK下载数据遇到的坑

Reuters：路透社语料库（商业和金融新闻）。包括10788篇新闻文献，共计130万字，分为90个主题，按照“训练”和“测试”分为两组。
1、执行下面的代码一直连接失败

import nltk
nltk.download('reuters')

[nltk_data] Error loading reuters:

之前用过nltk.download()没毛病。
2、然后尝试下面方法：

弹出：
还是不行，其实这个和网络关系很大，刚刚试了一下居然成功了。
3、从github下载：nltk_data 这个下载也很慢，半天刷不出来，耐心等待，会弹出下载窗口，然后移动到下面路径中的任意一个

一定要先建“corpora”文件，再把reuters.zip放进去。一开始我直接放到nltk_data下找不到，根据代码情况决定是否解压（我用pycharm运行不解压就可以，但是在Jupyter Notebook不解压报错：No such file or directory: ‘E:\nltk_data\corpora\reuters\test\14829’ ？？？）

Part 1: Count-Based Word Vectors（基于计数的词向量）

导包

import sys
assert sys.version_info[0] == 3
assert sys.version_info[1] >= 5

from gensim.models import KeyedVectors  # KeyedVectors:实现实体（单词、文档、图片都可以）和向量之间的映射。每个实体由其字符串id标识。
from gensim.test.utils import datapath
import pprint  # 输出的更加规范易读
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = [10, 5]  # plt.rcParams主要作用是设置画的图的分辨率，大小等信息
import nltk
nltk.download('reuters')  # 建议github下载
from nltk.corpus import reuters  # 导入路透社语料库
from numpy import *
import numpy as np
import random
import scipy as sp
from sklearn.decomposition import TruncatedSVD
from sklearn.decomposition import PCA

START_TOKEN = ''
END_TOKEN = ''
np.random.seed(0)
random.seed(0)

读取，准备数据

def read_corpus(category="crude"):
    """ Read files from the specified Reuter's category.
        Params:
            category (string): category name
        Return:
            list of lists, with words from each of the processed files
    """
    files = reuters.fileids(category)  # 类别为crude的文档
    # 每个文档都转化为小写，并在开头结尾加标识符
    return [[START_TOKEN] + [w.lower() for w in list(reuters.words(f))] + [END_TOKEN] for f in files]

# pprint模块格式化打印
# pprint.pprint(object, stream=None, indent=1, width=80, depth=None, *, compact=False)
# width：控制打印显示的宽度。默认为80个字符。注意：当单个对象的长度超过width时，并不会分多行显示，而是会突破规定的宽度。
# compact：默认为False。如果值为False，超过width规定长度的序列会被分散打印到多行。如果为True，会尽量使序列填满width规定的宽度。
reuters_corpus = read_corpus()
pprint.pprint(reuters_corpus[:3], compact=True, width=100)

创建字典

# 计算出语料库中出现的不同单词，并排序。
def distinct_words(corpus):
    """ Determine a list of distinct words for the corpus.
        Params:
            corpus (list of list of strings): corpus of documents
        Return:
            corpus_words (list of strings): list of distinct words across the corpus, sorted (using python 'sorted' function)
            num_corpus_words (integer): number of distinct words across the corpus
    """
    corpus_words = []
    num_corpus_words = -1
    # ------------------
    # Write your implementation here.
    flattened_list = [word for every_list in corpus for word in every_list]  # 展平成一维
    corpus_words = sorted(set(flattened_list))  # set去重，sorted排序
    num_corpus_words = len(corpus_words)  # 字典总数
    # ------------------
    return corpus_words, num_corpus_words

# 测试
def test_one():
    # Define toy corpus
    test_corpus = ["START All that glitters isn't gold END".split(" "),
                   "START All's well that ends well END".split(" ")]
    test_corpus_words, num_corpus_words = distinct_words(test_corpus)

    # Correct answers
    ans_test_corpus_words = sorted(
        list(set(["START", "All", "ends", "that", "gold", "All's", "glitters", "isn't", "well", "END"])))
    ans_num_corpus_words = len(ans_test_corpus_words)

    # Test correct number of words
    assert (num_corpus_words == ans_num_corpus_words), "Incorrect number of distinct words. Correct: {}. Yours: {}" \
        .format(ans_num_corpus_words, num_corpus_words)

    # Test correct words
    assert (test_corpus_words == ans_test_corpus_words), "Incorrect corpus_words.\nCorrect: {}\nYours:   {}".format(
        str(ans_test_corpus_words), str(test_corpus_words))

    # Print Success
    print("-" * 80)
    print("Passed All Tests!")
    print("-" * 80)

构建共现矩阵

def compute_co_occurrence_matrix(corpus, window_size=4):
    """ Compute co-occurrence matrix for the given corpus and window_size (default of 4).
            Note: Each word in a document should be at the center of a window. Words near edges will have a smaller
                  number of co-occurring words.
                  For example, if we take the document "START All that glitters is not gold END" with window size of 4,
                  "All" will co-occur with "START", "that", "glitters", "is", and "not".
            Params:
                corpus (list of list of strings): corpus of documents
                window_size (int): size of context window
            Return:
                M (numpy matrix of shape (number of corpus words, number of corpus words)):
                    Co-occurence matrix of word counts.
                    The ordering of the words in the rows/columns should be the same as the ordering of the words given by the distinct_words function.
                word2Ind (dict): dictionary that maps word to index (i.e. row/column number) for matrix M.
        """
    words, num_words = distinct_words(corpus)
    M = None
    word2Ind = {}
    # ------------------
    # Write your implementation here.
    word2Ind = {k: v for (k, v) in zip(words, range(num_words))}
    # print(word2Ind)
    M = np.zeros((num_words, num_words))
    # ！！！一个单词对应字典中的索引和当前文档中的索引，别混了。
    for every_document in corpus:
        for doc_index, word in enumerate(every_document):  # 遍历当前文档中的每个单词及单词在文档中的索引
            # print(doc_index, word)
            dict_index = word2Ind[word]  # 单词对应字典中的索引
            for j in range(doc_index - window_size, doc_index + window_size + 1):  # 文档中单词的索引位置-4/+4
                if j >= 0 and j < len(every_document) and j != doc_index:  # 窗口单词范围[0,len(doc))
                    outer_index = word2Ind[every_document[j]]
                    M[dict_index, outer_index] += 1
    # ------------------

    # 老师的答案
    # for document in corpus:
    #     len_doc = len(document)
    #     for index in range(0, len_doc):
    #         center_index = word2Ind[document[index]]
    #         for i in range(index - window_size, index + window_size + 1):
    #             if i >= 0 and i < len_doc and i != index:
    #                 outer_index = word2Ind[document[i]]
    #                 # print('Incrementing for',document[index],document[i])
    #                 M[center_index, outer_index] += 1.0
    return M, word2Ind

def test_two():
    # Define toy corpus and get student's co-occurrence matrix
    test_corpus = ["START All that glitters isn't gold END".split(" "),
                   "START All's well that ends well END".split(" ")]
    M_test, word2Ind_test = compute_co_occurrence_matrix(test_corpus, window_size=1)

    # Correct M and word2Ind
    M_test_ans = np.array(
        [[0., 0., 0., 1., 0., 0., 0., 0., 1., 0., ],
         [0., 0., 0., 1., 0., 0., 0., 0., 0., 1., ],
         [0., 0., 0., 0., 0., 0., 1., 0., 0., 1., ],
         [1., 1., 0., 0., 0., 0., 0., 0., 0., 0., ],
         [0., 0., 0., 0., 0., 0., 0., 0., 1., 1., ],
         [0., 0., 0., 0., 0., 0., 0., 1., 1., 0., ],
         [0., 0., 1., 0., 0., 0., 0., 1., 0., 0., ],
         [0., 0., 0., 0., 0., 1., 1., 0., 0., 0., ],
         [1., 0., 0., 0., 1., 1., 0., 0., 0., 1., ],
         [0., 1., 1., 0., 1., 0., 0., 0., 1., 0., ]]
    )
    word2Ind_ans = {'All': 0, "All's": 1, 'END': 2, 'START': 3, 'ends': 4, 'glitters': 5, 'gold': 6, "isn't": 7,
                    'that': 8, 'well': 9}

    # Test correct word2Ind
    assert (word2Ind_ans == word2Ind_test), "Your word2Ind is incorrect:\nCorrect: {}\nYours: {}" \
        .format(word2Ind_ans, word2Ind_test)

    # Test correct M shape
    assert (M_test.shape == M_test_ans.shape), "M matrix has incorrect shape.\nCorrect: {}\nYours: {}" \
        .format(M_test.shape, M_test_ans.shape)

    # Test correct M values
    for w1 in word2Ind_ans.keys():
        idx1 = word2Ind_ans[w1]
        for w2 in word2Ind_ans.keys():
            idx2 = word2Ind_ans[w2]
            student = M_test[idx1, idx2]
            correct = M_test_ans[idx1, idx2]
            if student != correct:
                print("Correct M:")
                print(M_test_ans)
                print("Your M: ")
                print(M_test)
                raise AssertionError(
                    "Incorrect count at index ({}, {})=({}, {}) in matrix M. Yours has {} but should have {}."
                        .format(idx1, idx2, w1, w2, student, correct))

    # Print Success
    print("-" * 80)
    print("Passed All Tests!")
    print("-" * 80)

# test_two()

降维

def reduce_to_k_dim(M, k=2):
    """ Reduce a co-occurence count matrix of dimensionality (num_corpus_words, num_corpus_words)
        to a matrix of dimensionality (num_corpus_words, k) using the following SVD function from Scikit-Learn:
            - http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.TruncatedSVD.html
        Params:
            M (numpy matrix of shape (number of corpus words, number of corpus words)): co-occurence matrix of word counts
            k (int): embedding size of each word after dimension reduction
        Return:
            M_reduced (numpy matrix of shape (number of corpus words, k)): matrix of k-dimensioal word embeddings.
                    In terms of the SVD from math class, this actually returns U * S
    """
    n_iters = 10  # Use this parameter in your call to `TruncatedSVD`
    M_reduced = None
    print("Running Truncated SVD over %i words..." % (M.shape[0]))

    # ------------------
    # Write your implementation here.
    svd = TruncatedSVD(n_components=k, n_iter=n_iters, random_state=0)
    # svd.fit(M)  # 训练数据
    # M_reduced = svd.transform(M)  # 降维
    M_reduced = svd.fit_transform(M)  # 等价于上面两句
    # print(M_reduced)  # 二维矩阵
    # ------------------
    print("Done.")
    return M_reduced

def test_three():
    # ---------------------
    # Run this sanity check
    # Note that this not an exhaustive check for correctness
    # In fact we only check that your M_reduced has the right dimensions.
    # ---------------------

    # Define toy corpus and run student code
    test_corpus = ["START All that glitters isn't gold END".split(" "),
                   "START All's well that ends well END".split(" ")]
    M_test, word2Ind_test = compute_co_occurrence_matrix(test_corpus, window_size=1)
    M_test_reduced = reduce_to_k_dim(M_test, k=2)

    # Test proper dimensions
    assert (M_test_reduced.shape[0] == 10), "M_reduced has {} rows; should have {}".format(M_test_reduced.shape[0], 10)
    assert (M_test_reduced.shape[1] == 2), "M_reduced has {} columns; should have {}".format(M_test_reduced.shape[1], 2)

    # Print Success
    print("-" * 80)
    print("Passed All Tests!")
    print("-" * 80)

# test_three()

可视化

# 降维之后可视化
def plot_embeddings(M_reduced, word2Ind, words):
    """
    Plot in a scatterplot the embeddings of the words specified in the list "words".
    NOTE: do not plot all the words listed in M_reduced / word2Ind.
    Include a label next to each point.
    Params:
        M_reduced (numpy matrix of shape (number of unique words in the corpus , k)): matrix of k-dimensioal word embeddings
        word2Ind (dict): dictionary that maps word to indices for matrix M
        words (list of strings): words whose embeddings we want to visualize
    """
    # ------------------
    # Write your implementation here.
    # 需要得到每个单词的x，y坐标。
    # 单词：words。  x，y：M_reduced的[[x,y],[x,y]]
    for word in words:
        x = M_reduced[word2Ind[word]][0]
        y = M_reduced[word2Ind[word]][1]
        plt.scatter(x, y, marker='x', color='red')  # marker:表示的是标记的样式，默认的是'o'。
        # plt.text()给图形添加文本注释
        plt.text(x+0.0002, y+0.0002, word, fontsize=9)   # x、y上方0.002处标注文字说明，word标注的文字，fontsize：文字大小
    plt.show()
    # ------------------

def test_four():
    # The plot produced should look like the "test solution plot" depicted below.
    # ---------------------
    print("-" * 80)
    print("Outputted Plot:")
    
    M_reduced_plot_test = np.array([[1, 1], [-1, -1], [1, -1], [-1, 1], [0, 0]])
    word2Ind_plot_test = {'test1': 0, 'test2': 1, 'test3': 2, 'test4': 3, 'test5': 4}
    words = ['test1', 'test2', 'test3', 'test4', 'test5']
    plot_embeddings(M_reduced_plot_test, word2Ind_plot_test, words)
    
    print("-" * 80)

# test_four()

降维之后的共现图分析

def plot_analysis():
    # -----------------------------
    # Run This Cell to Produce Your Plot
    # ------------------------------
    reuters_corpus = read_corpus()   # 二维列表数据
    M_co_occurrence, word2Ind_co_occurrence = compute_co_occurrence_matrix(reuters_corpus)  # 共现矩阵，字典
    M_reduced_co_occurrence = reduce_to_k_dim(M_co_occurrence, k=2)  # 降维

    # Rescale (normalize) the rows to make them each of unit-length
    # 重新缩放(规格化)这些 行（axis=1），使它们成为每个单元长度
    M_lengths = np.linalg.norm(M_reduced_co_occurrence, axis=1)  # 8185个词--8185行。一维
    # print(shape(M_reduced_co_occurrence))   # (8185, 2)
    # print(shape(M_lengths[:, np.newaxis]))  # 二维（列）(8185, 1)

    # numpy的broadcasting知识：https://jakevdp.github.io/PythonDataScienceHandbook/02.05-computation-on-arrays-broadcasting.html
    M_normalized = M_reduced_co_occurrence / M_lengths[:, np.newaxis]  # broadcasting
    
    words = ['barrels', 'bpd', 'ecuador', 'energy', 'industry', 'kuwait', 'oil', 'output', 'petroleum', 'venezuela']
    plot_embeddings(M_normalized, word2Ind_co_occurrence, words)

plot_analysis()

Part 2 （待更新。。。）

绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
渝婧感恩日记第68天梁渝婧lydia
1.哇！我真是太幸福啦！感恩奇迹感恩训练营毕业典礼，让我能共振到同学们的喜悦和能量，感谢！感谢！感谢！2.哇！我真是太幸福啦！感恩每天早起，运动3公里！这个星期又做到连续三天，不间断！感谢亲爱的渝婧！你真的是非常的棒！加油，继续坚持！感谢！感谢！感谢！3.哇！我真是太幸福啦！感恩曾正波班主任给我们分享的艾宾浩斯的记忆曲线255学习法，让我蠢蠢欲试，感谢！感谢！感谢！4.哇！我真是太幸福啦！感恩胜利
放松的一天 4da9b7687fa0
20190325总结起床07:20图片发自App睡觉:23:00天气:晴今日任务清单学习·信息·阅读•水滴阅读Day40Alice’sAdventuresinWonderlandChapter6.2图片发自App•BBC跟读训练营Day24图片发自App图片发自App图片发自App•潘多拉口语训练营Day6Wow.Whatabigboy!•文化知识学习今日无•阅读时间地狱健康·饮食·锻炼•饮食目标
人到中年的5大恐惧不想独白的独白
这一段时间闭关在家，心里越来越没有底。全球疫情，全国疫情，一直在关心和自我调试中。但是，好像还是对自己的未来充满了无所适从。不想去做什么，也没有激情和兴趣去开始什么。人生过半，还有什么可以逆袭或改变的机会呢。不知道做什么的时候，去追剧，做美食，教育孩子，锻炼，花钱进什么什么读书训练营，打卡训练营，微信群，各种分享和共同体的群。但是还是没有任何的起色。就这样了吗。中午并不困，但是到了12点，还是习惯
股票公众号怎么赚钱的？炒股公众号靠什么赚钱？氧惠评测
股票公众号赚钱的方式主要有以下几种：别指望别人对你好，你没有价值，别人怎么可能会对你好，要知道:人生都是相互的，你要让自己有价值，只要你有价值了，水到自然渠成了。氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做
抖音返利平台有哪些?值得推荐抖音返利app有哪些? 氧惠超好用
随着抖音电商的崛起，越来越多的用户开始关注抖音返利平台希望通过这些平台在享受购物乐趣的同时，也能获得一定的返利优惠。那么，面对众多的抖音返利平台，哪个返利最高呢？本文将为您深入解析，助您找到最优选择。氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新
超过晚上9点不打卡和点评别有余味
一开营宇彤老师就说到：点评导师们，为了让大家积极练习，你们能及时点评，每天晚上9点前打完卡，写不完作业的，点评官就不点评了。原因:声音学习，不同于演讲不同于写作，可以深夜耕耘，“深耕”。声音就得早早练，如果半夜练习，哪能放的开。邻居会同意吗？家人会同意吗？为了家庭，邻居和谐，深夜不练声。给大家养成好习惯在坚持星球第二期声音训练营打卡第5天，宇彤老师上午又在群里抛出要一个问题：“参加写作，演讲学习，
2023-06-30 151d580c6a8c
翔龙商学院三天学习后感：经过2023年6月27-29日三天学习后，确实成长很快，给自己的成长又提高一个台阶，感谢集团尤总及各位老师的辛苦再次感谢和感恩，对具体学习的翔龙商学院第十七期TTT训练营温故而知新，回顾一下具体学习情况，打造三师农化师，会议推广师，市场策划师继续落地。1、范永强老师从土壤与农化，李比希的矿物营养学，强酸＜5.5，酸性5.5-6.5，中性6.5-7.5，碱性7.5-8.5，强
意志力日志第二次总结意志力消退：玩物丧志首当其冲保险经纪人生
高级注意力不留给游戏意志力训练营已经过去半个月了，慢慢实践也利用起来了，记录时间时间的流逝确实很快，但是意志力的流逝如不知原理很快就会出现大问题。意志力消退罪魁祸首是睡眠饮食，其次就是电子游戏。现在记录了娱乐时间，如果每天的游戏时间超过一小时自己就非常有罪恶感，因为自己在游戏中很是争抢好胜吧，但是高强度的集中注意力消耗了自己仅有的高级注意力，以后打游戏就佛系了，自己最重要的东西要放在心上。运动让生
绘本讲师训练营［35期］4/21 阅读原创《幸福的种子》 b5c49a79b8b7
350023洪岳103-141页图片发自App阅读这本书已经快接近尾声了，从一开始蒙蒙的状态，变得逐渐清晰，以前不了解绘本，只读文字，不重视图，更不会文图相结合，更更不会看封面和封底，所以很庆幸参加了这次培训，让我的思路更清晰，今天尝试给孩子读了三本绘本，虽然从表达到声音到拓展还需要不断加强，但是已经激起了孩子的兴趣了～图片发自App之前不理解为了叫幸福的种子，读书到这个《改变人类的力量》让我深深
有哪些比较好用的软件可以领淘宝优惠券的？氧惠_飞智666999
有很多比较好用的软件可以领淘宝优惠券，以下是一些常用的软件：领购物大额优惠券、赚返利佣金用氧惠~氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。珊珊导师氧惠邀请码888999，注册送万元推广大礼包，
继续探索通往桃花源的路-我为何参加进阶写作特训营安晴兰
记得一个月前写了一篇为何参加21天爱上写作训练营，我开始了这个写作的旅程。一个月后写了一篇参与课程的心得。我发现这段很短的时间，21天，回首一望，其实，自己才迈开了一步。老师给我们一些方法与技巧，告诉我们补给的重要，老师看着我们继续前行，因为这条写作路，是自己的选择。我相信老师一定希望我们勇往直前，笔从心的继续写下去，做个终生的写作者。这段时间我的写作产出量的确比不上其他多产的小伙伴，但我已达到老
怎么搞个第二副业？第二副业有哪些？氧惠评测
如果你想要开启一个副业，以下是一些可以考虑的方向：氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。珊珊导师氧惠邀请码888999，注册送万元推广大礼包，教你如何1年做到百万团队。摄影：如果你对摄影有
【邢妍日记】第14篇《今日我点评》写日记的邢妍
2021年11月17日晴星期三《今日我点评》一切都是刚刚好！今天刚好限号！（只能居家工作）今天刚好我值日！今天是我参加日记星球第62期《21天文字日记训练营》的第14天！我关注到了很多不同领域、不同行业的朋友！与此同时因为写日记，我也被很多人关注！今天是我值日点评作业！24篇日记！认真阅读、用心点评、欣赏并点赞☞一气合成！居然5个小时没离开座位！我也是佩服我自己！每件事认真用心做！结果都不会差！以
代码随想录算法训练营第45天 | LeetCode115.不同的子序列、 LeetCode583.两个字符串的删除操作、LeetCode72.编辑距离霸L 算法数据结构动态规划
目录LeetCode115.不同的子序列LeetCode583.两个字符串的删除操作LeetCode72.编辑距离LeetCode115.不同的子序列给你两个字符串s和t，统计并返回在s的子序列中t出现的个数，结果需要对10^9+7取模。思路：昨天做了一道判断子序列的问题，今天这个跟它有点区别，这里是问子序列的个数有多少个。但是大体上其实就是分为两个部分，遇到元素相等时如何处理，不相等时又如何处理
代码随想录算法训练营第9天 | LeetCode28.找出字符串中第一个匹配项的下标、LeetCode459.重复的子字符串霸L 算法数据结构
LeetCode28.找出字符串中第一个匹配项的下标给你两个字符串haystack和needle，请你在haystack字符串中找出needle字符串的第一个匹配项的下标（下标从0开始）。如果needle不是haystack的一部分，则返回-1。给你两个字符串haystack和needle，请你在haystack字符串中找出needle字符串的第一个匹配项的下标（下标从0开始）。如果needle不
QQ群优惠券和微信群优惠券有什么区别？群里发的优惠券链接都是哪里的？氧惠评测
淘宝优惠券的来源主要是商家为了促销而设置的。这些优惠券可以增加商品的销售量，提升商家的利润。商家可以在店铺首页、商品详情页或领取页面中发布优惠券，用户可以在这些地方领取优惠券并使用。氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大
免费天猫优惠券领取以及天猫优惠券怎么使用? 氧惠_飞智666999
亲们，你们是不是经常在天猫上看到各种优惠券和代金券，却不知道该怎么用呢？别着急，我来给你们科普一下！氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。古楼导师氧惠邀请码555888，注册送万元推广大礼
代码随想录算法训练营第46天 | LeetCode647.回文子串、 LeetCode516.最长回文子序列霸L 算法数据结构动态规划
目录LeetCode647.回文子串1.动态规划2.双指针法LeetCode516.最长回文子序列LeetCode647.回文子串给你一个字符串s，请你统计并返回这个字符串中回文子串的数目。回文字符串是正着读和倒过来读一样的字符串。子字符串是字符串中的由连续字符组成的一个序列。思路：在回溯系列也做过求给定字符串的所有回文子串，那里求的是所有的划分结果，这里统计的是回文子串的数目，但是因为回溯本质上
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
财富训练营总结：遇见一个理财还理心的好课，遇见一个勤奋还热心的自己玉衡_李俊晔
图片发自训练营第一天21天财富训练营从4.2到22号，一晃就圆满结束了。这段旅程我走得特别开心，又特别踏实，收获满满的：一、付出＋创造＝成长（进步）因为有理财的需求，有创业的需求，有写作的需求……这次训练营似乎满足了我的各种需求，所以我特别在意和上心，还特别热情。主动承担了2组组长的角色。每天早上，我会将老师的课件转发在组群，鼓励大家学习打卡，其实同时提醒了自己认真学习，认真打卡。——在最后一天发
电影优惠券怎么领？高省爱氧惠
电影优惠券的领取方式有很多种，以下是一些常见的方式：领购物大额优惠券、赚返利佣金用氧惠~氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。珊珊导师氧惠邀请码888999，注册送万元推广大礼包，教你如何
精读论语复盘：用跨越千年的时代瑰宝为人生加持慢慢学说话
21天的精读论语训练营告于段落，回顾我的学习历程，每个阶段的学习都认真听讲，结合自身实际提炼总结卡文，每篇卡文都荣幸的推选为精选。积极参加班级的思启活动，与书友们分享了《赞美的力量》和《从拆弹专家到炸弹专家，一场心灵的自我救赎》，结合论语启发思考。参与小组PK和班级PK活动，撰写了小组PK赛中论语大辩论的脚本，并担任辩论主持，撰写了班级PK赛中《上位风波》的脚本并饰演同事小赵，都取得的不错的成绩。
绘本讲师训练营【第30期】2/21阅读原创《绘本之力》学习笔记2 郑贤钰
30028郑贤钰今天读了绘本之力《留在灵魂里的东西》读了心里有非常大的感触！两个年幼什么都不懂的孩子，为了自己心爱的东西，攒下来自己的零花钱，却买了一个自己不知道怎么用的东西，当他们觉得这个东西根本就不好，准备扔掉的时候，这是故事中的有趣有爱的老爷爷出现了，帮助孩子们再一次发现之前别人拉出优美的音乐，原来自己买的这一个琴，自认为没用的琴也能够经过老爷爷熟练的演奏也能拉出这样优美的声音，这让孩子们十
2022年3月23日复盘凤晴天
工作方面：今天过来开始伎钢筋的结算单。然后开始做模板木方的结算单。开始加昨天钢管扣件对账缺的部分，晚上过来加班，又把那个需求总计划给上传了一下。25号要上传创效和限额领料资料。学习方面：1.秘密的话，还是没有怎么听他们社群里面的分享。2、21天演讲训练营，今天是总决赛及结营仪式。因为加班也没有听他们的比赛。但是看群里边发的就是军人的，感觉军人的气概，那种气魄非常强。3.小a的话已经开始拉10天训练
绘本讲师训练营【19期】2/21 阅读原创《幸福的种子》 coco_c71d
图片发自App19103朱婷一、图书与幼儿的世界从幼儿时期开始，我们的孩子已经懂的了感受，母亲，是给孩子感受最重要的人.母亲才是婴儿生存的最大力量与依靠，母亲的温柔、爱都会是婴儿最安全的感受.所以母亲要丰富自己的情感与认知，然后再将这些饱含艺术家们的情感、认知，悄悄的播种在孩子的心中，与孩子建立亲密的关系.幼儿时的快乐是和朋友、兄弟姐妹一起，和母亲一起的幸福，幼儿时的孩子看不懂任何书，他只能看着图
绘本讲师训练营【31期】8/21阅读原创《小海螺和大鲸鱼》读后感 Michelle_cf08
31017柯齐霞图片发自App这是一个一条大鲸鱼和一只小海螺的故事。是一个深刻故事，故事让人有意想不到的情节，鲸是那么凶猛的，而小海螺又是那么小小的善良的，这两种生动碰到一起，你只看名字一定不会想到是温情的故事。故事内容如下：在大海旁边有几块黑的大岩石，在岩石上有许多小海螺。其中一只小海螺用自己的粘液写了几个字“请让我出海远航好不好？大鲸鱼顶着小海螺去远航。小海螺看到了冰山、金色的沙滩、成群的鱼儿
剽悍财富行动营成长记录：从无知到自信 Jojo_d89d
来自：赋能三连-Jojo01偶然的交集去年的某一天，在另一个训练营中认识了一位很优秀的朋友，她做了一个分享，在大家佩服之余提到了她之前一天看一本书，强度很大但是进步也很大，成功吸引了我的注意。加上我觉得她的分享特别有条理，让我听了还想听，所以跟她交流了，由此了解到了剽悍训练营，关注半年了，怕自己时间不够，今年挑了这个时间来参加。02愿景及目标在进入训练营之前，我有很多想象，我参加训练营之后拖延症会
梧桐幸福演说训练营第八天之《幸福演说家》（补作业） 7fd6564e6ed8
今天是母亲节，也是佛诞日，此刻的我在上古养生之道的课堂上参加学习，时间被安排的很紧实，没有跟妈妈发语音和打电话，就给妈妈发了一条微信过去，我相信我的妈妈已经收到我的祝愿妈妈，我想念你，很想很想你，在我心中妈妈就是佛，我好想此刻见到你，在这里祝福你健康幸福，快乐每一天。老师说当一个幸福的演说家，在这里我来解读一下我对幸福演说家的理解。对我来说付出是一种幸福。每当帮我周围的人用我所学的上古的手法解决了
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end