Searchable Symmetric Encryption Scheme——对称密文检索

引言：

在IT界，大数据安全和密码学的高级实现似乎很难找到，很简单的一个例子是：倒排索引的实现有很多，但是在加密基础上再次实现密文检索和倒排索引却是寥寥无几，这篇博文基于对称密文实现检索。

数据集

真实数据集：
http://archive.ics.uci.edu/ml/datasets/Bag+of+Words
Enron Emails，NIPS full papers，NYTimes news articles 用关键词W对密文建立索引，对密文进行检索 D=39861 代表文档数目 W=28102代表单词数目 N=6,400,000 (approx)代表单词总数

问题描述

实现以下加密方案

环境

Python3.7
Pycharm professional

Cryptography(python密码学算法库）

Cryptography是Python提供的一个为密码学使用者提供便利的第三方库，官方中，cryptography 的目标是成为“人们易于使用的密码学包”，就像 requests 是“人们易于使用的http库”一样。这个想法使你能够创建简单安全、易于使用的加密方案。如果有需要的话，你也可以使用一些底层的密码学基元，但这也需要你知道更多的细节，否则创建的东西将是不安全的。

参考学习链接：
官网：
https://cryptography.io/en/latest/

Python3加密学习：
https://linux.cn/article-7676-1.html

安装：
Pip install cryptography

调用（这里只提供本文需要的包）
from cryptography.fernet import Fernet #used for the symmetric key generation
from cryptography.hazmat.backends import default_backend #used in making key from password
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.kdf.pbkdf2 import PBKDF2HMAC

dataset

数据集：本次实验采用University of California Irvine的数据集，Enron Emails，NIPS full papers，NYTimes news articles 用关键词W对密文建立索引，对密文进行检索 D=39861 代表文档数目 W=28102代表单词数目 N=6,400,000 (approx)代表单词总数。
首先以Enron Emails数据为例子，数据文件的数据以如下的形式呈现：

其中每一行的第一个数据是文件的编号，第二个数据是单词的编号，第三个数据是词频，这种形式的数据其实为我们在进行倒排索引的构建时提供了便利。

倒排索引word_dict的构建

这一部分是对数据集构建基本的倒排索引，采用传统的建立方法就可以，核心代码如下：

    for idx, val in enumerate(filenames):#val is the name of the file
        cnt = Counter()
        for line in open(filenames[idx], 'r'): 
            print(line)
            word_list = line.replace(',', '').replace('\'', '').replace('.', '').lower().split()
            for word in word_list:
                cnt[word] += 1
        filedata.append((val, cnt)) 


    for i in allwords:
        word_dict[i]
        for idx, val in enumerate(filedata):
            if i in val[1]:#val[1] is allwords of the value
                word_dict[i].append(val[0])# val[0] is the name of file
        word_dict[i].sort()

首先我们通过两个简单的测试文件进行验证:
example1:
File1:“hello this is a test data file data file file”
File2: “also file data is a test file”

将这两个文件作为输入，可以看到输出的倒排索引如下：word_dict
defaultdict(, {‘file’: [‘simple.txt’, ‘simple2.txt’], ‘data’: [‘simple.txt’, ‘simple2.txt’], ‘hello’: [‘simple.txt’], ‘this’: [‘simple.txt’], ‘is’: [‘simple.txt’, ‘simple2.txt’], ‘also’: [‘simple2.txt’], ‘a’: [‘simple.txt’, ‘simple2.txt’]})

example2：
有了这两个的基础，我们再对Enron Emails dataset进行word_list构建，考虑到Enron Emails dataset的数据量较大，难以从输出上看到结构，我们只取其中的前10个文件对应的数据集运行，得到如下的word_dict：
defaultdict(, {‘118’: [‘1’], ‘285’: [‘1’, ‘5’], ‘1229’: [‘1’, ‘3’], ‘1688’: [‘1’], ‘2068’: [‘1’, ‘2’], ‘5511’: [‘2’, ‘5’], ‘19675’: [‘2’], ‘1197’: [‘2’], ‘9458’: [‘2’], ‘2233’: [‘2’, ‘6’], ‘14050’: [‘3’], ‘26050’: [‘3’], ‘1976’: [‘3’], ‘3328’: [‘3’], ‘536’: [‘2’, ‘3’], ‘22690’: [‘4’], ‘9404’: [‘4’], ‘4802’: [‘2’, ‘4’], ‘19497’: [‘4’], ‘23690’: [‘4’], ‘19640’: [‘5’], ‘3182’: [‘2’, ‘5’], ‘24409’: [‘5’], ‘25181’: [‘5’], ‘16151’: [‘6’], ‘1599’: [‘6’], ‘6993’: [‘2’, ‘3’, ‘6’], ‘13091’: [‘5’, ‘6’, ‘8’], ‘15091’: [‘6’], ‘6964’: [‘7’], ‘9464’: [‘7’], ‘10636’: [‘7’], ‘12107’: [‘7’], ‘14325’: [‘4’, ‘7’], ‘4813’: [‘8’], ‘15088’: [‘10’, ‘6’, ‘8’], ‘25519’: [‘8’], ‘15291’: [‘8’], ‘1503’: [‘8’], ‘9970’: [‘9’], ‘22771’: [‘9’], ‘1267’: [‘9’], ‘4402’: [‘9’], ‘10258’: [‘9’], ‘6623’: [‘10’, ‘8’], ‘13104’: [‘10’, ‘3’], ‘19117’: [‘10’, ‘6’], ‘171’: [‘10’], ‘5680’: [‘10’]})

索引完整代码：

import itertools
from itertools import permutations, combinations  # used for permutations
from cryptography.fernet import Fernet  # used for the symmetric key generation
from collections import Counter  # used to count most common word
from collections import defaultdict  # used to make the the distinct word list
from llist import dllist, dllistnode  # python linked list library
import base64  # used for base 64 encoding
import os
from cryptography.hazmat.backends import default_backend  # used in making key from password
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.kdf.pbkdf2 import PBKDF2HMAC
import random  # to select random key
import sys
import re
import bitarray  # for lookup table


def main():
    word_dict = intialization()  # if you want to repair ,it is important
    print(word_dict)
    word_dict = intialization2()
    print(word_dict)


############################################################################################

def intialization():
    '''
    Prompts user for documents to be encrypted and generates the distinct
    words in each. Returns the distinct words and the documents that contained them
    in a dictionary 'word_dict'
    '''

    filenames = []
    x = input("Please enter the name of a file you want to encrypt: ")  # filename
    filenames.append(x)
    while (True):
        x = input("\nEnter another file name or press enter if done: ")
        if not x:
            break
        filenames.append(x)
    # finds the occurence of each word in a flle
    filedata = []
    for idx, val in enumerate(filenames):#val is the name of the file
        cnt = Counter()
        for line in open(filenames[idx], 'r'):#这里的line感觉是文件中的所有内容，，还是一个个单词读的？？
            print(line)
            word_list = line.replace(',', '').replace('\'', '').replace('.', '').lower().split()
            for word in word_list:
                cnt[word] += 1
        filedata.append((val, cnt))#这其实是一个统计词频的
        print(filedata)

    # takes the 5 most common from each document as the distinct words，in fact ,this is not necessary
    allwords = []
    for idx, val in enumerate(filedata):
        for value, count in val[1].most_common(5):
            if value not in allwords:
                allwords.append(value)
    print(allwords)
    # makes a dictory with the distinct word as index and a value of a list of filenames
    word_dict = defaultdict(list)

    for i in allwords:
        word_dict[i]
        for idx, val in enumerate(filedata):
            if i in val[1]:#val[1] is allwords of the value
                word_dict[i].append(val[0])# val[0] is the name of file
        word_dict[i].sort()


    return word_dict


############################################################################################
def intialization2():

    filenames = ["data1.txt"]
    # finds the occurence of each word in a flle
    filedata = []
    list1=[]
    docnum=0
    linenum=0
    for idx, val in enumerate(filenames):#val is the name of the file
        cnt = Counter()
        for line in open(filenames[idx], 'r'):#这里的line经过测试是按照一行一行读的，每一行有三个数字
            a=1
            linenum+=1
            word_list = line.replace(',', '').replace('\'', '').replace('.', '').lower().split()
            for data in word_list:
                if a==1:#说明这个提取的词是文档的编号
                    if linenum!=1:
                        if str(doc)!=str(data):
                            filedata.append((doc, cnt))
                            del cnt
                            cnt = Counter()
                            docnum+=1
                    doc=data
                    a+=1
                    continue
                if a==2:#说明这个提取的词是单词的编码
                    term=data
                    a+=1
                    continue
                if a==3:
                    fre=data
            cnt[term] = fre
                #print("first line"+data)
        filedata.append((doc, cnt))
    #print(filedata)
    allwords = []
    for idx, val in enumerate(filedata):
        for value, count in val[1].most_common(5):
            if value not in allwords:
                allwords.append(value)
    #print(allwords)
    # makes a dictory with the distinct word as index and a value of a list of filenames
    word_dict = defaultdict(list)
    for i in allwords:
        word_dict[i]
        for idx, val in enumerate(filedata):
            if i in val[1]:  # val[1] is allwords of the value
                word_dict[i].append(val[0])  # val[0] is the name of file
        word_dict[i].sort()
    #print(word_dict)
    return word_dict
if __name__ == '__main__':
	main()

算法

 根据输入的密码生成密钥：

key_s, key_y, key_z = keygen(password)

 构造节点存储数据并进行加密，存储在数组中：
生成密钥后，对于关键词wi的所有文档，构造节点数组，每个节点由三部分组成：文档id，下一个节点的加密密钥，下一个节点的加密地址

我们使用密钥K（i，j-1）加密节点N（i，j），并将其保存在数组中的第K1（ctr）个位置，同时令ctr=ctr+1
实现：
（1）初始化数组A，地址，加密密钥：

A = [0] * 10000
ctr = 1
keyword_key_pair = []

（2）对word list中的灭一个word，对一个节点生成key

K_i_0 = Fernet.generate_key()
keyword_key_pair.append([i, K_i_0, ctr])

（3）对后面的文档（1 <= j <= |D(wi)|）中的每一个，构建节点

N(i,j) = (id(D(i,j) || K(i,j) || v(s)(ctr+1))
K_i_j = Fernet.generate_key()
curr_addr = psuedo_random(key_s, ctr)
N = doc + "\n" + str(K_i_j) + "\n" + str(next_addr)

特别要注意对没后一个文档的处理，即指针尾的处理：

if j == len(doc_list) - 1:
next_addr = None
else:
next_addr = psuedo_random(key_s, ctr+1)

（4）当然，这个节点本身也是要用K（i，j-1）进行加密的

N = Fernet(K_i_jminus1).encrypt(str.encode(N))

（5）将加密后的节点存储后数组中，并且进行更新：

A[curr_addr] = N
K_i_jminus1 = K_i_j
ctr = ctr + 1

 生成表头，存储wi的所有文档的第一个文档位置，存储置换函数的异或结果：

（1）设置伪随机置换

random.seed(keyword + str(key_z))
index = random.randrange(0, 1000)

（2）计算

addr = psuedo_random(key_s,ctr)
value = str(addr) + "\n" + str(key)

（3）对f_y进行异或

	cat_string = []	#empty string to begin
for m in value:
	#concatenate ascii value of each character in value
	cat_string.append(ord(m))
value = [f_y ^ x for x in cat_string]

（4）将所有等于零的元素设置为某个随机键值：

for ind,val in enumerate(T):
if (val == 0):
x = random.randrange(0, 10000)
x = str(x)
x = Fernet(key_s).encrypt(str.encode(x))
T[ind] = x

完成以上内容以后，对索引节点加密的部分基本完成，我们已经建立起数组A和表单T，接下来就可以进入查询query的部分了！
 生成陷门
为了保证服务器不知道我们的查询内容，我们同样需要对查询的关键字进行加密，这个过程就叫陷门。生成的陷门形式为：

（1）返回置换函数，关键字的伪随机排列函数

random.seed(keyword + str(key_z))
index = random.randrange(0, 1000)
random.seed(keyword + str(key_y))
f_y = random.randrange(0,1000)

 搜索
前面的过程中，我们已经有了T, A, trapdoor，这样服务器对给定的trapdoor，就可以从T中找到第一个节点的地址，再从A从不断查找下一个，就可以完成搜索。最后服务器将找到的文档标识返回给数据的所有者。这里要用到的一个数学性质就是a异或b再异或b等于a，这是解密的关键。
（1）将ascii值与f_y进行异或运算，以获得字符串的列表，包含节点的地址和密钥

addr_and_key = [chr(f_y ^ x) for x in value]
mystring = ''
for x in addr_and_key:
mystring = mystring + x

这里的mystring就是节点的地址
这样我们就可以对节点的内容进行解密，得到doc-id，增加到结果中即可。

split_node = re.split(r"\n", d_n)
doc_id = split_node[0]
key = split_node[1]
addr = split_node[2]
list_of_docs.append(doc_id)

实现效果：

我们以123456为密码，可以看到以下实现效果：

建立A，T完成后，可以进行搜索，我们以118为例子：

源代码：


import itertools 
from itertools import permutations, combinations #used for permutations
from cryptography.fernet import Fernet #used for the symmetric key generation
from collections import Counter #used to count most common word
from collections import defaultdict # used to make the the distinct word list
from llist import dllist, dllistnode # python linked list library
import base64 #used for base 64 encoding
import os 
from cryptography.hazmat.backends import default_backend #used in making key from password
from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.kdf.pbkdf2 import PBKDF2HMAC
import random #to select random key
import sys
import re
import bitarray #for lookup table


def main():
	print("Welcome to Searchable Symmetric Encryption.\n\n")
	reply = input("Do you already have an encrypted data set? (Y)es or (N)o: ")
	while(True):
		#if yes then you have already generated keys and just want to search
		if(reply.lower() == 'y' or reply.lower() == "yes"):
			password = input("Please enter the password: ")
			break

		#if no then need to generate symmetric keys
		elif (reply.lower() == 'n' or reply.lower() == "no"):
			password = None
			while(True):
				password1 = input("Please choose a password: ")
				password2 = input("Please re-enter the password: ")
				if(password1 == password2):
					password = password1
					print("")
					break
				print("Passwords not the same try again\n")
            # here really start
			key_s, key_y, key_z = keygen(password)

			word_dict = intialization2()#if you want to repair ,it is important

			A, keyword_key_pair = build_array(word_dict, key_s, key_y, key_z)#A is the array, keyword_key_pair is  gauge outfit

			T = look_up_table(keyword_key_pair, key_s, key_y, key_z)

			print("\n\nWelcome!")
			keyword = input("\nPlease enter the keyword to search, or 'exit' to exit: ")

			while keyword != 'exit':
				
				trapdoor = Trapdoor(keyword, key_z, key_y)		#陷门

				list_of_docs = Search(T, A, trapdoor)       #搜索

				print(f"\nSearch Results for \"{keyword}\":\n")
				for i in list_of_docs:
					print(i)

				keyword = input("\nPlease enter the keyword to search, or 'exit' to exit: ")

			print("\n\nGoodbye!\n")

			break

		#this just makes sure user enters yes or no or y or n
		else:
			reply = input("\nInput Y for yes or N for no: ")



############################################################################################

def intialization():
	''' 
	Prompts user for documents to be encrypted and generates the distinct 
	words in each. Returns the distinct words and the documents that contained them
	in a dictionary 'word_dict'
	'''

	filenames = []
	x = input("Please enter the name of a file you want to encrypt: ")        #filename
	filenames.append(x)
	while(True):
		x = input("\nEnter another file name or press enter if done: ")
		if not x:
			break
		filenames.append(x)
			# finds the occurence of each word in a flle
	filedata = []
	for idx, val in enumerate(filenames):
		cnt = Counter()
		for line in open(filenames[idx], 'r'):
			word_list = line.replace(',','').replace('\'','').replace('.','').lower().split()
			for word in word_list:
				cnt[word]+=1
		filedata.append((val,cnt))
			
	#takes the 5 most common from each document as the distinct words
	allwords = []
	for idx, val in enumerate(filedata):
		for value, count in val[1].most_common(5):
			if  value not in allwords:
				allwords.append(value)

	#makes a dictory with the distinct word as index and a value of a list of filenames
	word_dict = defaultdict(list)
	for i in allwords:
		word_dict[i]
		for idx, val in enumerate(filedata):
			if i in val[1]:
				word_dict[i].append(val[0])
		word_dict[i].sort()

	return word_dict

############################################################################################

def keygen(u_password):
	''' Generates 3 keys, key s,y,z, based on the given password from the user. '''

	# This is input in the form of a string
	password_provided = u_password 

	# Convert to type bytes
	password = password_provided.encode() 

	salt_s = b'\x91\xabr\xebx\xc5\x9dx^b_7\xb6\x8a\xbb5'
	salt_y = b'\x1cy8\r\x7f\xf8,\xe2Pu!/\x043\xdc\x0e'
	salt_z = b'\x9b\xd0\xb6\x85!J\xde\xe5\xc8\xb3\xc9\xa2\tqPy'

	kdf_s = PBKDF2HMAC(
	    algorithm=hashes.SHA256(),
	    length=32,
	    salt=salt_s,
	    iterations=100000,
	    backend=default_backend()
	)
	key_s = base64.urlsafe_b64encode(kdf_s.derive(password))

	kdf_y = PBKDF2HMAC(
	    algorithm=hashes.SHA256(),
	    length=32,
	    salt=salt_y,
	    iterations=100000,
	    backend=default_backend()
	)
	key_y = base64.urlsafe_b64encode(kdf_y.derive(password))

	kdf_z = PBKDF2HMAC(
	    algorithm=hashes.SHA256(),
	    length=32,
	    salt=salt_z,
	    iterations=100000,
	    backend=default_backend()
	)
	key_z = base64.urlsafe_b64encode(kdf_z.derive(password))

	#returns three base_64 encoded keys
	return key_s, key_y, key_z


############################################################################################
def psuedo_random(key_s, ctr):
	''' A pseudorandom function based on key s, to return a value to index array A '''

	#Convert key s to decimal value
	decimal_key = int.from_bytes(key_s, byteorder=sys.byteorder)
	combined = decimal_key + ctr

	#Find a random value based on key s and counter
	random.seed(combined)
	index = random.randrange(0, 10000)
	return index

############################################################################################
def build_array(word_dict, key_s, key_y, key_z):
	'''
	Creates an array of nodes, each containing the document id, key to encrypt the
	next node, and the address of the next node
	'''

	A = [0] * 10000
	ctr = 1
	keyword_key_pair = []

	#for each word in set of distinct words, word_dict in this case	
	for i, doc_list in word_dict.items():

		#Generate a key for the first node
		K_i_0 = Fernet.generate_key()
		keyword_key_pair.append([i, K_i_0, ctr])

		#initialize the previous key to the first one created
		K_i_jminus1 = K_i_0 
		
		# for 1 <= j <= |D(wi)|:
		# for each document which has distinct word wi....iterate through doc_list
		for j, doc in enumerate(doc_list):
			
			#again generate key K(i,j)
			K_i_j = Fernet.generate_key()

			#N(i,j) = (id(D(i,j) || K(i,j) || v(s)(ctr+1)), where id(D(i,j) is the jth identifier in D(wi)
	
			curr_addr = psuedo_random(key_s, ctr)
			if j == len(doc_list) - 1:
				next_addr = None
			else:
				next_addr = psuedo_random(key_s, ctr+1)# return a random value
			
			N = doc + "\n" + str(K_i_j) + "\n" + str(next_addr)
			#newline is a delimeter to separate three components of the encrypted string
			#N = doc + K_i_j + address of next node. 

			#encrypt N with Ki,j-1, ie the previous key
			N = Fernet(K_i_jminus1).encrypt(str.encode(N))

			#update and save K at i,j-1
			K_i_jminus1 = K_i_j 

			#store the encrypted N in the array
			A[curr_addr] = N
	
			#update counter
			ctr = ctr + 1

	# Filling in the rest of the array with random encrypted data
	for ind,val in enumerate(A):
		if (val == 0):
			x = random.randrange(0, 10000)
			x = str(x)
			x = Fernet(key_s).encrypt(str.encode(x))
			A[ind] = x


	return A, keyword_key_pair

############################################################################################
def look_up_table(keyword_key_pair,key_s, key_y, key_z):
	'''
	Generates a table which stores the XORed result of permutation
	function f_y and the address of a node concatenated with the key
	'''
	T = [0] * 1000
	for i in keyword_key_pair:
		keyword = i[0]
		key = i[1]
		ctr = i[2]

		# pseudorandom permutation on z
		random.seed(keyword + str(key_z))
		index = random.randrange(0, 1000)

		#computes value 
		addr = psuedo_random(key_s,ctr)
		value = str(addr) + "\n" + str(key)

		#computed 'f_y(w_i)'
		random.seed(keyword + str(key_y))
		f_y = random.randrange(0,1000)

		#XOR value with f_y
		cat_string = []	#empty string to begin
		for m in value:
			#concatenate ascii value of each character in value
			cat_string.append(ord(m))

		value = [f_y ^ x for x in cat_string]

		T[index] = value
	

	#set all elements equal to zero as some random key value
	for ind,val in enumerate(T):
		if (val == 0):
			x = random.randrange(0, 10000)
			x = str(x)
			x = Fernet(key_s).encrypt(str.encode(x))
			T[ind] = x
	return T

def Trapdoor(keyword, key_z, key_y):
	'''
	returns the permutation function
	and pseudorandom permutation function on keyword
	'''
	random.seed(keyword + str(key_z))
	index = random.randrange(0, 1000)
	
	#the pseudo-random function 'f_y(w)'
	random.seed(keyword + str(key_y))
	f_y = random.randrange(0,1000)

	return (index, f_y)


def Search(T, A, trapdoor):
	'''
	Indexes both T and A with trapdoor values generated by keyword 
	in main to find and decrypt the document ids
	'''

	list_of_docs = []

	value = T[trapdoor[0]]

	f_y = trapdoor[1]

	#XORs the ascii value with f_y to obtain list version of string 
	#	containing the address and the key for the node
	addr_and_key = [chr(f_y ^ x) for x in value]
	
	#converts the list into one string
	mystring = ''
	for x in addr_and_key:
		mystring = mystring + x

	#addr_node is a list.
	addr_node = re.split(r"\n", str(mystring))

	#if addr_node isn't two separate items, we didn't find a document
	if len(addr_node) == 1:
		print("\n")
	else:

		addr = addr_node[0]
		key = addr_node[1]

		#remove b' at the beginning and ' at the end
		key = key[2:-1]

		#get the node based on the address from array A
		node = A[int(addr)]

		#turn key back into bytes and use Fernet function to 
		#	decrypt back to plaintext
		decrypted_node = Fernet(str.encode(key)).decrypt(node)
		
		#remove b' at the beginning and ' at the end
		d_n = str(decrypted_node)[2:-1]
		split_node = re.split(r"\\n", d_n)
		doc_id = split_node[0]
		key = split_node[1]
		addr = split_node[2]

		list_of_docs.append(doc_id)

		#Repeat iterating while the address is not null, meaning
		#	 there are still documents with the keyword
		while addr != 'None':
			key = key[2:-1]
			key = str.encode(key)
			node = A[int(addr)]
			decrypted_node = Fernet(key).decrypt(node)
			d_n = str(decrypted_node)[2:-1]
			split_node = re.split(r"\\n", d_n)
			doc_id = split_node[0]
			key = split_node[1]
			addr = split_node[2]
			list_of_docs.append(doc_id)

	return list_of_docs
def intialization2():

    filenames = ["data2.txt"]
    # finds the occurence of each word in a flle
    filedata = []
    docnum=0
    linenum=0
    for idx, val in enumerate(filenames):#val is the name of the file
        cnt = Counter()
        for line in open(filenames[idx], 'r'):#这里的line经过测试是按照一行一行读的，每一行有三个数字
            a=1
            linenum+=1
            word_list = line.replace(',', '').replace('\'', '').replace('.', '').lower().split()
            for data in word_list:
                if a==1:#说明这个提取的词是文档的编号
                    if linenum!=1:
                        if str(doc)!=str(data):
                            filedata.append((doc, cnt))
                            del cnt
                            cnt = Counter()
                            docnum+=1
                    doc=data
                    a+=1
                    continue
                if a==2:#说明这个提取的词是单词的编码
                    term=data
                    a+=1
                    continue
                if a==3:
                    fre=data
            cnt[term] = fre
                #print("first line"+data)
        filedata.append((doc, cnt))
    #print(filedata)
    allwords = []
    for idx, val in enumerate(filedata):
        for value, count in val[1].most_common(2):
            if value not in allwords:
                allwords.append(value)
    #print(allwords)
    # makes a dictory with the distinct word as index and a value of a list of filenames
    word_dict = defaultdict(list)
    for i in allwords:
        word_dict[i]
        for idx, val in enumerate(filedata):
            if i in val[1]:  # val[1] is allwords of the value
                word_dict[i].append(val[0])  # val[0] is the name of file
        word_dict[i].sort()
    #print(word_dict)
    return word_dict
if __name__ == '__main__':
	main()

大数据分析与安全分析 Zh&&Li 网络安全运维数据分析安全数据挖掘运维数据库
大数据分析一、大数据安全威胁与需求分析1.1大数据相关概念发展大数据：是指非传统的数据处理工具的数据集大数据特征：海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等大数据的种类和来源非常多，包括结构化、半结构化和非结构化数据有关大数据的新兴网络信息技术应用不断出现，主要包括大规模数据分析处理、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和存储系统1.2大数据安全威胁分析“数
每日安全资讯（2018.6.06）溪边的墓志铭
《贵阳市大数据安全管理条例》将实施：明确数据安全第一责任人《条例》明确，大数据发展应用中，数据的所有者、管理者、使用者和服务提供者等安全责任单位的法定代表人或主要负责人，是本单位大数据安全的第一责任人。https://www.secrss.com/articles/3170当前网络诈骗犯罪的主要媒介及应对思路为了应对公安机关的打击，网络诈骗行为在不断的更新换代，各类新型诈骗方式层出不穷，我国对网络
以数据安全筑牢新时代旅游安全之基,硬盘文件数据销毁，硬盘销毁硬盘文件数据销毁海龙安全旅游单例模式
在数字化高速发展的时代，旅游行业也迎来了大数据的浪潮。全国旅游标准化技术委员会近日发布标准《旅游大数据安全与隐私保护要求（征求意见稿）》，并公开征求意见，截止时间为2024年10月8日。这一举措无疑为新时代旅游安全工作注入了强大动力。数据安全，已然成为旅游安全的重要组成部分。旅游大数据涵盖了游客的个人信息、行程安排、消费习惯等众多敏感内容。一旦这些数据遭到泄露或滥用，不仅会给游客带来极大的困扰和损
企业级大数据安全架构（一）平台安全隐患大数据企业级安全性
作者：楼高引言当谈到企业级大数据平台时，安全性是一个至关重要的方面。随着数据规模的不断增长和信息的敏感性，大数据平台面临着多种安全隐患，需要得到充分的关注和解决，以确保其在生产环境中可靠可用。以下是一些企业级大数据平台可能面临的安全隐患，这些隐患需要得到重视。1缺乏统一的访问控制机制大数据平台由Hadoop生态体系众多组件组成，而每个组件都会提供相应的WebUI界面和RESTful接口，例如Nam
亚信安全发布2016年第一季度安全威胁报告 weixin_34281537 网络移动开发区块链
近日，云与大数据安全的领导者亚信安全发布了2016年第一季度安全威胁报告。报告显示，勒索软件病毒在本季度已经成为威胁企业安全的头号病毒，其不仅从代码结构方面发生变化，且感染方式更加多元化、本地化。此外，安卓恶意程序也从上个季度末的1,770万个增长到本季度末的2,050万个，与去年同期相比更是增长一倍以上。鉴于网络安全威胁数量仍在不断增多且技术更加精进，亚信安全建议企业用户应该建立纵深式的主动防御
亚信安全2016年Q1安全威胁报告: 勒索软件成威胁企业的头号病毒 weixin_34191734 网络移动开发区块链
亚信安全发布2016年第一季度安全威胁报告:勒索软件成为威胁企业的头号病毒,安卓恶意程序比去年同期增长一倍以上近日，云与大数据安全的领导者亚信安全发布了2016年第一季度安全威胁报告。报告显示，勒索软件病毒在本季度已经成为威胁企业安全的头号病毒，其不仅从代码结构方面发生变化，且感染方式更加多元化、本地化。此外，安卓恶意程序也从上个季度末的1,770万个增长到本季度末的2,050万个，与去年同期相比
国内首个！亚信安全获得CCRC数据分类分级产品认证证书亚信安全官方账号大数据安全 web安全 apache 开发语言人工智能
亚信安全信数数据分类分级系统AISDCV1.0，荣获中国网络安全审查认证和市场监管大数据中心颁发的首个数据分类分级产品IT产品信息安全认证证书！标志着亚信安全在大数据安全领域的强大技术实力以及专业研究，正式获得国内数据分类分级产品评定的第一个国家级权威认证与认可。中国网络安全审查认证和市场监管大数据中心（英文缩写为：CCRC）为国家市场监督管理总局直属的正司局级事业单位，IT产品信息安全认证是依据
企业级大数据安全架构（九）FreeIPA管理员密码忘记后如何修改云掣YUNCHE 企业级大数据安全架构大数据安全架构安全
作者：楼高1重置DirectoryServer管理员密码1.1停止directoryserver服务[root@ipaschema]#start-dirsrvHDP-HADOOP如果你不知道你的实例名，可以通过如下方式获取1.2生成一个新的HASH密码停止服务后使用pwdhash命令生成一个新的HASH密码[root@ipaschema]#pwdhashadmin123，新密码是admin1231
企业级大数据安全架构（八）FreeIPA高可用部署云掣YUNCHE 企业级大数据安全架构大数据安全架构
作者：楼高前面第七章详细介绍了部署FreeIPA来做kerberos认证，这节接着介绍FreeIPA高可用部署1.FreeIPA高可用配置说明：在安装完一台ipa-server之后，在另一个备份节点部署ipa-client-install和ipa-replica-install1.1备节点机器上yum安装ipa-server相关包yuminstall-yipa-server1.2修改备节点dns配
【大数据安全】数据管理安全&安全分析&隐私保护 Francek Chen 大数据技术基础安全大数据大数据安全
目录一、数据管理安全（一）数据溯源（二）数字水印（三）策略管理（四）完整性保护（五）数据脱敏二、安全分析（一）大数据安全分析架构（二）大数据防DDoS攻击（三）攻击可视化与安全业务定制三、隐私保护（一）隐私保护面临的挑战（二）内容关联密钥（三）华为大数据隐私保护方案一、数据管理安全（一）数据溯源数据溯源技术对大数据平台中的明细数据、汇总数据使用后中各项数据的产生来源、处理、传播和消亡进行历史追踪。
【大数据安全】大数据安全的挑战与对策&基础设施安全 Francek Chen 大数据技术基础安全大数据大数据安全
目录一、大数据安全的挑战与对策（一）数据加密技术（二）大数据安全与隐私（三）大数据安全保障体系（四）华为大数据安全解决方案二、基础设施安全（一）认证技术（二）访问控制（三）公钥基础设施（四）华为大数据平台大数据安全是指在大数据环境下，为了保护数据不被非法获取、篡改或破坏，确保数据的安全性、完整性和可用性的一系列措施和技术。一、大数据安全的挑战与对策（一）数据加密技术1、对称密码对称密码的特征是加密
企业级大数据安全架构（七）服务安全云掣YUNCHE 企业级大数据安全架构安全大数据安全架构
作者：楼高在企业级大数据安全方案中，本节主要介绍服务安全问题，引入kerberos认证机制，目前直接对接kerberos使用较多，这里我们使用FreeIPA来集成kerberosFreeIPA官网下载地址：https://www.freeipa.org/page/DownloadsHadoop服务的安全问题由来已久，因此在设计之初并未考虑安全问题。这导致用户在提交任务的时候可以随意伪造身份，或是恶
大数据安全 | 期末复习（下）啦啦右一 #大数据安全大数据与数据分析网络
文章目录安全策略和攻击安全协议IPseeSSLSSHS/MIME协议公钥基础设施PKIPGPHTTPS防火墙防毒墙安全审计入侵检测VPN网络物理隔离安全网关UTM安全策略和攻击安全协议定义：安全协议（securityprotocol），又称作密码协议（cryptographicprotocol）、加密协议（encryptionprotocol），是以密码学为基础的消息交换协议，其目的是在网络环境中
大数据安全 | 期末复习（中）啦啦右一 #大数据安全大数据与数据分析大数据
文章目录感知数据安全⭐️传感器概述传感器的静态特性调制方式换能攻击现有防护策略AI安全⭐️智能语音系统——脆弱性攻击手段AI的两面性哈希函数哈希函数的分类、特性、用途自由起始碰撞攻击分析HD5Hash函数数字签名⭐️数字签名概述RSARSA数字签名算法感知数据安全⭐️物理-数字空间的互联且强交互使得跨域攻击成为可能。传感器概述传感器在物联网中的作用相当于人体的感觉器官。定义国家标准GB7665-8
企业级大数据安全架构（六）数据授权和审计管理云掣YUNCHE 企业级大数据安全架构大数据安全架构安全
作者：楼高本节详细介绍企业级大数据架构中的第六部分，数据授权和审计管理1.Ranger简介ApacheRanger是一款被设计成全面掌管Hadoop生态系统的数据安全管理框架，为Hadoop生态系统众多组件提供一个统一的数据授权和管理界面，管理员只需要对接一个Ranger管理系统，就可以对整个Hadoop生态系统进行数据管理，数据授权和审计。2.安装Ranger和RangerKMS需要先创建ran
详解Linux运维工程师高级篇（大数据安全方向）. weixin_30588729 运维操作系统 java
hadoop安全目录：kerberos（已发布）elasticsearch（已发布）http://blog.51cto.com/chenhao6/2113873knoxoozierangerapachesentry简介：从运维青铜到运维白银再到运维黄金，这里就要牵扯到方向问题也就是装备，根据自己的爱好，每个人都应该选择一个适合自己和喜欢自己的一个职业技术方向，如：大数据安全，开发运维，云计算运维等
国内首个！亚信安全获得CCRC数据分类分级产品认证证书亚信安全官方账号大数据安全运维网络安全人工智能 web安全
亚信安全信数数据分类分级系统AISDCV1.0，荣获中国网络安全审查认证和市场监管大数据中心颁发的首个数据分类分级产品IT产品信息安全认证证书！标志着亚信安全在大数据安全领域的强大技术实力以及专业研究，正式获得国内数据分类分级产品评定的第一个国家级权威认证与认可。中国网络安全审查认证和市场监管大数据中心（英文缩写为：CCRC）为国家市场监督管理总局直属的正司局级事业单位，IT产品信息安全认证是依据
企业级大数据安全架构（五）Knox安装云掣YUNCHE 企业级大数据安全架构大数据
本章节介绍安全架构里面一个重要组件Knox安装，我们是通过ambari安装，如果安装开源Knox可参考官网文档1添加服务打开Ambari页面并登录，然后点击主页上的"AddService"按钮。2Knox勾选在服务列表中，找到并勾选"Knox"选项，然后点击"Next"按钮。3安装knox节点在选择安装节点页面上，选择要安装Knox的节点，然后点击"Next"按钮。4设置knox密码在设置Knox
大数据安全 | 期末复习（上）| 补档啦啦右一 #大数据安全大数据与数据分析单例模式
文章目录概述⭐️大数据的定义、来源、特点大数据安全的含义大数据安全威胁保障大数据安全采集、存储、挖掘环节的安全技术大数据用于安全隐私的定义、属性、分类、保护、面临威胁安全基本概念安全需求及对应的安全事件古典密码学里程碑事件扩散和混淆的概念攻击的分类模运算移位加密仿射加密维吉尼亚密码DES混淆与扩散Feistel加密DES密钥生成DES流程数论欧几里得算法拓展欧几里得算法欧拉函数有限域运算AES密钥
企业级大数据安全架构（四）Ranger安装云掣YUNCHE 企业级大数据安全架构大数据安全架构安全
作者：楼高Ranger是支持审计功能的，安装时可以选择审计数据保存的位置，默认支持Solr和HDFS。HDFS的配置比较简单，这里就不赘述了，我们这里使用Ambari默认自带的Solr保存审计日志，下面部署Solr：1选择安装组件选择InfraSolraddservice在ambari中solr是InfraSolr2选择安装节点3选择服务安装节点4配置相关信息5查看solr配置可以导出配置信息6开
大数据安全速通知识点爱打网球的小哥哥一枚吖大数据安全单例模式
以下是关于我对于大数据安全这门课程的的知识大概归纳，欢迎批评指正~大数据安全首先要对大数据有一定了解。什么是大数据？大数据是指在一定时间内无法用常规软件进行捕捉、管理和处理数据集合，需要新的处理方式才能具有更强决策力、洞察发现力和流程优化力的信息资产。大数据的四个特点？价值密度低。种类多。容量大。变化快。首先，什么是大数据安全呢？保障大数据安全。保障数据采集过程，计算过程、数据形态，应用价值的处理
边缘计算挑战和机遇 ღ᭄陽先生꧔ꦿ᭄ 边缘计算人工智能
方向一：数据安全与隐私保护1.背景介绍随着数据的产生和收集量日益增加，大数据技术在各个领域的应用也不断拓展。然而，这也带来了数据安全和隐私保护的问题。在大数据环境下，数据安全和隐私保护的重要性得到了广泛认识。本文将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作步骤以及数学模型公式详细讲解具体代码实例和详细解释说明未来发展趋势与挑战附录常见问题与解答1.1背景介绍大数据安全与隐
企业级大数据安全架构（三）修改集群节点hostname 云掣YUNCHE 企业级大数据安全架构大数据安全架构安全
作者：楼高在后续安装FreeIPA的过程中，要求机器名必须包含完整的域名信息。如果之前在Ambari集群节点上的机器名不符合这个要求，可以按照以下步骤在Ambari上修改所有节点的机器名：1.部署节点说明本次测试是三台ambari节点，主机名分别是jz001，jz002，jz003。其中ambari-server安装在jz001上；ambari-agent三台均有安装。2.禁用Kerberos需要
企业级大数据安全架构（二）安全方案云掣YUNCHE 企业级大数据安全架构安全大数据安全架构
作者：楼高1Knox访问控制ApacheKnox是一个为ApacheHadoop部署提供交互的应用网关，通过其RESTAPI和用户友好的UI，为所有与Hadoop集群的REST和HTTP交互提供了统一的访问点。Knox不仅仅是一个访问网关，它还具备强大的访问控制功能，可以精确管理用户对Hadoop资源的访问权限。另外，Knox与企业常用的身份管理和单点登录（SSO）系统集成，使得企业可以直接使用现
企业级大数据安全架构（一）平台安全隐患云掣YUNCHE 企业级大数据安全架构大数据安全架构安全
作者：楼高引言当谈到企业级大数据平台时，安全性是一个至关重要的方面。随着数据规模的不断增长和信息的敏感性，大数据平台面临着多种安全隐患，需要得到充分的关注和解决，以确保其在生产环境中可靠可用。以下是一些企业级大数据平台可能面临的安全隐患，这些隐患需要得到重视。1缺乏统一的访问控制机制大数据平台由Hadoop生态体系众多组件组成，而每个组件都会提供相应的WebUI界面和RESTful接口，例如Nam
4月28日柒月是你的忧伤
中国信息安全测评中心联合安恒信息，于2017年推出注册Web安全工程师（简称CWSE），工业控制系统安全工程师（简称ICSSE），大数据安全分析师和云计算安全工程师认证。本次大会为首批完成上述四个认证培训并通过考试的学员颁发证书。阿里云安全总监
2018-06-01 天霸动霸tun
网络边界趋于“消亡”大数据立法刻不容缓大数据在互联网时代遍地开花的同时，也面临着绕不过去的挑战，那就是安全问题。在互联网乃至物联网时代，如果我们不能很好地解决安全问题，就会影响社会各方面的发展。因此，各级政府在鼓励发展大数据的同时，要同步考虑构建大数据安全体系。Java/架构师/大数据/区块链/高并发/分布式/机器学习/人工智能_腾讯课堂
数据建模在交管的应用王永翔大数据
数据建模在交管的应用主要表现在以下几个方面：1、交通管理与规划：利用大数据技术，交管部门能够对交通流量、事故高发区、拥堵路段等进行实时监控和分析。通过数据建模，可以预测未来的交通趋势，为城市交通规划和管理提供决策支持。2、安全风险评价：在重点运输企业中，通过建立大数据安全风险评价模型，交管部门能够对企业的交通安全风险进行评估，及时预警，从而降低交通事故的发生。3、违法行为的查处：通过大数据分析研判
工作7年的大数据大牛都在研究啥：ELK大数据日志处理系统 Java程序员YY
随着大数据、云计算等技术的发展，互联网已经深入到了生活的方方面面，这意味着不少互联网企业积累了庞大的消费数据资源。结合大数据挖掘分析技术企业可以挖掘出客户的潜在需求从而实现精细化运营。大数据在给企业带来了巨大发展机遇，同时也带来了更加严峻的安全挑战。这些大数据涉及到大量的客户隐私，一旦被恶意攻击导致数据泄露，后果将不堪设想，因此保护大数据安全已是企业业务发展的关键。一、ELK大数据日志处理系统实现
大数据安全测试 bigdata-余建新大数据大数据安全
测试1、用户hive/[email protected]和nn/1.common2.hadoop.fql.com分别对Hive进行查询（1）HDFS配置vim/usr/local/fqlhadoop/hadoop/conf/core-site.xmlhadoop.proxyuser.hive.hosts*hadoop.proxyuser.hive.groups*h
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><