weixin_39861823

python编写股票公式_一个用Python编写的股票数据（沪深）爬虫和选股策略测试框架...

一个户外论坛的特点: 列出一些活动，有翻页功能，点向一个活动显示当前活动信息，在二楼一般显示报名名单！需要的数据: 就是活动的信息，报名的名单，价钱，主

一个股票数据(沪深)爬虫和选股策略测试框架，数据基于雅虎YQL和新浪财经。

根据选定的日期范围抓取所有沪深两市股票的行情数据。

根据指定的选股策略和指定的日期进行选股测试。

计算选股测试实际结果(包括与沪深300指数比较)。

保存数据到JSON文件、CSV文件。

支持使用表达式定义选股策略。

支持多线程处理。

代码

main.py

from stockholm import Stockholm

import option

import os

def checkFoldPermission(path):

if(path == 'USER_HOME/tmp/stockholm_export'):

path = os.path.expanduser('~') + '/tmp/stockholm_export'

try:

if not os.path.exists(path):

os.makedirs(path)

else:

txt = open(path + os.sep + "test.txt","w")

txt.write("test")

txt.close()

os.remove(path + os.sep + "test.txt")

except Exception as e:

print(e)

return False

return True

def main():

args = option.parser.parse_args()

if not checkFoldPermission(args.store_path):

print('\nPermission denied: %s' % args.store_path)

print('Please make sure you have the permission to save the data!\n')

else:

print('Stockholm is starting...\n')

stockh = Stockholm(args)

stockh.run()

print('Stockholm is done...\n')

if __name__ == '__main__':

main()

option.py

import argparse

import datetime

def get_date_str(offset):

if(offset is None):

offset = 0

date_str = (datetime.datetime.today() + datetime.timedelta(days=offset)).strftime("%Y-%m-%d")

return date_str

_default = dict(

reload_data = 'Y',

gen_portfolio = 'N',

output_type = 'json',

charset = 'utf-8',

test_date_range = 60,

start_date = get_date_str(-90),

end_date = get_date_str(None),

target_date = get_date_str(None),

store_path = 'USER_HOME/tmp/stockholm_export',

thread = 10,

testfile_path = './portfolio_test.txt',

db_name = 'stockholm',

methods = ''

)

parser = argparse.ArgumentParser(description='A stock crawler and portfolio testing framework.')

parser.add_argument('--reload', type=str, default=_default['reload_data'], dest='reload_data', help='Reload the stock data or not (Y/N), Default: %s' % _default['reload_data'])

parser.add_argument('--portfolio', type=str, default=_default['gen_portfolio'], dest='gen_portfolio', help='Generate the portfolio or not (Y/N), Default: %s' % _default['gen_portfolio'])

parser.add_argument('--output', type=str, default=_default['output_type'], dest='output_type', help='Data output type (json/csv/all), Default: %s' % _default['output_type'])

parser.add_argument('--charset', type=str, default=_default['charset'], dest='charset', help='Data output charset (utf-8/gbk), Default: %s' % _default['charset'])

parser.add_argument('--testrange', type=int, default=_default['test_date_range'], dest='test_date_range', help='Test date range(days): %s' % _default['test_date_range'])

parser.add_argument('--startdate', type=str, default=_default['start_date'], dest='start_date', help='Data loading start date, Default: %s' % _default['start_date'])

parser.add_argument('--enddate', type=str, default=_default['end_date'], dest='end_date', help='Data loading end date, Default: %s' % _default['end_date'])

parser.add_argument('--targetdate', type=str, default=_default['target_date'], dest='target_date', help='Portfolio generating target date, Default: %s' % _default['target_date'])

parser.add_argument('--storepath', type=str, default=_default['store_path'], dest='store_path', help='Data file store path, Default: %s' % _default['store_path'])

parser.add_argument('--thread', type=int, default=_default['thread'], dest='thread', help='Thread number, Default: %s' % _default['thread'])

parser.add_argument('--testfile', type=str, default=_default['testfile_path'], dest='testfile_path', help='Portfolio test file path, Default: %s' % _default['testfile_path'])

parser.add_argument('--dbname', type=str, default=_default['db_name'], dest='db_name', help='MongoDB DB name, Default: %s' % _default['db_name'])

parser.add_argument('--methods', type=str, default=_default['methods'], dest='methods', help='Target methods for back testing, Default: %s' % _default['methods'])

def main():

args = parser.parse_args()

print(args)

if __name__ == '__main__':

main()

stockholm.py

#coding:utf-8

import requests

import json

import datetime

import timeit

import time

import io

import os

import csv

import re

from pymongo import MongoClient

from multiprocessing.dummy import Pool as ThreadPool

from functools import partial

class Stockholm(object):

def __init__(self, args):

## flag of if need to reload all stock data

self.reload_data = args.reload_data

## flag of if need to generate portfolio

self.gen_portfolio = args.gen_portfolio

## type of output file json/csv or both

self.output_type = args.output_type

## charset of output file utf-8/gbk

self.charset = args.charset

## portfolio testing date range(# of days)

self.test_date_range = args.test_date_range

## stock data loading start date(e.g. 2014-09-14)

self.start_date = args.start_date

## stock data loading end date

self.end_date = args.end_date

## portfolio generating target date

self.target_date = args.target_date

## thread number

self.thread = args.thread

## data file store path

if(args.store_path == 'USER_HOME/tmp/stockholm_export'):

self.export_folder = os.path.expanduser('~') + '/tmp/stockholm_export'

else:

self.export_folder = args.store_path

## portfolio testing file path

self.testfile_path = args.testfile_path

## methods for back testing

self.methods = args.methods

## for getting quote symbols

self.all_quotes_url = 'http://money.finance.sina.com.cn/d/api/openapi_proxy.php'

## for loading quote data

self.yql_url = 'http://query.yahooapis.com/v1/public/yql'

## export file name

self.export_file_name = 'stockholm_export'

self.index_array = ['000001.SS', '399001.SZ', '000300.SS']

self.sh000001 = {'Symbol': '000001.SS', 'Name': '上证指数'}

self.sz399001 = {'Symbol': '399001.SZ', 'Name': '深证成指'}

self.sh000300 = {'Symbol': '000300.SS', 'Name': '沪深300'}

## self.sz399005 = {'Symbol': '399005.SZ', 'Name': '中小板指'}

## self.sz399006 = {'Symbol': '399006.SZ', 'Name': '创业板指'}

## mongodb info

self.mongo_url = 'localhost'

self.mongo_port = 27017

self.database_name = args.db_name

self.collection_name = 'testing_method'

def get_columns(self, quote):

columns = []

if(quote is not None):

for key in quote.keys():

if(key == 'Data'):

for data_key in quote['Data'][-1]:

columns.append("data." + data_key)

else:

columns.append(key)

columns.sort()

return columns

def get_profit_rate(self, price1, price2):

if(price1 == 0):

return None

else:

return round((price2-price1)/price1, 5)

def get_MA(self, number_array):

total = 0

n = 0

for num in number_array:

if num is not None and num != 0:

n += 1

total += num

return round(total/n, 3)

def convert_value_check(self, exp):

val = exp.replace('day', 'quote[\'Data\']').replace('(0)', '(-0)')

val = re.sub(r'$((-)?\d+)$', r'[target_idx\g<1>]', val)

val = re.sub(r'\.\{((-)?\w+)\}', r"['\g<1>']", val)

return val

def convert_null_check(self, exp):

p = re.compile('\((-)?\d+...\w+\}')

iterator = p.finditer(exp.replace('(0)', '(-0)'))

array = []

for match in iterator:

v = 'quote[\'Data\']' + match.group()

v = re.sub(r'$((-)?\d+)$', r'[target_idx\g<1>]', v)

v = re.sub(r'\.\{((-)?\w+)\}', r"['\g<1>']", v)

v += ' is not None'

array.append(v)

val = ' and '.join(array)

return val

class KDJ():

def _avg(self, array):

length = len(array)

return sum(array)/length

def _getMA(self, values, window):

array = []

x = window

while x <= len(values):

curmb = 50

if(x-window == 0):

curmb = self._avg(values[x-window:x])

else:

curmb = (array[-1]*2+values[x-1])/3

array.append(round(curmb,3))

x += 1

return array

def _getRSV(self, arrays):

rsv = []

x = 9

while x <= len(arrays):

high = max(map(lambda x: x['High'], arrays[x-9:x]))

low = min(map(lambda x: x['Low'], arrays[x-9:x]))

close = arrays[x-1]['Close']

rsv.append((close-low)/(high-low)*100)

t = arrays[x-1]['Date']

x += 1

return rsv

def getKDJ(self, quote_data):

if(len(quote_data) > 12):

rsv = self._getRSV(quote_data)

k = self._getMA(rsv,3)

d = self._getMA(k,3)

j = list(map(lambda x: round(3*x[0]-2*x[1],3), zip(k[2:], d)))

for idx, data in enumerate(quote_data[0:12]):

data['KDJ_K'] = None

data['KDJ_D'] = None

data['KDJ_J'] = None

for idx, data in enumerate(quote_data[12:]):

data['KDJ_K'] = k[2:][idx]

data['KDJ_D'] = d[idx]

if(j[idx] > 100):

data['KDJ_J'] = 100

elif(j[idx] < 0):

data['KDJ_J'] = 0

else:

data['KDJ_J'] = j[idx]

return quote_data

def load_all_quote_symbol(self):

print("load_all_quote_symbol start..." + "\n")

start = timeit.default_timer()

all_quotes = []

all_quotes.append(self.sh000001)

all_quotes.append(self.sz399001)

all_quotes.append(self.sh000300)

## all_quotes.append(self.sz399005)

## all_quotes.append(self.sz399006)

try:

count = 1

while (count < 100):

para_val = '[["hq","hs_a","",0,' + str(count) + ',500]]'

r_params = {'__s': para_val}

r = requests.get(self.all_quotes_url, params=r_params)

if(len(r.json()[0]['items']) == 0):

break

for item in r.json()[0]['items']:

quote = {}

code = item[0]

name = item[2]

## convert quote code

if(code.find('sh') > -1):

code = code[2:] + '.SS'

elif(code.find('sz') > -1):

code = code[2:] + '.SZ'

## convert quote code end

quote['Symbol'] = code

quote['Name'] = name

all_quotes.append(quote)

count += 1

except Exception as e:

print("Error: Failed to load all stock symbol..." + "\n")

print(e)

print("load_all_quote_symbol end... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

return all_quotes

def load_quote_info(self, quote, is_retry):

print("load_quote_info start..." + "\n")

start = timeit.default_timer()

if(quote is not None and quote['Symbol'] is not None):

yquery = 'select * from yahoo.finance.quotes where symbol = "' + quote['Symbol'].lower() + '"'

r_params = {'q': yquery, 'format': 'json', 'env': 'http://datatables.org/alltables.env'}

r = requests.get(self.yql_url, params=r_params)

## print(r.url)

## print(r.text)

rjson = r.json()

try:

quote_info = rjson['query']['results']['quote']

quote['LastTradeDate'] = quote_info['LastTradeDate']

quote['LastTradePrice'] = quote_info['LastTradePriceOnly']

quote['PreviousClose'] = quote_info['PreviousClose']

quote['Open'] = quote_info['Open']

quote['DaysLow'] = quote_info['DaysLow']

quote['DaysHigh'] = quote_info['DaysHigh']

quote['Change'] = quote_info['Change']

quote['ChangeinPercent'] = quote_info['ChangeinPercent']

quote['Volume'] = quote_info['Volume']

quote['MarketCap'] = quote_info['MarketCapitalization']

quote['StockExchange'] = quote_info['StockExchange']

except Exception as e:

print("Error: Failed to load stock info... " + quote['Symbol'] + "/" + quote['Name'] + "\n")

print(e + "\n")

if(not is_retry):

time.sleep(1)

load_quote_info(quote, True) ## retry once for network issue

## print(quote)

print("load_quote_info end... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

return quote

def load_all_quote_info(self, all_quotes):

print("load_all_quote_info start...")

start = timeit.default_timer()

for idx, quote in enumerate(all_quotes):

print("#" + str(idx + 1))

load_quote_info(quote, False)

print("load_all_quote_info end... time cost: " + str(round(timeit.default_timer() - start)) + "s")

return all_quotes

def load_quote_data(self, quote, start_date, end_date, is_retry, counter):

## print("load_quote_data start..." + "\n")

start = timeit.default_timer()

if(quote is not None and quote['Symbol'] is not None):

yquery = 'select * from yahoo.finance.historicaldata where symbol = "' + quote['Symbol'].upper() + '" and startDate = "' + start_date + '" and endDate = "' + end_date + '"'

r_params = {'q': yquery, 'format': 'json', 'env': 'http://datatables.org/alltables.env'}

try:

r = requests.get(self.yql_url, params=r_params)

## print(r.url)

## print(r.text)

rjson = r.json()

quote_data = rjson['query']['results']['quote']

quote_data.reverse()

quote['Data'] = quote_data

if(not is_retry):

counter.append(1)

except:

print("Error: Failed to load stock data... " + quote['Symbol'] + "/" + quote['Name'] + "\n")

if(not is_retry):

time.sleep(2)

self.load_quote_data(quote, start_date, end_date, True, counter) ## retry once for network issue

print("load_quote_data " + quote['Symbol'] + "/" + quote['Name'] + " end..." + "\n")

## print("time cost: " + str(round(timeit.default_timer() - start)) + "s." + "\n")

## print("total count: " + str(len(counter)) + "\n")

return quote

def load_all_quote_data(self, all_quotes, start_date, end_date):

print("load_all_quote_data start..." + "\n")

start = timeit.default_timer()

counter = []

mapfunc = partial(self.load_quote_data, start_date=start_date, end_date=end_date, is_retry=False, counter=counter)

pool = ThreadPool(self.thread)

pool.map(mapfunc, all_quotes) ## multi-threads executing

pool.close()

pool.join()

print("load_all_quote_data end... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

return all_quotes

def data_process(self, all_quotes):

print("data_process start..." + "\n")

kdj = self.KDJ()

start = timeit.default_timer()

for quote in all_quotes:

if(quote['Symbol'].startswith('300')):

quote['Type'] = '创业板'

elif(quote['Symbol'].startswith('002')):

quote['Type'] = '中小板'

else:

quote['Type'] = '主板'

if('Data' in quote):

try:

temp_data = []

for quote_data in quote['Data']:

if(quote_data['Volume'] != '000' or quote_data['Symbol'] in self.index_array):

d = {}

d['Open'] = float(quote_data['Open'])

## d['Adj_Close'] = float(quote_data['Adj_Close'])

d['Close'] = float(quote_data['Close'])

d['High'] = float(quote_data['High'])

d['Low'] = float(quote_data['Low'])

d['Volume'] = int(quote_data['Volume'])

d['Date'] = quote_data['Date']

temp_data.append(d)

quote['Data'] = temp_data

except KeyError as e:

print("Data Process: Key Error")

print(e)

print(quote)

## calculate Change / 5 10 20 30 Day MA

for quote in all_quotes:

if('Data' in quote):

try:

for i, quote_data in enumerate(quote['Data']):

if(i > 0):

quote_data['Change'] = self.get_profit_rate(quote['Data'][i-1]['Close'], quote_data['Close'])

quote_data['Vol_Change'] = self.get_profit_rate(quote['Data'][i-1]['Volume'], quote_data['Volume'])

else:

quote_data['Change'] = None

quote_data['Vol_Change'] = None

last_5_array = []

last_10_array = []

last_20_array = []

last_30_array = []

for i, quote_data in enumerate(quote['Data']):

last_5_array.append(quote_data['Close'])

last_10_array.append(quote_data['Close'])

last_20_array.append(quote_data['Close'])

last_30_array.append(quote_data['Close'])

quote_data['MA_5'] = None

quote_data['MA_10'] = None

quote_data['MA_20'] = None

quote_data['MA_30'] = None

if(i < 4):

continue

if(len(last_5_array) == 5):

last_5_array.pop(0)

quote_data['MA_5'] = self.get_MA(last_5_array)

if(i < 9):

continue

if(len(last_10_array) == 10):

last_10_array.pop(0)

quote_data['MA_10'] = self.get_MA(last_10_array)

if(i < 19):

continue

if(len(last_20_array) == 20):

last_20_array.pop(0)

quote_data['MA_20'] = self.get_MA(last_20_array)

if(i < 29):

continue

if(len(last_30_array) == 30):

last_30_array.pop(0)

quote_data['MA_30'] = self.get_MA(last_30_array)

except KeyError as e:

print("Key Error")

print(e)

print(quote)

## calculate KDJ

for quote in all_quotes:

if('Data' in quote):

try:

kdj.getKDJ(quote['Data'])

except KeyError as e:

print("Key Error")

print(e)

print(quote)

print("data_process end... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

def data_export(self, all_quotes, export_type_array, file_name):

start = timeit.default_timer()

directory = self.export_folder

if(file_name is None):

file_name = self.export_file_name

if not os.path.exists(directory):

os.makedirs(directory)

if(all_quotes is None or len(all_quotes) == 0):

print("no data to export...\n")

if('json' in export_type_array):

print("start export to JSON file...\n")

f = io.open(directory + '/' + file_name + '.json', 'w', encoding=self.charset)

json.dump(all_quotes, f, ensure_ascii=False)

if('csv' in export_type_array):

print("start export to CSV file...\n")

columns = []

if(all_quotes is not None and len(all_quotes) > 0):

columns = self.get_columns(all_quotes[0])

writer = csv.writer(open(directory + '/' + file_name + '.csv', 'w', encoding=self.charset))

writer.writerow(columns)

for quote in all_quotes:

if('Data' in quote):

for quote_data in quote['Data']:

try:

line = []

for column in columns:

if(column.find('data.') > -1):

if(column[5:] in quote_data):

line.append(quote_data[column[5:]])

else:

line.append(quote[column])

writer.writerow(line)

except Exception as e:

print(e)

print("write csv error: " + quote)

if('mongo' in export_type_array):

print("start export to MongoDB...\n")

print("export is complete... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

def file_data_load(self):

print("file_data_load start..." + "\n")

start = timeit.default_timer()

directory = self.export_folder

file_name = self.export_file_name

all_quotes_data = []

f = io.open(directory + '/' + file_name + '.json', 'r', encoding='utf-8')

json_str = f.readline()

all_quotes_data = json.loads(json_str)

print("file_data_load end... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

return all_quotes_data

def check_date(self, all_quotes, date):

is_date_valid = False

for quote in all_quotes:

if(quote['Symbol'] in self.index_array):

for quote_data in quote['Data']:

if(quote_data['Date'] == date):

is_date_valid = True

if not is_date_valid:

print(date + " is not valid...\n")

return is_date_valid

def quote_pick(self, all_quotes, target_date, methods):

print("quote_pick start..." + "\n")

start = timeit.default_timer()

results = []

data_issue_count = 0

for quote in all_quotes:

try:

if(quote['Symbol'] in self.index_array):

results.append(quote)

continue

target_idx = None

for idx, quote_data in enumerate(quote['Data']):

if(quote_data['Date'] == target_date):

target_idx = idx

if(target_idx is None):

## print(quote['Name'] + " data is not available at this date..." + "\n")

data_issue_count+=1

continue

## pick logic ##

valid = False

for method in methods:

## print(method['name'])

## null_check = eval(method['null_check'])

try:

value_check = eval(method['value_check'])

if(value_check):

quote['Method'] = method['name']

results.append(quote)

valid = True

break

except:

valid = False

if(valid):

continue

## pick logic end ##

except KeyError as e:

## print("KeyError: " + quote['Name'] + " data is not available..." + "\n")

data_issue_count+=1

print("quote_pick end... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

print(str(data_issue_count) + " quotes of data is not available...\n")

return results

def profit_test(self, selected_quotes, target_date):

print("profit_test start..." + "\n")

start = timeit.default_timer()

results = []

INDEX = None

INDEX_idx = 0

for quote in selected_quotes:

if(quote['Symbol'] == self.sh000300['Symbol']):

INDEX = quote

for idx, quote_data in enumerate(quote['Data']):

if(quote_data['Date'] == target_date):

INDEX_idx = idx

break

for quote in selected_quotes:

target_idx = None

if(quote['Symbol'] in self.index_array):

continue

for idx, quote_data in enumerate(quote['Data']):

if(quote_data['Date'] == target_date):

target_idx = idx

if(target_idx is None):

print(quote['Name'] + " data is not available for testing..." + "\n")

continue

test = {}

test['Name'] = quote['Name']

test['Symbol'] = quote['Symbol']

test['Method'] = quote['Method']

test['Type'] = quote['Type']

if('KDJ_K' in quote['Data'][target_idx]):

test['KDJ_K'] = quote['Data'][target_idx]['KDJ_K']

test['KDJ_D'] = quote['Data'][target_idx]['KDJ_D']

test['KDJ_J'] = quote['Data'][target_idx]['KDJ_J']

test['Close'] = quote['Data'][target_idx]['Close']

test['Change'] = quote['Data'][target_idx]['Change']

test['Vol_Change'] = quote['Data'][target_idx]['Vol_Change']

test['MA_5'] = quote['Data'][target_idx]['MA_5']

test['MA_10'] = quote['Data'][target_idx]['MA_10']

test['MA_20'] = quote['Data'][target_idx]['MA_20']

test['MA_30'] = quote['Data'][target_idx]['MA_30']

test['Data'] = [{}]

for i in range(1,11):

if(target_idx+i >= len(quote['Data'])):

print(quote['Name'] + " data is not available for " + str(i) + " day testing..." + "\n")

break

day2day_profit = self.get_profit_rate(quote['Data'][target_idx]['Close'], quote['Data'][target_idx+i]['Close'])

test['Data'][0]['Day_' + str(i) + '_Profit'] = day2day_profit

if(INDEX_idx+i < len(INDEX['Data'])):

day2day_INDEX_change = self.get_profit_rate(INDEX['Data'][INDEX_idx]['Close'], INDEX['Data'][INDEX_idx+i]['Close'])

test['Data'][0]['Day_' + str(i) + '_INDEX_Change'] = day2day_INDEX_change

test['Data'][0]['Day_' + str(i) + '_Differ'] = day2day_profit-day2day_INDEX_change

results.append(test)

print("profit_test end... time cost: " + str(round(timeit.default_timer() - start)) + "s" + "\n")

return results

def data_load(self, start_date, end_date, output_types):

all_quotes = self.load_all_quote_symbol()

print("total " + str(len(all_quotes)) + " quotes are loaded..." + "\n")

all_quotes = all_quotes

## self.load_all_quote_info(all_quotes)

self.load_all_quote_data(all_quotes, start_date, end_date)

self.data_process(all_quotes)

self.data_export(all_quotes, output_types, None)

def data_test(self, target_date, test_range, output_types):

## loading test methods

methods = []

path = self.testfile_path

## from mongodb

if(path == 'mongodb'):

print("Load testing methods from Mongodb...\n")

client = MongoClient(self.mongo_url, self.mongo_port)

db = client[self.database_name]

col = db[self.collection_name]

q = None

if(len(self.methods) > 0):

applied_methods = list(map(int, self.methods.split(',')))

q = {"method_id": {"$in": applied_methods}}

for doc in col.find(q, ['name','desc','method']):

print(doc)

m = {'name': doc['name'], 'value_check': self.convert_value_check(doc['method'])}

methods.append(m)

## from test file

else:

if not os.path.exists(path):

print("Portfolio test file is not existed, testing is aborted...\n")

return

f = io.open(path, 'r', encoding='utf-8')

for line in f:

if(line.startswith('##') or len(line.strip()) == 0):

continue

line = line.strip().strip('\n')

name = line[line.find('[')+1:line.find(']:')]

value = line[line.find(']:')+2:]

m = {'name': name, 'value_check': self.convert_value_check(value)}

methods.append(m)

if(len(methods) == 0):

print("No method is loaded, testing is aborted...\n")

return

## portfolio testing

all_quotes = self.file_data_load()

target_date_time = datetime.datetime.strptime(target_date, "%Y-%m-%d")

for i in range(test_range):

date = (target_date_time - datetime.timedelta(days=i)).strftime("%Y-%m-%d")

is_date_valid = self.check_date(all_quotes, date)

if is_date_valid:

selected_quotes = self.quote_pick(all_quotes, date, methods)

res = self.profit_test(selected_quotes, date)

self.data_export(res, output_types, 'result_' + date)

def run(self):

## output types

output_types = []

if(self.output_type == "json"):

output_types.append("json")

elif(self.output_type == "csv"):

output_types.append("csv")

elif(self.output_type == "all"):

output_types = ["json", "csv"]

## loading stock data

if(self.reload_data == 'Y'):

print("Start loading stock data...\n")

self.data_load(self.start_date, self.end_date, output_types)

## test & generate portfolio

if(self.gen_portfolio == 'Y'):

print("Start portfolio testing...\n")

self.data_test(self.target_date, self.test_date_range, output_types)

mongo_scripts.txt

use stockholm

db.counters.insert(

{

_id: "method_id",

seq: 0

}

)

function getNextSequence(name) {

var ret = db.counters.findAndModify(

{

query: { _id: name },

update: { $inc: { seq: 1 } },

new: true

}

);

return ret.seq;

}

db.testing_method.insert({"method_id": getNextSequence("method_id"), "name":"测试方法1", "desc":"这是一个测试方法。", "user_name":"Stockholm", "user_id":"[email protected]", "creation_date": new Date(), "modification_date": new Date(), "method":"day(-2).{KDJ_J}<20 and day(-1).{KDJ_J}<20 and day(0).{KDJ_J}-day(-1).{KDJ_J}>=40 and day(0).{Vol_Change}>=1 and day(0).{MA_10}*1.05>day(0).{Close}"})

db.testing_method.insert({"method_id": getNextSequence("method_id"), "name":"测试方法2", "desc":"这是一个测试方法。", "user_name":"Stockholm", "user_id":"[email protected]", "creation_date": new Date(), "modification_date": new Date(), "method":"day(-2).{KDJ_J}-day(-1).{KDJ_J}>20 and day(0).{KDJ_J}-day(-1).{KDJ_J}>20 and day(-1).{KDJ_J}<50 and day(0).{Vol_Change}<=1"})

portfolio_test.txt

## Portfolio selection methodology sample file

[测试方法1]:day(-2).{KDJ_J}<20 and day(-1).{KDJ_J}<20 and day(0).{KDJ_J}-day(-1).{KDJ_J}>=40 and day(0).{Vol_Change}>=1 and day(0).{MA_10}*1.05>day(0).{Close}

[测试方法2]:day(-2).{KDJ_J}-day(-1).{KDJ_J}>20 and day(0).{KDJ_J}-day(-1).{KDJ_J}>20 and day(-1).{KDJ_J}<50 and day(0).{Vol_Change}<=1

##[测试方法3]:50

运行时参数

--storepath c://test --output csv --startdate 2015-09-01 --enddate 2015-12-07 --charset utf-8 --testfile ./portfolio_test.txt --reload Y --portfolio Y --thread 10

能干什么

如果你想基于沪深股市行情数据进行一些工作，它可以帮助你导出指定时间范围内所有沪深A股的行情数据和一些技术指标，包括代码、名称、开盘、收盘、最高、最低、成交量、均线、KDJ等。

还有些什么问题

行情数据目前来源于雅虎YQL，每日数据的更新时间不太稳定(一般在中国时间午夜左右)。

环境

Python 3.4以上

pip install requests

pip install pymongo

使用

python main.py [-h] [--reload {Y,N}] [--portfolio {Y,N}]

[--output {json,csv,all}] [--storepath PATH] [--thread NUM]

[--startdate yyyy-MM-dd] [--enddate yyyy-MM-dd]

[--targetdate yyyy-MM-dd] [--testrange NUM] [--testfile PATH]

可选参数

-h, --help 查看帮助并退出 --reload {Y,N} 是否重新抓取股票数据，默认值：Y --portfolio {Y,N} 是否生成选股测试结果，默认值：N --output {json,csv,all} 输出文件格式，默认值：json --charset {utf-8,gbk} 输出文件编码，默认值：utf-8 --storepath PATH 输出文件路径，默认值：~/tmp/stockholm_export --thread NUM 线程数，默认值：10 --startdate yyyy-MM-dd 抓取数据的开始日期，默认值：当前系统日期-100天(例如2015-01-01) --enddate yyyy-MM-dd 抓取数据的结束日期，默认值：当前系统日期 --targetdate yyyy-MM-dd 测试选股策略的目标日期，默认值：当前系统日期 --testrange NUM 测试日期范围天数，默认值：50 --testfile PATH 测试文件路径，默认值：./portfolio_test.txt

可用数据/格式

行情数据:

[

{"Symbol": "600000.SS",

"Name": "浦发银行"， "Data": [ {"Vol_Change": null, "MA_10": null, "Date": "2015-03-26", "High": 15.58, "Open": 15.15, "Volume": 282340700, "Close": 15.36, "Change": null, "Low": 15.04}, {"Vol_Change": -0.22726, "MA_10": null, "Date": "2015-03-27", "High": 15.55, "Open": 15.32, "Volume": 218174900, "Close": 15.36, "Change": 0.0, "Low": 15.17} ] }

]

Date(日期); Open(开盘价); Close(收盘价); High(当日最高); Low(当日最低); Change(价格变化%); Volume(成交量); Vol_Change(成交量较前日变化); MA_5(5日均线); MA_10(10日均线); MA_20(20日均线); MA_30(30日均线); KDJ_K(KDJ指标K); KDJ_D(KDJ指标D); KDJ_J(KDJ指标J);

选股策略测试数据:

[

{

"Symbol": "600000.SS",

"Name": "浦发银行",

"Close": 14.51,

"Change": 0.06456,

"Vol_Change": 2.39592,

"MA_10": 14.171,

"KDJ_K": 37.65,

"KDJ_D": 33.427,

"KDJ_J": 46.096,

"Data": [ {"Day_5_Differ": 0.01869, "Day_9_Profit": 0.08546, "Day_1_Profit": -0.02826, "Day_1_INDEX_Change": -0.00484, "Day_3_INDEX_Change": 0.01557, "Day_5_INDEX_Change": 0.04747, "Day_3_Differ": 0.02647, "Day_9_INDEX_Change": 0.1003, "Day_5_Profit": 0.06616, "Day_3_Profit": 0.04204, "Day_1_Differ": -0.02342, "Day_9_Differ": -0.014840000000000006} ] }

]

Close(收盘价); Change(价格变化%); Vol_Change(成交量较前日变化); MA_10(十天均价); KDJ_K(KDJ指标K); KDJ_D(KDJ指标D); KDJ_J(KDJ指标J); Day_1_Profit(后一天利润率%); Day_1_INDEX_Change(后一天沪深300变化率%); Day_1_Differ(后一天相对利润率%——即利润率-沪深300变化率); Day_n_Profit(后n天利润率%); Day_n_INDEX_Change(后n天沪深300变化率%); Day_n_Differ(后n天相对利润率%——即利润率-沪深300变化率);

行情数据抓取范例

获取从当前日期倒推100天(不是100个交易日)的所有沪深股票行情数据。

执行完成后，数据在当前用户文件夹下./tmp/stockholm_export/stockholm_export.json

python main.py

如果想导出csv文件

python main.py --output=csv

选股策略测试范例

选股策略范例文件内容如下(包括在源码中)

选股策略”method 1”是:前前个交易日的KDJ指标的J值小于20+前个交易日的KDJ指标J值小于20+当前交易日的KDJ指标J值比上个交易日大40+当前交易日成交量变化大于100%

## Portfolio selection methodology sample file

[method 1]:day(-2).{KDJ_J}<20 and day(-1).{KDJ_J}<20 and day(0).{KDJ_J}-day(-1).{KDJ_J}>=40 and day(0).{Vol_Change}>=1

以当前系统日期为目标日期进行倒推60天得选股策略测试。

不重新抓取行情数据并执行测试命令。

执行完毕后，会将测试结果按照每天一个文件的方式保存在./tmp/stockholm_export/。

文件名格式为result_yyyy-MM-dd.json(例如result_2015-03-24.json)。

python main.py --reload=N --portfolio=Y

通过更改测试文件中的选股策略公式，可以随意测试指定时间范围内的选股效果。

使用python scrapy爬虫框架爬取科学网自然科学基金数据 fundspider.py文件 # -*- coding: utf-8 -*-from scrapy.selector import Selectorfrom fundsort.ite

你可能感兴趣的:(python编写股票公式)

深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
python做一个注册界面_python如何做一个登录注册界面 weixin_39824033 python做一个注册界面
python做一个登录注册界面的方法：首先初始化一个window界面，并使用画布实现欢迎的logo；然后用代码实现登录和注册按钮；接着并进行登录判断代码；最后完成注册界面即可。【相关学习推荐：python视频教程】python做一个登录注册界面的方法：一、登录界面1、首先初始化一个window界面window=tk.Tk()window.title('WelcometoMofanPython')w
python读取zip包内文件_Python模块学习：zipfile zip文件操作 weixin_40001634 python读取zip包内文件
最近在写一个网络客户端下载程序，用于下载服务器上的数据。有些数据(如文本，office文档)如果直接传输的话，将会增加通信的数据量，使下载时间变长。服务器在传输这些数据之前先对其进行压缩，客户端接收到数据之后进行解压，这样可以减小网通传输数据的通信量，缩短下载的时间，从而增加客户体验。以前用C#做类似应用程序的时候，我会用SharpZipLib这个开源组件，现在用Python做类似的工作，只要使用
python制作登陆窗口_python登陆界面 weixin_39758494 python制作登陆窗口
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！print(账号密码错误！请重试。)returnfalsebutton(master,text=登陆,width=10,command=test).grid(row=3,column=0,sticky=w,padx=10,pady=5)button(master,text=退出,wid
如何使用零配置的Sphinx生成Python文档？潮易 sphinx 全文检索搜索引擎
如何使用零配置的Sphinx生成Python文档？在Python编程中，编写文档是非常重要的。一个好的文档可以帮助其他开发者理解和使用你的代码。Sphinx是一个用于生成Python项目的文档的静态网页生成器，它支持多种文档格式，包括ReStructuredText和Markdown。以下是使用零配置的方式来使用Sphinx生成Python文档的详细步骤：1.首先，确保你已经安装了Sphinx。打
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？潮易 python 开发语言
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？这个问题涉及到Python编程中的MQTT（MessageQueuingTelemetryTransport）库的使用，该库允许我们创建客户端订阅和发布消息到MQTT服务器。以下是一个简单的步骤：1.安装MQTT库：可以使用pip安装`paho-mqtt`库。```pythonpipinstallpaho-mqtt```2.创建一个MQTT客
Python-tkinter自制登录界面（含注册） GCHEK python 开发语言
简单的用户登录、注册界面importtkinterastkimporttimeimportsubprocessimportsysimportosimporttkinter.messageboxwindow=tk.Tk()window.title('GCHEK')window.geometry('400x300')#设置储存用户信息的容器，这里用的txt。ifnotos.path.exists('U
Python爬虫requests(详细) dme. Python爬虫零基础入门爬虫 python
本文来学爬虫使用requests模块的常见操作。1.URL参数无论是在发送GET/POST请求时，网址URL都可能会携带参数，例如：http://www.5xclass.cn?age=19&name=dengres=requests.get(url="https://www.5xclass.cn?age=19&name=deng")res=requests.get(url="https://www
使用python计算等比数列求和的方法 HAMYHF windows
在python中，计算Sum=m+mm+mmm+mmmm+.....+mmmmm.....,输入两个数m,n。m的位数累加到n的值，列出算式并计算出结果：#为了打印出算式，并计算出结果，将m,mm这些放入到列表中#定义列表中的m初始值为0,用Ele来代表m,mm....Ele=0#定义总和为0Sum=0#定义一个空列表List=[]#输入两个值n=int(input("inputadigit：")
Python+Playwright常用元素定位方法 HAMYHF python 功能测试
CSSselector选择器在CSS中，定位元素主要通过选择器完成，以下是几种常见的CSS选择器定位方法：标签选择器(element):直接使用HTML元素名称来定位，例如p会选择所有段落元素。属性选择器(attribute):选择所有具有指定属性的元素，无论该属性的值是什么。例如，[title]会选择所有包含title属性的元素。选择具有指定属性，并且该属性值完全等于给定值的元素。例如，[typ
【Go语言快速上手】第二部分：Go语言进阶之测试与性能优化卜及中 Golang golang 性能优化 log4j
文章目录前言：测试和性能优化一、编写单元测试和基准测试1.1单元测试1.1.1示例：编写单元测试1.2基准测试1.2.1示例：编写基准测试二、使用pprof进行性能分析2.1启用pprof2.1.1示例：启用pprof2.2使用pprof工具分析性能2.2.1示例：生成CPU性能报告2.2.2示例：生成内存使用报告2.3分析报告三、代码优化技巧3.1减少内存分配3.1.1示例：重用切片3.2避免锁
Python中的 redis keyspace 通知_python 操作redis psubscribe(‘__keyspace@0__ ‘) 2301_82243733 程序员 python 学习面试
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
Python数据分析与可视化程序媛小果 python python 数据分析开发语言
Python数据分析与可视化在数据驱动的商业世界中，数据分析和可视化成为了理解复杂数据集、做出明智决策的关键工具。Python，作为一种功能强大且易于学习的编程语言，提供了丰富的库和框架，使得数据分析和可视化变得简单高效。本文将探讨Python在数据分析和可视化中的应用，包括数据预处理、分析、以及如何通过可视化工具将数据洞察转化为可操作的策略。1.数据分析的重要性数据分析是提取数据中有用信息的过程
【Python 学习 / 7】模块与文件操作卜及中 Python基础 python 学习数据库
文章目录前言一、导入模块1.导入整个模块2.导入模块中的特定函数3.给模块或函数起别名二、常用模块1.`math`模块2.`random`模块3.`os`模块4.`sys`模块三、文件处理1.打开文件2.读取文件3.写入文件4.关闭文件5.使用`with`语句管理文件四、日期时间1.`datetime`模块获取当前日期和时间创建日期和时间对象格式化日期和时间解析字符串为日期对象2.`time`模块
2分钟学会编写maven插件聪明马的博客 Java maven java spring
什么是Maven插件Maven是Java项目中常用的构建工具，可以自动化构建、测试、打包和发布Java应用程序。Maven插件是Maven的一项重要功能，它可以在Maven构建过程中扩展Maven的功能，实现自定义的构建逻辑。Maven插件可以提供很多不同的功能，例如：生成代码、打包文件、部署应用程序等。插件通常是在Maven构建生命周期中的某个阶段执行，例如：编译、测试、打包、安装和部署。Mav
YashanDB其他模式对象数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%...视图用户可以将一个使用频率较高的查询语句定义为一个持久化的对象，该持久化对象称为视图，为视图提供原始数据的表称为基表。通过查询视图代替原来的查询表，可简化SQL语句编写。假设公司EMPLOYEE表包含所有员工个人信息，DEPA
经销商管理系统架构设计方案（附 Java版本和Python版本源代码详解） AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
经销商管理系统架构设计方案（Java实现源代码详解）关键词：经销商管理系统，Java，SpringBoot，MyBatis，MySQL，架构设计，源代码1.背景介绍随着市场竞争的日益激烈，企业对经销商的管理越来越重视。传统的经销商管理方式效率低下，信息滞后，难以适应现代企业的发展需求。为了提高经销商管理效率，降低运营成本，越来越多的企业开始采用信息化的手段来管理经销商，而经销商管理系统应运而生。经
Python:数据从Excel表格链接到Word文档更新Excel即可自动更新Word 一个花生米生花 python excel word
要使用Python来创建或更新一个Word文档，并将数据从Excel表格链接到Word文档中，你可以使用python-docx库来操作Word文档和openpyxl或pandas库来读取Excel文件。不过，需要注意的是，python-docx库并不支持将外部文件链接到Word文档的功能。你可以在Word文档中插入Excel数据的快照，但它们不会自动更新。如果你想要在Word文档中插入Excel数
使用Odoo Shell卸载模块 odoo中国 odoo odoo 开源软件 erp
使用OdooShell卸载模块我们在Odoo使用过程中，因为模块安装错误或者前端错误等导致odoo无法通过界面登录，这时候你可以使用OdooShell来卸载模块。OdooShell是一个交互式Pythonshell，允许你直接与Odoo数据库和模型进行交互。以下是使用OdooShell卸载模块的详细步骤：步骤1：启动OdooShell要启动OdooShell，你需要在终端中运行以下命令。确保你已经
NumPy的基本使用 Mo思编程学习 numpy python 开发语言 pip
在Python的数据科学与数值计算领域，NumPy无疑是一颗耀眼的明星。作为Python中用于科学计算的基础库，NumPy提供了高效的多维数组对象以及处理这些数组的各种工具。本文将带您深入了解NumPy的基本使用，感受它的强大魅力。一、安装与导入在使用NumPy之前，首先要确保它已经安装在您的Python环境中。如果您使用的是Anaconda发行版，NumPy通常已经预装。若未安装，可以使用如下命
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/