哈拉泽空

数据挖掘课程设计实战——基于Django开发的音乐推荐系统网站

当当当当~上一次发博客好像是在去年11月了。歇了这么久了，就趁这个风和日丽的下午，选在数字图像处理课上跟大家分享一下一下上学期最后的数据挖掘课程设计吧！（反正数字图像处理课我是听不懂~）

项目要求用Django开发前端可视化，前端可视化模块是我的组长负责的，所以本博客主要专注于推吉安算法模块的实现、代码讲解。如有问题欢迎与我交流。

1. 项目介绍

音乐推荐系统

必须实现的需求：用户注册/登录/退出，存储音乐数据，存储用户和歌手数据，计算音乐模型，根据基于内容的推荐算法和基于物品和用户的协同过滤算法等计算用户可能感兴趣的音乐，展示用户可能喜欢的音乐，具有选择用户，选择标签（可选歌曲、歌手等），为你推荐，歌单与歌手推荐，歌单详情与歌单详情页推荐，排行榜，我的足迹，后台管理等功能。

2. 项目演示

网站首页

登陆页面

所有歌曲页面

“猜你喜欢”页面

“我的信息”页面

“浏览记录”页面

3. 模块分解

要开发搭建一个具有推荐功能的音乐网站，工程量着实不小。本次课程设计我们是分组每组三人进行的，三人之间的分工大概是这样的：

4. 数据库中的数据

我们选取了数据集中听歌次数最多的前500名用户，处理得到了这些用户听过的歌，共有25928首

数据处理过后的干净数据是长介个样子滴

【1】歌曲表（⭐歌曲热榜、全部歌曲模块所使用的表）

song_id	title	release	artist_name	year	play_count
SOBONKR12A58A7A7E0	You're The One	If There Was A Way	Dwight Yoakam	1990	726885
SOAUWYT12A81C206F1	Undo	Vespertine Live	Bj?rk	2001	648239
SOSXLTC12AF72A7F54	Revelry	Only By The Night	Kings Of Leon	2008	527893
SOFRQTD12A81C233C0	Sehr kosmisch	Musik von Harmonia	Harmonia	1999	425463
SOEGIYH12A6D4FC0E3	Horn Concerto No. 4 in E flat K495: II. Romance (Andante cantabile)	Mozart - Eine kleine Nachtmusik	Barry Tuckwell/Academy of St Martin-in-the-Fields/Sir Neville Marriner	1999	389880
SOAXGDH12A8C13F8A1	Dog Days Are Over (Radio Edit)	Now That's What I Call Music! 75	Florence + The Machine	1999	356533
....	....	....	....	....	....

【2】歌手表（⭐歌曲热榜所使用的表）

artist_name

Linkin Park

Blackmore's Night

Vanessa Carlton

Tarkan

Stelios Kazantzides

Akon

Dierks Bentley

Ry Cooder

......

【3】用户表（⭐登录、注册模块所使用的表）

user_id	username	password	sex	age
093cb74eb3c517c5179ae24caf0ebec51b24d2a2	1	123456	男	17
d13609d62db6df876d3cc388225478618bb7b912	2	123456	男	21
4cbca37009400bb5676ba54c2a4cc24ff0531cb7	3	123456	男	24
d5d1fc74f29ef42eefc2acf4c8c59da2994a0a16	4	123456	男	19
81193c20d49bfbca4a72eaa1119f6bb2fc4d9e48	5	123456	女	17
d19e8c59d207bf3e3c7ca0248a1fa684c00d006b	6	123456	男	33
bedad07238f60df86cb77b2d4ef1441c8f0b3a3b	7	123456	男	31
9c6ebf1d5ba38bcb577149b22e19448f655f6252	8	123456	女	25
1fc2a7f42424249718cc544a0a1036a69d5bc7b8	9	123456	女	15
fc05f377863a77d7784b02de2cc06cdecb85968b	10	123456	女	27
....	....	....	....	...

【4】年份表（⭐歌曲热榜所使用的表）

year
2007
2006
2002
1999
2004
2003
.....

【5】用户-歌曲表（⭐推荐算法模块所使用的表）

song_id	user_id	listen_count	title	play_count	release	artist_name	year	fractional_listen_count
SOABHYV12A6D4F6D0F	093cb74eb3c517c5179ae24caf0ebec51b24d2a2	11	Shadow Of The Day (Album Version)	13132	Minutes To Midnight	Linkin Park	2007	0.000837648
SOABHYV12A6D4F6D0F	d13609d62db6df876d3cc388225478618bb7b912	1	Shadow Of The Day (Album Version)	3657	Minutes To Midnight	Linkin Park	2007	0.000273448
SOABHYV12A6D4F6D0F	4cbca37009400bb5676ba54c2a4cc24ff0531cb7	33	Shadow Of The Day (Album Version)	3470	Minutes To Midnight	Linkin Park	2007	0.009510086
...	...	...	...	...	...	...	...	...

【6】在Django框架的models中建好表，把他们分别导进去就可以啦！

5. 我所负责的模块

我负责完成的是推荐算法的实现模块，实现了以下几种推荐算法：

UserCF（基于用户的协同过滤）

ItemCF（基于物品的协同过滤）

SVD分解

冷启动（对新注册的用户进行音乐的推荐）

以下是我负责的推荐算法模块的代码

# Thanks to Siraj Raval for this module
'''两种推荐算法：基于物品相似度和对于新用户的冷启动'''
import pandas as pd
import numpy as np
from scipy.sparse import coo_matrix
import math as mt
from scipy.sparse.linalg import * #used for matrix multiplication
from scipy.sparse.linalg import svds
from scipy.sparse import csc_matrix

#Class for Popularity based Recommender System model
#计算统计返回歌曲表中每首歌的被听次数，用于新用户（解决冷启动）
class popularity_recommender_py():
    def __init__(self):
        self.train_data = None
        self.user_id = None
        self.item_id = None
        self.popularity_recommendations = None

    def create(self, train_data, user_id, item_id):
        self.train_data = train_data
        self.user_id = user_id
        self.item_id = item_id#进行分类的指标：可以选择 歌曲名 歌手 年份 等等
        train_data_grouped = train_data.groupby([self.item_id]).agg({self.user_id: 'count'}).reset_index()#计算按分类指标的播放次数
        train_data_grouped.rename(columns = {self.user_id: 'score'},inplace=True)
        train_data_sort = train_data_grouped.sort_values(['score', self.item_id], ascending = [0,1])#对计算结果进行排序
        train_data_sort['Rank'] = train_data_sort['score'].rank(ascending=0, method='first')
        self.popularity_recommendations = train_data_sort.head(10)#返回前十名推荐歌曲作为推荐结果

    def recommend(self, user_id):
        user_recommendations = self.popularity_recommendations
        user_recommendations['user_id'] = user_id
        cols = user_recommendations.columns.tolist()
        cols = cols[-1:] + cols[:-1]
        user_recommendations = user_recommendations[cols]
        return user_recommendations

#基于用户的歌曲相似度进行推荐（基于用户的协同过滤算法）返回的是推荐歌曲的dataFrame
class user_similarity_recommender_py():

    def __init__(self):
        self.train_data = None
        self.user_id = None
        self.user_title = None#user_id
        self.item_title = None
        self.ans_user_set = {}

    def create(self,train_data,user_title,item_title, user_id):#构造对象
        self.user_title = user_title
        self.train_data = train_data
        self.item_title = item_title
        self.user_id = user_id

    def get_all_user_train_data(self):#获取training data中的所有用户id
        all_users = list(self.train_data[self.user_title].unique())
        return all_users

    def get_user_items(self, user):  # 获取user用户听过的所有歌的列表
        user_data = self.train_data[self.train_data[self.user_title] == user]  # user这个用户都听了哪几首歌
        user_items = list(user_data[self.item_title].unique())
        return user_items

    def get_similarity_users(self):#获取前十个相似的用户
        all_users = self.get_all_user_train_data()#得到所有用户
        song_user = set(self.get_user_items(self.user_id))#得到待推荐用户听过的歌
        lis = []
        for i in all_users:#对于数据集中的每一个用户
            l = []
            song_i = set(self.get_user_items(i))
            songs_intersection = song_i.intersection(song_user)#计算这两名用户听过歌曲的交集
            if len(songs_intersection) != 0:
                songs_union = song_i.union(song_user)#计算这两名用户听过歌曲的并集
                score = float(len(songs_intersection))/float(len(songs_union))#计算这两名用户的相似度
                l.append(i)
                l.append(score)
                lis.append(l)
        lis.sort(key=lambda x : x[1], reverse=True)#按相似度对用户进行排序
        ans = []
        return lis
        for i in range(0, min(5,len(lis))):
            ans.append(lis[i][0])#得到前五名用户的user_id
        return ans

    def get_ans(self):
        ini_songs = self.get_user_items(self.user_id)
        users = self.get_similarity_users()#得到与被推荐用户最相似的前五名用户的id
        columns = ['similary_users','songs']
        ans = []
        for i in users:#对于每一个推荐结果用户
            recommend_user = i[0]
            songs = self.get_user_items(recommend_user)#得到推荐结果用户听过的所有歌
            for recommend_song in songs:
                if recommend_song not in ini_songs and recommend_song not in ans:#如果这首歌没被推荐过，待推荐用户也没有听过
                    ans.append(recommend_song)
                    if len(ans) == 10:#限制返回的歌曲数量
                        return ans

#Class for Item similarity based Recommender System model
#基于歌曲的受众相似度进行推荐（基于物品的协同过滤算法）返回的是推荐歌曲的dataFrame
class item_similarity_recommender_py():
    def __init__(self):
        self.train_data = None
        self.unique_song_title = None
        self.user_id = None
        self.item_id = None
        self.cooccurence_matrix = None
        self.songs_dict = None
        self.rev_songs_dict = None
        self.item_similarity_recommendations = None
        self.dic = {}

    def create(self, train_data, user_id, item_id, unique_song_title):
        self.train_data = train_data
        self.user_id = user_id
        self.item_id = item_id
        self.unique_song_title = unique_song_title
        self.get_my_dic()

    def get_user_items(self, user):
        user_data = self.train_data[self.train_data[self.user_id] == user]#user这个用户都听了哪几首歌
        user_items = list(user_data[self.item_id].unique())
        return user_items

    def get_item_users(self, item):
        item_data = self.train_data[self.train_data[self.item_id] == item]
        item_users = set(item_data[self.user_id].unique())
        return item_users

    def get_all_items_train_data(self):
        all_items = list(self.train_data[self.item_id].unique())
        # print("all_items:",all_items)
        return all_items

    def get_my_dic(self):
        user_id = self.train_data['user_id']
        song_title = self.train_data['title']
        for i in song_title:
            self.dic[i] = []
        lis = []
        j = 0
        for i in song_title:
            self.dic[i].append(user_id[j])
            j += 1

    def construct_cooccurence_matrix(self, user_songs, all_songs):#构造相似度矩阵
        cooccurence_matrix = np.matrix(np.zeros(shape=(len(user_songs), len(all_songs))), float)
        for i in range(0, len(all_songs)):#遍历所有的歌
            users_i = set(self.dic[all_songs[i]])#取出听过这一首歌的用户
            for j in range(0, len(user_songs)):#遍历待推荐用户听过的所有歌
                users_j = set(self.dic[user_songs[j]])#取出听过这一首歌的用户
                users_intersection = users_i.intersection(users_j)
                if len(users_intersection) != 0:
                    users_union = users_i.union(users_j)
                    cooccurence_matrix[j, i] = float(len(users_intersection)) / float(len(users_union))#用Jacccard相似系数作为衡量相似度
                else:
                    cooccurence_matrix[j, i] = 0
        return cooccurence_matrix


    def generate_top_recommendations(self, user, cooccurence_matrix, all_songs, user_songs):
        user_sim_scores = cooccurence_matrix.sum(axis=0)/float(cooccurence_matrix.shape[0])
        #每首歌总得分为这首歌与user_songs中所有歌相似度的平均值
        user_sim_scores = np.array(user_sim_scores)[0].tolist()#得到每首歌的推荐下标
        sort_index = sorted(((e,i) for i,e in enumerate(list(user_sim_scores))), reverse=True)#将歌曲按总相似度进行排序
        columns = ['user_id', 'song', 'score', 'rank']
        df = pd.DataFrame(columns=columns)#构造一个DataFrame类型暂时存储推荐结果
        rank = 1#限制返回的歌曲数量
        for i in range(0,len(sort_index)):#遍历推荐列表
            if ~np.isnan(sort_index[i][0]) and all_songs[sort_index[i][1]] not in user_songs and rank <= 10:
                #如果这首歌待推荐用户没有听过，并且推荐下标在10以内
                df.loc[len(df)]=[user,all_songs[sort_index[i][1]],sort_index[i][0],rank]#将这首歌的信息存入df
                rank = rank+1
        ans = list(df['song'])#返回推荐的歌曲名列表
        return ans

    def recommend(self, user):
        user_songs = self.get_user_items(user)    #得到待推荐用户听过的所有的歌
        all_songs = self.unique_song_title        #得到数据集中所有的歌名
        cooccurence_matrix = self.construct_cooccurence_matrix(user_songs, all_songs) #计算得到相似度矩阵
        recommendations = self.generate_top_recommendations(user, cooccurence_matrix,all_songs, user_songs)#得到推荐的歌曲名列表
        return recommendations


#SVD分解预测用户的评分 返回值类型还需处理
class SVD():
    def __init__(self):
        self.User_id = None
        self.uTest = None
        self.train_data = None
        self.user_id = None
        self.mt_candidate = None
        self.small_set = None
        self.K = None
        self.MAX_UID = None
        self.MAX_PID = None
        self.urm = None

    def create(self,train_data, user_id):
        self.train_data = train_data
        self.User_id = user_id
        # self.user_id = user_id

    def process_data(self):
        self.small_set = self.train_data
        user_codes = self.small_set.user_id.drop_duplicates().reset_index()  # 得到所有的用户，去除重复值
        song_codes = self.small_set.song_id.drop_duplicates().reset_index()  # 得到所有的歌id，去除重复值
        user_codes.rename(columns={'index': 'user_index'}, inplace=True)
        song_codes.rename(columns={'index': 'song_index'}, inplace=True)
        song_codes['so_index_value'] = list(song_codes.index)
        user_codes['us_index_value'] = list(user_codes.index)
        self.small_set = pd.merge(self.small_set, song_codes, how='left')
        self.small_set = pd.merge(self.small_set, user_codes, how='left')
        us_ids = user_codes['user_id']
        us_index_values = user_codes['us_index_value']
        for i in range(len(us_ids)):
            if us_ids[i] == self.User_id:
                self.uTest = us_index_values[i]
                break
            if self.uTest != None:
                break
        self.mat_candidate = self.small_set[['us_index_value', 'so_index_value', 'fractional_play_count']]

    def get_data_sparse(self):
        data_array = self.mat_candidate.fractional_play_count.values
        row_array = self.mat_candidate.us_index_value.values
        col_array = self.mat_candidate.so_index_value.values

        data_sparse = coo_matrix((data_array, (row_array, col_array)), dtype=float)
        self.K = 500
        self.urm = data_sparse
        self.MAX_PID = self.urm.shape[1]
        self.MAX_UID = self.urm.shape[0]

    def compute_svd(self, urm, K):#进行矩阵分解，返回U、S、Vt三个矩阵
        U, s, Vt = svds(urm, K)
        dim = (len(s), len(s))
        S = np.zeros(dim, dtype=np.float32)
        for i in range(0, len(s)):
            S[i, i] = mt.sqrt(s[i])
        U = csc_matrix(U, dtype=np.float32)#用来进行稀疏矩阵的压缩
        S = csc_matrix(S, dtype=np.float32)
        Vt = csc_matrix(Vt, dtype=np.float32)
        return U, S, Vt

    def compute_estimated_matrix(self, urm, U, S, Vt, K, test):
        rightTerm = S * Vt  # 对于每一个用户 U * S * Vt 得到的是他的坐标
        max_recommendation = 250
        estimatedRatings = np.zeros(shape=(self.MAX_UID, self.MAX_PID), dtype=np.float16)
        recomendRatings = np.zeros(shape=(self.MAX_UID, max_recommendation), dtype=np.float16)
        userTest = self.uTest
        prod = U[userTest, :] * rightTerm
        estimatedRatings[userTest, :] = prod.todense()#得到用户U的预测评分列表
        recomendRatings[userTest, :] = (-estimatedRatings[userTest, :]).argsort()[:max_recommendation]#将评分表进行排序
        #将计算结果按评分排序后返回
        return recomendRatings

    def get_ans(self):
        self.process_data()
        self.get_data_sparse()
        U, S, Vt = self.compute_svd(self.urm, self.K)
        uTest_recommended_items = self.compute_estimated_matrix(self.urm, U, S, Vt , self.K, True)
        user = self.uTest
        ans_lis = []
        for i in uTest_recommended_items[user, 0:10]:#得到前十个评分最高的歌曲信息
            song_details = self.small_set[self.small_set.so_index_value == i].drop_duplicates('so_index_value')[
                ['title', 'artist_name', 'year', 'release']]
            ans_lis.append(list(song_details['title'])[0])#将歌曲名添加至答案列表中
        return ans_lis

6.我学到了什么

1. 使用python的数据科学处理模块pandas进行数据预处理

当我们进行大数据项目的开发时，首要的第一步就是从网站上获取数据，这时候就有很多种方式了：使用网络爬虫，下载使用国内外的公开数据集等等。

拿到的数据集往往十分庞大，并且数据集中的数据往往存在数据冗余，数据缺失，数据错误等问题，我们想要进行模型的训练，当然要先对获取的海量数据进行数据预处理。

我们这次项目中拿到的数据文件类型是csv文件，对csv文件进行处理，可以使用python的强大数据科学分析库pandas来进行。首先我们import pandas as pd

import pandas as pd
#(1)读取csv文件中的数据：（值得注意的是：encoding应该与使用记事本打开的编码保持一致）
data = pd.read_csv(文件名, encoding="utf-8")#读取出来后是一个DataFrame类型
#(2)合并两个具有相同列的DataFrame
data_merge = pd.merge(data1, data2, on=共同的列名)
#(3)取出DataFrame中的某一列，并去除重复值(取出的是一个列表类型)
col = data_merge[列名].unique()
#(4)打印DataFrame的前几行
print(data.head(10))

然后再配合excel中的“删除重复值”、“排序”等功能，就可以进行数据预处理，得到我们想要的数据啦

2. 使用python对文件夹中的海量图片进行批量命名

当文件夹中有成百上千张不规则命名的图片，我们如何将这些图片修改成统一的文件名格式呢？

贴一个大神博客链接：python批量修改文件夹中的图片名称

十分好用！相当牛逼！

3. django框架知识

Django是一个开放源代码的Web应用框架，由Python写成。采用了MTV的框架模式，即模型M，视图V和模版T。它最初是被开发来用于管理劳伦斯出版集团旗下的一些以新闻内容为主的网站的，即是CMS（内容管理系统）软件。并于2005年7月在BSD许可证下发布。这套框架是以比利时的吉普赛爵士吉他手Django Reinhardt来命名的。2019年12月2日，Django 3. 0发布

常用的Django命令：

django-admin startproject 程序名 #建立一个新的Django项目

django-admin startapp app名 #建立一个新的Django app

python manage.py runserver #运行建立的Django项目

python manage.py makemigrations #进行模型数据库文件的迁移, 记录我们对models.py的所有改动，并且将这个改动迁移到migrations这个文件下生成一个文件

python manage.py migrate #这条命令的主要作用就是把这些改动作用到数据库也就是执行migrations里面新改动的迁移文件更新数据库，比如创建数据表，或者增加字段属性

4. 推荐算法知识

（1）基于用户的协同过滤：UserCF 伪代码：

itemCF：要给user i推荐歌曲
1. 找出i听的所有歌曲的集合song_set_i[song1,song2,song3,...]
2. 找出歌曲集中的所有歌曲song_set_all[song1,........................]
3. for song_i in song_set_all :
   		找出听过歌曲song_i的用户的集合user_i[user1,user2,.....]
   		for song_j in song_set_i :
   					找出听过歌曲song_j的用户的集合user_j[user1,user2,.....]	
   					求出user_i 和 user_j 的交集 / 并集 的值，作为song_i和song_j的相似分，填在相似度矩阵coo中
   		song_i的得分：song_i 这一行的 所有 song_j 的相似分 的总和/song_set_i的大小
4. 将所有song的得分进行排序，返回前十名
（根据歌曲的受众，进行相似歌曲的推荐。其主要通过分析用户的行为记录计算物品之间的相似度。物品A和物品B具有很大的相似度是因为喜欢歌曲A的用户大都也喜欢歌曲B。）

（2）基于物品的协同过滤：ItemCF 伪代码：

userCF：要给user i 推荐歌曲
1. 找出user_i听的所有歌曲的集合song_set_i
2. 找出用户集中的所有用户user_set_all
3. for user in user_set_all :
   		找出用户user听过的歌曲的集合song_set_user
   		求出song_set_i和song_set_user的交集 / 并集 的值，作为user_i 和 user 的相似分
4. 将user_set_all中所有user的相似分进行排序，选出前十名user
5. 将前十名user听的歌曲返回，作为推荐的结果
（根据用户的相似度，进行推荐。与待推荐用户听歌记录相似的用户喜欢听的歌，很大可能上也会是待推荐用户喜欢听的歌）

（3）SVD分解

SVD分解就是用来将一个大的矩阵以降低维数的方式进行有损地压缩。应用在推荐系统中，我们的思路是利用新用户的评分向量找出该用户的相似用户。SVD分解就是将矩阵分解为U，S，V三个矩阵。k就是在进行矩阵降维时，选择的S矩阵中的特征值个数。对于新用户的评分，乘以U矩阵和S矩阵，得到他的降维结果。再与其余用户计算相似度，将与他最相似的用户评过分他却没评过分的歌曲排序，返回前几首作为推荐结果。

（4）冷启动（解决新用户的推荐策略）

将曲库中听的最多的歌曲推荐给新用户。

7. 心得和感悟

本次数据分析与挖掘课程设计让我亲身体验了一次开发完整的实际项目的经历。在本次课程设计中我负责推荐算法模块的开发设计。刚开始的几天，我一度觉得基于物品的推荐算法十分晦涩难懂。但我很快找到了解决的方案：用编译器自带的调试功能一步一步进行调试，观察每一个变量的变化情况。经过成百次的调试，我终于懂了算法的底层实现原理，然后又根据自己的理解手动实现了基于用户的推荐算法。虽然实现了算法，我们却又遇到了新的问题：算法的计算效率过慢，万级别的数据往往需要一分钟甚至是好几分钟才能够计算出答案。经过不断的打断点测试，计算运行时间，我们终于找到了时间复杂度过高的根源：建立倒排表这一步花费了大量的时间。在经过思考后，我决定将数据库中的数据按物品编号进行排序，并预处理每个物品的倒排表，将程序的运行时间缩短在十秒以内。经过学习和改进，又实现了更快的推荐算法：SVD（奇异值分解），经过一起努力，最终将推荐算法联通到了数据库与前端页面。每种算法背后都有着简洁的思想，正确的原理，将它们理解并运用到代码中，是我这次课程设计最大的收获。在这次课程设计中我其实获得了很多，也明白了很多我自己的缺陷。作为计算机系的学生，动手能力一定要强，所以有很多东西不一定到了用的时候再去学，而是要提前了解，提前去学，这样才能够真正地提高自己。

基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
数据分析案例-电脑笔记本价格数据可视化分析3 艾派森数据分析信息可视化 python 数据分析数据挖掘电脑
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
【无标题】Python学习心得 w180316 python
在当今数字化的时代，编程已经成为不可或缺的技能。我选择学习Python语言，是被它的简洁、高效和广泛的应用场景所吸引。经过一段时间的学习，我有了许多深刻的体会和感悟。Python语言给我的第一印象就是简洁易懂。它的语法相对简单，结构清晰，不像一些其他编程语言那样有复杂的规则和晦涩的符号。这使得初学者能够更快地入门，减少了学习门槛和压力。比如，在Python中，变量的定义不需要明确指定数据类型，而是
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
Python：列表切片允许“后边小于左边”吗？
目录1问题2测试3欢迎纠错4论文写作/Python学习智能体1问题在Python中，列表切片允许“后边小于左边”吗？2测试在Python中，列表切片允许“后边小于左边”，此时会返回一个空列表，不会报错。例如：lst=[1,2,3,4,5]print(lst[3:1])#输出：[] 这是因为，当切片的结束索引小于开始索引，且步长为默认的1（正数）时，Python认为没有符合条件的元素，
【字节跳动】数据挖掘面试题0010：解释全国人均收入下降，各省份人均收入增加的现象，属于辛普森悖论（开放性问题）言析数智数据挖掘常见面试题辛普森悖论局部与整体分析差异归因数据分析面试题
文章大纲一、辛普森悖论的核心定义二、现象成因：加权平均中的“权重偏移”三、数学逻辑与案例说明1.数学表达式2.具体案例四、辛普森悖论的本质：忽略“混杂因素”的影响五、生活中常见的辛普森悖论案例及应对策略1.医疗疗法效果评估2.大学录取率的性别偏差3.篮球运动员投篮效率4.公司员工绩效与部门规模如何利用辛普森悖论？（数据分析中的价值）六、总结全国人均收入下降而各省份人均收入增加的现象，确实属于辛普森
数据挖掘：从理论到实践的深度探索代码老y 数据挖掘人工智能
在当今数字化时代，数据已经成为企业决策的重要依据。数据挖掘作为一门从大量数据中提取有价值信息的技术，已经广泛应用于各个领域，如金融、医疗、零售、互联网等。本文将深入探讨数据挖掘的基本概念、主要技术和实际应用案例，帮助读者更好地理解数据挖掘的价值和应用。一、数据挖掘的基本概念（一）数据挖掘的定义数据挖掘（DataMining）是从大量数据中提取有用信息的过程。它结合了统计学、机器学习、数据库技术和人
【力扣（LeetCode）】数据挖掘面试题0003： 356. 直线镜像
文章大纲题目描述**坐标变化规律**解题方案题目描述在一个二维平面空间中，给你n个点的坐标。问，是否能找出一条平行于y轴的直线，让这些点关于这条直线成镜像排布？平行于y轴的直线（即垂直于x轴的直线，其方程形式为(x=a)，其中(a)为常数）的对称点具有以下显著特点：坐标变化规律设直线为(x=a)，平面内任意一点(P(x,y))关于该直线的对称点为(P’(x’,y’))，则两者坐标满足：纵坐标不变：
Python vars() 函数：探索对象的内部程序员喵哥 Python python 开发语言
更多Python学习内容：ipengtao.comPython是一门具有强大而灵活的编程语言，可以访问和探索对象的内部属性。vars()函数是Python标准库中的一个强大工具，它可以获取对象的属性和属性值，并以字典的形式返回它们。在本文中，将深入研究vars()函数，探讨它的用途、示例和适用场景。前言在Python中，对象是一切。对象可以是数字、字符串、列表、字典、函数、类实例等等。每个对象都可
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
Python爬虫在社交平台数据挖掘中的应用：深入探索用户互动程序员威哥 python 爬虫数据挖掘
引言社交媒体已经成为全球用户互动的主要平台，每天都有大量的信息生成，用户之间的互动行为如点赞、评论、分享、转发等构成了宝贵的数据资源。如何利用这些互动数据为商业决策、用户行为分析以及产品优化提供支持，已经成为数据科学与大数据分析领域的一个重要课题。Python作为一款强大的编程语言，凭借其丰富的爬虫库和数据分析工具，已经成为挖掘社交平台数据的重要工具。在本文中，我们将通过Python爬虫技术，深入
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
python学习试题（选择，问答，代码等）爱莉希雅&&& python 学习开发语言
python选择题（1）以下哪个是合法的Python变量名？[email protected]答案：B（2）表达式True+2的结果是？A.TrueB.3C.2D.TypeError答案：B（3）以下哪个表达式会引发错误？A."1"+"2"B.[1,2]+[3,4]C.(1,2)+(3,4)D.{1,2}+{3,4}答案：D（4）以下哪个是将字符串转换为整数的正确方法？A.str
Python爬虫实战：利用Selenium与反反爬技术高效爬取天眼查企业信息 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy selenium
摘要本文将详细介绍如何使用Python爬虫技术获取天眼查的企业信息数据。我们将从爬虫基础开始，逐步深入到高级反反爬技术，最终构建一个能够稳定获取天眼查数据的爬虫系统。文章包含完整的代码实现、技术原理分析以及实际应用场景，帮助读者全面掌握企业信息爬取的核心技术。关键词：Python爬虫、天眼查、Selenium、反反爬技术、企业信息采集、数据挖掘一、引言在当今大数据时代，企业信息数据对于市场分析、商
Python 爬虫实战：京东商品数据采集（登录态验证 + 价格监控系统） Python核芯 Python爬虫实战项目 python 爬虫开发语言
一、引言在电商飞速发展的当下，京东作为国内头部电商平台之一，拥有海量商品数据。对于商家而言，精准掌握这些数据能助力优化定价策略、洞察市场动态；对消费者来说，追踪商品价格走势有助于把握最佳购买时机。本文将深入剖析如何借助Python爬虫技术实现京东商品数据采集，包括突破登录态验证以及搭建价格监控系统，为读者呈上一份实用的电商数据挖掘指南。二、环境搭建安装Python库：执行以下命令安装所需的库：pi
python 元类的继承_Python学习_13_继承和元类五伤先生 python 元类的继承
继承继承的含义就是子类继承父类的命名空间，子类中可以调用父类的属性和方法，由于命名空间的查找方式，当子类中定义和父类同名属性或者方法时，子类的实例调用的是子类中的属性，而不是父类，这就形成了python中的多态：defSuperClass:defa_method:passdefSubClass(SuperClass):defa_method:passobj=SubClass()obj.a_meth
Python元类基础知识示例深度剖析，从新手小白成为Python编程高手只存在于虚拟的King python 开发语言深度学习学习经验分享计算机网络程序人生
文章目录引言一、什么是元类？二、元类的工作原理三、如何定义元类四、元类的应用场景五、元类的注意事项六、结论关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包+项目源码合集①Python工具包②Python实战案例③Python小游戏源码五、面试资料六、Python兼职渠道引言Python是一种强大的编程语言，一部
AI“大航海”时代：企业人力资源的AI-HR实践与效能提升策略
在数字化浪潮的推动下，人工智能（AI）正以前所未有的速度渗透各行各业，人力资源管理（HR）领域也不例外。AI技术的引入与应用落地，不仅提升HR管理效率，更在深层次上带来人力资源运作模式的变革。什么是AI-HR所谓AI-HR，是指将人工智能技术应用于人力资源管理，并通过机器学习、自然语言处理、数据挖掘等技术，优化招聘、培训、绩效评估、员工关系等人力资源各个业务模块。近年来，随着AI技术的成熟和普及，
Python学习打卡：day09 胜天半子祁厅 Python python 学习开发语言
day9笔记来源于：黑马程序员python教程，8天python从入门到精通，学python看这套就够了目录day964、字典课后习题65、5类数据容器的总结对比数据容器分类数据容器特点对比66、数据容器的通用操作遍历统计len、max和min转换list(容器)、tuple(容器)、str(容器)、set(容器)排序容器通用功能总览67、拓展——字符串的大小比较ASCII码表字符串比较68、函数
Python学习打卡：day02
day2笔记来源于：黑马程序员python教程，8天python从入门到精通，学python看这套就够了目录day28、字符串的三种定义方式字符串在Python中有多种定义形式字符串的引号嵌套9、字符串的拼接10、字符串格式化11、格式化的精度控制12、字符串格式化的方式213、对表达式进行格式化14、字符串格式化的课后练习题15、数据输入（input语句）input语句（函数）input语句获取
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- 实例化 OCR 对象的 predict() 方法介绍
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
新手必看的python学习心得 2401_89815407 python 开发语言
Python学习心得：从入门到实践的体会Python作为一门简洁高效的编程语言，其学习过程充满趣味与挑战。通过系统学习与实践，总结出以下关键经验与感悟。Python新手常见代码问题及解决方法Python作为一门易学易用的编程语言，吸引了大量初学者。然而新手在学习过程中常会遇到一些典型问题。以下是常见问题及解决方案。缩进错误Python使用缩进区分代码块，新手容易混淆缩进方式或忘记缩进。正确做法是统
Python学习笔记2-垃圾回收机制 Carrie_Lei Python python 学习笔记
Python的垃圾回收机制是自动管理内存的系统，用于回收不再使用的内存，以避免内存泄漏和优化内存使用。Python使用引用计数（ReferenceCounting）和垃圾回收（GarbageCollection）两种方式来管理内存。1.引用计数(ReferenceCounting)引用计数是Python内存管理的基础机制。每个对象都维护一个引用计数器，记录有多少个引用指向该对象。当一个新的引用指向
满血DeepSeek加持的AlphaGPT，助力高文律师事务所全面拥抱AI
2025年初,中国团队精心雕琢的通用大模型DeepSeek凭借其创新的架构优化以及深入的数据挖掘技术,在逻辑推理、多轮对话和知识搜索等关键领域大放异彩,其为诸多垂直领域,特别是法律行业的智能化转型,开拓了全新的方向。2月8日,法律科技领域的领军者iCourt将旗下的AlphaGPT与DeepSeek深度融合,重磅推出业内首款“DeepSeek+法律专业”AI大模型。这一创举彻底打破了传统法律智能工
量化策略进阶：事件驱动与另类数据挖掘实战
前面的章节，我们已经详细探讨了量化系统的基础架构：从数据的获取与管理（数据层），到策略的研发与验证（回测层），再到指令的高速执行（交易执行层），以及确保资金安全的防线（风控与监控运维层），我们共同构建了一套完整的量化交易体系。今天，我们将深入探讨量化策略的更高维度：事件驱动型策略和另类数据挖掘。这不仅仅是技术栈的扩展，更是对市场洞察力和信息处理能力的全面提升，旨在帮助您的策略在传统量价数据之外，捕
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
【力扣（LeetCode）】数据挖掘面试题0013：1264. 页面推荐（泛化后，基于MySQL题解）言析数智数据挖掘常见面试题 leetcode 数据挖掘 mysql 笔试笔试题
文章大纲一、题目要求：二、模拟数据构建三、题解参考方案朋友关系列表：Friendship+---------------+---------+|ColumnName|Type|+---------------+---------+|user1_id|int||user2_id|int|+---------------+---------+(user1_id,user2_id)是这张表具有唯一值的列
R 语言安装使用教程小奇JAVA面试安装使用教程 r语言开发语言
一、R语言简介R是一种用于统计分析、数据挖掘和可视化的编程语言和环境。它在学术界和数据分析领域中广泛使用，拥有丰富的统计函数库和绘图功能。二、安装R语言2.1下载R安装包前往CRAN官网下载适合你操作系统的安装程序：官网地址：https://cran.r-project.org/2.2Windows安装下载.exe安装包；双击安装程序，按默认选项一路安装即可；安装完成后，可通过RGUI或命令行启动
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要