zm714981790

Dataquest用户数据分析

Thinking Through Analytics Data

本文将介绍如何从头到尾对数据进行分析。我们将探索Dataquest这个网站上用户的匿名化分析数据。我们将探索用户是如何进行学习的，数据源主要有两个：

数据库
网站前端的收集的数据

A Quick Look At Dataquest

首先需要明确Dataquest这个网站是怎样构造的：当前处在一个任务中，任务是由远程数据库，以及一些知识点组成。每个任务包含多个屏幕（screen），屏幕的目录在右边，可以点击它跳到相应的屏幕中。这些屏幕可以是code屏幕，也可以是文本屏幕，code屏幕通常需要你写答案，然后点击运行来检测答案的正确性。系统所使用的语言是python3.

Looking At Student Data

第一个数据集来自数据库，包含了：

学习进展信息（progress data）：是否成功完成某个屏幕，学生所写的代码，比如你刚完成了一个屏幕的内容就产生了一个新的记录（是否成功完成以及你的代码）。每个progress数据由一个pk值唯一确定。
尝试数据（attempt data）：包含学生对每个任务所作的各种代码尝试记录，每个progress data都有一个或多个与之关联的attempt data，每一个attempt数据有一个pk值唯一确定，attempt中的screen_progress属性就是progress的pk值，这是attempt的外键，通过这个外键将attempt与progress联系到一起。
为了使分析更简单，本文提取了50个学生的数据库信息：

# The attempts are stored in the attempts variable, and progress is stored in the progress variable.

# Here's how one progress record looks.
print("Progress Record:")
# Pretty print is a custom function we made to output json data in a nicer way.
pretty_print(progress[0])
print("\n")

# Here's how one attempt record looks.
print("Attempt Record:")
pretty_print(attempts[0])
'''
# 一条Progress记录有fields，model，pk三个键，而fields中有attempts，complete，user等更详细的键。
Progress Record:
{
    "fields": {
        "attempts": 0,
        "complete": true,
        "created": "2015-04-07T21:21:57.316Z",
        "last_code": "# We'll be coding in python.\n# Python is a great general purpose language, and is used in a lot of data science and machine learning applications.\n# If you don't know python, that's okay -- important concepts will be introduced as we go along.\n# In python, any line that starts with a # is called a comment, and is used to put in notes and messages.\n# It isn't part of the code, and isn't executed.",
        "last_context": null,
        "last_correct_code": "# We'll be coding in python.\n# Python is a great general purpose language, and is used in a lot of data science and machine learning applications.\n# If you don't know python, that's okay -- important concepts will be introduced as we go along.\n# In python, any line that starts with a # is called a comment, and is used to put in notes and messages.\n# It isn't part of the code, and isn't executed.",
        "last_output": "{\"check\":true,\"output\":\"\",\"hint\":\"\",\"vars\":{},\"code\":\"# We'll be coding in python.\\n# Python is a great general purpose language, and is used in a lot of data science and machine learning applications.\\n# If you don't know python, that's okay -- important concepts will be introduced as we go along.\\n# In python, any line that starts with a # is called a comment, and is used to put in notes and messages.\\n# It isn't part of the code, and isn't executed.\"}",
        "screen": 1,
        "updated": "2015-04-07T21:25:07.799Z",
        "user": 48309
    },
    "model": "missions.screenprogress",
    "pk": 299076
}

# 一条Attempt 记录有fields，model，pk三个键，同样fields中有更详细的键screen_progress等。
Attempt Record:
{
    "fields": {
        "code": "# We'll be coding in python.\n# Python is a great general purpose language, and is used in a lot of data science and machine learning applications.\n# If you don't know python, that's okay -- important concepts will be introduced as we go along.\n# In python, any line that starts with a # is called a comment, and is used to put in notes and messages.\n# It isn't part of the code, and isn't executed.",
        "correct": true,
        "created": "2015-03-01T16:33:56.537Z",
        "screen_progress": 231467,
        "updated": "2015-03-01T16:33:56.537Z"
    },
    "model": "missions.screenattempt",
    "pk": 62474
}
'''

The Structure Of The Data

可以发现progress以及attempts都是字典格式的数据。

Progress record

pk – the id of the record in the database
fields
- attempts – a count of how many attempts the student made on the
  screen.
- complete – whether the student successfully passed the screen (True
  if they have / False if not).
- created – what time the student first saw the screen.
- last_code – the text of the last code the student wrote.
- last_correct_code – the last code the student wrote that was
  correct. Null if they don’t have anything correct.
- screen – the id of the screen this progress is associated with.
- user – the id of the user this progress is associated with.

Attempt record

pk – the id of the record in the database
fields
- code – the code that was submitted for this attempt.
- correct – whether or not the student got the answer right.
- screen_progress – the id of the progress record this attempt is associated with.

# This gets the fields attribute from the first attempt, and prints it
# As you can see, fields is another dictionary
# The keys for fields are listed above
pretty_print(attempts[0]["fields"]) ''' { "code": "# We'll be coding in python.\n# Python is a great general purpose language, and is used in a lot of data science and machine learning applications.\n# If you don't know python, that's okay -- important concepts will be introduced as we go along.\n# In python, any line that starts with a # is called a comment, and is used to put in notes and messages.\n# It isn't part of the code, and isn't executed.", "correct": true, "created": "2015-03-01T16:33:56.537Z", "screen_progress": 231467,
 "updated": "2015-03-01T16:33:56.537Z"
}
'''
# This gets the "correct" attribute from "fields" in the first attempt record
print(attempts[0]["fields"]["correct"])
'''
True
'''

Exploring The Data

得到详细的数据后，可以计算一些东西，来进一步了解数据：

The number of attempts.
The number of progress records.
The number of attempts each student makes per screen (# of attempts / # of progress records).

# Number of screens students have seen
progress_count = len(progress) print(progress_count)

# Number of attempts
attempt_count = len(attempts) print(attempt_count)
'''
2134
3995
'''

Get User ID

我们需要获取用户是如何与网站进行交互的，比如用户通过了多少个任务等等，所以首先需要获取有多少个用户id，然后根据id分组计算频数：

# A list to put the user ids
all_user_ids = []

for record in progress:
 user_id = record["fields"]["user"]
 all_user_ids.append(user_id)

# This pulls out only the unique user ids
all_user_ids = list(set(all_user_ids))
'''
all_user_ids  : list (<class 'list'>)
[51331,
 52100,
 58628,
 54532,
 55945,
 46601,
 50192,
 ...
'''

Matrices

矩阵是二维数组，矩阵的索引形式如下matrix[1,2]。

import numpy as np
# if we pass a list to asarray, it converts them to a vector
# If we pass a list of lists to asarray, it converts them to a matrix.
matrix = np.asarray([
        [1,2,3],
        [4,5,6],
        [7,8,9],
        [10,11,12]
    ])
matrix_1_1 = matrix[1,1]
matrix_0_2 = matrix[0,2]

Pandas DataFrame

Dataframe和矩阵相似，但是Dataframes存储的数据的每个列可以是不同的数据类型。并且有许多內建的函数可以用来做数据分析和数据可视化。创建一个Dataframe对象的最简单的方法就是通过字典列表来初始化。但是这个字典里面不能有嵌套，也就是所有的键都在同一个水平上。所以对于我们的数据需要做些调整。由于之前一条progress记录包含pk,field主键，而field里面又有很多子键，因此将field去掉，将其子键提取出来和pk在同一个水平。

# "Flatten" the progress records out.
flat_progress = []
for record in progress:
    # Get the fields dictionary, and use it as the start of our flat record.
    flat_record = record["fields"]
    # Store the pk in the dictionary
    flat_record["pk"] = record["pk"]

    # Add the flat record to flat_progress
    flat_progress.append(flat_record)
flat_attempts = []
for record in attempts:
    flat_record = record["fields"]
    flat_record["pk"] = record["pk"]
    flat_attempts.append(flat_record)

Creating Dataframes

将JOSN数据转化为DataFrame数据

import pandas as pd
progress_frame = pd.DataFrame(flat_progress)
# Print the names of the columns
print(progress_frame.columns)
''' Index(['attempts', 'complete', 'created', 'last_code', 'last_context', 'last_correct_code', 'last_output', 'pk', 'screen', 'updated', 'user'], dtype='object') '''
attempt_frame = pd.DataFrame(flat_attempts)

Users’ Progresss Count

现在通过Dataframe的一些内建函数可以很快速简单的获取一些统计信息，比如有多少个用户user_ids，以及每个用户的progress个数user_id_counts，以及每个屏幕被记录了多少次screen_counts.并且value_counts()是按照值从小到大排序的。

# Get all the unique values from a column.
user_ids = progress_frame["user"].unique()

# Make a table of how many screens each user attempted
user_id_counts = progress_frame["user"].value_counts()
print(user_id_counts)
screen_counts = progress_frame["screen"].value_counts()
''' 46578 177 48108 136 49340 135 54823 131 47451 123 42983 118 52584 108 ... '''

Making Charts

用可视化技术来分析数据最直观，使用matplotlib来观察一下用户完成progress的情况：

import matplotlib.pyplot as plt

# Plot how many screens each user id has seen.
# The value_counts method sorts everything in descending order. user_counts = progress_frame["user"].value_counts() # The range function creates an integer range from 1 to the specified number. x_axis = range(len(user_counts)) # Make a bar plot of the range labels against the user counts. plt.bar(x_axis, user_counts) # We have to use this to show the plot. plt.show()

下图显示的是每用户的progess（完成的屏幕数量）数量，由于user_counts是排好序的，因此图中的从打大小排下来的。可以发现数据呈现长尾分布，大部分人只学习了少量的任务。

Pandas Filtering

选择第一个屏幕的progress数据：

screen_1_frame = progress_frame[progress_frame["screen"] == 1]

Matching Attempts To Progress

将每个attempt和对应的progess（每个用户对每个screen都会产生一个pregress记录）联系在一起，这样才可以统计每个screen总共有多少个attempt，他们中有多少个是正确的。attempt可以通过screen_progress （the id of the progress record this attempt is associated with）这个属性将其与progess（pk）联系在一起。

下面这个代码是找到1137条progress记录的的尝试情况：

# 这是个布尔型Series,找到第1137条progress（某个人对某个screen的详细信息）的记录的尝试信息。
has_progress_row_id = attempt_frame["screen_progress"] == progress_frame["pk"][1137]
progress_attempts = attempt_frame[has_progress_row_id]
# 一共有49条尝试，正确的有5条，错误的有44条
correct_attempts_count = progress_attempts[progress_attempts["correct"] == True].shape[0]
incorrect_attempts_count = progress_attempts[progress_attempts["correct"] == False].shape[0]

Figuring Out Attempt Ratios

现在已经可以将progress和attempt联系起来，我们想要知道用户在每个progress上是否第一次尝试就correct了，这可以体现这个任务的难易程度，也可以暗示用户放弃了学习（如果一次都没有成功）。
DataFrame对象通过groupby函数根据某列”screen_progress”的取值将其分组得到一个GroupBy对象。然后利用groups.aggregate将DataFrameGroupBy对象中某个取值进行聚合。
下面的代码：我们将每个screen_progress对应的成功的attempt除以attempt的总数，就可以知道该用户在这个任务上的成功率，然后可视化所有的用户的成功率分布。

import numpy as np
import matplotlib.pyplot as plt

# Split the data into groups
groups = attempt_frame.groupby("screen_progress")

ratios = []
# Compute ratios for each group
# Loop over each group, and compute the ratio.
for name, group in groups:
    # The ratio we want is the number of correct attempts divided by the total number of attempts.
    # Taking the mean of the correct column will do this.
    # If you take the sum or mean of a boolean column, True values will become 1, and False values 0.
    ratio = np.mean(group["correct"])

    # Add the ratio to the ratios list.
    ratios.append(ratio)
''' ratios list (<class 'list'>) [1.0, 1.0, 1.0, 1.0, '''
# This code does the same thing as the segment above, but it's simpler.
# We aggregate across each group using the np.mean function.
# This takes the mean of every column in each group, then makes a dataframe with all the means.
# We only care about correctness, so we only select the correct column at the end.
easier_ratios = groups.aggregate(np.mean)["correct"]
''' easier_ratios Series (<class 'pandas.core.series.Series'>) screen_progress 231467 1 231470 1 231474 1 231476 1 '''
# We can plot a histogram of the easier_ratios series.
# The kind argument specifies that we want a histogram.
# Histograms show how values are distributed -- in this case, 900 of the screens have only 1 (correct) attempt.
# Many more appear to have had two attempts (a .5 ratio).
easier_ratios.plot(kind="hist")
plt.show()
counts = groups.aggregate(len)["correct"]
counts.plot(kind="hist")
plt.show()

观察下图，成功率为1的表示用户第一次尝试就成功了，并且这个比例占据最多，表示大部分任务还是较容易的，用户第一次通过了。第二个图显示了用户完成一个屏幕内容尝试的次数在10次以内。少数要超过10，表明用户超过10次完成不了后可能会选择放弃这个任务。

Who Gives Up?

我们可以根据上面的信息探索谁放弃了继续学习，比如成功率为0表示一次都没有成功。我们可以适当降低这个任务的难度或者给他一点提示帮助他度过这个难关继续学习。
因此我们需要获知这个用户要放弃之前所做的事，就是这个用户在最后一次尝试后放弃之前他做了那些事情？我们可以建立一个模型，识别出这种规律，在捕捉到用户快要放弃的时，我们可以及时的给出帮助。
我们可以通过attempts分组后计算成功率为0的用户来找到放弃的用户，但是这样比较复杂。然而progress中有个属性complete记录了一个用户是否完成一个屏幕信息，我们可以直接获取这个信息来判断该用户是否放弃。的没有如果complete的那些记录，然后将与之相连的attempts提取出来。gave_up_ids 存储的是那些放弃了的process的pk值。可以通过pk值与attempt中的screen_progress 相连。来获取在用户放弃时他做了多少尝试。

gave_up = progress_frame[progress_frame["complete"] == False]
gave_up_ids = gave_up["pk"]

Graphing Attempt Counts

现在获取那些放弃学习的用户的attempt数据，pandas中有一个isin函数返回布尔型Series，其中screen_progress在(gave_up_ids)中对应True。其中groups.aggregate(len)计算的是每组（screen_progress）的个数，其实后面groups.aggregate(len)[“correct”]还是groups.aggregate(len)[“code”]都是一样的，因为这只是计算这组数据的长度：

gave_up_boolean = attempt_frame["screen_progress"].isin(gave_up_ids)
'''
gave_up_boolean
Series (<class 'pandas.core.series.Series'>)
0     False
1     False
2     False
'''
# 所有的用户放弃前所作的尝试
gave_up_attempts = attempt_frame[gave_up_boolean] # 按照screen_progress（用户screen对）分组得到每个用户尝试情况
groups = gave_up_attempts.groupby("screen_progress") # 计算每个用户尝试的次数 counts = groups.aggregate(len)["correct"] counts.plot(kind="hist") plt.show()

Attempt Count Differential

可以发现大部分人进行了一次尝试失败后就放弃了，当然有些长尾数据，有个人尝试了15次才放弃了。现在看看没有放弃的那些人普遍提交了多少次：

gave_up = attempt_frame[attempt_frame["screen_progress"].isin(gave_up_ids)]
groups = gave_up.groupby("screen_progress")
counts = groups.aggregate(len)["correct"]

# We can use the .mean() method on series to compute the mean of all the values.
# This is how many attempts, on average, people who gave up made.
print(counts.mean())

# We can filter our attempts data to find who didn't give up (people that got the right answer).
# To do this, we use the ~ operator.
# It negates a boolean, and swaps True and False.
# This filters for all rows that aren't in gave_up_ids.
eventually_correct = attempt_frame[~attempt_frame["screen_progress"].isin(gave_up_ids)]
groups = eventually_correct.groupby("screen_progress")
counts = groups.aggregate(len)["correct"]
print(counts.mean())
''' 2.89473684211 2.4858044164 '''

从结果中发现放弃的人提交的平均次数要大于没有放弃的人提交的平均次数。

Another Data Store

为了更好的帮助那些放弃的用户，我们需要获取更细粒度的数据。有些数据比如用户播放一个video或者点击一个按钮这种信息不会被存储在数据库中，这些数据会被存储在一个特殊的分析数据库，这些是通过网站的前端收集到的。我们挑选了其中一些信息进行分析：

started-mission – a mission is started by a student
started-screen – a screen in a mission is started
show-hint – a click on the “hint” button
run-code – a click on the “run” button
reset-code – a click on the “reset code” button
next-screen – a click on the “next” button
get-answer – a click on the “show answer” button

以上这些信息被存储为一个session，一个session代表一个用户在一段时间内（开始进入dataquest学习，做任务，离开）所采取的一些点击行为（一个点击行为就是一个事件event）。每个session包含多个event字典，而sessions以list的形式存储每个session。我们随机抽样了200个用户session数据进行分析。

''' sessions list (<class 'list'>) [[{'event_type': 'started-mission', 'keen': {'created_at': '2015-06-12T23:09:03.966Z', 'id': '557b668fd2eaaa2e7c5e916b', 'timestamp': '2015-06-12T23:09:07.971Z'}, 'sequence': 1}, {'event_type': 'started-screen', 'keen': {'created_at': '2015-06-12T23:09:03.979Z', 'id': '557b668f90e4bd26c10b6ed6', 'timestamp': '2015-06-
    ...
'''

# We have 200 sessions
print(len(sessions))
'''
200
'''

# The first session has 38 student events
print(len(sessions[0]))
'''
38
'''

# Here's the third event from the first user session -- it's a started-screen event
print(sessions[0][3])
'''
{'event_type': 'started-screen', 'mission': 1, 'type': 'code', 'sequence': 2, 'keen': {'timestamp': '2015-06-12T23:09:28.589Z', 'id': '557b66a4672e6c40cd9249f7', 'created_at': '2015-06-12T23:09:24.688Z'}}
'''

# We'll make a histogram of event counts per session
plt.hist([len(s) for s in sessions])
plt.show()

Event Structure

下面是event的数据结构：

event_type – the type of event – there’s a list of event types in the last screen.

created_at – when the event occured – in the keen dictionary.

id – the unique id of the event – in the keen dictionary.

sequence – this field varies by event type – for started-mission events, it’s the mission that was started. For all
other events, it’s the screen that the event occured on. Each mission
consists of multiple screens.

mission – If the event occurs on a screen, then this is the mission the event occurs in.

type – if the event occurs on a screen, the type of screen (code, video, or text).

为了将数据整理为DataFrame，首先需要将其转换为字典列表，所以需要将键都调整为统一水平，并且添加了一个新的键session_id，因为每个session有多个event，因此通过session_id将这些event联系起来。

# Where we'll put the events after we "flatten" them
flat_events = []

# If we're going to combine everything in one dataframe, we need to keep 
# track of a session id for each session, so we can link events across sessions.
session_id = 1
# Loop through each session.
for session in sessions:
    # Loop through each event in each session.
    for event in session:
        new_event = {
            "session_id": session_id,
            # We use .get() to get the fields that could be missing.
            # .get() will return a default null value if the key isn't found in the dictionary.
            # If we used regular indexing like event["mission"], we would get an
            # error if the key wasn't found.
            "mission": event.get("mission"),
            "type": event.get("type"),
            "sequence": event.get("sequence")
        }

        new_event["id"] = event["keen"]["id"]
        new_event["created_at"] = event["keen"]["created_at"]
        new_event["event_type"] = event["event_type"]
        flat_events.append(new_event)

    # Increment the session id so each session has a unique id.
    session_id += 1

Convert To Dataframe

event_frame = pd.DataFrame(flat_events)

Exploring The Session Data

现在可以进行event数据的分析，比如我们可以分析用户在一个session中最常做的event是什么？一个session结束表示用户在这个平台的学习结束了，这里面肯定有很好的模式值得我们去学习。这与之前的用户的放弃行为有关系，那些放弃学习的用户的学习过程也肯定有一个特殊的模式。所以首先需要将event按照created_at属性进行升序排列，因为事件是先后发生的，我们需要在时间序列上观察行为的变迁，然后按照session_id进行分组，单独观察每个用户的行为序列。对于每个session中的最后的event就是结束的event。

# Sort event_frame in ascending order of created_at.
event_frame = event_frame.sort(["created_at"], ascending=[1])

# Group events by session
groups = event_frame.groupby("session_id")

# ending_events 存储每个session的最后结束的event类型，是个series对象，一行数据，只有event_type这个数据
ending_events = []
for name, group in groups:
    # The .tail() method will get the last few events from a dataframe.
    # The number you pass in controls how many events it will take from the end.
    # Passing in 1 ensures that it only takes the last one.
    last_event = group["event_type"].tail(1)
    ''' last_event Series (<class 'pandas.core.series.Series'>) 7446 started-screen Name: event_type, dtype: object '''
    ending_events.append(last_event)

# The concat method will combine a list of series into a dataframe.
ending_events = pd.concat(ending_events)
ending_event_counts = ending_events.value_counts()
ending_event_counts.plot(kind="bar")
plt.show()

可以发现用户离开dataquest这个平台最后做的一件事通常是started-screen。

Most Common Events

我们还可以每个事件发生的次数：

event_counts = event_frame["event_type"].value_counts()
event_counts.plot(kind="bar")
plt.show()

Discussion

最常见的event和用户离开平台前的event有一个最主要的区别：绝大多数人在离开平台前都会触发started-screen event事件，要远远高于平均水平。主要原因分析如下：

当人们打开一个screen，看了一眼觉得太难了然后离开这个学习平台。

或者他们打开了一个screen，但是这个任务打开的时间太长（网速不行还是网站太卡等等），使得他们离开了这个网页。我们需要与用户交谈，来确定到底是什么原因导致他们离开，然后采取一些措施，提高用户学习的时间。

我们也可以看看哪个任务或者哪个屏幕用户在上面那个放弃了，这可以使我们意识到这个屏幕的内容或许太难或者太简单，然后做出相应的调整。

Mission Numbers

我们想看看哪个mission上面的event最多，很显然，最开始mission有更多的观众。

event_counts = event_frame["mission"].value_counts()
event_counts.plot(kind="bar")
plt.show()

Explore!

mission中有字符型数据和数值型数据，所以上面那个条形图是对的。

count = event_frame["mission"].unique()
''' ndarray (<class 'numpy.ndarray'>) array([None, 5, '5', '3', 3, 2, 7, '2', 6, '6', 1, '1', '9', 9, 4, '4', '7', '8', 8, '33', 51, '51'], dtype=object) '''

我们可以从数据中探索下面这些有趣的问题：

基于一个用户当前的sequence是否能预测他下一步要采取的动作

是否某些events经常出现在某些missions

能否评估mission的困难度

其他的数据怎么收集

你可能感兴趣的:(Dataquest用户数据分析)

飞轮科技荣获中国电信星海大数据最佳合作伙伴奖！
近日，由中国电信集团数据发展中心主办的数据要素合作论坛在广州召开。大会以“数聚共生·智启未来”为主题，旨在展示数据要素应用成果，探索数据要素创新实践。与会期间，为了感谢2024年生态合作伙伴对中国电信数据业务发展工作的支持，会议举行了“星海大数据·最佳合作伙伴奖”颁奖仪式。飞轮科技凭借其在数据分析领域的卓越表现与深厚实力，获得这一殊荣。作为中国电信的长期合作伙伴，飞轮科技持续致力于为中国电信提供先
Python语言的编程范式 AI向前看包罗万象 golang 开发语言后端
Python语言的编程范式Python是一种广泛使用的高级编程语言，它因其简单易读的语法和强大的功能而受到程序员的喜爱。自1991年由荷兰人GuidolvanRossum首次发布以来，Python的发展迅速，其应用范围涵盖了Web开发、数据分析、人工智能、科学计算、自动化等多个领域。本文将深入探讨Python的编程范式，帮助读者更好地理解该语言的特性和优势。1.什么是编程范式编程范式是对程序设计风
云原生周刊：K8s 生产环境架构设计及成本分析 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
开源项目推荐KubeZoneNetKubeZoneNet旨在帮助监控和优化Kubernetes集群中的跨可用区（Cross-Zone）网络流量。这个项目提供了一种简便的方式来跟踪和分析Kubernetes集群中跨不同可用区的通信，帮助用户优化集群的网络架构、提高资源利用效率并减少网络延迟。通过实时监控和数据分析，KubeZoneNet能有效地识别跨可用区的网络瓶颈，并提供改进建议，以支持Kuber
多查询分析中的并发处理实践 FADxafs python
在进行查询分析时，某些技术可能会生成多个查询。在这种情况下，我们需要记得执行所有查询并合并结果。本文将通过一个简单的示例（使用模拟数据）展示如何实现这一点。技术背景介绍在数据分析和信息检索领域，查询分析技术能够帮助我们生成和优化查询以提高搜索效率。然而，当同时生成多个查询时，处理这些查询并有效地合并结果就显得尤为重要。本次我们将使用langchain库来演示如何处理多查询情况。核心原理解析通过生成
PHP语言的编程范式代码驿站520 包罗万象 golang 开发语言后端
PHP语言的编程范式引言PHP（PHP:HypertextPreprocessor）是一种广泛使用的开源脚本语言，特别适合于Web开发。虽然最初被设计用于生成动态网页，但随着技术的发展，PHP已逐渐演化为一种功能强大的编程语言，广泛应用于服务器端编程、命令行脚本以及桌面应用程序的开发。目前，PHP的应用范围涵盖了网站开发、数据分析、内容管理系统等多个领域。本文将深入探讨PHP语言的编程范式，包括面
设计模式-解释器模式夏旭泽设计模式解释器模式
背景四则运算问题：先输入表达式的形式如a+b+c-d，然后分别输入变量的值，最后输出结果。传统模式：编写一个方法，接收表达式的形式，分析表达式，再根据分析结果执行相关操作。问题：不利于拓展，耦合性高，（如果想要加入乘法运算需要修改很多地方）基本介绍给定一个语言（表达式），定义他的文法的一种表示，并定义解释器，使用解释器解释语言。最常见的例子：编译器四个角色①context：是环境角色，含有解释器之
【2025】拥抱未来砥砺前行摔跤猫子其他年终总结拥抱未来砥砺前行深度思考
2024是怎样的一年2024在历史画卷上是波澜壮阔的一年，人工智能的浪潮来临，涌现出无数国产大模型。22年11月ChatGPT发布，它的出现如同在平静湖面上投下一颗巨石，激起了层层波澜，短短五天用户数就达到了100万，让整个世界为之侧目的同时也掀起了一场AI技术竞赛的浪潮。面对大模型这一蓝海，各方力量都试图搭上这趟时代的列车，争先恐后的相继开启布局。公司大模型名称发布时间澜舟科技孟子GPTV120
Python气象数据分析：风速预报订正、台风预报数据智能订正、机器学习预测风电场的风功率、浅水模型、预测ENSO等小艳加油大气科学 python 人工智能气象机器学习
目录专题一Python和科学计算基础专题二机器学习和深度学习基础理论和实操专题三气象领域中的机器学习应用实例专题四气象领域中的深度学习应用实例更多应用Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Py
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点岑童嵘
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点【下载地址】泰坦尼克号生存分类数据集本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件：训练集和测试集。数据集主要用于训练和评估机器学习模型，以预测泰坦尼克号乘客的生存情况项目地址:https://gitcode.com/open-source-toolkit/35561项目介绍泰坦尼克号生存分类数
【Python】Tkinter电器销售有限公司销售数据分析（源码）【独一无二】不争不抢不显不露 python 数据分析开发语言
一、设计要求该项目创建一个数据分析软件，利用Tkinter和Matplotlib构建图形用户界面（GUI），读取和分析美迪电器销售有限公司销售数据。用户可以通过界面选择月份查看数据详情、生成销量图表并计算月总销量和年总销量。二、设计思路2.模块引入首先引入了所需的模块，包括Tkinter（用于GUI创建和管理）、ttk（Tkinter主题化控件）、messagebox（用于弹出消息框）、panda
MDX语言的数据类型 BinaryBardC 包罗万象 golang 开发语言后端
MDX语言的数据类型详解引言MDX（多维表达式）是一种用于查询和操作多维数据集的查询语言，广泛用于数据分析和商业智能领域。MDX语言的设计旨在帮助用户高效地从多维数据库（如MicrosoftSQLServerAnalysisServices）中提取和分析数据。随着数据量的不断增加和数据结构的日益复杂，MDX提供了一种强大的方式来处理和分析这些多维数据。在MDX中，数据类型是理解和使用该语言的基础，
R语言的软件工程 BinaryBardC 包罗万象 golang 开发语言后端
R语言的软件工程1.引言随着数据科学的快速发展，R语言作为一种统计计算和图形绘制的编程语言，其在数据分析、可视化以及机器学习等领域的应用日益广泛。尽管R语言在数据处理上有其独特的优势，但要将其运用于大型项目和商业应用中，就需要遵循软件工程的原则。本篇文章将探讨R语言在软件工程中的应用，主要涵盖软件开发生命周期、代码规范、版本控制、测试和文档等方面。2.软件开发生命周期软件开发生命周期（SDLC）是
StarRocks Awards 2024 年度贡献人物开源
在过去一年，StarRocks在Lakehouse与AI等关键领域取得了显著进步，其卓越的产品功能极大地简化和提升了数据分析的效率，使得"OneData，AllAnalytics"的愿景变得更加触手可及。虽然实现这一目标的道路充满挑战且漫长，但我们并不孤单，因为有一群社区伙伴与我们并肩作战。每一位贡献者的代码提交和每一次的布道，都在推动着StarRocks社区向前发展。为了表达对这些贡献者的深深感
TikTok跨境电商应该怎么做？几大关键策略在这菠萝派爱跨境网络物联网大数据服务器
根据最新数据显示，TikTok的用户数量在全球范围内迅速增长，尤其是在欧美、东南亚等地区，平台的用户粘性非常高，这使得TikTok成为了品牌、商家甚至独立卖家进行跨境电商业务的理想平台。然而，如何利用TikTok实现跨境电商的成功并非易事。本文将从市场分析、平台策略、运营方法等多方面分析，帮助商家做好TikTok跨境。一、TikTok跨境电商的市场潜力分析1.TikTok全球用户增长TikTok在
基于mybatis-plus实现的多租户架构叔叔很忙 java spring
整体概述多租户技术或称多重租赁技术，简称SaaS，是一种软件架构技术，是实现如何在多用户环境下（多用户一般是面向企业用户）共用相同的系统或程序组件，并且可确保各用户间数据的隔离性。多租户在数据存储上主要存在三种方案，独立数据库、共享数据库，独立Schema、共享数据库，共享Schema，共享数据表。独立数据库即一个租户一个数据库，这种方案的用户数据隔离级别最高，安全性最好，但成本较高。优点：为不同
后端学习1.4： Mybatis-plus配置多租户 Congee_porridge 后端开发学习 mybatis java spring boot 后端
功能要求Mybatis-plus配置多租户。从header中的token获取租户信息；所有userController的数据库操作*不要*配置多租户，所有工作计划相关的数据库操作*需要*配置多租户，达成数据隔离。开发工具：IDEA技术：Springboot+MabtisPlus+Postman1、什么是多租户？多租户技术（多重租赁技术，简称saas），是一种软件架构技术；可以实现同一套程序下用户数
Linux 如何使用parted进行磁盘分区？ linux
简介Linux中的parted命令是一个用于创建、修改和管理磁盘分区的多功能工具。它支持传统的MBR（MasterBootRecord：主引导记录）和现代的GPT（GUIDPartitionTable：GUID分区表）分区方案。磁盘分区的主要原因最佳性能：正确管理分区可以提高系统的速度和响应性。例如，将操作系统文件从用户数据中分离出来，或者将频繁访问的数据放在磁盘上更快的部分上，都可以提高性能。数
StarRocks on AWS Graviton3，实现 50% 以上性价比提升大数据数据库数据湖云计算云服务
在数据时代，企业拥有前所未有的大量数据资产，但如何从海量数据中发掘价值成为挑战。数据分析凭借强大的分析能力，可从不同维度挖掘数据中蕴含的见解和规律，为企业战略决策提供依据。数据分析在营销、风险管控、产品优化等领域发挥着关键作用,帮助企业提高运营效率、优化业务流程、发现新商机、增强竞争力。低成本高效率的完成对海量数据的分析，及时准确的释放数据价值，已成为企业赢得竞争优势的利器。StarRockson
对于编程零基础，第一个语言是 Python 的人有什么建议？ cda2024 python 开发语言
在当今数字化时代，编程已成为一项必备技能。无论你是想成为一名专业的软件开发人员，还是希望在数据分析、人工智能等领域有所建树，掌握一门编程语言都是至关重要的第一步。对于许多初学者来说，Python是一个理想的选择。它不仅语法简洁易懂，而且拥有强大的社区支持和丰富的库资源。那么，对于编程零基础且选择Python作为第一门语言的人，有哪些实用的建议呢？1.建立正确的学习心态1.1持之以恒学习编程并不是一
Pinterest联盟营销综合指南好运来__ 大数据网络人工智能服务器 ip
Pinterest不仅是社交媒体平台，还是一个优质的视觉搜索引擎，独特的交互方式和平台生态使得Pinterest依然很受欢迎，因此它也成为最适合进行联盟营销的平台之一。一、为什么要使用Pinterest联盟营销1.活跃用户多Pinterest活跃用户数超过5亿，庞大的用户基础在一定程度上意味着更高的购买潜力。2.用户质量高根据PAConsulting和Pinterest的数据，奢侈品牌最关注的消费
chatgpt赋能python：用Python安装Jupyter：让数据科学变得更加高效！ aijinglingchat ChatGpt python chatgpt jupyter 计算机
用Python安装Jupyter：让数据科学变得更加高效！对于数据科学家而言，jupyter是不可或缺的工具之一。它是一个基于web的交互式计算环境，可以帮助我们在Python中以一种轻松、方便、可交互的方式进行编程和数据分析。今天，我们将向您介绍在Python中如何安装jupyter。安装Python要安装jupyter，首先需要安装Python。如果您已经安装了Python，请跳到下一步。您可
Kylin入门教程 -龙川- 介绍学习笔记 kylin
引言ApacheKylin是一个开源的分布式分析引擎，提供Hadoop上的多维分析（OLAP）能力，使得超大规模数据集的实时查询和分析成为可能。它通过预计算数据立方体来加速查询，使得复杂查询可以在亚秒级响应。本文将详细介绍Kylin的基本概念、安装与配置、基本操作及高级功能，帮助你全面掌握这款强大的数据分析工具。第一部分：Kylin简介1.1什么是Kylin？Kylin是由eBay开发并捐赠给Ap
Pinterest联盟营销综合指南纯干苹果派人工智能网络物联网大数据服务器 ip
Pinterest不仅是社交媒体平台，还是一个优质的视觉搜索引擎，独特的交互方式和平台生态使得Pinterest依然很受欢迎，因此它也成为最适合进行联盟营销的平台之一。一、为什么要使用Pinterest联盟营销1.活跃用户多Pinterest活跃用户数超过5亿，庞大的用户基础在一定程度上意味着更高的购买潜力。2.用户质量高根据PAConsulting和Pinterest的数据，奢侈品牌最关注的消费
实战指南：使用Wireshark捕获并解密HTTPS数据包 md_1008 wireshark https 测试工具
在网络安全和数据分析领域，捕获和分析网络数据包是理解网络行为、诊断问题和进行安全审计的重要手段。HTTPS（HyperTextTransferProtocolSecure）作为现代Web通信的主要协议，通过SSL/TLS加密确保了数据的安全传输。然而，在某些情况下，如网络调试、安全测试或故障排除时，我们可能需要解密HTTPS数据包以查看其详细内容。本文将提供一份实战指南，教你如何使用Wiresha
AI赋能人力资源：效率提升新路径前端
引言人工智能(AI)正以前所未有的速度改变着各行各业，从自动驾驶到医疗诊断，AI的应用日益广泛。而人力资源领域，作为企业运营的核心环节，也正经历着AI带来的深刻变革。传统的人力资源管理面临诸多挑战，例如招聘效率低、候选人筛选精准度不足、员工培训成本高昂以及数据分析能力有限等。这些问题不仅影响企业的招聘速度和效率，也制约了企业的发展。为了应对这些挑战，越来越多的企业开始探索AI技术在人力资源领域的应
云原生周刊：K8s 生产环境架构设计及成本分析云计算
开源项目推荐KubeZoneNetKubeZoneNet旨在帮助监控和优化Kubernetes集群中的跨可用区（Cross-Zone）网络流量。这个项目提供了一种简便的方式来跟踪和分析Kubernetes集群中跨不同可用区的通信，帮助用户优化集群的网络架构、提高资源利用效率并减少网络延迟。通过实时监控和数据分析，KubeZoneNet能有效地识别跨可用区的网络瓶颈，并提供改进建议，以支持Kuber
【一点分享】Python数据分析（1）：Jupyterlab搭建，练习Python和Sql的神器。或许能用上 Python python sql mysql
在之前Mysql专栏分享过程中，一直用的Sequel客户端进行sql编写和说明注解，及时执行的结果不能保存，得写一条sql截图一次，麻烦。而Jupyterlab就可以很好解决这个问题，代码过程与执行结果都会相邻挨着保留，随时可以查看，导出或截图都非常方便。而且，Jupyterlab还天然支持Python环境，学Python甚是方便，单步执行和结果就是亮点。其他的shell等各种语言环境也可以安装插
融云 IM 干货丨如果云存储数据被泄露，用户应该怎么办？融云即时通讯
云存储数据泄露后的应对措施云存储数据泄露是一个严重的问题，需要迅速采取一系列措施来减少损失并防止进一步的数据泄露。以下是一些关键的应对措施：1.确认泄露情况立即调查：一旦怀疑数据泄露，应立即进行调查，确认泄露的范围和性质。了解哪些数据被泄露，泄露的途径是什么，以及可能的受影响用户。2.通知相关方通知用户：如果用户数据受到影响，应尽快通知用户，告知他们数据泄露的情况，并提供必要的补救措施。通知执法机
如何抓取社交媒体上的公开用户信息：完整的Python爬虫教程与实战 Python爬虫项目媒体 python 爬虫 selenium 开发语言 ajax
引言社交媒体平台如Twitter、Instagram、Facebook和LinkedIn等，成为了现代社会中获取信息、表达观点、社交互动的主要场所。通过社交媒体，用户分享个人信息、兴趣、活动以及与他人的互动数据，极大地丰富了网络世界的内容。在数据分析、市场研究、舆情监控等领域，抓取社交媒体上的公开用户信息是非常重要的任务。对于很多数据科学家、市场分析师、爬虫开发者来说，如何高效地抓取社交媒体平台的
基于Python的股市数据爬取与分析：从实时行情到历史数据的完整教程 Python爬虫项目 2025年爬虫实战项目 python 数据挖掘开发语言爬虫 oracle 人工智能
引言股市投资是一项具有高度风险和回报的活动，实时行情和历史数据的获取是股市分析和决策的基础。随着数据科学和爬虫技术的迅速发展，许多投资者和分析师通过编写Python爬虫来获取股市数据，进行数据分析、技术分析和预测。无论是获取实时股市行情，还是分析股票的历史数据，Python都能为我们提供强大的工具支持。本篇博客将为你提供一个完整的股市数据爬取与分析教程，介绍如何利用Python爬虫获取实时股市行情
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc