Xin学数据

GPT3.5 改用 GPT4 价格翻了30倍如何破局？ GPT 对话成本推演

场景介绍

假设你搭建了一个平台，提供 ChatGPT 3.5 的聊天服务。目前已经有一批用户的使用数据，想要测算一下如果更换 GPT 4.0 服务需要多少成本？

方案阐述

如果是全切，最简单粗暴的方案就是根据提供 ChatGPT 3.5 消费的金额乘以一个倍数，这个倍数是 GPT 4 的单格/ChatGPT 3.5 的单价，不过由于输入价和输出价有差异，所以会有一定误差，但不影响全量切换的大致判断。

如果要求更精确一些，就需要根据每一次问答的输入 Token 数和输出 Token 数，分别求和，计算有多少 k Tokens，然后算一个占比，看看各自的消费占比，分别乘以输入和输出的价格倍数。

以上是直接接官方的情况，但是更多时候，可能是通过第三方服务，第三方的价格不是根据官方定价，会有出入，需要结合第三方价格具体分析。

由于 GPT 4.0 相对高昂的价格，一般需要做限制，比如：限制访问频率、限制整体用量等。
举个例子，限制每分钟不超过 3 次，每 3 小时不超过 50 次；每天 10 次，每月 100次、200 次等。
这时候就需要精确一些的计算，通过指定的算法，测算切换 GPT 4.0 的成本是多少。

本次用于示例计算的单价为：

Model	Input	Output
gpt-4	$0.03 / 1K tokens	$0.06 / 1K tokens
gpt-3.5-turbo-1106	$0.0010 / 1K tokens	$0.0020 / 1K tokens

本次拿两个限制做案例开展：

案例1：限制每天 10 次
案例2：限制每分钟不超过 3 次，每 3 小时不超过 50 次

创建测试数据

本次测试借助数据库 MySQL 来实现这些复杂的算法。
首先在本地创建数据库testdb。

create database if not exists testdb;

创建表chat_logs，并给四个字段都加上索引，提高查询效率：

create table if not exists testdb.chat_logs(
	user_id					bigint	comment '用户ID'
  ,request_time		bigint	comment '请求时间'
  ,prompt_tokens	bigint	comment '提示词的 Tokens，input Tokens'
  ,output_tokens	bigint	comment '回答的 Tokens，output Tokens'
  ,index userid_idx(user_id)
  ,index reqtime_idx(request_time)
  ,index prompt_idx(prompt_tokens)
  ,index output_idx(output_tokens)
) comment 'GPT对话记录';

插入数据，本次demo 数据量 100 条。

由于数据较长，不便展示，另外上传到资源，可前往免费下载：GPT 对话成本推演-数据demo

插入数据方法

方法1：复制代码，接着上面步骤粘贴代码，回车即可执行
方法2：直接执行文件，假设文件路径为：D:\insert_into_table.sql，则执行命令如下：

SOURCE D:\insert_into_table.sql;

案例1：限制每天 10 次（总量限制）

该逻辑实现比较简单，按天聚合，然后排序计算不超过 10 有多少 Tokens，大于 10 次又有多少 Tokens，然后再分别乘以单价，计算得出限制后的成本。

使用 SQL 实现

查看每天限制 10 次 GPT 4.0，超过部分按 GPT 3.5 计算，需要先将请求的数据按天进行排序，然后计算不超过 10 的部分和大于 10 的分别的 Tokens 分别是多少。

格式化时间，将request_time转为request_date

-- 格式化时间
select user_id,from_unixtime(request_time,'%Y-%m-%d') request_date,request_time,prompt_tokens,output_tokens
from testdb.chat_logs

按天编号

with chat_logs_format as(
  -- 格式化时间
  select user_id,from_unixtime(request_time,'%Y-%m-%d') request_date,request_time,prompt_tokens,output_tokens
  from testdb.chat_logs
)
-- 对话排序
select *,row_number()over(partition by user_id,request_date order by request_time) req_sort
from chat_logs_format

分类求 Tokens 数，编号req_sort不超过 10 次的分为GPT4，其他分为GPT3.5。

with chat_logs_format as(
  -- 格式化时间
  select user_id,from_unixtime(request_time,'%Y-%m-%d') request_date,request_time,prompt_tokens,output_tokens
  from testdb.chat_logs
)
,chat_sort as(
  -- 对话排序
  select user_id,request_date,prompt_tokens,output_tokens
  		,row_number()over(partition by user_id,request_date order by request_time) req_sort
  from chat_logs_format
)
-- 分类求 Tokens 数
select if(req_sort<=10,'GPT4','GPT3.5') mark_model
  ,sum(prompt_tokens)/1000 k_prompt_tokens
  ,sum(output_tokens)/1000 k_output_tokens
from chat_sort
group by mark_model

根据 Tokens 计算成本。

with chat_logs_format as(
  -- 格式化时间
  select user_id,from_unixtime(request_time,'%Y-%m-%d') request_date,request_time,prompt_tokens,output_tokens
  from testdb.chat_logs
)
,chat_sort as(
  -- 对话排序
  select user_id,request_date,prompt_tokens,output_tokens
  		,row_number()over(partition by user_id,request_date order by request_time) req_sort
  from chat_logs_format
)
,k_tokens as(
  -- 分类求 Tokens 数
  select if(req_sort<=10,'GPT4','GPT3.5') mark_model
  	,sum(prompt_tokens)/1000 k_input_tokens
    ,sum(output_tokens)/1000 k_output_tokens
  from chat_sort
  group by mark_model
)
-- gpt-4：input 0.03，output 0.06
-- gpt-3：input 0.0010，output 0.0020
select sum(0.0010*k_input_tokens+0.0020*k_output_tokens) "调整前成本"
	,sum(if(mark_model='GPT4',0.03,0.0010)*k_input_tokens+if(mark_model='GPT4',0.06,0.0020)*k_output_tokens) "调整后成本"
from k_tokens

调整前后成本相差还是挺大的，调整后成本是调整前的 12.5 倍。实际情况可以拿更多的数据，比如说一周、一个月，进行测算。

使用 Python 实现

使用 Python 实现比 SQL 实现多加了一步：读取数据，并转化为数组。之后的逻辑也是大同小异：时间格式化->记录排序、编号->分类求 Token->计算成本。

读取数据表，使用sql读取数据库数据，并使用 Pandas 转为 DataFrame。

import pandas as pd
from sqlalchemy import create_engine
def get_datas(sql):
    # 连接数据库
    # engine = create_engine("mysql+pymysql://用户名:密码@主机地址:端口号/数据库名")
    connect_info = 'mysql+pymysql://{}:{}@{}:{}/{}?charset=utf8'\
    .format("root", "123123", "127.1.1.0", "3306","testdb")
    engine = create_engine(connect_info)
    # 执行SQL语句
    prox = engine.execute(sql)
    df = pd.DataFrame(list(prox),columns=prox.keys())
    return df
sql = 'select * from testdb.chat_logs'
df = get_datas(sql)

将时间戳格式化

#将 request_time 转为日期格式
df['request_date'] = pd.to_datetime(df.request_time,unit='s').dt.date

排序编号

df['req_sort'] = df.groupby(['user_id','request_date'])['request_time'].rank(ascending=True,method='first')

分类，编号req_sort不超过 10 次的分为GPT4，其他分为GPT3.5。

df['mark_model'] = df.req_sort.apply(lambda x:'GPT4' if x<=10 else 'GPT3.5')

求和，并转化为 k Token 单位

df_1 = df.groupby(['mark_model'])['prompt_tokens','output_tokens'].sum().reset_index()
df_1['k_input_tokens'] = df_1.prompt_tokens/1000
df_1['k_output_tokens'] = df_1.output_tokens/1000
df_1[['mark_model','k_input_tokens','k_output_tokens']]

计算成本

-- gpt-4：input 0.03，output 0.06
-- gpt-3：input 0.0010，output 0.0020
input_price_4 = 0.03
input_price_3 = 0.0010
output_price_4 = 0.06
output_price_3 = 0.0020
df_1['调整前成本'] = df_1[['mark_model','k_input_tokens','k_output_tokens']].apply(lambda x:x[1]*input_price_3+x[2]*output_price_3,axis=1)
df_1['调整后成本'] = df_1[['mark_model','k_input_tokens','k_output_tokens']].apply(lambda x:x[1]*input_price_4+x[2]*output_price_4 if x[0]=='GPT4' else x[1]*input_price_3+x[2]*output_price_3,axis=1)
df_1[['调整前成本','调整后成本']].sum()

案例2：限制每分钟不超过 3 次，每 3 小时不超过 50 次（频率限制）

该逻辑实现比较复杂一些，本质上还是先切分，然后排序再进行统计 Tokens，再计算成本。
不同点在于，前面是按天切分，有天然的便捷方式，直接格式化即可，每天看做一个桶，分桶计算，而 1 分钟和 3 小时需要自行构建相关的计算桶，不能一步到位。

过程算法其实也有多种：
比如说按自然分钟计算，每分钟为一个单位；按自然小时计算，0_2、35、6_8、911、12_14、1517、18_20、2123。
比如说拿一个初始的值做差值计算，然后在这个基础上分割，这个会受到初始值的影响，不过如果把初始值设置为某一天的零时零点零分，可以兼容上面一个算法，本次拿第二种来展开。

PS：实现第一种的方法：1分钟分桶：from_unixtime(request_time,’%Y-%m-%d %H:%i’)；3小时分桶（日期+小时）：from_unixtime(request_time,’%Y-%m-%d’)、floor(hour(from_unixtime(request_time)/3)

使用 SQL 实现

取最小时间，使用窗口函数来取值。如果是想设置固定的某个值，可以直接新增一个列。

-- 取最小的请求时间，
select user_id,request_time,prompt_tokens,output_tokens
	,min(request_time)over(partition by user_id) min_time
from chat_logs

求时间差值，使用request_time减去最小值。

-- 取时间差值
select user_id,request_time,prompt_tokens,output_tokens
  ,request_time-min(request_time)over(partition by user_id) minute_diff
from chat_logs

分桶，1 分钟则除以 60 秒，3 小时则除以 60603 秒，然后使用ceil()函数向上取值。

-- 分桶
select user_id,request_time,prompt_tokens,output_tokens
	,ceil((request_time-min(request_time)over(partition by user_id))/60) minute_bucket
  ,ceil((request_time-min(request_time)over(partition by user_id))/60/60/3) hour_bucket
from chat_logs

排序，根据用户和分桶字段进行分组，然后对request_time升序排序

with 
-- 分桶
cut_bucket as(
  select user_id,request_time,prompt_tokens,output_tokens
    ,ceil((request_time-min(request_time)over(partition by user_id))/60) minute_bucket
    ,ceil((request_time-min(request_time)over(partition by user_id))/60/60/3) hour_bucket
  from chat_logs
)
-- 排序
select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket
    ,row_number()over(partition by user_id,minute_bucket order by request_time) minute_bucket_sort
    ,row_number()over(partition by user_id,hour_bucket order by request_time) hour_bucket_sort
from cut_bucket

分类求和，将minute_bucket_sort<=3 and hour_bucket_sort<=50分为GPT4，其他的分为GPT3.5，然后聚合求 Tokens。

with
-- 分桶
cut_bucket as(
  select user_id,request_time,prompt_tokens,output_tokens,ceil((request_time-min(request_time)over(partition by user_id))/60) minute_bucket
    ,ceil((request_time-min(request_time)over(partition by user_id))/60/60/3) hour_bucket
  from chat_logs
)
-- 排序
,bucket_sort as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket
      ,row_number()over(partition by user_id,minute_bucket order by request_time) minute_bucket_sort
      ,row_number()over(partition by user_id,hour_bucket order by request_time) hour_bucket_sort
  from cut_bucket
)
-- 分类
,mark_models as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket,minute_bucket_sort,hour_bucket_sort
  	,(case when minute_bucket_sort<=3 and hour_bucket_sort<=50 then 'GPT4' else 'GPT3.5' end) mark_model
  from bucket_sort
)
-- 计算分钟<=3且3小时<=50
select mark_model
	,sum(prompt_tokens)/1000 k_input_tokens
  ,sum(output_tokens)/1000 k_output_tokens
from mark_models
group by mark_model

然后再计算成本，完事！
直接计算minute_bucket_sort<=3且hour_bucket_sort<=50就可以了？
不不不！这里有坑，先不聚合，查看明细数据看看，如下图第一个红框，它不符合 1 分钟 3 次上限的逻辑，所以被剔除了，标记为 GPT3.5。而第二个框，它不符合 3 小时 50 次上限的逻辑，所以也被剔除了。
不知道你是否意识到了问题，通过肉眼看，第二个框的 3 条记录应该是要被统计到 3 小时 50 次上限的逻辑的，因为前面因为 1 分钟的限制多剔除了 3 条记录。
所以在 3 小时的桶里面排序的时候，需要建立 1 分钟的桶的基础之上，先保证每一条记录都符合 1 分钟的逻辑，再针对这些记录拿 3 小时的逻辑加以限制。

修改 3 小时的分桶排序逻辑，要建立在 1 分钟的基础上才开始排序。
新增一个步骤，对 1 分钟的桶不超过 3 次的部分和大于 3 次的部分进行分类。然后对 3 小时的分桶排序则建在 1 分钟不超过 3 次的类别上。
代码实现上，将 1 分钟不超过 3 次和大于 3 次的分类（mark_target_record）加入 3 小时的分桶排序的分组（partition by）中，然后限制只取mark_target_record=1部分作为GPT4，参考修改逻辑如下：

with 
-- 分桶
cut_bucket as(
  select user_id,request_time,prompt_tokens,output_tokens,ceil((request_time-min(request_time)over(partition by user_id))/60) minute_bucket
    ,ceil((request_time-min(request_time)over(partition by user_id))/60/60/3) hour_bucket
  from chat_logs
)
-- 排序
,bucket_sort as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket
      ,row_number()over(partition by user_id,minute_bucket order by request_time) minute_bucket_sort
      ,row_number()over(partition by user_id,hour_bucket order by request_time) hour_bucket_sort
  from cut_bucket
)
-- 对分钟的排序数据进行分类
,mark_chatlog as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket,minute_bucket_sort,hour_bucket_sort
    ,(case when minute_bucket_sort<=3 then 1 else 0 end) mark_target_record
  from bucket_sort
)
-- 分钟 <= 3 且 3小时 <= 50 标记为 GPT4
,mark_models as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket,minute_bucket_sort,hour_bucket_sort,mark_target_record
    ,(case when mark_target_record=1 and row_number() over(partition by user_id,hour_bucket,mark_target_record order by request_time)<=50 then 'GPT4' else 'GPT3.5' end) mark_model
  from mark_chatlog
)
select *
from mark_models
order by user_id,request_time

修改为叠加的逻辑之后，效果如下：

计算 Token 数，根据分好的模型聚合求和即可。

with 
-- 分桶
cut_bucket as(
  select user_id,request_time,prompt_tokens,output_tokens,ceil((request_time-min(request_time)over(partition by user_id))/60) minute_bucket
    ,ceil((request_time-min(request_time)over(partition by user_id))/60/60/3) hour_bucket
  from chat_logs
)
-- 排序
,bucket_sort as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket
      ,row_number()over(partition by user_id,minute_bucket order by request_time) minute_bucket_sort
      ,row_number()over(partition by user_id,hour_bucket order by request_time) hour_bucket_sort
  from cut_bucket
)
-- 对分钟的排序数据进行分类
,mark_chatlog as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket,minute_bucket_sort,hour_bucket_sort
    ,(case when minute_bucket_sort<=3 then 1 else 0 end) mark_target_record
  from bucket_sort
)
-- 分钟 <= 3 且 3小时 <= 50 标记为 GPT4
,mark_models as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket,minute_bucket_sort,hour_bucket_sort,mark_target_record
    ,(case when mark_target_record=1 and row_number() over(partition by user_id,hour_bucket,mark_target_record order by request_time)<=50 then 'GPT4' else 'GPT3.5' end) mark_model
  from mark_chatlog
)
-- 聚合求 Tokens
select mark_model
	,sum(prompt_tokens)/1000 k_input_tokens
  ,sum(output_tokens)/1000 k_output_tokens
from mark_models
group by mark_model

统计结果如下：

计算调整前后成本：

with 
-- 分桶
cut_bucket as(
  select user_id,request_time,prompt_tokens,output_tokens,ceil((request_time-min(request_time)over(partition by user_id))/60) minute_bucket
    ,ceil((request_time-min(request_time)over(partition by user_id))/60/60/3) hour_bucket
  from chat_logs
)
-- 排序
,bucket_sort as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket
      ,row_number()over(partition by user_id,minute_bucket order by request_time) minute_bucket_sort
      ,row_number()over(partition by user_id,hour_bucket order by request_time) hour_bucket_sort
  from cut_bucket
)
-- 对分钟的排序数据进行分类
,mark_chatlog as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket,minute_bucket_sort,hour_bucket_sort
    ,(case when minute_bucket_sort<=3 then 1 else 0 end) mark_target_record
  from bucket_sort
)
-- 分钟 <= 3 且 3小时 <= 50 标记为 GPT4
,mark_models as(
  select user_id,request_time,prompt_tokens,output_tokens,minute_bucket,hour_bucket,minute_bucket_sort,hour_bucket_sort,mark_target_record
    ,(case when mark_target_record=1 and row_number() over(partition by user_id,hour_bucket,mark_target_record order by request_time)<=50 then 'GPT4' else 'GPT3.5' end) mark_model
  from mark_chatlog
)
-- 聚合求 Tokens
,k_tokens as(
  select mark_model,sum(prompt_tokens)/1000 k_input_tokens,sum(output_tokens)/1000 k_output_tokens
  from mark_models
  group by mark_model
)
-- gpt-4：input 0.03，output 0.06
-- gpt-3：input 0.0010，output 0.0020
select sum(0.0010*k_input_tokens+0.0020*k_output_tokens) "调整前成本"
	,sum(if(mark_model='GPT4',0.03,0.0010)*k_input_tokens+if(mark_model='GPT4',0.06,0.0020)*k_output_tokens) "调整后成本"
from k_tokens

统计结果如下：

调整前后成本相差 27 倍。

使用 Python 实现

同样，使用 Python 实现比 SQL 实现多加了一步：读取数据，并转化为数组。之后的逻辑也是大同小异：求最小时间->求时间差值->分桶->1分钟排序和分类->3 小时排序和最终分类->分类求 Token->计算成本。

读取数据表，使用sql读取数据库数据，并使用 Pandas 转为 DataFrame。

import pandas as pd
from sqlalchemy import create_engine
def get_datas(sql):
    # 连接数据库
    # engine = create_engine("mysql+pymysql://用户名:密码@主机地址:端口号/数据库名")
    connect_info = 'mysql+pymysql://{}:{}@{}:{}/{}?charset=utf8'\
    .format("root", "123123", "127.1.1.0", "3306","testdb")
    engine = create_engine(connect_info)
    # 执行SQL语句
    prox = engine.execute(sql)
    df = pd.DataFrame(list(prox),columns=prox.keys())
    return df
sql = 'select * from testdb.chat_logs'
df = get_datas(sql)

取最小请求时间，并合并到原来的数据框。

#取每个key的最小请求时间
df_mintime = df.groupby(['user_id'])['request_time'].min().reset_index()
#合并到原DataFrame
df = df.merge(df_mintime,on='user_id',how='left',suffixes=['','_min'])

将请求时间和最小请求时间求差值。

#将请求时间和最小请求时间求差值；  
df['diff_time'] = df.request_time-df.request_time_min

分桶，保持单位一致，即 1 分钟转为 60 秒，3 小时转为 60603 秒。
使用math.ceil()向上取整。

#根据差值进行分桶，两层：1 分钟 和 3 小时，都向上取整数； 
import math
df['minute_bucket'] = df.diff_time.apply(lambda x:math.ceil(x/60))
df['hour_bucket'] = df.diff_time.apply(lambda x:math.ceil(x/60/60/3))

对 1 分钟的桶排序和分类：不超过 3 次的为一类用 1 标识，其他的为另外一类，用 0 表示。

#对 1 分钟的桶和 user_id 分组，按请求时间排序； 
df['minute_bucket_sort'] = df.groupby(['user_id','minute_bucket'])['request_time'].rank(ascending=True,method='first')
#对 1 分钟不超过 3 次和大于 3 次的部分进行分组
df['mark_target_record'] = df.minute_bucket_sort.apply(lambda x:1 if x<=3 else 0)

3 小时的桶排序，根据用户、分桶和 1 分钟的分类进行分组，按请求时间排序。

#3小时的桶排序
df['hour_bucket_sort'] = df.groupby(['user_id','hour_bucket','mark_target_record'])['request_time'].rank(ascending=True,method='first')

最终分类：minute_bucket_sort<=3，且hour_bucket_sort<=50为 GPT4，其他为 GPT3.5。

#最终分类
df['mark_model']  = df[['minute_bucket_sort','hour_bucket_sort']].apply(lambda x:'GPT4' if x[0]<=3 and x[1]<=50 else 'GPT3.5',axis=1)

分类聚合求 Tokens

#按请求日期和模型聚合，统计Tokens 和价格
df_1 = df.groupby(['mark_model'])['prompt_tokens','output_tokens'].sum().reset_index()
df_1['k_input_tokens'] = df_1.prompt_tokens/1000
df_1['k_output_tokens'] = df_1.output_tokens/1000
df_1[['mark_model','k_input_tokens','k_output_tokens']]

结果如下，再除以 1000 就是上面 SQL 的结果。

求最终调整前后成本

#求调整前后成本
#gpt-4：input 0.03，output 0.06
#gpt-3：input 0.0010，output 0.0020
input_price_4 = 0.03
input_price_3 = 0.0010
output_price_4 = 0.06
output_price_3 = 0.0020
df_1['调整前成本'] = df_1[['mark_model','k_input_tokens','k_output_tokens']].apply(lambda x:x[1]*input_price_3+x[2]*output_price_3,axis=1)
df_1['调整后成本'] = df_1[['mark_model','k_input_tokens','k_output_tokens']].apply(lambda x:x[1]*input_price_4+x[2]*output_price_4 if x[0]=='GPT4' else x[1]*input_price_3+x[2]*output_price_3,axis=1)
df_1[['调整前成本','调整后成本']].sum()

Python 完整代码：

import pandas as pd
from sqlalchemy import create_engine

#连接数据库读取数据，并转为 DataFrame
def get_datas(sql):
    # 连接数据库
    # engine = create_engine("mysql+pymysql://用户名:密码@主机地址:端口号/数据库名")
    connect_info = 'mysql+pymysql://{}:{}@{}:{}/{}?charset=utf8'\
    .format("root", "123123", "127.1.1.0", "3306","testdb")
    engine = create_engine(connect_info)
    # 执行SQL语句
    prox = engine.execute(sql)

    data = list()
    for result in prox:
        cur = dict()
        #     print(result)
        for k, v in result._mapping.items(): # 不用 _mapping 也可以，后续会被弃用而已
            cur[k] = v
        data.append(cur)
    df = pd.DataFrame(data)
    return df
sql = 'select * from testdb.chat_logs'
df = get_datas(sql)

#取每个key的最小请求时间
df_mintime = df.groupby(['user_id'])['request_time'].min().reset_index()
#合并到原DataFrame
df = df.merge(df_mintime,on='user_id',how='left',suffixes=['','_min'])

#将请求时间和最小请求时间求差值；  
df['diff_time'] = df.request_time-df.request_time_min

#根据差值进行分桶，两层：1 分钟 和 3 小时，都向上取整数； 
import math
df['minute_bucket'] = df.diff_time.apply(lambda x:math.ceil(x/60))
df['hour_bucket'] = df.diff_time.apply(lambda x:math.ceil(x/60/60/3))

#对 1 分钟的桶和 user_id 分组，按请求时间排序； 
df['minute_bucket_sort'] = df.groupby(['user_id','minute_bucket'])['request_time'].rank(ascending=True,method='first')
#对 1 分钟不超过 3 次和大于 3 次的部分进行分组
df['mark_target_record'] = df.minute_bucket_sort.apply(lambda x:1 if x<=3 else 0)
#3小时的桶排序
df['hour_bucket_sort'] = df.groupby(['user_id','hour_bucket','mark_target_record'])['request_time'].rank(ascending=True,method='first')
#最终分类
df['mark_model']  = df[['minute_bucket_sort','hour_bucket_sort']].apply(lambda x:'GPT4' if x[0]<=3 and x[1]<=50 else 'GPT3.5',axis=1)


#按请求日期和模型聚合，统计Tokens 和价格
df_1 = df.groupby(['mark_model'])['prompt_tokens','output_tokens'].sum().reset_index()
df_1['k_input_tokens'] = df_1.prompt_tokens/1000
df_1['k_output_tokens'] = df_1.output_tokens/1000
df_1[['mark_model','k_input_tokens','k_output_tokens']]

#求调整前后成本
#gpt-4：input 0.03，output 0.06
#gpt-3：input 0.0010，output 0.0020
input_price_4 = 0.03
input_price_3 = 0.0010
output_price_4 = 0.06
output_price_3 = 0.0020
df_1['调整前成本'] = df_1[['mark_model','k_input_tokens','k_output_tokens']].apply(lambda x:x[1]*input_price_3+x[2]*output_price_3,axis=1)
df_1['调整后成本'] = df_1[['mark_model','k_input_tokens','k_output_tokens']].apply(lambda x:x[1]*input_price_4+x[2]*output_price_4 if x[0]=='GPT4' else x[1]*input_price_3+x[2]*output_price_3,axis=1)
df_1[['调整前成本','调整后成本']].sum()

小结

从上面的两个案例来看，成本都是以十倍上涨，不过加了限制，最高也不会超过官方标价的倍数（30 倍）。
但无论如何，成本较之前都是很高的。
如果想要保证用户体验好、可以多用GPT4、成本又不高，那是很难的。
当然，解决办法还是有的：

用户层面：可以搞会员制，要求不高的，用用GPT3.5，要求高的多掏钱买个会员。
供应商层面：降低成本，这个要拼渠道了。

没有完美的，只有合适的，看需求搞事情~

你可能感兴趣的:(Python应用,数据库,gpt-3,gpt,python,mysql)

RoomGPT: 人工智能驱动的室内设计革命 m0_56734068 人工智能
RoomGPT:用AI重新定义室内设计在当今数字化时代,人工智能正在改变各个行业的面貌,室内设计领域也不例外。RoomGPT作为一款革命性的AI驱动室内设计工具,正在彻底改变人们对室内空间进行创意和改造的方式。本文将深入探讨RoomGPT的工作原理、使用方法以及它为室内设计行业带来的变革。RoomGPT简介RoomGPT是一个开源项目,由GitHub用户Nutlope开发。它允许用户上传任何房间的
sql优化：墨京 mysql sql 数据库
1.插入语句sql优化：insert语句优化：1.批量插入，这样可以避免多次的和数据库交互，提高性能。建议500-1000条数据一次批量插入。insertintot_ordervalues('1','o1','1'),('2','o2','1'),('3','o3','1')2.手动提交事物：避免多次的事物提交操作，当所有要插入的数据插入完成后，手动提交。STARTTRANSACTIONinser
同花顺python_【本地直连】同花顺 Python量化交易接口上线 weixin_39938724 同花顺python
来源：雪球App，作者：私募之家THS，（https://xueqiu.com/5808549553/129022113）导读：同花顺智能交易终端MindGo版已上线2年多，凭借着同花顺深厚的技术底蕴，不断地对终端进行优化。至今，已服务近1000位个人客户，超过200家私募机构，市场份额不断扩大。目前终端已实现：支持股票、指数、基金、期货、外汇、黄金T+D等6个品种日/分钟级策略回测投研策略无缝对
深入理解Redis的淘汰策略青柠小鱼码字猴 redis 数据库缓存算法
内存淘汰是什么？Redis作为一款非关系型数据库，数据是存储到内存中的，和传统常规数据库相比，这给予可很高的并发访问量，但是相应的，存储空间就不如那些存储在磁盘中的数据库了。而内存淘汰就是为了应对Redis内存存储空间无法再放置新数据时，所设置的一种机制，即把老数据进行删除淘汰，来保证新数据的顺哪里插入。内存淘汰的意义？内存淘汰将Redis的存储空间由固态的变为了动态的，即数据对应的存储空间并非一
Redis集群全流程实战指南代码中の快捷键 java redis
Redis集群全流程实战指南：从零搭建到生产优化1.开篇：理解Redis集群的核心价值Redis作为高性能内存数据库，在单机模式下存在三大瓶颈：容量限制：受单机内存大小制约性能瓶颈：单节点QPS上限可用性风险：单点故障问题Redis集群通过分布式架构完美解决这些问题，本文将带您完成从理论认知到生产部署的全流程实践。2.架构设计篇：深入Redis集群原理2.1数据分片机制哈希槽（HashSlot）：
基于SpringBoot律师事务所案件管理系统的设计与实现一点教程 Java项目 spring boot 后端 java spring 律师事务所案件管理系统
博主主页：一点教程博主简介：专注Java技术领域和毕业设计项目实战、Java微信小程序、安卓等技术开发，远程调试部署、代码讲解、文档指导、ppt制作等技术指导。主要内容：毕业设计，SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Python、Nodejs、小程序、安卓app、大数据等设计与开发感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以和博主沟通，希
Python爬虫实战：使用Scrapy+Selenium+Playwright高效爬取Stack Overflow问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫 scrapy 微信开发语言科技 selenium
摘要本文将详细介绍如何使用Python生态中最先进的爬虫技术组合（Scrapy+Selenium+Playwright）来爬取StackOverflow的问答数据。我们将从基础爬虫原理讲起，逐步深入到分布式爬虫、反反爬策略、数据存储等高级话题，并提供完整的可运行代码示例。本文适合有一定Python基础，想要掌握专业级网络爬虫技术的开发者阅读。1.爬虫技术概述1.1为什么选择StackOverflo
Python爬虫实战：使用Scrapy+Selenium+Playwright高效爬取Coursera课程信息 Python爬虫项目 2025年爬虫实战项目 python 爬虫 scrapy 微信开发语言科技 selenium
前言在当今信息爆炸的时代，在线教育平台如Coursera提供了海量的高质量课程资源。对于学习者、教育研究者和数据分析师来说，获取这些平台的课程信息具有重要价值。本文将详细介绍如何使用Python爬虫技术高效爬取Coursera课程信息，并分析其中的技术难点与解决方案。1.Coursera网站分析Coursera是一个典型的现代Web应用，具有以下特点：采用React/Vue等前端框架构建，大量内容
Python爬虫实战：借助工具高效采集微信公众号文章 Python爬虫项目 python 爬虫微信 facebook 音视频开发语言
导语微信公众号作为信息传播的重要平台，涵盖了新闻、技术、生活等各个领域的优质内容。对于数据分析师、内容整理者或研究人员而言，系统地采集公众号文章内容具有重要意义。然而，微信公众号对爬虫设置了较强的反爬机制，直接采集存在一定难度。本文将结合实际案例，介绍如何借助工具和Python技术高效采集微信公众号文章。1.项目目标与需求定义目标：采集指定微信公众号的历史文章，包括标题、链接、发布时间等信息；支持
深入理解Redis
深入理解Redis：高性能内存数据库的核心原理与应用实践1.引言在现代互联网应用中，高性能、低延迟的数据访问是至关重要的。传统的关系型数据库（如MySQL）虽然功能强大，但在高并发场景下往往成为性能瓶颈。Redis（RemoteDictionaryServer）应运而生，作为一个开源的内存键值数据库，它凭借极快的读写速度、丰富的数据结构和灵活的扩展能力，成为缓存、会话存储、消息队列等场景的首选解决
高效主机发现与端口枚举：fscan工具实战指南 Bruce_xiaowei 笔记总结经验网络安全 fscan 信息搜集
高效主机发现与端口枚举：fscan工具实战指南在网络安全领域，主机发现与端口枚举是渗透测试和信息收集的基础环节。本文将深入探讨fscan这一高效工具的核心技术原理与实战应用，帮助你快速掌握网络扫描的核心技能。一、fscan与Nmap工具对比特性fscanNmap开发语言Python3C++主要功能主机探测、端口扫描、漏洞检测主机发现、服务识别、OS检测爆破能力内置弱口令检测需配合其他工具扫描速度极
2025年上半年软考系统架构设计师--案例分析试题与答案不对法计算机软考机考系统架构
必选题一:大模型训练系统某公司开发一个在线大模型训练平台，支持Python代码编写、模型训练和部署,用户通过python编写模型代码,将代码交给系统进行模型代码的解析,最终由系统匹配相应的计算机资源进行输出，用户不需要关心底层硬件平台。a.系统发生错误时，不影响正常运行时发送一个消息给系统管理员(可靠性。ps:可靠性中包括了健壮性:指的是保护应用程序不受错误使用和错误输入的影响，在发生意外错误事件
苍穹外卖Day07 guslegend windows
缓存菜品问题用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大。结果：系统响应慢、用户体验差解决方案通过Redis来缓存菜品数据，减少数据库查询操作缓存逻辑分析：每个分类下的菜品保存一份缓存数据数据库中菜品数据有变更时清理缓存数据DishController代码改写(用户端)publicResult>list(LongcategoryId){//构造r
关于JAVA中LIST元素修改的一个问题记录
在工作中有遇到一个问题，需要从既有获取数据库中的LIST数据，做一下对其中部分数据做处理存入另外一个LIST集合之中，但是，有些现象还是比较出乎我的意料的，模拟了一下相关场景，具体的代码如下：packagecom.interview.demo;importjava.util.ArrayList;importjava.util.List;classStudent{privateStringname;
服务器、树莓派/香橙派部署HomeAssistant与小爱音箱联动不对法物联网物联网
HomeAssistant功能介绍与多平台部署实战：CentOS服务器、树莓派、香橙派部署及小爱音箱联动控制一、HomeAssistant简介HomeAssistant是一款基于Python开发的开源智能家居自动化平台，它最大的特点是高度集成和自定义。通过HomeAssistant，用户可以将不同品牌、不同协议的智能家居设备（如空调、电灯、传感器等）整合到一个统一的平台进行管理和控制，同时还支持通
EnterpriseDB/Barman 地理冗余配置指南：构建级联备份架构管翔渊Lacey
EnterpriseDB/Barman地理冗余配置指南：构建级联备份架构barmanBarman-BackupandRecoveryManagerforPostgreSQL项目地址:https://gitcode.com/gh_mirrors/ba/barman地理冗余概述在现代数据库运维中，确保数据的高可用性和灾难恢复能力至关重要。EnterpriseDB/Barman提供的地理冗余功能允许管理
数据分析案例-全球表面温度数据可视化与统计分析艾派森数据分析信息可视化 python 数据分析数据挖掘
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
山西大同大学学生公寓管理系统（11402）
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
Qt 各种功能学习笔记栈不收 qt 学习笔记
目录1.Qt关于数据库1.1Qt链接数据库1.2将数据库的模型显示在控件中2.Qt关于控件2.1用正则表达式设置输入框只能输入正浮点数2.2设置QDateTimeEdit的时间格式和设置为当前时间1.Qt关于数据库1.1Qt链接数据库基础教学：使用Qt链接MySql数据库_qt连接mysql_栈不收的博客-CSDN博客需要注意的问题：在链接MySQL的时候，首先要确保MySQL已经安装成功在目录Q
生信技能16 - 生信分析序列处理常用函数生信与基因组学生信分析项目实战技能合集 python numpy 数据分析
生信分析序列处理常用函数生信分析经常需要对序列进行处理，下面的实现代码可用于个人练习，可以让我们更好地理解序列处理的原理，当然python也有更高效率的包可以实现以下功能。read_seq_file读取序列txt文件函数count_nucletotides计算各核苷酸数量函数dna2rnaDNA序列转RNA序列函数seq_reverseDNA序列转换为互补序列函数count_GC_ratio计算序
SpringBoot+WebSocket实现直播连麦雨轩智能 java及Linux相关教程 spring boot websocket 后端
一、引言随着互联网技术的发展，直播已成为一种主流的内容传播形式。其中，连麦功能作为直播互动的重要手段，能够有效提升用户参与感和观看体验。本文将介绍如何使用SpringBoot和WebSocket技术构建一个直播连麦系统，实现主播与观众之间的实时音视频交流和文字聊天功能。为了方便DEMO的运行，本系统基于纯内存操作实现核心业务逻辑，不依赖外部数据库或者缓存组件。二、技术设计2.1技术栈后端：Spri
Python 数据分析实践经验与学习心得 lzzy_sj_0999 python 数据分析开发语言
在当今数据驱动的时代，Python以其丰富的库和便捷的语法，成为数据分析领域的首选语言。本文将结合实际案例，分享Python数据分析的学习心得与实践经验，涵盖数据读取、清洗、分析及可视化等关键环节，希望能为大家的学习和工作提供帮助。一、数据分析必备库介绍在Python数据分析中，有几个核心库是必须掌握的，它们就像我们手中的“神兵利器”，能够高效完成各种数据分析任务。Pandas：用于数据处理和分析
数据库-事务 ruleslol spring spring jdbc
一、什么是事务？在执行SQL语句的时候，某些业务要求，一系列操作必须全部执行，而不能仅执行一部分。例如，一个转账操作：--从id=1的账户给id=2的账户转账100元--第一步：将id=1的A账户余额减去100UPDATEaccountsSETbalance=balance-100WHEREid=1;--第二步：将id=2的B账户余额加上100UPDATEaccountsSETbalance=ba
MySQL(107)如何进行分片查询？辞暮尔尔-烟火年年 MySQL mysql 数据库
进行分片查询时，需要根据分片键确定查询应在哪些分片上执行。分片查询的复杂性在于需要处理跨分片查询的情况。以下是一个更为详细的示例，展示如何在分片数据库中进行查询，并结合Java代码进行实现。1.环境准备假设我们继续使用SpringBoot和MySQL，且需要查询的表是orders表。我们已经有了分片的数据库环境和数据源配置。2.项目依赖在pom.xml中添加必要的依赖：org.springfram
【分治算法】【Python实现】Strassen矩阵乘法「已注销」 #分治算法分治算法 Python
文章目录@[toc]问题描述基础算法时间复杂性Strassen算法时间复杂性问题时间复杂性Python实现个人主页：丷从心·系列专栏：分治算法学习指南：算法学习指南问题描述设AAA和BBB是两个n×nn\timesnn×n矩阵，AAA和BBB的乘积矩阵CCC中元素cij=∑k=1naikbkjc_{ij}=\displaystyle\sum\limits_{k=1}^{n}{a_{ik}b_{kj
Docker 镜像制作 Ris Hen docker docker
目录镜像制作及原因快照方式制作镜像Dockerfile制作镜像为什么需要DockerfileDockerfile指令常见问题镜像制作及原因镜像制作是因为某种需求，官方的镜像无法满足需求，需要我们通过一定手段来自定义镜像来满足要求。制作镜像往往因为以下原因1.编写的代码如何打包到镜像中直接跟随镜像发布2.第三方制作的内容安全性未知，如含有安全漏洞3.特定的需求或者功能无法满足，如需要给数据库添加审计
AI如何提升个性化广告精准度——让投放更智能、更懂用户 Echo_Wish 前沿技术人工智能人工智能
AI如何提升个性化广告精准度——让投放更智能、更懂用户随着人工智能（AI）技术的发展，个性化广告已经从粗暴推送演变为智能匹配，广告主再也不想把预算砸给不感兴趣的人，而是精准触达有购买意向的用户。AI在广告投放中的核心优势在于深度数据分析、智能推荐、实时优化，让广告投放更精准、更有效。今天，我们就来聊聊AI如何提升个性化广告的精准度，并用Python代码演示其中的关键技术。1.为什么传统广告投放越来
N-P准则下的多传感器融合(python) 不会打架的锤子机器学习自动化算法算法 python vscode
本文设计了一个主程序：main_sensor_fusion，和一个函数程序：cal_fuse。主程序里面包含主干部分和绘图部分，函数程序包含数据生成函数gen，检测概率计算函数cal，非0逻辑矩阵函数No_zero_value，单传感器判决函数fus_seq，多传感融合函数fusion。需要的点赞私聊if__name__=="__main__":begin_time=time()#Measurep
Python+Vue计算机毕业设计智慧养老院管理系统egn81（源码+程序+LW+部署）心心毕设程序源码 python vue.js 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Python3.7.7+Django+Mysql5.7+piplist+HBuilderX（Vscode也行）+Vue+Pychram社区版。项目技术：Django+Vue+Python+Mysql等等组成，B/S模式等等。环境需要1.运行环境：最好是安装Python3.7.7，我们在这个平台上运行的。其他版本理论上也
InfluxDB 3 Core 持久化机制深度解析：高可靠实时数据引擎的设计哲学与工业实践梦想画家数据库 InfluxDB 分层持久化架构
本文深入拆解InfluxDB3Core的数据持久化架构，涵盖写入流程、故障恢复、存储引擎设计，并结合物联网、金融监控等场景分析其高可靠性实现逻辑。通过对比传统时序数据库架构与性能实测数据，揭示新一代引擎如何平衡实时性与数据安全性，为大规模时序数据处理提供生产级保障。一、持久化核心机制：从写入到落盘的全链路保护1.分层持久化架构InfluxDB3Core采用三级数据保护策略：写入请求→内存缓冲区(V
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

GPT3.5 改用 GPT4 价格翻了30倍 如何破局？ GPT 对话成本推演

场景介绍

方案阐述

创建测试数据

案例1：限制每天 10 次（总量限制）

使用 SQL 实现

使用 Python 实现

案例2：限制每分钟不超过 3 次，每 3 小时不超过 50 次（频率限制）

使用 SQL 实现

使用 Python 实现

小结

你可能感兴趣的:(Python应用,数据库,gpt-3,gpt,python,mysql)

GPT3.5 改用 GPT4 价格翻了30倍如何破局？ GPT 对话成本推演