- DeepSeek面试——分词算法
mzgong
人工智能算法
DeepSeek-V3分词算法一、核心算法:字节级BPE(Byte-levelBPE,BBPE)DeepSeek-V3采用字节级BPE(BBPE)作为核心分词算法,这是对传统BPE(BytePairEncoding)算法的改进版本。其核心原理是将文本分解为字节(Byte)序列,通过统计高频相邻字节对的共现频率进行逐层合并,最终形成128K扩展词表。二、BBPE的核心优势1.多语言统一处理能力跨语言
- python/R 连接 clickhouse
weixin_41283198
pythonclickhouser语言python大数据r语言
1、python-clickhouseimportnumpyasnpfromclickhouse_driverimportClientimportpandasaspdsql=open('/opt/check_detect_local.sql','r',encoding='utf8')sqltxt=sql.readlines()print(len(sqltxt))sqls=[]foriinnp.ar
- 爬虫中一些有用的用法
才不是小emo的小杨
爬虫xpath
文本和标签在一个级别下如果文本和a标签在一个级别下比如:#获取a标签后的第一个文本节点text_node=a.xpath('following-sibling::text()[1]')[0].strip()将xpath的html代码转换成字符串etree.tostring(root,pretty_print=True,encoding="utf-8")获取所有同级标签的最后一个data_list=
- 解决问题:Android Studio启动不了
piggy514
androidstudioandroidide
1、启动不了之前的操作:build报错的提示的都是乱码,于是网上搜了下,去菜单Help>EditCustomVMoptions此时AS打开了AS安装目录下bin/studio64.exe.vmoptions这个文件根据网上说法在里边加一句-Dfile.encoding=UTF-8即可,于是加了,结果AS闪退。再也启动不了,重启电脑后也不行,重新安装也不行。看来有时不要轻信网上操作。怎么解决乱码问题
- python中的文件操作
Mswanga
pythonpython开发语言
1.创建文件python中使用open()函数创建或者打开文件,语法格式:open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)file:表示要打开的文件的路径,也可以是被封装的整数类型文件描述符mode:用于指定文件的打开模式,默认是’r‘(以文本模式打开并且
- 20250310:OpenCV mat对象与base64互转
微风❤水墨
AI模型部署Mat转base64
代码:https://github.com/ReneNyffenegger/cpp-base64指南:https://renenyffenegger.ch/notes/development/Base64/Encoding-and-decoding-base-64-with-cpp/实操:
- 视频文件的几个关键参数
buleideli
AndroidCameracameraandroid
参数的解释VideoEncodingBitRate(视频编码比特率)比特率是指每秒钟视频使用的数据量,通常以bps(bitspersecond)为单位。比特率越高,视频质量越好,但同时也会导致文件体积增大。比特率直接影响视频文件的大小,是影响最大的因素之一。高比特率意味着更高的画质和更大的文件尺寸。VideoFrameRate(视频帧率)帧率指的是每秒钟显示的图像帧数,通常用fps(framesp
- requests入门以及requests库实例和with,os的解释(Python网络爬虫和信息提取)
眸生
Python爬虫python爬虫开发语言笔记
导学定向网络数据爬取和网页解析的基本能力requests入门安装方法首先cmdpipinstallrequests然后打开idle测试**>>>importrequests>>>r=requests.get("http://www.baidu.com")>>>r.status_code200>>>r.encoding='utf-8'>>>r.text**requests库的7个主要方法reques
- 【LLM】从零开始实现 LLaMA3
FOUR_A
LLM人工智能机器学习大模型llama算法
分词器在这里,我们不会实现一个BPE分词器(但AndrejKarpathy有一个非常简洁的实现)。BPE(BytePairEncoding,字节对编码)是一种数据压缩算法,也被用于自然语言处理中的分词方法。它通过逐步将常见的字符或子词组合成更长的词元(tokens),从而有效地表示文本中的词汇。在自然语言处理中的BPE分词器的工作原理如下:初始化:首先,将所有词汇表中的单词分解为单个字符或符号。例
- 数字IP转换成字符串IP
故事里故去
C#C#字符串处理时间性能IP地址构造字节操作
DateTimelulu=DateTime.Now;byte[][]data=newbyte[256][];for(inti=0;i<256;i++){data[i]=Encoding.Default.GetBytes("."+i.ToString());}byte[]buff1=newbyte[4];buff1[0]=230;buff1[1]=220;buff1[2]=123;buff1[3]=
- python系列【仅供参考】:python3 生成pdf 中文乱码问题处理
坦笑&&life
#pythonpythonpdf开发语言
python3生成pdf中文乱码问题处理python3生成pdf中文乱码问题处理1.首先上代码:2.乱码原因:3.安装字体库4.找一台安装了中文字体的服务器python3生成pdf中文乱码问题处理1.首先上代码:importpdfkit#urlPath是待导出的链接pdfkit.from_url(urlPath,'test.pdf',options={'encoding':'UTF-8'
- Python爬虫之爬取酷狗音乐
进击的Loser
Python爬虫之爬取酷狗音乐废话不说,上代码:#!Python#-*-encoding:utf-8-*-'''1.文件名称:酷我音乐爬虫.py2.创建时间:2021/03/2117:29:093.作者名称:ZAY4.Python版本:3.7.0'''importosimportgetpassimportrequestsfromurllib.parseimportquoteclassSpider(
- java.sql.SQLNonTransientConnectionException: Public Key Retrieval is not allowed
二十七剑
java开发语言
只需要在url:jdbc:mysql://xxx?serverTimezone=Asia/Shanghai&useUnicode=true&characterEncoding=utf8&useSSL=false后面加上&allowPublicKeyRetrieval=true即url:jdbc:mysql://xxx?serverTimezone=Asia/Shanghai&useUnicode=
- 解释 HTTP 中的内容协商,如何根据客户端偏好返回合适的内容?
程序员黄同学
前端开发JavaScriptnode.jshttp网络协议网络
一、内容协商的解释(一)概念在HTTP协议中,内容协商(ContentNegotiation)是一种机制,它允许服务器根据客户端的请求头信息(如Accept、Accept-Language、Accept-Encoding等),来决定返回给客户端最合适的内容。例如,同一个URL可能对应多种不同格式(如HTML、JSON、XML)、不同语言(如英语、中文)或者不同编码(如gzip压缩、无压缩)的资源,
- 10.1go常用包json
chxii
go语言基础golangjson开发语言
序列化(Marshal):将Go的数据结构转换为JSON字符串。反序列化(Unmarshal):将JSON字符串转换为Go的数据结构。使用json.Marshal进行序列化json.Marshal函数可以将Go的数据结构转换为JSON格式的字节切片([]byte)packagemainimport("encoding/json""fmt""log")//定义一个结构体typePersonstruc
- 【每日一练】python文件读.写.追加基本用法
程之编
Python学习笔记python
"""本节课程内容:1.打开一个文件,模式为写入2.用传参方式写入文件内容3.如何追加文件内容4.如何读取新写入的文件5.牢记操作完一定要关闭程序使用close()函数Ps:如果写完文件后就读取文件,需要使用seek(0)把指针复位到开头。否则,下面读取文件为空,因为写完后指针会停留在尾部。"""#打开文件flit=open('测试.txt','w',encoding='utf-8')#写入文件的
- 黑马程序员瑞吉外卖Day6小程序空白无显示
Lkkkkkkkcy
Java学习java微信小程序前端
做项目时出现问题之druid连接池报错报错discardlongtimenonereceivedconnection.,jdbcUrl:jdbc:mysql://localhost:3306/sky_take_out?serverTimezone=Asia/Shanghai&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=c
- 【wp】hgame2023 week3 Re&&Pwn
woodwhale
ctf与君共勉pwnctfpwnrehgame
【wp】hgame2023week3Re&&PwnRecpp那个chacha20加密不会。kunmusic用dnspy逆dll,在Program的Main方法中找到了初始化的数据下断点执行,拷贝出data写一份脚本进行data与104的异或defstep_one():withopen("./data",encoding="u8")asf:lines=f.readlines()data=[]forl
- 12.4 Python open()函数详解:打开指定文件
愿与你共信仰
第12章Python文件操作(I/O)python基础超详细
在Python中,如果想要操作文件,首先需要创建或者打开指定的文件,并创建一个文件对象,而这些工作可以通过内置的open()函数实现。open()函数用于创建或打开指定文件,该函数的常用语法格式如下:file=open(file_name[,mode='r'[,buffering=-1[,encoding=None]]])此格式中,用[]括起来的部分为可选参数,即可以使用也可以省略。其中,各个参数
- go语言转换json字符串为json数据
绛洞花主敏明
golangjson开发语言
在Go语言中,可以使用标准库encoding/json中的json.Unmarshal函数将JSON字符串转换为JSON数据(通常是Go中的结构体或map类型)。以下是一个简单的示例:示例代码packagemainimport("encoding/json""fmt""log")//定义一个结构体,用于映射JSON数据typePersonstruct{Namestring`json:"name"`
- 一键生成Python项目依赖清单:pipreqs完全指南
北岭敲键盘的荒漠猫
#python开发python开发语言
省流:pipinstallpipreqspipreqs./--encoding=utf8--force一键生成Python项目依赖清单:pipreqs完全指南作为Python开发者,你是否经历过这些痛苦场景?✅项目迁移到新环境时,发现漏装了几个依赖包,调试到崩溃…✅用pipfreeze导出依赖,结果混入一堆无关的全局包,臃肿不堪…✅手动维护requirements.txt,每次更新都要反复核对版本
- Python AES 加密和解密(qbit)
pythonaes加密解密
前言AES有多种加密模式,本文选取了最常用的CBC模式CipherBlockChaining密码块链模式技术栈Python3.11.8cryptography43.0.3loguru0.7.2示例代码导入库#encoding:utf-8#author:qbit#date:2024-10-28#summary:测试AES的加密和解密importosimportrandomimportstringfr
- Redis 源码分析-内部数据结构 intset
笨手笨脚の
#Redisredis数据结构setintset并差集
Redis源码分析-内部数据结构intsetintset是用于实现集合(set)这种对外的数据结构。它包含的元素无序,且不能重复。当插入的元素都是整形,底层使用intset存储,否则使用dict。intset结构和部分函数分析结构体定义如下://intset结构体typedefstructintset{uint32_tencoding;//数据编码,表示intset中的每个数据元素用几个字节(2、
- Python入门实例
造夢先森
编程语言python实例tuple集合set
相关基础Python数据类型:#-*-encoding:utf-8-*-#列表(list):可修改s1=['a','s','d']s1[2]='z'prints1[2]#元组(tuple):不可修改.tuple也是一种lists2=(1,2,3)prints2[2]#集合(set)a=set('asdfghdd')b=set('zxdfvb')printa&bprinta|bprinta-bpri
- SpringBoot启动端口配置
走在时光柱上的程序员
Javahttpsspringboot
###serverserver:port:443###端口配置,如果是https,80端口要配置成433address:0.0.0.0###服务地址,0.0.0.0表示内外网都可以访问,如果不配置Adress,端口可能不会生效servlet:context-path:/###url根路径tomcat:uri-encoding:UTF-8###编码ssl:###https配置protocol:TLS
- .Net Core HttpClient处理响应压缩
溪源More
pythonjava编程语言springhttp
前言在上篇文章[ASP.NETCore中的响应压缩]中我们谈到了在ASP.NETCore服务端处理关于响应压缩的请求,服务端的主要工作就是根据Content-Encoding头信息判断采用哪种方式压缩并返回。之前在群里有人问道过,现在的网络带宽这么高了还有必要在服务端针对请求进行压缩吗?确实,如今分布式和负载均衡技术这么成熟,很多需要处理高并发大数据的场景都可以通过增加服务器节点来进行。但是,在资
- 网络安全清单
网络安全Max
web安全智能路由器安全
点击文末小卡片,免费获取网络安全全套资料,资料在手,涨薪更快移除(Deprovisioning)移除(Deprovisioning)是一个除去现存用户帐户的过程,其包括用户帐户登记和设备失效。分布式编码规则(DER:DistinguishedEncodingRules)分布式编码规则(DER)是一个基本编码规则的子集,其提供一个严密的方法来描述任何ASN.1值来作为一个8位字节的字符串。指定网桥(
- 【Android】Android Studio 中文乱码问题解决方案
非晓为骁
Androidandroidandroidstudioide
问题现象在Java文件编译或运行时,IDE控制台或代码编辑区出现类似以下乱码提示:E:\...\FileHelper.java:92:����:�Ҳ�������此类乱码通常由编码配置冲突或文件存储格式异常导致。核心解决步骤1.统一编码配置全局设置进入File→Settings→Editor→FileEncodings,确保以下三项均设置为UTF-8:GlobalEncoding、ProjectE
- 文本数据格式转换备份
@Mr_LiuYang
写过的小程序数据库csv转db文本格式转换
概述一些文本格式转换代码,个人做一下备份。ipynb转py格式importnbformatfromnbconvertimportPythonExporter#读取Jupyternotebook文件notebook_filename='Builddata.ipynb'#替换为你的.ipynb文件路径withopen(notebook_filename,'r',encoding='utf-8')asn
- Golang的Aes加解密工具类
张声录1
golang开发语言后端
packagemainimport("bytes""crypto/aes""crypto/sha1""encoding/binary""encoding/hex""fmt")//SHA1PRNG模拟Java的SHA1PRNG算法typeSHA1PRNGstruct{state[sha1.Size]bytecounteruint32indexint}//NewSHA1PRNG使用种子初始化SHA1P
- 继之前的线程循环加到窗口中运行
3213213333332132
javathreadJFrameJPanel
之前写了有关java线程的循环执行和结束,因为想制作成exe文件,想把执行的效果加到窗口上,所以就结合了JFrame和JPanel写了这个程序,这里直接贴出代码,在窗口上运行的效果下面有附图。
package thread;
import java.awt.Graphics;
import java.text.SimpleDateFormat;
import java.util
- linux 常用命令
BlueSkator
linux命令
1.grep
相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志,这个命令绝对是必不可少的。
但之前总是习惯于使用 (grep -n 关键字 文件名 )查出关键字以及该关键字所在的行数,然后再用 (sed -n '100,200p' 文件名),去查出该关键字之后的日志内容。
但其实还有更简便的办法,就是用(grep -B n、-A n、-C n 关键
- php heredoc原文档和nowdoc语法
dcj3sjt126com
PHPheredocnowdoc
<!doctype html>
<html lang="en">
<head>
<meta charset="utf-8">
<title>Current To-Do List</title>
</head>
<body>
<?
- overflow的属性
周华华
JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml&q
- 《我所了解的Java》——总体目录
g21121
java
准备用一年左右时间写一个系列的文章《我所了解的Java》,目录及内容会不断完善及调整。
在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等,请大家及时指出,我会第一时间更正。
&n
- [简单]docx4j常用方法小结
53873039oycg
docx
本代码基于docx4j-3.2.0,在office word 2007上测试通过。代码如下:
import java.io.File;
import java.io.FileInputStream;
import ja
- Spring配置学习
云端月影
spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi=&q
- Java新手入门的30个基本概念三
aijuans
java新手java 入门
17.Java中的每一个类都是从Object类扩展而来的。 18.object类中的equal和toString方法。 equal用于测试一个对象是否同另一个对象相等。 toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法) 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。
- 《2008 IBM Rational 软件开发高峰论坛会议》小记
antonyup_2006
软件测试敏捷开发项目管理IBM活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵!
其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下.
参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
- PL/SQL的过程编程,异常,声明变量,PL/SQL块
百合不是茶
PL/SQL的过程编程异常PL/SQL块声明变量
PL/SQL;
过程;
符号;
变量;
PL/SQL块;
输出;
异常;
PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
- Mockito(三)--完整功能介绍
bijian1013
持续集成mockito单元测试
mockito官网:http://code.google.com/p/mockito/,打开documentation可以看到官方最新的文档资料。
一.使用mockito验证行为
//首先要import Mockito
import static org.mockito.Mockito.*;
//mo
- 精通Oracle10编程SQL(8)使用复合数据类型
bijian1013
oracle数据库plsql
/*
*使用复合数据类型
*/
--PL/SQL记录
--定义PL/SQL记录
--自定义PL/SQL记录
DECLARE
TYPE emp_record_type IS RECORD(
name emp.ename%TYPE,
salary emp.sal%TYPE,
dno emp.deptno%TYPE
);
emp_
- 【Linux常用命令一】grep命令
bit1129
Linux常用命令
grep命令格式
grep [option] pattern [file-list]
grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。
pattern可以是普通字符串,也可以是正则表达式,当查找的字符串包含正则表达式字符或者特
- mybatis3入门学习笔记
白糖_
sqlibatisqqjdbc配置管理
MyBatis 的前身就是iBatis,是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询,存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。
以前也学过iBatis,因为MyBatis是iBatis的升级版本,最初以为改动应该不大,实际结果是MyBatis对配置文件进行了一些大的改动,使整个框架更加方便人性化。
- Linux 命令神器:lsof 入门
ronin47
lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息,但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实,因为它是指“列出打开文件(lists openfiles)”。而有一点要切记,在Unix中一切(包括网络套接口)都是文件。
有趣的是,lsof也是有着最多
- java实现两个大数相加,可能存在溢出。
bylijinnan
java实现
import java.math.BigInteger;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class BigIntegerAddition {
/**
* 题目:java实现两个大数相加,可能存在溢出。
* 如123456789 + 987654321
- Kettle学习资料分享,附大神用Kettle的一套流程完成对整个数据库迁移方法
Kai_Ge
Kettle
Kettle学习资料分享
Kettle 3.2 使用说明书
目录
概述..........................................................................................................................................7
1.Kettle 资源库管
- [货币与金融]钢之炼金术士
comsci
金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的
那么随着人类在理论物理和工程物理上面取得的一些突破性进展......
炼金术这个古老
- Toast原来也可以多样化
dai_lm
androidtoast
Style 1: 默认
Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT);
def.show();
Style 2: 顶部显示
Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT);
t
- java数据计算的几种解决方法3
datamachine
javahadoopibatisr-languer
4、iBatis
简单敏捷因此强大的数据计算层。和Hibernate不同,它鼓励写SQL,所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦,只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。
复杂计算环境是它的弱项,比如:分布式计算、复杂计算、非数据
- 向网页中插入透明Flash的方法和技巧
dcj3sjt126com
htmlWebFlash
将
Flash 作品插入网页的时候,我们有时候会需要将它设为透明,有时候我们需要在Flash的背面插入一些漂亮的图片,搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。
一、Swf透明、无坐标控制 首先教大家最简单的插入Flash的代码,透明,无坐标控制: 注意wmode="transparent"是控制Flash是否透明
- ios UICollectionView的使用
dcj3sjt126com
UICollectionView的使用有两种方法,一种是继承UICollectionViewController,这个Controller会自带一个UICollectionView;另外一种是作为一个视图放在普通的UIViewController里面。
个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。
1.UIViewController实现委托,代码如
- Eos平台java公共逻辑
蕃薯耀
Eos平台java公共逻辑Eos平台java公共逻辑
Eos平台java公共逻辑
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
蕃薯耀 2015年6月1日 17:20:4
- SpringMVC4零配置--Web上下文配置【MvcConfig】
hanqunfeng
springmvc4
与SpringSecurity的配置类似,spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。
applicationContext-MvcConfig.xml
<!-- 启用注解,并定义组件查找规则 ,mvc层只负责扫描@Controller -->
<
- 解决ie和其他浏览器poi下载excel文件名乱码
jackyrong
Excel
使用poi,做传统的excel导出,然后想在浏览器中,让用户选择另存为,保存用户下载的xls文件,这个时候,可能的是在ie下出现乱码(ie,9,10,11),但在firefox,chrome下没乱码,
因此必须综合判断,编写一个工具类:
/**
*
* @Title: pro
- 挥洒泪水的青春
lampcy
编程生活程序员
2015年2月28日,我辞职了,离开了相处一年的触控,转过身--挥洒掉泪水,毅然来到了兄弟连,背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人,还敢跨行业,选择Unity3D?“,”真是不自量力••••••“,”真是初生牛犊不怕虎•••••“,••••••我只是淡淡一笑,拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连!
这就是我青春的分割线,不后悔,只会去用泪水浇灌——已经来到
- 稳增长之中国股市两点意见-----严控做空,建立涨跌停版停牌重组机制
nannan408
对于股市,我们国家的监管还是有点拼的,但始终拼不过飞流直下的恐慌,为什么呢?
笔者首先支持股市的监管。对于股市越管越荡的现象,笔者认为首先是做空力量超过了股市自身的升力,并且对于跌停停牌重组的快速反应还没建立好,上市公司对于股价下跌没有很好的利好支撑。
我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空,在
- 动态设置iframe高度(iframe高度自适应)
Rainbow702
JavaScriptiframecontentDocument高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新,大家可能都会想到使用ajax。
但有些情况下,须使用在页面中嵌入一个iframe来作局部刷新。
对于使用iframe的情况,发现有一个问题,就是iframe中的页面的高度可能会很高,但是外面页面并不会被iframe内部页面给撑开,如下面的结构:
<div id="content">
<div id=&quo
- 用Rapael做图表
tntxia
rap
function drawReport(paper,attr,data){
var width = attr.width;
var height = attr.height;
var max = 0;
&nbs
- HTML5 bootstrap2网页兼容(支持IE10以下)
xiaoluode
html5bootstrap
<!DOCTYPE html>
<html>
<head lang="zh-CN">
<meta charset="UTF-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">