敲代码的喜羊羊

【情感提取+情感计算+词频统计】python情感分析

目录

1、情感分析介绍

2、基于大连理工情感词汇方法

2.1加载大连理工情感词典，程度副词典，否定词典，停用词典

2.2译文断章切句

2.3提取情感词并计算情感值

2.4统计词频

2.5调用实现

1、情感分析介绍

情感分析是一种自然语言处理技术，旨在识别文本中的情感并将其分类为积极、消极或中性。它通过使用机器学习算法和自然语言处理技术来自动分析文本中的情感，从而帮助人们更好地理解文本的情感含义。

本文以某译本new_deepl_translated.txt为分析对象，通过对译文断章切句，进而对每一个句子情感词提取、情感值计算，以及词频统计，最后保存为excel文件。

new_deepl_translated.txt部分内容如下：

情感值计算结果：

词频统计结果：

2、基于大连理工情感词汇方法

2.1加载大连理工情感词典，程度副词典，否定词典，停用词典

各词典大家可以从网上进行下载，顶部我放了一个资源包可以直接拿来用。

定义一个类sa，用于加载情感词典、程度副词典、否定词典、停用词典，以及分词和去除停用词。针对大连理工情感词典，我只需要加载词语、情感分类、强度、极性这4列内容。

class sa:
    # 加载情感词典、程度副词典、否定词典、停用词典
    def __init__(self, senti_dict_path, degree_dict_path, not_dict_path, stopword_path):
        self.senti_dict = self.load_dict(senti_dict_path)
        self.degree_dict = self.load_degree_dict(degree_dict_path)
        self.not_dict = self.load_not_dict(not_dict_path)
        self.stopwords = self.load_stopwords(stopword_path)

    # 加载情感词典
    def load_dict(self, path):
        with open(path, 'r', encoding='utf-8') as f:
            lines = f.readlines()
        word_dict = {}
        for line in lines:
            items = line.strip().split('\t')
            if len(items) >= 7:               
                word = items[0]  #情词
                emotion = items[4]  #情词类别
                strength = int(items[5])  #情词强度
                polarity = int(items[6])  #情词极性
                word_dict[word] = {'emotion': emotion, 'strength': strength, 'polarity': polarity}
        return word_dict
    
     # 加载程度副词词典
    def load_degree_dict(self, path):
        with open(path, 'r', encoding='utf-8') as f:
            lines = f.readlines()
        degree_dict = {}
        for line in lines:
            items = line.strip().split('\t')
            if len(items) >= 2:
                degree_word = items[0]  #副词
                degree_value = float(items[1])   #副词权值
                degree_dict[degree_word] = degree_value
        return degree_dict
    
    # 加载否定词词典
    def load_not_dict(self, path):
        with open(path, 'r', encoding='utf-8') as f:
            lines = f.readlines()
        not_dict = {}
        for line in lines:
            items = line.strip().split('\t')
            if len(items) >= 1:
                not_word = items[0]  #否定词
                not_dict[not_word] = True
        return not_dict
      

    # 加载停用词表
    def load_stopwords(self, path):
        with open(path, 'r', encoding='utf-8') as f:
            stopwords = [line.strip() for line in f.readlines()]
        return stopwords

    # 分词
    def cut_words(self, text):
        words = jieba.cut(text)
        return [word for word in words]

    # 去除停用词
    def remove_stopword(self, words):
        return [word for word in words if word not in self.stopwords]

2.2译文断章切句

定义一个SplitFile方法对译文进行分章，然后定义normal_cut_sentence方法对译文进行分句。

# 断章  将一个txt文件的内容，按照第几章进行分割 section
def SplitFile(filename):
        f=open(filename, 'r', encoding="utf-8") 
        # 获取文件每一行
        lines = f.readlines()

        zhang = ""
        zhangji = []
        i = 0
        for line in lines:          
                strh = line[0:6] # 取一行前5个字
                if ("第" in strh and "章" in strh):
                    #print (strh)
                    if (i>0):

                        zhangji.append([zhang])
                        zhang = ""
                zhang += line        
                i += 1
        zhangji.append([zhang])  #最后一章
        
        #print (章集)
        print (filename,"章节数 = ",len(zhangji))
        return zhangji

#切句 将文本切句,换回句列表
def normal_cut_sentence(text):
    text = re.sub('([。！？\?])([^’”"）])',r'\1\n\2',text)#普通断句符号且后面没有引号
    #text = re.sub('(\.{6})([^’”])',r'\1\n\2',text)#英文省略号且后面没有引号
    text = re.sub('(\…{2})([^’”])',r'\1\n\2',text)#中文省略号且后面没有引号
    text = re.sub('([.。！？\?\.{6}\…{2}][’”"])([^’”"])',r'\1\n\2',text)#断句号+引号且后面没有引号
    text = re.sub(r"\n\n",r'\n',text)  #删除多余空行
    text = re.sub(r"\n\n",r'\n',text)  #删除多余空行
    text = re.sub(r"\n\n",r'\n',text)  #删除多余空行
    text = re.sub(r"\n\n",r'\n',text)  #删除多余空行
    text = text.rstrip("\r\n")    # 去掉段尾的\n，然后
    return text.split("\n")

2.3提取情感词并计算情感值

利用jieba包进行分词后，去除停用词，然后在大连理工情感词汇中查找每一个词汇，依次判断词语是否是情感词，提取情感种类与分值。

情感值计算公式：

其中，大连理工情感词典各情感分类规则如下：

#提取情感词和计算情感值
class ScoreAnalysis:
    # 初始化
    def __init__(self, senti_dict_path, degree_dict_path, not_dict_path, stopword_path):
        self.sa = sa(senti_dict_path, degree_dict_path, not_dict_path, stopword_path)
        self.score_class = {'好': 0, '乐': 1, '怒': 2, '哀': 3, '惧': 4, '恶': 5, '惊': 6, '思': 7}  #将情感分为8大类

    # 查找情感词
    def findword(self, text):
        Eword_list = []
        word_loc = []
        for i in range(0, len(text)):
            if text[i] in self.sa.senti_dict.keys():
                word = Word(text[i], self.sa.senti_dict[text[i]])
                Eword_list.append(word)
                word_loc.append(i)
        return Eword_list, word_loc

    #计算情感得分
    def get8score(self, text):
        Eword_list, word_loc = self.findword(text)  ##查找文本中包含哪些情感词
        # 8大类找对应感情大类的词语，分别统计分数= 词极性*词权重
        result = []
        for key in self.score_class.keys(): #区分8大类
            not_word = []
            degree_word = []
            score = 0
            intensity = 1
            score_words = []
            degree_word_pos = -1
            not_word_pos = -1
            for j in range(0,len(Eword_list)):  #遍历text每个词
                word = Eword_list[j]
                word_score = 0
                if (key == word.class_value):   #判断情感词属于哪个大类
                    score_words.append(word.word)
                    #扫描情感词前面4个词内的程度副词和否定词                        
                    not_v = 1
                    degree = 1
                    not_word = []
                    degree_word = []
                    degree_word_pos = -1
                    not_word_pos = -1
                    star = word_loc[j]-4
                    if star < 0:
                        star = 0
                    for i in range(star, word_loc[j]-1):
                        if text[i] in self.sa.degree_dict.keys(): #扫描程度副词
                            degree_word.append(text[i])    
                            degree *= self.sa.degree_dict[text[i]]
                            degree_word_pos = i
                    for i in range(star, word_loc[j]-1):
                        if text[i] in self.sa.not_dict.keys(): #扫描否定词
                            not_word.append(text[i])
                            not_v *= -1
                            not_word_pos = i
                    if not_word_pos > -1 and degree_word_pos > -1:
                        if not_word_pos < degree_word_pos:       #否定词在前: "不太高兴"
                            degree *= 0.5
                        else:                            #否定词在后 "太不高兴"
                            degree *= 2
                    word_score = word.value['polarity'] * not_v * degree
                    word_score = float(word_score)
                    #print(word_score)
                    if word_score > score and word_score > 0:
                        score = word_score
                    if word_score < score and word_score < 0:
                        score = word_score
            # 限定取值范围
            if score > 9 :
                score = 9
            if score < -9 :
                score = -9

            result.append([key, score, score_words, not_word, degree_word])
        return result


#对22小类合并为8大类
class Word:
    # 初始化
    def __init__(self, word, value):
        self.word = word
        self.value = value
        self.class_value = self.get_class_value()

    # 获取情感词的大类
    def get_class_value(self):
        emotion = self.value['emotion']
        if emotion in ['PD', 'PH', 'PG', 'PB', 'PK']:
            return '好'
        elif emotion in ['PA', 'PE']:
            return '乐'
        elif emotion == 'NA':
            return '怒'
        elif emotion in ['NB', 'NJ', 'NH','PF']:
            return '哀'
        elif emotion in ['NI', 'NC', 'NG']:
            return '惧'
        elif emotion in ['NE', 'ND', 'NN', 'NK', 'NL']:
            return '恶'
        elif emotion == 'PC':
            return '惊'
        elif emotion == 'NF':
            return '思'
        else:
            return 'none'

2.4统计词频

定义"添加词频"方法，向词频列表中添加词汇，如果词汇已存在，则将其频次加1，否则将其添加到列表末尾。

def 添加词频(word, freq_list):
    """
    参数：
    word -- 待添加的词汇
    freq_list -- 词频列表

    返回值：
    无
    """
    word_str = ','.join(map(str.strip, word)).strip('[]\'\"') # 将词汇转换为字符串并去除引号和方括号
    # 将逗号分隔的字符串转换为词汇列表
    word_list = word_str.split(',')
    
    for w in word_list:
        added = False
        for i in range(len(freq_list)):
            if freq_list[i][0] == w:
                freq_list[i][1] += 1
                added = True
                break
        if not added:
            freq_list.append([w, 1])

2.5调用实现

#导入相关包
import re
import os
import time
import pandas as pd
import jieba


#传入词典
senti_dict_path = 'D:/emotion_project/origin/tici/大连理工情感词汇.txt'
degree_dict_path = 'D:/emotion_project/origin/tici/副词赋值.txt'
not_dict_path = 'D:/emotion_project/origin/tici/否定词.txt'
stopword_path = 'D:/emotion_project/origin/tici/cn_stopwords.txt'

#加载词典实例化对象sa类
sa_obj = sa(senti_dict_path, degree_dict_path, not_dict_path, stopword_path)

#计算情值实例化对象ScoreAnalysis类
sa = ScoreAnalysis(senti_dict_path, degree_dict_path, not_dict_path, stopword_path)

#**************************************************************************

#分析deepl机器翻译译本每句8种情感值,生成情感表格、词频表格

machine_trans = [ "deepl"]
  
f_deepl   = "new_deepl_translated.txt"   #文本路径        
files  = [f_deepl]

情类 = ['好','乐','怒','哀','惧','恶','惊','思']
表头 = ["原句","正面","负面","好","好词","乐","乐词","怒","怒词","哀","哀词","惧","惧词","恶","恶词","惊", "惊词","思","思词"]
情感乐 = [[0]*5]*64

篇号 = 0 
章号 = 0
行号 = 0

#**************************************************************************

开始时间 = time.time()
for 篇 in files[0:]:#不含后边界 共5篇 
    
    #情感值统计表结果路径
    writer = pd.ExcelWriter("D:/emotion_project/" + machine_trans[篇号]+'.xlsx')

    #词频统计表结果路径
    词频表格 = pd.ExcelWriter("D:/emotion_project/" + machine_trans[篇号]+'词频表.xlsx')

    正面词频 = []  
    负面词频 = []
    八情词频 = [[] for i in range(8)]
  
    章号 = 0       
    章集 = SplitFile(篇)  #调用-断章-方法
    for 章 in 章集[0:]:  #共64章   
        章情词频 = []
        章情词集 = ""
        句集 = normal_cut_sentence( 章[0] )  # 调用-分句-方法
        章分析 = []
        for 句 in 句集:
            words = sa_obj.cut_words(句)  # 分词
            words_ = sa_obj.remove_stopword(words)  #去除停用词
            八情 = sa.get8score(words_)  #提取情感词和计算情感值

            #数据处理
            正面 = 0
            负面 = 0
            for 情 in 八情:
                if 情[1] > 0 :
                    正面 += 情[1]
                else:
                    负面 += 情[1]


            #添加表格行数据
            行 = []
            行.append(句)
            行.append(正面)
            行.append(负面)
            for 情 in 八情:
                行.append(情[1]) #情感值
                行.append(情[2]) #情感词
            print(行)
            章分析.append(行)


#*******************************词频统计*************************************

            for 情 in 八情[0:2]:  #0,1
                添加词频( 情[2], 正面词频 )

            for 情 in 八情[6:8]:  #6,7
                添加词频( 情[2], 正面词频 )           

            for 情 in 八情[2:6]:  #2,3,4,5
                添加词频( 情[2], 负面词频 )
            i = 0
            for 情 in 八情:
                if len(情[2]) > 0:
                    添加词频(情[2], 章情词频 )
                    添加词频(情[2], 八情词频[i] )
                i +=1

        #print(章情词频)
        第几章 = '第'+str(章号+1) +'章'
        df = pd.DataFrame(章情词频, columns = ['章情词','频'] )
        df.sort_values(by="频",ascending = False, inplace = True) #按词频降序排列
        df.to_excel( 词频表格,  第几章  ,index=False )

#**************************************************************************

        df = pd.DataFrame(章分析, columns = 表头 )
        df.to_excel( writer,  第几章   ,index=False )  
        章号 += 1

    df = pd.DataFrame(正面词频, columns = ['正面词','频'] )
    df.sort_values(by="频",ascending = False, inplace = True)              #按词频降序排列
    df.to_excel( 词频表格,  '正面词频'   ,index=False )

    df = pd.DataFrame(负面词频, columns = ['负面词','频'] )
    df.sort_values(by="频",ascending = False, inplace = True)              #按词频降序排列
    df.to_excel( 词频表格,  '负面词频'   ,index=False )      

    for i in range(8):          
        df = pd.DataFrame(八情词频[i], columns = [情类[i]+'词','频'] )
        df.sort_values(by="频",ascending = False, inplace = True)              #按词频降序排列
        df.to_excel( 词频表格,  情类[i]+'词频'   ,index=False ) 

    词频表格.save()
    writer.save()        
    篇号 += 1 

结束时间 = time.time()
print("耗时",结束时间-开始时间,"秒")

运行结果：

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR