谁不学习揍谁！

大数据可视化项目—基于Python豆瓣电影数据可视化分析系统的设计与实现

大数据可视化项目——基于Python豆瓣电影数据可视化分析系统的设计与实现

本项目旨在通过对豆瓣电影数据进行综合分析与可视化展示，构建一个基于Python的大数据可视化系统。通过数据爬取收集、清洗、分析豆瓣电影数据，我们提供了一个全面的电影信息平台，为用户提供深入了解电影产业趋势、影片评价与演员表现的工具。项目的关键步骤包括数据采集、数据清洗、数据分析与可视化展示。首先，我们使用爬虫技术从豆瓣电影网站获取丰富的电影数据，包括电影基本信息、评分、评论等存储到Mysql数据库。然后，通过数据清洗与预处理，确保数据的质量与一致性，以提高后续分析的准确性。数据分析阶段主要包括对电影评分分布、不同类型电影的数量分布、评分、演员的影响力等方面的深入研究。基于Echarts进行可视化展示，借助Python中的数据分析库（如Pandas、NumPy）和可视化库（如Matplotlib、Seaborn），我们能够以图表的形式清晰地展示电影数据的特征和趋势。最终，我们将分析结果以交互式的可视化界面呈现，用户可以通过系统自定义的查询与过滤功能，深入挖掘他们感兴趣的电影信息。这个项目不仅为电影爱好者提供了一个全面的数据参考平台，也为电影产业从业者提供了洞察行业动向的工具。

最后我们爬取到的字段信息：电影名，评分，封面图，详情url，上映时间，导演，类型，制作国家，语言，片长，电影简介，星星比例，多少人评价，预告片，前五条评论，五张详情图片

 for i,moveInfomation in enumerate(moveisInfomation):
        try:
            resultData = {}
            # 详情
            resultData['detailLink'] = detailUrls[i]
            # 导演（数组）
            resultData['directors'] = ','.join(moveInfomation['directors'])
            # 评分
            resultData['rate'] = moveInfomation['rate']
            # 影片名
            resultData['title'] = moveInfomation['title']
            # 主演（数组）
            resultData['casts'] = ','.join(moveInfomation['casts'])
            # 封面
            resultData['cover'] = moveInfomation['cover']

            # =================进入详情页====================
            detailMovieRes = requests.get(detailUrls[i], headers=headers)
            soup = BeautifulSoup(detailMovieRes.text, 'lxml')
            # 上映年份
            resultData['year'] = re.findall(r'[(](.*?)[)]',soup.find('span', class_='year').get_text())[0]
            types = soup.find_all('span',property='v:genre')
            for i,span in enumerate(types):
                types[i] = span.get_text()
            # 影片类型（数组）
            resultData['types'] = ','.join(types)
            country = soup.find_all('span',class_='pl')[4].next_sibling.strip().split(sep='/')
            for i,c in enumerate(country):
                country[i] = c.strip()
            # 制作国家（数组）
            resultData['country'] = ','.join(country)
            lang = soup.find_all('span', class_='pl')[5].next_sibling.strip().split(sep='/')
            for i, l in enumerate(lang):
                lang[i] = l.strip()
            # 影片语言（数组）
            resultData['lang'] = ','.join(lang)

            upTimes = soup.find_all('span',property='v:initialReleaseDate')
            upTimesStr = ''
            for i in upTimes:
                upTimesStr = upTimesStr + i.get_text()
            upTime = re.findall(r'\d*-\d*-\d*',upTimesStr)[0]
            # 上映时间
            resultData['time'] = upTime
            if soup.find('span',property='v:runtime'):
                # 时间长度
                resultData['moveiTime'] = re.findall(r'\d+',soup.find('span',property='v:runtime').get_text())[0]
            else:
                # 时间长度
                resultData['moveiTime'] = random.randint(39,61)
            # 评论个数
            resultData['comment_len'] = soup.find('span',property='v:votes').get_text()
            starts = []
            startAll = soup.find_all('span',class_='rating_per')
            for i in startAll:
                starts.append(i.get_text())
            # 星星比例（数组）
            resultData['starts'] = ','.join(starts)
            # 影片简介
            resultData['summary'] = soup.find('span',property='v:summary').get_text().strip()

            # 五条热评
            comments_info = soup.find_all('span', class_='comment-info')
            comments = [{} for x in range(5)]
            for i, comment in enumerate(comments_info):
                comments[i]['user'] = comment.contents[1].get_text()
                comments[i]['start'] = re.findall('(\d*)', comment.contents[5].attrs['class'][0])[7]
                comments[i]['time'] = comment.contents[7].attrs['title']
            contents = soup.find_all('span', class_='short')
            for i in range(5):
                comments[i]['content'] = contents[i].get_text()
            resultData['comments'] = json.dumps(comments)

            # 五张详情图
            imgList = []
            lis = soup.select('.related-pic-bd img')
            for i in lis:
                imgList.append(i['src'])
            resultData['imgList'] = ','.join(imgList)

将结果保存到CSV文件和SQL数据库中，并在完成后更新页数记录。

从豆瓣电影数据中提取演员和导演的电影数量信息，以便后续的分析和可视化展示。

def getAllActorMovieNum():
    allData = homeData.getAllData()
    ActorMovieNum = {}
    for i in allData:
        for j in i[1]:
            if ActorMovieNum.get(j,-1) == -1:
                ActorMovieNum[j] = 1
            else:
                ActorMovieNum[j] = ActorMovieNum[j] + 1
    ActorMovieNum = sorted(ActorMovieNum.items(), key=lambda x: x[1])[-20:]
    x = []
    y = []
    for i in ActorMovieNum:
        x.append(i[0])
        y.append(i[1])
    return x,y

定义统计导演执导电影数量的函数getAllDirectorMovieNum()：

def getAllDirectorMovieNum():
    allData = homeData.getAllData()
    ActorMovieNum = {}
    for i in allData:
        for j in i[4]:
            if ActorMovieNum.get(j,-1) == -1:
                ActorMovieNum[j] = 1
            else:
                ActorMovieNum[j] = ActorMovieNum[j] + 1
    ActorMovieNum = sorted(ActorMovieNum.items(), key=lambda x: x[1])[-20:]
    x = []
    y = []
    for i in ActorMovieNum:
        x.append(i[0])
        y.append(i[1])
    return x,y

allData = homeData.getAllData()：调用homeData模块中的getAllData函数，获取所有的电影数据，并将其保存在allData变量中。
ActorMovieNum = {}：创建一个空字典ActorMovieNum，用于存储导演与其执导电影数量的映射。
for i in allData:：遍历所有电影数据，其中i代表每一部电影的信息。
for j in i[4]:：在每部电影的信息中，使用i[4]访问导演的信息，然后遍历每个导演。
if ActorMovieNum.get(j, -1) == -1:：检查字典ActorMovieNum中是否已经存在该导演的记录。如果不存在，则将该导演作为键加入字典，并将对应的值初始化为1。
else:：如果字典中已存在该导演的记录，则将对应的值加1，表示该导演又执导了一部电影。
ActorMovieNum = sorted(ActorMovieNum.items(), key=lambda x: x[1])[-20:]：将字典中的导演及其执导电影数量按照电影数量进行降序排序，然后取排序后的前20项。排序的依据是key=lambda x: x[1]，即按照字典中的值进行排序。
x = [] 和 y = []：创建两个空列表，用于存储导演名称和对应的执导电影数量。
for i in ActorMovieNum:：遍历排序后的前20项导演及其执导电影数量。
x.append(i[0]) 和 y.append(i[1])：将导演的名称和执导电影数量分别加入列表x和y。
return x, y：返回存储导演名称和执导电影数量的两个列表。

从名为homeData的模块中导入getAllData函数，然后使用pandas库创建一个数据框（DataFrame）df。getAllData函数的返回值被传递给DataFrame的构造函数，同时指定了数据框的列名。

from . import homeData: 这行代码从当前目录（.表示当前目录）导入homeData模块。
import pandas as ps: 这行代码导入pandas库，并使用ps作为别名。一般来说，pandas的别名是pd，但在这里使用了ps。
df = ps.DataFrame(homeData.getAllData(), columns=[...]): 这行代码创建一个数据框df，并使用homeData.getAllData()的返回值填充数据框。列名由columns参数指定，列的顺序与列表中的顺序相对应。列名包括：
- ‘id’: 电影ID
- ‘directors’: 导演
- ‘rate’: 评分
- ‘title’: 标题
- ‘casts’: 演员
- ‘cover’: 封面
- ‘year’: 上映年份
- ‘types’: 类型
- ‘country’: 制片国家
- ‘lang’: 语言
- ‘time’: 时长
- ‘moveiTime’: 电影时长
- ‘comment_len’: 评论长度
- ‘starts’: 星级
- ‘summary’: 摘要
- ‘comments’: 评论
- ‘imgList’: 图片列表
- ‘movieUrl’: 电影链接
- ‘detailLink’: 详细链接

这样就创建了一个包含特定列名的数据框，其中的数据来自homeData.getAllData()函数的返回结果。

from . import homeData
import pandas as ps
df = ps.DataFrame(homeData.getAllData(),columns=[
        'id',
        'directors',
        'rate',
        'title',
        'casts',
        'cover',
        'year',
        'types',
        'country',
        'lang',
        'time',
        'moveiTime',
        'comment_len',
        'starts',
        'summary',
        'comments',
        'imgList',
        'movieUrl',
        'detailLink'
    ])

从数据框（DataFrame）中的’country’列中提取地址数据。数据框中的地址数据提取出来，并统计每个地址出现的次数。它首先检查’country’列中的每个元素，如果元素是一个列表，则将列表中的每个元素添加到一个新的列表（address）中。然后，它创建一个字典（addressDic），将地址作为键，出现次数作为值，最后返回地址列表和对应的出现次数列表。

def getAddressData():
    # 获取名为 'country' 的列的值
    addresses = df['country'].values
    
    # 创建一个空列表来存储地址
    address = []
    
    # 遍历 'country' 列的每个元素
    for i in addresses:
        # 如果元素是列表类型
        if isinstance(i, list):
            # 遍历列表中的每个元素并添加到 address 列表中
            for j in i:
                address.append(j)
        else:
            # 如果元素不是列表类型，直接将其添加到 address 列表中
            address.append(i)
    
    # 创建一个空字典来存储地址及其出现次数
    addressDic = {}
    
    # 遍历地址列表中的每个元素
    for i in address:
        # 如果地址字典中不存在该地址，则将其添加并设置出现次数为1
        if addressDic.get(i, -1) == -1:
            addressDic[i] = 1
        else:
            # 如果地址字典中已存在该地址，则将其出现次数加1
            addressDic[i] = addressDic[i] + 1
    
    # 返回地址列表和对应的出现次数列表
    return list(addressDic.keys()), list(addressDic.values())

从数据框的’lang’列中提取语言数据，并统计每种语言出现的次数。最终返回语言列表和对应的出现次数列表。

def getLangData():
    # 获取名为 'lang' 的列的值
    langs = df['lang'].values
    
    # 创建一个空列表来存储语言数据
    languages = []
    
    # 遍历 'lang' 列的每个元素
    for i in langs:
        # 如果元素是列表类型
        if isinstance(i, list):
            # 遍历列表中的每个元素并添加到 languages 列表中
            for j in i:
                languages.append(j)
        else:
            # 如果元素不是列表类型，直接将其添加到 languages 列表中
            languages.append(i)
    
    # 创建一个空字典来存储语言及其出现次数
    langsDic = {}
    
    # 遍历语言列表中的每个元素
    for i in languages:
        # 如果语言字典中不存在该语言，则将其添加并设置出现次数为1
        if langsDic.get(i, -1) == -1:
            langsDic[i] = 1
        else:
            # 如果语言字典中已存在该语言，则将其出现次数加1
            langsDic[i] = langsDic[i] + 1
    
    # 返回语言列表和对应的出现次数列表
    return list(langsDic.keys()), list(langsDic.values())

数据库创建四个表：

修改为自己的数据库主机名和账号密码：

启动项目：

服务端口：5000 http://127.0.0.1:5000

用户注册 http://127.0.0.1:5000/registry

用户登录

首页页面展示：

还有电影数据，包括电影名、评分、片场、预告片等数据。

查看电影预告片

电影搜索

电影产量分析

电影数据时长分布占比

电影评分统计分析

豆瓣评分星级饼状图、豆瓣年度评价评分柱状图

豆瓣电影中外评分分布图

数据视图切换

电影拍摄地点统计图

电影语言统计图

电影类型饼图

导演作品数量前20

数据表操作

标题词云图

简介词云图

s4XV8qh-1701860368769)

演员名词云图

评论词云图

经过对一系列测试结果的有效分析，本平台开发系统符合用户的要求和需求。所有的基本功能齐全，可视化展示效果好，服务运行稳定，操作起来简单方便，测试系统性能、整体设计和代码逻辑都很Nice！

各位有兴趣的小伙伴 可以扫码要项目开发文档、完整项目源码和其它相关资料。

后面有时间和精力也会分享更多关于大数据领域方面的优质内容，喜欢的小伙伴可以点赞关注收藏，有需要的都可以私信我！感谢各位的喜欢与支持！

使用C#读取、创建、修改Excel文件 ocean1992 开发常用知识 Windows Excel C#
使用C#读取、创建、修改Excel文件开发环境基本类型和概念读取和拷贝打开xls文件获取已编辑区域保存和退出其他功能Excel表格文件在我们的日常工作中非常常见，例如各类财务，会计，交易流水。有时候我们需要从中根据我们特定的规则提取，整理一些信息。Excel内置的函数和宏代码可以帮助我们完成一些简单的任务，面对复杂的一些任务缺无能为力。在此简要展示如何使用c#来操作excel文件，利用c#编写程序
DataGrip的数据库驱动的离线安装一口酥Hac 数据库数据库
文章目录概要离线安装数据库驱动本地云桌面注意概要在某些工作环境中，由于网络访问受限，可能无法自动下载所需的数据库驱动。离线安装数据库驱动本地本地的DataGrip打开File->DataSources:云桌面云桌面的DataGrip打开File->DataSources:注意请确保下载的驱动版本与您所使用的数据库版本完全兼容，以避免出现连接或功能异常。
def __init__(self)是什么意思_通俗的告诉你Python中 init_ 到底是什么含义？ cjz0422 python
Python是面向对象的编程语言，因此我从Class、Instance以及属性(property/attribute)的角度出发解释。_init_根据其英文意思(initialize)，用来初始化一个类(class)的新成员(instance)，它是一个constructor.当新成员被创建时，这个方程会自动被调用。举个栗子1，使用_init_方程我们创建了一个叫做“人类”(Person)的类别，
Oracle PL/SQL 编程入门：第八章异常 caifox菜狐狸 Oracle PL/SQL 编程入门 oracle sql 数据库异常异常范围自定义异常 Exceptions
欢迎来到OraclePL/SQL编程入门的第八章！在这一章中，我们将深入探讨PL/SQL中的异常处理机制。通过学习如何定义和使用自定义异常、内置异常以及异常链，你将能够编写更加健壮和可靠的程序。此外，我们还会介绍一些注意事项，并通过实际例子展示它们的用法。准备好迎接新的挑战了吗？让我们开始吧！第一节：异常范围异常处理是编程中的重要组成部分，它允许你在运行时捕获并处理错误，从而避免程序崩溃。PL/S
python学习-def __init__(self)理解（1）哦里哦里哦里给深度学习
python中__init__()的作用在python中创建类后，通常会创建一个init__()方法，这个方法会在创建类的实例的时候自动执行。实例1:【实例化Bob这个对象的时候，__init__()方法会自动执行】：在下面的示例中，我们在实例化Bob这个对象的时候，__init__()方法就已经自动执行了，如果不是__init__()方法，比如说eat()方法，那就只有在调用时才会执行。clas
PyQT5 键盘模拟/鼠标连点器的实现一个爱折腾的小人物 python qt 开发语言游戏程序 python 开源经验分享
近来在玩一个游戏，找不到合适的鼠标连点器，不是有广告就是功能太复杂，自己写了一个，分享出来，如果有需要的可以自行运行研究。准备工作Python版本：Python3.12.3；运行前确保pyQT5已经安装：pipinstallPyQt5程序运行界面：程序代码：通过引入单独的常量和变量文件，并为每个元素增加中文注释来实现界面语句、变量和常量的统一规划。代码：常量定义文件（constants.py）#c
AI重塑SaaS：从工具到智能业务伙伴 XianxinMao 人工智能
标题：“AI重塑SaaS：从工具到智能业务伙伴”文章信息摘要：AI代理正在推动SaaS产品从静态工具向动态、自优化平台转变，赋予其预测能力和自主决策能力，使其成为主动的业务伙伴。通过实时分析用户行为和市场需求，AI代理能够自动调整系统功能，优化业务流程，并预测未来需求。这一转变不仅提升了SaaS产品的效率和灵活性，还使其从被动工具演变为智能伙伴。然而，AI代理的广泛应用也带来了隐私、伦理和监管挑战
Nginx前端后端共用一个域名如何配置 Misnice Nginx nginx 前端运维
在Nginx中配置前端和后端共用一个域名的情况，通常是通过路径或子路径将请求转发到不同的服务。以下是一个示例配置，假设：前端静态文件在/var/www/frontend/。后端API服务运行在http://127.0.0.1:5000。域名是example.com，其中：静态前端通过example.com访问。后端API通过example.com/api/访问。server{listen80;se
【华为OD-E卷 - 字符串解密 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-字符串解密100分（python、java、c++、js、c）】题目给定两个字符串string1和string2。string1是一个被加扰的字符串。string1由小写英文字母（’a’~’z’）和数字字符（’0’~’9’）组成，而加扰字符串由’0’~’9’、’a’~’f’组成。string1里面可能包含0个或多个加扰子串，剩下可能有0个或多个有效子串，这些有效子串被加扰子串隔开
Python学习日记------def __init__( ):函数 Canliays 学习 python
在Python中，__init__方法是类的构造函数，用于在创建对象时进行初始化。它可以接受参数也可以不接受参数，具体的选择取决于你是否希望在创建对象时传入初始值。无参数的__init__方法无参数的__init__方法通常在类定义时使用默认值来初始化属性，而不需要在创建对象时传入任何参数。classStudent:def__init__(self):self.name="Unknown"#默认值
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，深度学习作为其主要驱动力之一，已经在各个领域取得了显著的成果。然而，随着模型规模的不断扩大，如何高效地搭建、训练和部署深度学习模型，成为一个亟待解决的问题。传统的单机训练方式在计算资源有限的情况
Python Flask教程洒脱的六边形战士加辣 python python flask 开发语言
一、前言Flask是一个用Python编写的轻量级的Web应用框架。Flask基于WSGI（WebServerGatewayInterface）和Jinja2模板引擎，旨在帮助开发者快速、简便地创建Web应用。Flask被称为"微框架"，因为它使用简单的核心，用扩展增加其他功能。1.HelloWorld以下的Flask程序会在网页输出HelloWorld：fromflaskimportFlaska
LeetCode - #195 Swift 实现打印文件中的第十行网罗开发 Swift vue.js leetcode swift
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
【Matlab高端绘图SCI绘图模板】第006期对比绘柱状图（只需替换数据）小熊科研路（同名GZH）可视化 matlab 信息可视化开发语言
1.简介柱状图作为科研论文中常用的实验结果对比图，本文采用了3组实验对比的效果展示图，代码已调试好，只需替换数据即可生成相关柱状图，为科研加分。通过获得Nature配色的柱状图，让你的论文看起来档次更高，让你的科研更快地进行成果产出。用户能够生成既美观又精确的数据可视化图表。代码涵盖了从数据准备到最终图像输出的全过程，包括文件读取、颜色自定义、图形界面设置、数据可视化以及图像导出等关键步骤。适合数
python windows 外部usb设备检测 myzzb python windows 后端驱动开发交互
importwin32com#测试使用KINGSTON金士顿u盘list_name=["KINGSTON"]#windows外部设备检测defdetect():"""检测windows的外部设备通过全局变量把控，用的是匹配不是相等return获取到文件列表"""wmi=win32com.client.Dispatch("WbemScripting.SWbemLocator")service=wmi
python 双端口截图数据传输显示 myzzb 网络 python 图像处理 tkinter 学习
importioimporttimeimportsocketimportpyautoguidefcapture_and_send_image():whileTrue:try:#pil_image=Image.new("RGB",(160,90),(255,255,255))##截图screenshot=pyautogui.screenshot()##缩小图片new_size=(screenshot
知识图谱自动构建工具有哪些 Nate Hillick 知识图谱 neo4j 人工智能
知识图谱的自动构建工具有很多，常见的包括:Neo4j:基于图数据库的知识图谱构建工具Protégé:开源的知识图谱开发平台GoogleKnowledgeGraph:Google搜索引擎的知识图谱构建工具TopBraidComposer:基于SemanticWeb技术的知识图谱构建工具AllegroGraph:高性能图数据库，可用于构建知识图谱这仅仅是其中一部分工具，在市场上还有更多类似的工具。
python里permission denied错误是什么_Python错误：PermissionError: [Errno 13] Permission denied 如何解决... weixin_39954889 denied错误是什么
相关推荐2019-12-2014:41−zabbix启动报错cannotsetresourcelimit:[13]Permissiondenied1、zabbix-server启动报错报错信息如下：1668:20191220:140823.988usingconfiguratio...02152019-12-0914:59−作者：warm3snow出处：http://www.cnblogs.com
python权限不够无法写入_解决python使用pip安装模块的权限问题 weixin_39922929 python权限不够无法写入
ubuntu16.04下默认的python和pip1.ubuntu16.04默认安装了两个版本的python,python2.7和python3.5,可以使用python-V查看版本命令行中python是2.7版本,python3是python3.5版本请注意，系统自带的python千万不能卸载！2.ubuntu默认没有装pip,我们一般用sudoapt-getinstallpip,这样安装的是p
python 只用opencv吗,python – OpenCV：使用solvePnP来确定单应性 weixin_39934296 python 只用opencv吗
在过去的几周里,我尝试学习纠正图像,并在这里的人们的帮助下,我已经设法更好地理解它.大约一个星期前,我设置了一个我想要纠正的测试示例(从上面查看图像).这很好(原始：http://sitedezign.net/original.jpg和纠正：http://sitedezign.net/rectified.jpg)功能T=cv2.getPerspectiveTransform(UV_cp,XYZ_g
opencv python视频教程-OpenCV视频操作 weixin_37988176
使用工具Python3.5，使用库numpy；opencv1.用摄像头捕获视频cv2.VideoCapture()：0为默认计算机默认摄像头，1可以更换来源；~~~importnumpyasnpimportcv2cap=cv2.VideoCapture(0)while(True):#captureframe-by-frameret,frame=cap.read()#ouroperationonth
ARC碱金属Rydberg状态计算器软件包-2.0.1 夏勇兴
本文还有配套的精品资源，点击获取简介：此标题"ARC_Alkali_Rydberg_Calculator-2.0.1-cp27-macosx_10_6_x86_64.whl"为一个特定版本的PythonWheel软件包，旨在计算碱金属原子的Rydberg状态。适用于Python2.7版本，专为macOS10.6（SnowLeopard）64位架构设计。Rydberg状态是原子物理学中的一个重要概念
Monorepo 在网易的工程改造实践若川视野前端 javascript npm vue.js 开发语言
大家好，我是若川。我持续组织了近一年的源码共读活动，感兴趣的可以点此扫码加我微信lxchuan12参与，每周大家一起学习200行左右的源码，共同进步。同时极力推荐订阅我写的《学习源码整体架构系列》包含20余篇源码文章。历史面试系列。另外：目前建有江西|湖南|湖北籍前端群，可加我微信进群。背景目前云音乐内有多个RN收银台场景分布在不同的工程，比如页面收银台，浮层收银台，个性收银台等，后续可能还会有别
opencv 播放视频 smwhotjay opencv
看资料cv播放视频是用VideoCapture。结果始终打不开文件，open(0);倒是可以打开摄像头。于是抛弃他的c++类，用c接口来播放。结果ok.//打开CvCapture*capture=cvCreateFileCapture("a.avi");if(!capture){return-1;}//视频信息intcam_width=(int)cvGetCaptureProperty(captu
# 第一章：认识chatgpt 出门喝奶茶 chatgpt chatgpt
chatgpt发展背景详细介绍一、基础理论背景人工智能和自然语言处理的兴起早期理论:20世纪中期，人工智能（AI）初见端倪，目标是模拟人类智能。自然语言处理作为AI的重要分支，致力于让机器理解和生成人类语言。关键里程碑:1980年代的统计方法和2000年代的神经网络技术，使NLP实现了从规则驱动到数据驱动的转变。神经网络与深度学习2010年代，深度学习的兴起极大推动了NLP的发展。基于大规模语料库
Pycharm报错Python error: PermissionError: [Errno 13] Permission denied: 码农界的小小学生 python
Pycharm报错Pythonerror:PermissionError:[Errno13]Permissiondenied:在pycharm中读取csv文件时，出现错误PermissionError:[Errno13]Permissiondenied:。看了大部分博客说是因为文件权限问题，或者文件被手动打开，这两个方法都试了试后，无效。解决问题的方法：配置Python编译器时将ScriptPat
机器学习&深度学习目录 UQI-LIUWJ 各专栏目录深度学习人工智能 1024程序员节
机器学习模型机器学习笔记：Transformer_刘文巾的博客-CSDN博客attention相关机器学习笔记：attention_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ELMOBERT_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ViT（论文AnImageIsWorth16X16Words:TransformersforImageRecognitionatScale）_UQ
＜sa8650＞QCX Usecase 使用详解— Spectra Studio工程建立 waterAdmin 数据库车载系统视觉检测 c++c语言
＜sa8650＞QCXUsecase使用详解—SpectraStudio工程建立一前言二建立usecase工程2.1前提2.2创建usecase工程3.2查看usecase2三总结一前言目前高通平台在camera模块中，我们会使用到usecase这么一个功能模块；本文主要讲解sa8650平台中，通过SpectraStudio可视化配置usecase的使用。usecase的配置涉及到视频流在CAMX
医院服务总线常见架构比较：面向服务架构与事件驱动架构登山看云海医院信息集成平台架构系统架构
随着医疗信息化的快速发展，医院系统的集成需求日益增长。电子病历（EMR）、临床信息系统（CIS）、实验室信息系统（LIS）等各类系统之间的数据交换和协同工作，要求信息系统能够实现高效、稳定、可扩展的架构设计。在这种背景下，企业服务总线（ESB，EnterpriseServiceBus）成为关键的集成解决方案。本文将重点对比两种常见架构——面向服务架构（SOA，Service-OrientedArc
RAG系列（二）：如何优化索引东临碣石82 kotlin android 开发语言
上篇文章总览了RAG的各个环节，这篇我们接着讲第一个环节也就是“索引”环节如何做优化。具体细节“人人都是产品经理”的这篇文章里有非常详细的说明，不过我对微软体系搜索优化了解的多些，看到过的一些优化方法这里没有提到，比如微软的AISearch还有DataverseSemanticSearch里用到一些优化方法这里就没看到。知识搜索是一个可以扣出很多细节的领域，这里做个备考、补充学习过程中的一些体会并
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

大数据可视化项目—基于Python豆瓣电影数据可视化分析系统的设计与实现

大数据可视化项目——基于Python豆瓣电影数据可视化分析系统的设计与实现

你可能感兴趣的:(自然语言处理,知识图谱,可视化,信息可视化,python,开发语言,数据库,前端,学习,echarts)