逐梦苍穹

python获取职教云信息

⭐作者介绍：大二本科网络工程专业在读，持续学习Java，努力输出优质文章
⭐作者主页：@逐梦苍穹
⭐所属专栏：项目。

1、需求

1.1、推荐课程

1.2、课程详情

对于上面每个课程，点击图片能跳转到对应课程页面，爬取中上面每个课程页面中的如下红色线划出的信息并保存为“课程详细列表.csv”。各栏目依次为：课程名称，所属专业，学时安排，课程进度，学时数，累计选课人数，本期选课人数，学员所属单位数，本期学员所属单位数，累计互动次数，本期互动次数，累计日志总数。

2、思路分析

爬虫代码通用的部分，也是最重要的部分：请求头和资源访问路径。
请求头是模拟普通用户通过浏览器访问的行为，以此初步跳过爬虫检测机制

这里的推荐课程和课程详情的爬取，均使用解析JSON格式的数据的方式！

2.1、推荐课程

首先我们知道，对于前后端交互数据，需要使用Ajax。所以对浏览器请求抓包可以得到：

在这里可以看到，这个JSON响应的数据里面包含了一整页的数据，这些数据在portalMooc_selectCourseList.action里面，所以先定位这个资源的路径是什么：

可以看到，资源路径是：https://mooc.icve.com.cn/patch/zhzj/portalMooc_selectCourseList.action
但是如果去访问这个路径，会发现无法请求。
查看请求头，发现是POST：

使用python代码去访问，也是失败。

POST请求的资源，需要传入请求数据data，如下便是可以成功访问资源的代码：

那么这个data是怎么来的呢？
查看负载：

至此，关于推荐课程单页的获取，就结束了。接下来爬取多页，无非就是加循环。解析数据无非就是把json的键值对进行提取，不再赘述了。请看全部的代码，代码即注释：

完整代码

import csv
import json

import requests
from datetime import datetime

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53\
    7.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'
}
url = 'https://mooc.icve.com.cn/patch/zhzj/portalMooc_selectCourseList.action'
file = open('919页推荐课程.csv', mode='a', newline="",encoding='utf-8')
writer = csv.writer(file)
writer.writerow(['课程名称', '开课学校', '开始时间', '结束时间', '授课教师', '学习人数', '开课次数', '开课周次'])
for i in range(801, 920):
    data = {
        'newOrHot': 'hot',
        'curPage': i,
        'pageSize': '10',
        'state': '',
        'certificate': '',
        'majorType': 'all',
        'majorStatus': '全部',
        'searchValue': '',
        'projectCourseType': 'all',
        'publishCourseType': 'all',
        'cacheConditions': 'all'
    }
    response = requests.post(url, headers=headers, data=data)

    # 检查响应状态码是否为200，表示请求成功
    if response.status_code == 200:
        try:
            current_time = datetime.now()
            classesStartWeekly = ""
            dct = json.loads(response.text)['data']['items']  ##json字符串转换成python对象
            # print(dct)
            for data in dct:
                className = data[1]
                schoolName = data[2]
                startTime = data[3]
                endTime = data[4]
                teacher = data[5]
                learningNum = data[11]
                numberOfClass = data[9]

                time_diff = datetime.strptime(endTime + ' 23:59', '%Y-%m-%d %H:%M') - datetime.strptime(startTime + ' 0:00', '%Y-%m-%d %H:%M')
                if current_time > datetime.strptime(endTime, '%Y-%m-%d'):
                    current_weeks = (time_diff.seconds // 3600) // 7
                    classesStartWeekly = "课程已结束"
                elif(current_time < datetime.strptime(startTime, '%Y-%m-%d')):
                    classesStartWeekly = "课程未开始"
                else:
                    current_time_diff = current_time - datetime.strptime(startTime + ' 0:00', '%Y-%m-%d %H:%M')
                    current_weeks = current_time_diff.days // 7
                    if current_time_diff.days % 7 > 0:
                        current_weeks += 1
                    classesStartWeekly = current_weeks

                writer.writerow([className, schoolName, startTime, endTime, teacher,learningNum, numberOfClass, classesStartWeekly])
                print(className, schoolName, startTime, endTime, teacher, learningNum, numberOfClass, classesStartWeekly)
        except:
            pass
    else:
        print('请求失败')

2.2、课程详情

课程详情和推荐课程类似，即是抓包获取JSON数据。但是发现获取到的数据只包含部分。所以通过抓包，看到了前端的JS文件，通过对JS文件的分析，找到了所有的数据。

找到JSON数据

第一步我们需要先找到JSON的数据，这个地方和上面的推荐课程略有不同，这里需要间接获取。
可以看到我们"需要的所有数据"都在这里，这是第三个请求路径：(实际上数据不全，但是我们能获取到的只有这部分，后面再细说)

那么我们通过上面的推荐课程爬取，可以知道这部分的数据请求都是POST，需要传入data去请求，此时我们查看负载：

发现如果想要请求这个JSON资源，还需要传入两个Id：classId和courseId。
很明显这个Id加密过，没有办法得出规律，那么就需要利用其他渠道获取。
此时猜想，这个Id的数据肯定也是利用Ajax响应到前端的JSON资源。尝试寻找：

可以发现两个Id在这里，这是第二个请求路径。此时查看负载，发现还缺少classCode：

继续寻找，发现找不到了。这个地方的"类代码"应该是某一个唯一标识，一门课程对应一门。所以这个数据，应该是在一开始的"推荐课程"那里传递的：

此处，这是第一个请求路径。

最终思路

那么此时思路就明确了：
先通过第一个请求路径，得到classCode，
再把这个classCode作为data传递请求第二个请求路径的资源，获取到classId和courseId，
再把这两个Id作为data传递请求第三个请求路径的资源，获取到我们需要的课程详情的JSON数据。

URL
第一个：https://mooc.icve.com.cn/patch/zhzj/portalMooc_selectCourseList.action
第二个：https://mooc.icve.com.cn/patch/zhzj/portalMooc_getClassAndCourseIdByCode.action
第三个：https://mooc.icve.com.cn/patch/zhzj/portalMooc_selectCourseDetails.action

新的问题

此时获取到数据之后，发现了新的问题：有些数据是没有通过JSON格式传递的！
那么这些数据是怎么展现到前端页面的呢？毫无疑问是后端传递上来的JSON数据里面的某些数据，拿上来放在前端计算了。所以我们应该尝试找到前端计算的代码，我们可以去寻找JS文件：

可以看到，应该就是它了，但是我们不是要把它抓下来，而是要看它是如何计算的，然后照葫芦画瓢在python代码中计算。下面举个简单例子说明：(本期互动)
①定位前端元素

②JSON查找disCount

传的是0
③那就只能去JS里面查找

找到了这段逻辑，可以看到里面的num1和num2就是我们要的数据。剩下的数据以此类推，然后转为python代码，如：

完整代码

# -*- coding: utf-8 -*-
# @Author:︶ㄣ释然
# @Time: 2023/6/20 14:29
import csv
import json

import requests
from datetime import datetime
from termcolor import colored

file1 = open('919页课程详细列表.csv', mode='a', newline="", encoding='utf-8')
writer1 = csv.writer(file1)
writer1.writerow(['课程名称', '所属专业', '学时安排', '课程进度', '学时数', '累计选课人数', '本期选课人数', '学员所属单位数', '本期学员所属单位数', '累计互动次数', '本期互动次数', '累计日志总数','开课学校','学校类别','开始时间','结束时间'])

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53\
    7.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'
}
# list_classCode = []
# list_classId_and_courseId = []

'''每一次循环爬一页热门推荐页，一页十条'''
def getClassCode(url_getClassCode):
    file2 = open('919页热门推荐页ClassCode.csv', mode='a', newline="", encoding='utf-8')
    writer2 = csv.writer(file2)
    for i in range(801, 920):
        data_getClassCode = {
            'newOrHot': 'hot',
            'curPage': i,
            'pageSize': '10',
            'state': '',
            'certificate': '',
            'majorType': 'all',
            'majorStatus': '全部',
            'searchValue': '',
            'projectCourseType': 'all',
            'publishCourseType': 'all',
            'cacheConditions': 'all'
        }
        try:
            response = requests.post(url_getClassCode, headers=headers, data=data_getClassCode)
            # 检查响应状态码是否为200，表示请求成功
            if response.status_code == 200:
                dct = json.loads(response.text)['data']['items']
                for data_getClassCode in dct:
                    # list_classCode.append(data_getClassCode[12])
                    writer2.writerow([data_getClassCode[12]])
                print("成功获取热门推荐页第%s页" % i)

            else:
                print('请求失败')
        except:
            pass


'''查每一条的classId和courseId，上面for一次，这里就可以for10次'''
def getClassId_and_CourseId(url_getClassId_and_CourseId):
    file3 = open('919页classId_and_courseId.csv', mode='a', newline="", encoding='utf-8')
    writer3 = csv.writer(file3)

    csvfile = open('919页热门推荐页ClassCode.csv', newline='')
    reader = csv.reader(csvfile)
    listReader = list(reader)
    for i in range(6001, 9167):
        data_getClassId_and_CourseId = {
            'classCode': listReader[i][0]
        }
        try:
            response = requests.post(url_getClassId_and_CourseId, headers=headers, data=data_getClassId_and_CourseId)
            if response.status_code == 200:
                dct = json.loads(response.text)['data']
                # list_classId_and_courseId.append(dct)
                writer3.writerow([dct])
                print("成功获取第%s门课程的classId和courseId" % i)
            else:
                print('请求失败')
        except:
            pass


'''根据上面查到的两个Id，开始获取详情页JSON数据'''
def details(url_details):
    csvfile = open('919页classId_and_courseId.csv', newline='')
    reader = csv.reader(csvfile)
    listReader = list(reader)

    for i in range(1, 9154):
        current_time = datetime.now()

        json_str = str(listReader[i - 1][0])
        json_str = json_str.replace("'", "\"")
        dictionary = json.loads(json_str)

        data_details = {
            'classId': dictionary['classId'],
            'courseId': dictionary['courseId']
        }
        response = requests.post(url_details, headers=headers, data=data_details)
        if response.status_code == 200:
            try:
                dct = json.loads(response.text)
                className = dct['data']['className']
                majorName = dct['data']['majorName']
                learningPlan = round(float(dct['data']['learningTime']) / int(dct['data']['weekNum']), 2)
                weekDate = 0
                learningTime = dct['data']['learningTime']
                allClassPeople = int(dct['courseMoocData'][0][3]) + int(dct['classSpocList'][0][0])
                classPeople = dct['data']['classPeople']
                allSchoolCount = dct['courseMoocData'][0][0]
                schoolCount = dct['data']['schoolCount']
                allDisCount = int(dct['courseMoocData'][0][1]) + int(dct['classSpocList'][0][1])
                disCount = 0
                allLogCount = int(dct['courseMoocData'][0][2]) + int(dct['classSpocList'][0][3])
                schoolName = dct['data']['schoolName']
                schoolCategory = dct['data']['category']
                startTime = dct['data']['startTime']
                endTime = dct['data']['endTime']

                time = (current_time - datetime.strptime(dct['data']['startTime'], '%Y-%m-%d %H:%M:%S.%f'))
                time = time.days // 7
                weekDate = time
                if current_time < datetime.strptime(dct['data']['endTime'], '%Y-%m-%d %H:%M:%S.%f'):
                    if time % 7 > 0:
                        weekDate += 1
                else:
                    weekDate = int(dct['data']['weekNum'])

                questionNum = dct['data']['questionNum']
                noteNum = dct['data']['noteNum']
                allQuestionNum = dct['courseMoocData'][0][4]
                allNoteNum = dct['courseMoocData'][0][5]
                disCount = dct['data']['disCount']
                # print(questionNum,noteNum,allNoteNum,allQuestionNum)
                if disCount == '' or disCount is None:
                    disCount = 0
                if questionNum == '' or questionNum is None:
                    questionNum = 0
                if noteNum == '' or noteNum is None:
                    noteNum = 0
                if allQuestionNum == '' or allQuestionNum is None:
                    allQuestionNum = 0
                if allNoteNum == '' or allNoteNum is None:
                    allNoteNum = 0

                # 累计互动
                if (dct['postData']['data']['totalCount'] == None or 0 == dct['postData']['data']['totalCount'] or "0" == dct['postData']['data']['totalCount']):
                    allDisCount = int(allDisCount) + int(allQuestionNum) + int(allNoteNum)

                else:
                    allDisCount = int(allDisCount) + int(dct['postData']['data']['totalCount']) + int(allQuestionNum) + int(
                        allNoteNum)

                # 本期互动
                if (dct['postData']['data']['nowCount'] == None or 0 == dct['postData']['data']['nowCount'] or "0" == dct['postData']['data'][
                    'nowCount']):
                    disCount = int(disCount) + int(questionNum) + int(noteNum)

                else:
                    disCount = int(disCount) + int(dct['postData']['data']['nowCount']) + int(questionNum) + int(noteNum)
                writer1.writerow([className, majorName, learningPlan, weekDate, learningTime, allClassPeople, classPeople, allSchoolCount, schoolCount, allDisCount,
                                  disCount, allLogCount,schoolName,schoolCategory,startTime,endTime])
                print(className, majorName, learningPlan, weekDate, learningTime, allClassPeople, classPeople, allSchoolCount, schoolCount, allDisCount,
                      disCount, allLogCount,schoolName,schoolCategory,startTime,endTime)
            except Exception as e:
                print(colored(str(e), 'red'))
        else:
            print('请求失败')


if __name__ == '__main__':
    url_getClassCode = 'https://mooc.icve.com.cn/patch/zhzj/portalMooc_selectCourseList.action'
    url_getClassId_and_CourseId = 'https://mooc.icve.com.cn/patch/zhzj/portalMooc_getClassAndCourseIdByCode.action'
    url_details = 'https://mooc.icve.com.cn/patch/zhzj/portalMooc_selectCourseDetails.action'
    getClassCode(url_getClassCode)
    getClassId_and_CourseId(url_getClassId_and_CourseId)
    details(url_details)

数据库-第一范式、第二范式、第三范式、BC范式、第四范式简析 DS_Watson 数据库
在设计与操作维护数据库时，最关键的问题就是要确保数据能够正确地分布到数据库的表中。使用正确的数据结构，不仅有助于对数据库进行相应的存取操作，还可以极大地简化应用程序中的其他内容(查询、窗体、报表、代码等)，按照“数据库规范化”对表进行设计，其目的就是减少数据库中的数据冗余，以增加数据的一致性。泛化时在识别数据库中的一个数据元素、关系以及定义所需的表和各表中的项目这些初始工作之后的一个细化的过程。常
华为云OBS配置方法芊言凝语数据库网络服务器
华为云对象存储服务（ObjectStorageService，OBS）是一种海量、安全、低成本、高可靠的云存储服务。以下是华为云OBS配置的详细步骤及相关说明：创建OBS桶登录华为云控制台后，在搜索框中输入“对象存储服务”，选择对应的服务进入OBS管理页面。点击“创建桶”按钮，进入创建桶的配置页面。基本信息桶名称：输入一个全局唯一的桶名称，例如可以采用项目名称或业务名称相关的命名方式，方便识别和管
启动pip或ipython提示Fatal error in launcher: Unable to create process的解决方法 simple_whu python pip ipython python
错误以及原因分析有时，运行python的pip或ipython组件会报错：Fatalerrorinlauncher:Unabletocreateprocessusing'"C:\third_party\Python\3.9\win64-msvc-14.2\python.exe"错误信息最后这一串路径在我们的电脑上很可能并不存在！然而，启动pip或ipython时又会尝试运行这个路径的python.
【Python】成功解决NameError: name ‘XXX’ is not defined 云天徽上 python运行报错解决记录 python 开发语言 pandas 机器学习 numpy
【Python】成功解决NameError:name‘XXX’isnotdefined欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是云天徽上，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够
【Python 语法】 collections.Counter 用法一杯水果茶！人生苦短我用 Python python
Counter的基本用法Counter示例示例1：创建`Counter`并统计元素出现次数示例2：字符串中各字符出现次数示例3：`most_common(n)`返回出现次数最多的前n个元素及其次数示例4：`elements()`方法，按照计数的频率返回元素示例5：`update()`方法示例6：`subtract()`方法Counter是Python标准库collections模块中的一个子类，专
python量化交易策略实例_Day 80 量化投资与Python——项目案例 weixin_39964660 python量化交易策略实例
数据分析项目案例股票分析小结：需求：使用tushare包获取某股票的历史行情数据。输出该股票所有收盘比开盘上涨3%以上的日期。输出该股票所有开盘比前日收盘跌幅超过2%的日期。#需求四：假如我从2010年1月1日开始，每月第一个交易日买入1手股票，每年最后一个交易日卖出所有股票，到今天为止，我的收益如何？需求一：使用tushare包获取某股票的历史行情数据。#获取行情df=ts.get_k_data
pip升级ValueError: Unable to find resource t64.exe in package pip._vendor.distlib报错解决办法 AI小鸭学院 livingbody paddle安装与错误解析
pip升级报错解决办法pip升级频率很高，不升级经常会遇到这样哪样的异常。有一种异常，我相信你一定遇到，话不多说，上错误信息。1.错误现象(paddle2)D:\github\PGL>python.exe-mpipinstall--upgradepipLookinginindexes:https://pypi.tuna.tsinghua.edu.cn/simpleCollectingpipUsin
python线程通信_Python中线程之间的通信（不使用全局变量） weixin_39898150 python线程通信
Let'ssayifwehaveamainthreadwhichlaunchestwothreadsfortestmodules-"test_a"and"test_b".Boththetestmodulethreadsmaintaintheirstatewhethertheyaredoneperformingtestoriftheyencounteredanyerror,warningorifth
python多线程：Thread类的用法 m0_74824661 面试学习路线阿里巴巴 python java jvm
我们要创建Thread对象，然后让他们运行，每个Thread对象代表一个线程，在每个线程中我们可以让程序处理不同的任务，这就是多线程编程。创建Thread对象有两种方法：1.直接创建Thread，将一个callable对象从类的构造器传递出去，这个callable就是回调函数，用来处理任务。2.编写一个自定义类继承Thread，然后复写run()方法，在ru()方法中编写任务处理代码，然后创建Th
反超DeepSeek！新版GPT-4o登顶竞技场，奥特曼：还会更好量子位
关注前沿科技量子位GPT-4o悄悄更新版本，在大模型竞技场超越DeepSeek-R1登上并列第一。除了数学（第6），还在多个单项上拿下第一：创意写作；编程；指令遵循；长文本查询；多轮对话；先直观看下新版GPT-4o的能力如何，还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。Prompt：编写一个Python程序，展示一个球在旋转的六边形内弹跳。球应受到重力和摩擦力的影响，并
图扑智慧展馆合集 | 打造城市基础设施数字化应用
智慧展览馆是指利用先进的科技手段和现代化管理方式，将传统的展览馆、科技馆等场所进行数字化、智能化改造的新型展览空间。其中包括智慧展厅、智慧展馆和智慧博物馆等不同形式，它们带来了全新的观展体验和更为高效的管理模式。效果展示图扑运用HT强大的渲染功能，数字孪生各类智慧展览馆，1:1地复现其内部独特的结构造型和建筑特色。通过应用可视化、WebGIS、倾斜摄影、VR、沉浸式交互等多重技术手段，构建数据共享
2023年09月 GESP等级认证Python编程（三级）试题解析编程小伙伴测评网 CCF编程能力等级认证GESP Python三四级真题解析 python 开发语言算法少儿编程青少年编程数据结构排序算法
【单选题】（每题2分）1、人们所使用的手机上安装的App通常指的是？（）A、一款操作系统B、一款应用软件C、一种通话设备D、以上都不对正确答案：B试题解析：人们所使用的手机上安装的App通常指的是一款应用软件。App
江行智能×图扑软件：输煤皮带数字孪生管控系统
在现代矿业和电力行业中，输煤皮带系统是运输环节的核心。然后，随着智能化生产的高要求，智慧矿山输煤皮带系统的传统管理模式已显得力不从心。产业引入的三维可视化和数字孪生技术，一改传统输煤皮带系统由于设备老化、管理不善等原因，导致的可能出现停机和故障等问题，大幅提高输煤皮带系统运转效率。效果展示采用图扑软件自主研发HTforWeb产品构建轻量化的3D可视化场景，建立动态的数字化输煤皮带模型。在本次展示的
用 Python 撸一个 Web 服务器-第9章：项目总结 pythonweb
项目总结本教程带大家一起实现了一个TodoList程序，包含基础的增删改查功能，和用户登录认证。这也是Web开发中最常见的需求。我画了一张思维导图，帮助你从宏观的角度来概览TodoList程序，加深你对Web开发的理解。TodoList项目整体思路参考MVC设计模式。有意设计utils/目录专门用来存储一些工具方法，这些工具方法通常比较独立，尽量不从外部模块导入依赖，其他模块需要某个工具方法时从u
使用Python编写你的第一个算法交易程序盼达思文体科创 Python量化金融 python 算法 numpy conda pandas 金融
背景Background最近想学习一下量化金融，总算在盈透投资者教育（IBKRCampus）板块找到一篇比较好的算法交易入门教程。我在记录实践过程后，翻译成中文写成此csdn博客，分享给大家。如果你的英语好可以直接看原文。原文在数据准备阶段，采用了pandas_datareader.data读取网络数据，实际中出现了很多问题，我换成了yfinance。可以参考文末完整代码。参考资料：https:/
用 Python 撸一个 Web 服务器-第7章：重构——更好的组织代码 pythonweb
通过前几章的学习，我们完成了TodoList程序的todo管理部分，实现了对todo的增、删、改、查基本操作，这也是几乎所有Web程序都具备的功能。我们当然可以按照目前的思路继续来实现用户管理部分，在models.py中编写用户相关的模型，在templates/目录下新建用户相关HTML，在controllers.py中编写用户相关的视图函数。但是，随着新功能的加入，把不同功能的代码都写在相同的文
最新河马剧场全自动挂机项目 2501_90701284 其他经验分享
河马剧场助手是一款支持多账号操作的自动化工具以下是该项目的详细介绍：一、项目概述河马剧场助手支持多账号操作，推荐使用雷电模拟器进行多开，通过自动化操作，用户可以轻松完成新人签到领金币、每日签到、开宝箱、看剧领金币和逛街等任务，同时支持自动养号功能，确保账号的稳定性和安全性。二、核心功能（一）新人签到领金币（二）每日签到（三）开宝箱（四）看剧领金币（五）逛街（六）自动养号河马剧场助手支持自动养号功能
Implement Ridge Regression Loss Function 六月五日 Deep-ML Deep-ML
ImplementRidgeRegressionLossFunctionWriteaPythonfunctionridge_lossthatimplementstheRidgeRegressionlossfunction.Thefunctionshouldtakea2DnumpyarrayXrepresentingthefeaturematrix,a1Dnumpyarraywrepresentin
Python 算法交易秘籍（五）绝不原创的飞龙默认分类默认分类
原文：zh.annas-archive.org/md5/010eca9c9f84c67fe4f8eb1d9bd1d316译者：飞龙协议：CCBY-NC-SA4.0第十一章：算法交易-实际交易现在我们已经建立了各种算法交易策略，并成功地进行了令人满意的回测，并在实时市场中进行了纸上交易，现在终于到了进行实际交易的时候了。实际交易是指我们在真实市场小时内用真钱执行交易策略。如果您的策略在回测和纸上交易
如何在Python上安装xgboost？ cda2024 python 开发语言
在数据科学和机器学习领域，XGBoost无疑是一款备受推崇的算法工具。它以其高效、灵活和精确的特点，成为了众多数据科学家和工程师的首选。然而，对于初学者来说，如何在Python环境中成功安装XGBoost可能会成为一个挑战。本文将详细指导你在Python上安装XGBoost的过程，帮助你快速上手这一强大的机器学习工具。为什么选择XGBoost？在深入了解安装过程之前，我们先来看看XGBoost为何
【大模型】数据集构造方式油泼辣子多加深度学习人工智能 chatgpt
1.Alpaca数据格式Alpaca数据格式最早由StanfordAlpaca项目提出，目的是用来微调大语言模型（LLM），特别是用于InstructionTuning（指令微调）。它基于Self-Instruct方法，即使用更强大的模型（如OpenAI的GPT-3）来自动生成高质量的指令数据，从而让小型模型也能理解和执行指令任务。数据格式示例Alpaca数据集的格式通常是JSON，包含以下几个字
ESP32-C3 入门篇（三）Linux下开发环境搭建风往东吹 ESP32 linux 嵌入式硬件
文章目录前言一、克隆代码1.克隆esp-gitee-tools2.克隆esp-idf3.安装子模块二、安装编译环境1.更改编译器下载路径2.更改python软件源3.使用脚本安装环境4.安装cmake三、尝试编译1.导出环境变量2.编译例程四、遇到的问题1.ERROR:Thisscriptwascalledfromavirtualenvironment,cannotcreateavirtualen
控制论的革命者：阿拉德时代智利的技术与政治 shenminyin 控制论社会主义科学技术史赛博历史传记
本书背景位于南美国家智利，版图形如窄条，夹在安第斯山脉与太平洋之间。1970年，智利选民选择了在萨尔瓦多·阿连德·戈森斯（SalvadorGuillermoAllendeGossens）的领导下通过民主道路进行社会主义变革。图书推荐书籍简介本书讲述了20世纪70年代智利阿连德政府时期，一场独特的技术与政治变革实验——Cybersyn项目。这是一个旨在通过控制论和计算机技术，建立覆盖全国的实时经济信
springboot学生宿舍信息的系统（11574） codercode2022 spring boot 后端 java 开发语言 spring gulp 前端框架
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
vue单词汇总小六妹妹 vue.js 前端 javascript
vueVue单词大全0~9vue:(view)视图，视觉;message:消息;item:项目;in:在...里面;在(某范围或空间内的)某一点;在(某物的形体或范围)中;在…内;在…中;进入;counter:计数器;柜台;对立面;el:(element)(计算计)挂载元素;Vue实例挂载的元素节点;data:数据;methods:方法,方法论;add:添加;reduce:减少;10~19func
编程之外的财富：程序员必知的盈利策略 guzhoumingyue AI python
程序员找到稳定盈利的管道可以从以下几个方面入手：1.开发软件产品SaaS（软件即服务）：开发并销售订阅制软件，如项目管理工具、CRM系统等。移动应用：开发并上架移动应用，通过广告、内购或付费下载盈利。桌面应用：开发桌面软件，通过一次性销售或订阅模式盈利。2.提供技术服务自由职业：在平台（如Upwork、Freelancer）上接单，提供编程、网站开发等服务。咨询与培训：为企业提供技术咨询或开设编程
如何使用Vue3创建在线三维模型展示？ ScriptEcho 前端
本文由ScriptEcho平台提供技术支持项目地址：传送门代码相关的技术博客代码应用场景介绍本段代码使用RoughJS库在HTML5Canvas上创建了手绘风格的图像，展示了RoughJS库的强大功能，可用于创建具有有机手绘外观的图形。代码基本功能介绍代码通过RoughJS库创建了一个火焰状的图形，包括：火焰主体：使用path()函数绘制，采用不规则的形状和粗糙的线条。火焰细节：添加了额外的pat
从零开始掌握哈夫曼树：数据压缩与Python实现详解吴师兄大模型 python 数据结构哈夫曼树哈弗曼编码数据压缩算法开发语言
系列文章目录01-从零开始掌握Python数据结构：提升代码效率的必备技能！02-算法复杂度全解析：时间与空间复杂度优化秘籍03-线性数据结构解密：数组的定义、操作与实际应用04-深入浅出链表：Python实现与应用全面解析05-栈数据结构详解：Python实现与经典应用场景06-深入理解队列数据结构：从定义到Python实现与应用场景07-双端队列（Deque）详解：Python实现与滑动窗口应
python如何无密码登录_服务器之间实现免密登录的简易教程行者无疆0123 python如何无密码登录
今天这篇文章主要是教会大家如何实现服务器之间的免密登录。1、先在所有服务器上执行命令：ssh-keygen-tdsa-P''-f~/.ssh/id_dsamaster服务器slave1服务器slave2服务器2、而后在所有服务器上执行命令：cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keysmaster服务器slave1服务器slave2服务器3、之后将每台服务
python读取bashrc变量不生效问题鸭梨山大哎 linux python python 开发语言
修改/etc/environment然后重启终端即可/etc/environment是Linux系统中用于设置全局环境变量的配置文件。它通常用于定义系统范围内所有用户和进程共享的环境变量。与用户级别的配置文件（如.bashrc或.bash_profile）不同，/etc/environment中的环境变量对所有用户和会话生效。1./etc/environment的作用全局生效：在/etc/envi
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

python获取职教云信息

目录

1、需求

1.1、推荐课程

1.2、课程详情

2、思路分析

2.1、推荐课程

完整代码

2.2、课程详情

找到JSON数据

最终思路

新的问题

完整代码

你可能感兴趣的:(项目,python,爬虫,智慧职教)