chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内

GPTGLM-6B场景应用:

最近,ChatGPT已经火出圈了,一般OpenAI需要梯子,然后需要花钱,导致很多限制,用的很不方便(很希望大厂努力,有国人自己的大语言模型),目前主要感谢清华大学开源的ChatGLM-6B和秋葉aaaki大神造福我们。总结一句话3090显卡可以部署可以运用,但很难训练。
首先介绍一下秋葉aaaki大神的本地化部署的工具,我的配置是一块是3090,目前12G显存.bat,如果配置不够好,可以尝试下面12G以下
chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第1张图片

我尝试8G与12G的横向比较,对于客观问题,主要以8G为主,主观问题还是看看12G给我的看法,

客观问题8G

  1. 首先第一个问题”请解释一下什么是沉积物“,
    回答是”沉积物是指由水、大气、生物和化学因素等作用下,在地表形成的固态物质,通常由颗粒大小不等、形状各异的石头、泥沙、灰烬和其他无机物组成。沉积物可以存在于海洋、湖泊、河流、沼泽、沙漠和山脉等不同的地方。
    沉积物的形成过程包括物质的沉积和扬弃。在海洋中,沉积物由浮游生物的死亡外壳、有机物和骨骼组成。在河流和湖泊中,沉积物由洪水中的泥沙、水生动物尸体、植物种子和有机物组成。在陆地上,沉积物由风化、火山喷发、冰川侵蚀和人类活动等因素形成。
    沉积物在地球的历史上扮演了重要的角色。它们可以作为岩石的基础,帮助地球形成和稳定。沉积物还可以提供水源和土地,为人类社会和经济的发展提供支持。“
  2. 其次问了”请解释一下什么是碳酸盐台地“
    回答是”碳酸盐台地是指由于二氧化碳的供应充足,以及地质作用的结果,在地表形成了大量碳酸盐矿物的地区。这种地区通常位于高海拔地区,由于大气中二氧化碳的浓度较高,导致大气中的碳酸盐不断积累。
    碳酸盐台地通常由不同类型的碳酸盐矿物组成,包括大理石、石灰石、白云石和硅灰石等。这些矿物在沉积和变质作用的过程中形成,并沉积在地表,形成各种不同的地貌类型,如石林、石芽、峰林和岩溶等。
    碳酸盐台地的形成与许多因素有关,包括地质构造、气候条件和人类活动等。这些地区的地貌特征和景观通常非常美丽,也是许多登山、徒步旅行和探险爱好者的理想目的地。“

这里还加了一点主观评价,我觉得很好玩,这也可能是我把旁边Temperature机器感情拉大的缘故,不会太教科书。

  1. 你知道更新统鱼鳞山组是什么吗,如果知道请阐述一下
    更新统鱼鳞山组是一套由砂岩、砾岩和岩溶岩组成的地质层系,位于中国云南省昆明市石林彝族自治县境内。该组层系厚度较大,一般超过500米,是中国南方地区典型的石灰岩地区地质层系。
    更新统鱼鳞山组地层主要由砂岩、砾岩和岩溶岩组成,其中砂岩为主,砾岩为辅。砂岩主要由砂和砾石组成,质地比较坚硬,形成了许多石芽、突口、洞穴和地表地表形态。同时,该组地层还具有丰富的岩溶现象,如岩溶槽谷、溶蚀丘陵和岩溶峰林等。
    在地质构造上,更新统鱼鳞山组地层位于云南省石林彝族自治县境内的南盘江地质带上,是南盘江地质带的重要组成部分。该组地层的顶部受到南盘江的影响,形成了强烈的侵蚀和构造运动,而底部则受到地下水的侵蚀和渗透,形成了丰富的地表形态和地下水系。
    更新统鱼鳞山组是一套重要的地质层系,具有丰富的地质特征和景观,对研究地球演化过程、石灰岩地区地质环境、地下水演化等具有重要的科学意义。
    chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第2张图片
    chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第3张图片
    主观问题8G:

  2. 首先第一个问题”你认为沉积物学科未来的发展“,
    沉积物学科是一门非常古老的学科,但也是一门非常重要的学科,对地球科学和工程学等领域产生了深远的影响。随着科技和经济的发展,沉积物学科也在不断发展,未来可能还会出现许多新的技术和方法,以适应不断变化的环境和需求。以下是沉积物学科未来可能发展的方向:1. 数字化沉积物勘探:随着数字化技术的不断发展,沉积物勘探将变得更加精确和高效。数字化技术可以帮助沉积物学者更好地理解沉积物的特征和组成,并为勘探和开发提供更准确的数据。2. 环境模拟和沉积物修复:环境模拟和沉积物修复是沉积物学科中的新领域,旨在研究如何在不断变化的环境中保护或修复自然资源。这些技术可以为环境保护和可持续发展提供新的思路和方法。3. 海洋沉积物研究:海洋沉积物是地球表面最重要的沉积物之一,对海洋生态系统和海岸线的稳定性具有重要意义。随着海洋科学的迅速发展,海洋沉积物研究将成为海洋科学领域的重要分支。4. 沉积物学与地球物理学的结合:地球物理学是研究地球内部的科学,沉积物学则是研究地球表面的科学。未来,沉积物学和地球物理学的结合将为深入了解地球内部结构和地球表面特征提供新的思路和方法。5. 沉积物学与生命科学的结合:生命科学是研究生命本身的科学,沉积物学则是研究生物和非生物物质在地球表面形成的科学。未来,沉积物学和生命科学的结合将为研究生命的起源、演化和生态系统提供新的思路和方法。
    个人感觉如果从计算机角度(本身就是计算机专业)学科研究第一个数值化不是已经做了吗,地球海洋,不能称为未来发展,应该是把研究进行了一个宽泛的终结。

  3. 你知道更新统鱼鳞山组是什么吗,如果知道请阐述一下
    更新统鱼鳞山组是一套由砂岩、砾岩和岩溶岩组成的地质层系,位于中国云南省昆明市石林彝族自治县境内。该组层系厚度较大,一般超过500米,是中国南方地区典型的石灰岩地区地质层系。更新统鱼鳞山组地层主要由砂岩、砾岩和岩溶岩组成,其中砂岩为主,砾岩为辅。砂岩主要由砂和砾石组成,质地比较坚硬,形成了许多石芽、突口、洞穴和地表地表形态。同时,该组地层还具有丰富的岩溶现象,如岩溶槽谷、溶蚀丘陵和岩溶峰林等。在地质构造上,更新统鱼鳞山组地层位于云南省石林彝族自治县境内的南盘江地质带上,是南盘江地质带的重要组成部分。该组地层的顶部受到南盘江的影响,形成了强烈的侵蚀和构造运动,而底部则受到地下水的侵蚀和渗透,形成了丰富的地表形态和地下水系。更新统鱼鳞山组是一套重要的地质层系,具有丰富的地质特征和景观,对研究地球演化过程、石灰岩地区地质环境、地下水演化等具有重要的科学意义。
    这是我随机找的一个点,我感觉很已经很细,里面的岩性和生物构造也回答的很准(没展示,但我也问了)。

chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第4张图片
重点来了!!!!!

它能够弄数据集了,识别我想要的,真正意义上的,我可以就是我可以。(要是我就接一个后台,把数据输入不停输入,然后存到Excel, 或者word最后在清洗一下就好了,重点在于他不要联网,做个初步筛选还是可以的)。如下图所示我感觉很好。
chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第5张图片
好了跳过这个重点,接着对比效果,面对8G的第一个问题‘你认为沉积物学科未来的发展’,12G 是这样回答的:
沉积物学科是一门研究地球历史上物质形成和演化的学科,随着地球科学的不断发展,沉积物学科也在经历着不断地发展和变革。未来,沉积物学科可能会经历以下几个方面的发展:

  1. 沉积物结构的研究:随着地球化学、地球物理学、地球生物学等学科的发展,沉积物的结构、成分、生物过程等方面的研究将会得到更深入的探讨。这些研究将为沉积物学科提供更加全面和准确的知识,有助于更好地理解地球历史中的沉积物演化过程。

  2. 沉积物模拟技术的发展:沉积物学科中常用的模拟技术包括数值模拟和模型模拟。未来,这些技术将会得到更加成熟和广泛应用,有助于更好地模拟和预测沉积物的形成和演化过程。

  3. 沉积物勘探技术的进步:随着地球物理学、地球化学、遥感技术等的不断发展,沉积物勘探技术也在不断进步。这些技术将有助于更加精确地勘探沉积物,为地质调查、资源勘探等提供更加可靠的数据支持。

  4. 沉积物环境保护和治理:沉积物学科对于环境保护和治理具有重要的应用价值。未来,沉积物学科将会在环境保护和治理方面发挥更加重要的作用,有助于更好地保护地球的生态环境。

未来沉积物学科的发展将会涉及多个方面,包括研究、技术、应用等方面。这些发展将有助于提高沉积物学科在地球科学领域中的地位和作用,为更好地服务社会和环境保护做出更大的贡献。

大家自行体会,接着我又了几个问题我感觉很像一个特别好的摘要生成,和总结,确实比gpt-2 要昊太多
chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第6张图片
chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第7张图片
看吧数据为王的时代,一开始根本不是在于模型,而是数据,算力,开源算法只会让数据更值钱,如何数据挖掘更加重要,所以这不是一个随随便便的人就能完成。机器都知道,更何况是人。

ChatGLM-6B-Ptuning:

这个部分我需要感谢零炻博主,他把模型本地化了一下,可以训练少量的自己的领域数据,为啥说是少量,是因为两块3090,微调的话我感觉已经快撑不住了,里面是用第一个8g做微调,我也水了很多个人群,尝试过的人用告诉我Vicuna-7B在3090只能部署,不能微调,至少A100入门,看着显卡,我选择,还是AI画画不费卡,
chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第8张图片
chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第9张图片

当然了你可以看一下自己训练的效果,我这里还是拿博主的chatgpt能做本地化部署,训练私有化学科领域数据吗?-----模型只在工具之上,想法只在算力范围之内_第10张图片
看的出来都又效果,但没有涉及到的,就不行了,因为数据集没有没学到回答当然不对,如
在这里插入图片描述
因此,是抬着头拿已有的工具加上下流,搞学术发论文,还是低着头打标签,喂数据,拿到特殊特色的应用场景,坐落地(你觉得我搞翻了,我说的是大多数)。还是两者结合,都取决于,主观能动性,不分对错,工具也没有错。所以,很遗憾的是模型只在工具之上,想法只在算力范围之内,没有卡,没有钱,没有算力的我,还是享受被大佬带飞,而不是曲线救国来的舒服。

再次感谢
ChatGLM官方链接:https://github.com/THUDM/ChatGLM-6B
秋葉aaaki https://space.bilibili.com/12566101
零炻 https://space.bilibili.com/7990701/?spm_id_from=333.999.0.0


你可能感兴趣的:(chatgpt,人工智能)