深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

文章目录

  • 1 深度学习
    • 1.1 神经网络和深度学习
    • 1.2 神经网络的工作原理
    • 1.3 神经网络的专业术语
  • 2 LLM概述
    • 2.1 大模型的"大"是指什么?
    • 2.2 训练大模型有多烧钱?
    • 2.3 如何入门大模型?
    • 2.4 LLM的结构
      • 2.4.1 Transformer
      • 2.4.2 Prompts
      • 2.4.3 Fine Tuning
  • 3 本地跑大模型
    • 3.1 Ollama运行开源LLM
      • 3.1.1 启动并运行
      • 3.1.2 使用api访问
      • 3.1.3 设置外网访问
    • 3.2 Open-webui构筑本地UI
      • 3.2.1 启动UI页面
      • 3.2.2 可以下载多种模型
    • 3.3 llama.cpp运行开源LLM
      • 3.3.1 下载安装llama.cpp
      • 3.3.2 下载gguf格式的模型
      • 3.3.3 运行大模型
  • 4 将Ollama与Python结合使用
    • 4.1 使用库litellm
    • 4.2 使用库langchain
  • 5 参考附录

1 深度学习

1.1 神经网络和深度学习

神经网络是一种模拟人脑神经元工作方式的机器学习算法,也是深度学习算法的基本构成块。神经网络由多个相互连接的节点(也称为神经元或人工神经元)组成,这些节点被组织成层次结构。通过训练,神经网络可以学习从输入数据(例如图像、文本或声音)中提取有用的特征,并根据这些特征进行分类、预测或其他任务。
深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型_第1张图片

神经网络是一种机器学习算法,但它与传统机器学习在几个关键方面有所不同。其中一个重要的区别是神经网络能够自我学习和改进,不需要人为干预。通过训练,神经网络可以 自动从数据中提取有用的特征,这使得它在处理大规模数据集时具有优势。相比之下,传统机器学习算法通常需要手动选择和提供特征

深度学习的一个关键优势是它处理大数据的能力,随着数据量的增加,传统机器学习技术在性能和准确性方面可能会变得效率低下。而深度学习算法,由于其强大的表示能力和对数据的强大处理能力,仍然能够保持良好的性能和准

你可能感兴趣的:(深度学习,深度学习,人工智能)