AI相关的实用工具分享(附带最新评分排行)

AI实用工具大赏:赋能科研与生活,探索AI的无限可能

前言

在数字化浪潮汹涌而至的今天,人工智能(AI)已经渗透到我们生活的方方面面,无论是工作还是生活,都在悄然发生改变。AI的崛起不仅为我们带来了前所未有的便捷与高效,更在不断地拓宽我们的想象边界,让我们看到了未来的无限可能。

作为一名热衷于探索新技术的博主,我深感有责任和义务为大家梳理和分享当前AI领域的实用工具。在这篇文章中,我将带大家走进AI的奇妙世界,一起探索那些能够赋能我们工作与生活的实用工具。

从ChatGPT等闭源大语言模型,到开源大语言模型的崛起,再到GPT/LLMs应用在各个领域的广泛落地,AI技术正在以惊人的速度发展。而这些工具,正是我们踏上AI之旅的得力助手。

接下来,让我们一起开启这场AI实用工具的探索之旅吧!

AI相关的实用工具分享(附带最新评分排行)_第1张图片

各项能力评分

评分方法:从各个维度给大模型打分,每个维度都对应一个评测数据集,包含若干道题。 每道题依据大模型回复质量给1~5分,将评测集内所有题的得分累加并归一化为100分制,即作为最终得分。

类别 大模型 分类能力 信息抽取能力 阅读理解能力 数据分析能力 综合能力
商用 gpt4 94 94 99.3 97.0 96.1
商用 微软new-bing 95 83 94.0 100.0 93.0
商用 gpt-4-turbo(new) 91 90 94.0 96.0 92.8
商用 GLM4 86 90 97.3 96.0 92.3
商用 文心4.0 88 89 94.7 94.0 91.4
商用 讯飞星火v3.5(new) 87 92 89.3 87.3 88.9
商用 阿里qwen-max 86 82 95.3 91.3 88.7
商用 月之暗面kimichat(new) 92 85 84.0 89.3 87.6
开源 Qwen1.5-14B-Chat 89 79 90.7 90.7 87.3
开源 Qwen-72B-Chat 89 80 92.7 87.3 87.3
开源 Qwen1.5-72B-Chat 89 84 88.0 87.3 87.1
商用 gpt-3.5-turbo 81 83 92.7 91.3 87.0
开源 internlm2-chat-20b 93 80 86.0 88.0 86.8
开源 AquilaChat2-70B-Expr(new) 82 84 92.0 89.3 86.8
开源 deepseek-llm-67b-chat 87 81 86.7 92.0 86.7
商用 文心一言v2.2 90 87 88.0 81.0 86.5
开源 tigerbot-70b-chat-v2 97 84 80.0 85.0 86.5
开源 openbuddy-deepseek-67b 86 89 84.7 85.0 86.2
商用 baichuan3 86 83 90.7 84.7 86.1
商用 讯飞星火v3 87 82 88.0 86.0 85.8
开源 XVERSE-65B-Chat 83 84 84.0 89.0 85.0
商用 谷歌bard 86 88 85.3 77.0 84.1
开源 tigerbot-70b-chat-v3 94 85 84.0 71.0 83.5
开源 openbuddy-llama2-70b-v10.1 86 84 86.7 76.0 83.2
开源 tigerbot-13b-chat-v4 85 82 80.0 85.0 83.0
商用 chatglm-turbo 86 75 90.0 81.0 83.0
开源 Yi-34B-Chat 88 82 84.7 77.0 82.9
开源 aquilachat2-34b 77 82 88.0 83.0 82.5
商用 商汤senseChat 82 85 82.7 78.0 81.9
开源 openbuddy-mixtral-7bx8-v17.1 86 73 86.0 82.0 81.8
开源 internlm2-chat-7b 86 81 72.7 82.7 80.6
开源 BELLE-Llama2-13B-chat-0.4M 90 74 76.0 79.0 79.8
商用 字节跳动豆包 79 77 80.0 82.0 79.5
开源 qwen-14b-chat 84 72 84.7 77.0 79.4
开源 Baichuan2-13B-Chat 83 83 74.7 77.0 79.4
开源 Baichuan2-7B-Chat 88 76 83.3 69.0 79.1
商用 阿里通义千问 81 81 81.0 73.0 79.0
开源 BlueLM-7B-Chat 82 83 74.0 72.0 77.8
开源 openbuddy-zephyr-7b 82 83 74.0 72.0 77.8
开源 openbuddy-llama-65b-v8 68 84 79.3 76.0 76.8
开源 xverse-13b-chat 86 72 81.3 67.0 76.6
商用 chatglm-std 84 71 76.0 73.0 76.0
商用 chatglm-pro 84 70 76.0 73.0 75.8
开源 Qwen1.5-7B-Chat 80 76 76.0 70.7 75.7
商用 讯飞星火v1.5 76 81 76.0 69.0 75.5
开源 谷歌gemma-7b-it(new) 72 79 74.0 76.0 75.3
开源 openbuddy-mistral-7b-v13.1 79 72 73.3 76.0 75.1
商用 360智脑 86 71 74.0 66.0 74.3
开源 MiniCPM-2B-dpo(new) 79 77 74.0 66.0 74.0
开源 Llama-2-70b-chat 86 66 73.3 69.0 73.6
开源 Qwen-7B-Chat 89 72 74.0 59.0 73.5
商用 讯飞星火v2.0 72 75 79.3 65.0 72.8
开源 Baichuan-13B-Chat-v2 82 69 72.7 67.0 72.7
开源 chatglm3-6b 82 68 78.7 60.0 72.2
开源 Qwen1.5-4B-Chat 75 65 79.3 63.0 70.6
开源 miniCPM-2B-sft(new) 72 72 77.3 53.3 68.7
开源 Yi-6B-Chat 73 71 66.0 64.7 68.7
开源 Linly-Chinese-LLaMA2-13B 78 67 67.3 57.0 67.3
开源 ziya2-13b-chat 76 54 71.3 68.0 67.3
开源 Qwen-1_8B-Chat 73 66 75.3 51.3 66.4
商用 minimax 68 61 73.3 63.0 66.3
开源 openbuddy-openllama-3b-v10 64 60 61.3 40.7 56.5
开源 谷歌gemma-2b-it(new) 56 60 60.0 43.3 54.8
开源 Qwen1.5-1.8B-Chat 57 58 52.7 48.0 53.9
开源 Qwen1.5-0.5B-Chat 44 40 60.0 34.7 44.7
  • AI新闻动态

全部分类

  • ChatGPT及类似闭源大语言模型
  • 开源大语言模型
  • GPT/LLMs 应用
  • ChatGPT Prompts
  • 国内可使用的ChatGPT镜像站点
  • 大语言模型训练-评估平台
  • 集成了多个大语言模型的应用
  • AI工具箱类软件
  • AI Agent
  • 搜索引擎
  • 写作
  • 编程开发
  • 翻译工具
  • AI聊天-口语练习
  • 图像创作
  • 语音识别-生成字幕
  • 文字转语音
  • 声音克隆
  • 语音翻译
  • 语音合成
  • 语音处理
  • AI生成音频-音效-音乐
  • AI视频创作
  • 学术科研
  • OCR图像识别文字
  • 视频内容总结

评测

  • 大语言模型评测

精选文章

  • chatgpt相关文章

ChatGPT及类似闭源大语言模型

名称 说明 链接 费用
ChatGPT openAI的chatgpt 应用示例: B站视频:这9款工具帮你榨干ChatGPT,解锁隐藏玩法 B站视频:格斗之王!AI写出来的AI竟然这么强!
可汗学院创始人Khan最新TED演讲:GPT-4作为AI学习私教,可能带来教育史上最大变革
URL GPT3.5免费。ChatPlus会员20美元/月,可以使用GPT-4,目前的上限是每3小时25条消息。
微软Copilot 微软的Copilot,包含了多种AI工具和插件 URL 免费
Claude Anthropic研发的AI助手Claude URL 免费
Bard Google 的对话式AI工具,目前已支持中文等40多种语言 URL 免费
Gemini Google最新的大语言模型,包括Gemini Nono,Gemini Pro和Gemini Ultra。Gemini Pro已开放api和sdk使用。新闻介绍 URL 免费
Le Chat Mistral AI 推出了为 Le Chat 的聊天助手 URL 免费
豆包 字节跳动旗下的AI聊天软件 ;
体验测试视频:B站视频:百模大战-抖音子公司推出AI聊天机器人豆包
URL 免费
月之暗面的Kimi Chat 支持联网,支持上传文件(最多 50 个,每个 100 MB)接受 pdf、doc、xlsx、ppt、txt 等,文章总结能力比较强
张鹏对谈月之暗面杨植麟:大模型创业需要新的组织范式
URL 免费
文心一言 百度的大语言模型 URL 免费
通义千问 阿里云的大语言模型 视频介绍: B站视频:国产AI到底行不行?测试完通义千问,我只想说两个字【我们离ChatGPT还有多远】 URL 免费
智谱AI 名为 ChatGLM 的人工智能助手,是基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型开发 URL 免费
讯飞星火 讯飞的大语言模型 URL 免费
百川大模型 百川智能的大语言模型 URL 免费
中国国内发布的其他大模型 目前国内各大企业、科研机构和高校等单位已公开的 AI 大模型至少已经达到了 188 个。2023-12-17更新,更多信息

开源大语言模型

名称 说明 链接 费用
Llama 2 Llama2是Meta AI开发的开源的大型语言模型, 它是Llama 语言模型v2版本,可免费用于研究和商业用途。
非官方Llama2在线测试地址:
1. https://labs.perplexity.ai/
2. https://huggingface.co/spaces/ysharma/Explore_llamav2_with_TGI
URL
GitHub
免费
Mixtral-8x7B 法国人工智能初创公司 Mistral AI开源的一种具有开放权重的稀疏专家混合模型 (SMoE),在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5
论文地址:https://arxiv.org/pdf/2401.04088.pdf
论文主页:https://mistral.ai/news/mixtral-of-experts/
Github 免费
Qwen(通义千问) 阿里云研发的通义千问大模型系列
在线Demo地址:
Qwen-7B-Chat-Demo
Qwen-72B-Chat-Demo
Qwen1.5 72B 在线体验
Qwen-7B
Qwen1.5
免费
ChatGLM2-6B 中英双语对话模型 ChatGLM-6B 的第二代版本 GitHub 免费

GPT-LLMs应用

名称 说明 链接 费用
Poe 美版知乎 Quora 构建的AI 产品,有web和客户端。目前的情况是ChatGPT、Sage、Dragonfly、Claude 机器人可以免费、无限制、实时使用。只需要一个邮箱即可注册。可以随时切换AI而对话不中断,并且对话记录是在线保存并且同步到客户端的。chatgpt-4可以每天免费使用一次 视频介绍:B站视频:神器!与chatGPT类似的新人工智能问答AI:Poe, 美国知乎Quaro最新产品,专业回答 URL 免费,有付费升级版
monica AI助手,提供搜索、阅读、写作、翻译、绘画等多种任务的帮助。有独立应用和浏览器插件 URL
chrome插件
免费/付费
ollama 在本地环境中轻松运行和管理大型语言模型,如Llama 、Mistral、Gemma2等 Github 免费
openai/openai-python OpenAI API 的官方 Python 库,它是使用Stainless根据OpenAPI 规范生成的 Github 免费,需要使用OpenAPI的apikey
sashabaranov/go-openai OpenAI API的Go语言非官方的SDK,支持ChatGPT、GPT-3、 GPT-4、DALL·E 2 Github 免费
langchain 是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。 Github 免费
ChatGPT-Next-Web 一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 & Gemini Pro 模型 Github 免费
anything-llm 开源的文档聊天机器人解决方案 Github 免费
screenshot-to-code 插入截图并将其转换为简洁的 HTML/Tailwind/JS 代码,使用了GPT-4 Vision来生成代码,使用DALL-E 3生成图片 GitHub 免费,需要有GPT-4 Vision的授权
Chatbox 使用ChatGPT API(OpenAI API)的桌面应用程序, 将所有的聊天信息和提示信息存储在本地,从而减少了数据丢失的风险。比网页版使用更稳定些 GitHub 免费,需要使用OpenAPI的apikey
ChatGPT for Google 开源项目,浏览器插件,在搜索页面增加chatgpt的内容和对话框 GitHub 免费,需要chatgpt账号
gpt-crawler 可以爬取指定网站中的内容,并生成json文件,可以直接上传到GPTs的知识库使用 Github 免费
ChatGPT-Shortcut 开源,让生产力加倍的 ChatGPT 快捷指令,按照领域和功能分区,可对提示词进行标签筛选、关键词搜索和一键复制。 GitHub 免费
ChatGPT Sidebar ChatGPT 边栏是您在浏览任何网站时可以使用的人工智能助手。 视频介绍:B站视频:CharGPT初体验,浏览器安装人工智能侧边栏AI Sidebar扩展程序 URL 免费
WebChatGPT 开源程序,给chatgpt扩展联网的能力 视频介绍:B站视频:可以让ChatGPT直接联网的扩展程序 GitHub 免费
AIPRM for ChatGPT 浏览器插件,提供一系列精选ChatGPT 指令模板,甚至还能够自己创建,还可以调整AI 语气和写作风格 B站视频:集大成者!ChatGPT百宝箱,内置多种功能,所见即所得! URL 免费
GPTCache ⚡ GPTCache 是一个用于创建语义缓存以存储来自 LLM 查询的响应的库,类似于aigc场景中的redis。 它可用于降低依赖 LLM 服务(如ChatGPT)的成本,同时也可以有效减少服务响应时间,因为大模型推理一般都比较耗时。 GitHub 免费
MindMac 功能丰富、隐私第一的 macOS 原生 ChatGPT 应用程序,可在一个地方使用 OpenAI, Azure OpenAI, Anthropic Claude, OpenRouter,旨在实现最大生产力。 目前有 15 种语言版本。 URL 免费,有付费升级版

ChatGPT Prompts

名称 说明 链接 费用
f/awesome-chatgpt-prompts This repo includes ChatGPT prompt curation to use ChatGPT better. Github Free

国内可使用的ChatGPT镜像站点

名称 说明 链接
carrot Free ChatGPT Site List 这儿为你准备了众多免费好用的ChatGPT镜像站点,当前100+站点国内可使用ChatGPT镜像站点 GitHub
awesome-free-chatgpt 免费的 ChatGPT 镜像网站列表,持续更新。List of free ChatGPT mirror sites, continuously updated. GitHub

大语言模型训练-评估平台

Name Description Links Fees
FastChat 用于训练、服务和评估大型语言模型的开放平台。Vicuna 和 Chatbot Arena 的发布仓库。 Github Free

集成了多个大语言模型的应用

名称 说明 链接 费用
chathub 浏览器插件,在一个应用中使用不同的聊天机器人,目前支持 ChatGPT、新的 Bing Chat、Google Bard 和 Claude (via Poe),未来将集成更多机器人, 同时与多个聊天机器人聊天,方便比较它们的答案 GitHub 免费,付费支持更多功能
ChatALL 同时与多个大语言模型聊天的客户端(支持Windows、macOS、Linux系统),支持ChatGPT、Bing Chat、Claude、Bard、MOSS、Alpaca、HuggingChat等。需要拥有可以访问这些 AI 的帐号,或 API token GitHub 免费

AI工具箱类软件

名称 说明 链接 费用
Paper2GUI 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 40+AI 模型,内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统。B站视频介绍:补帧超分抠图配音,这个开源AI工具箱对小白太友好了! GitHub 免费

AI Agent

名称 说明 链接 费用
Auto-GPT 开源项目,使用gpt自主地实现你设定的任何目标。演示示例:爆火的自主人工智能AutoGPT,程序员表示开始真正有点担忧会失业了! GitHub 免费,需要OpenAI API key
OthersideAI/self-operating-computer 一个使用多模态模型(默认模型为GPT-4v)能够操作计算机的框架 Github 免费,需要GPT-4v
AppAgent 可以操作手机应用程序的AI Agent Github 免费

搜索引擎

名称 说明 链接 费用
New Bing 只需注册一个账户,首页即可体验。更多介绍 URL 免费
You.com 结合对话模式的搜索引擎 URL 免费
Perplexity.ai Perplexity.ai 是一个基于 GPT-3 的 AI 工具,类似 New Bing 的搜寻引擎、会附上参考结果 URL 免费

写作

名称 说明 链接 费用
Notion AI AI辅助的笔记软件,主要包括AI创作文章、翻译、修正语法、摘要和总结等 视频示例:B站视频:Notion AI完整介绍 | 十个节省时间的神功能(ChatGPT般强大) URL 有一定免费的AI试用次数,AI功能10$/每月
verse 印象笔记推出的AI写作工具 URL 免费
写作猫 集AI写作、多人协作、文本校对、改写润色、自动配图等功能为一体AI Native内容创作平台 URL 免费
Deep L Write 英文、德文写作工具,可以及時修正写作錯誤、改写句子。 URL 免費版本使用有文字字数限制/有付费升级版
grammarly 纠正语法、拼写、标点符号等错误的写作助手 URL 免费/有付费升级版
火山写作 写作润色、翻译 URL 免费

编程开发

名称 说明 链接 费用
GitHub Copilot GitHub 和 OpenAI 合作开发的一个代码编写助手 Github Copilot技巧和窍门 Github Copilot X的Chat功能介绍,Copilot X申请页面 URL 付费
通义灵码 阿里云开发的代码编写助手,可根据当前代码文件及跨文件的上下文,为你生成行级/函数级代码、单元测试、代码注释等,支持 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等主流语言,同时兼容 Visual Studio Code、JetBrains IDEs 等主流编程工具 URL 免费
CodeGeeX2 开源项目,由清华大学知识工程实验室团队研发,支持200多种主流编程语言的生成及翻译。 【项目原作解读】清华大学郑勤锴:CodeGeeX大规模多语言代码生成模型 GitHub 免费
Cursor 使用 GPT进行协作的代码编辑器 URL 免费
ai-code-translator 利用chatgpt将代码从一种语言翻译成另一种语言。 GitHub 免费,需要OpenAI API key
Amazon CodeWhisperer 亚马逊开放的AI编程辅助工具,根据你的注释和现有代码,实时生成从片段到完整功能的代码建议。在各种IDE的插件中可以安装,支持15种语言, 包括 Python, Java, and JavaScript等。只需要按照流程注册一个aws builder账号即可。 URL 免费
Fitten Code Fitten Code是由非十大模型驱动的AI编程助手,可以自动生成代码,提升开发效率,调试Bug。还可以对话聊天,解决您编程碰到的问题。免费且支持80多种语言:Python、C++、Javascript、Typescript、Java等。并提供丰富的IDE支持,包括Visual Studio Code、JetBrains系列IDE等。 URL 免费
gpt-engineer 一个根据指示生成代码的AI工具,能直接构建整个代码库。B站上的介绍演示视频:gpt-engineer:100%替代程序员的AI程序员来了… GitHub 免费
flappy 一个产品级面向所有程序员的LLM SDK GitHub 免费

翻译工具

名称 说明 链接 费用
immersive-translate 开源的,沉浸式双语网页翻译扩展 GitHub 免费
Deep L 准确即时的翻译工具,目前支持 31 种语言 URL 免费/付费
openai-translator 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 GitHub 免费,需要OpenAI API key

AI聊天-口语练习

名称 说明 链接 费用
pi.ai 一个公认很会聊天的AI,不用担心把天聊死了,并且支持文字和语音。语音输入需要借助苹果系统自带的输入。很适合练习英语对话和听力 URL 免费
Voice Control for ChatGPT chrome扩展程序,通过它可以与 ChatGPT 进行语音对话。可以帮助英语口语或其他语言口语练习。视频示例:B站视频:免费口语老师:如何用ChatGPT练习英语口语 URL 免费,需要chatgpt账号
SpeechGPT 开源项目,SpeechGPT 是一个让你与 ChatGPT 聊天的网站。 GitHub 免费,需要OpenAI API key

图像创作

名称 说明 链接 费用
Midjourney 输入文字或图片进行图片创作。应用示例:
尝试用chatGPT+midjourney进行科研绘图,被效果震惊到了。。。
URL 免費账户有一定的使用分钟限制,有付费升级版本
Stable diffusion webui 开源项目,输入文字或图片进行图片创作, Stable diffusion webui是Stable diffusion的GUI是将stable diffusion实现可视化的图像用户操作界面,它本身还集成了很多其它有用的扩展脚本。
新手入门教程:https://www.bilibili.com/video/BV1Qo4y167AK/ AI风格化视频或AI真人视频的效果:1. 【AI动画】欣小萌天台蹦迪 动画版,2. 死磕真人AI动作,人物和背景的终于不闪了,你们觉得哪个更好点?3. 5分钟,教会你如何生成AI动画
GitHub 免费
Photoshop 生成式AI功能 在Adobe Photoshop中使用生成式AI填充功能。功能介绍: 1. B站视频:Photoshop 革命性新功能-生成式填充功能介绍
2. 巫师后期B站视频:引爆点——Photoshop核弹级更新(创成式AI填充)彻底改变图片行业!
URL Photoshop 订阅会员可下载Beta版本试用
firefly Adobe 的AI图片处理网站 URL 免费/付费
clipdrop stability.ai 公司旗下的图像处理网站,包含文生图、AI扩图、图生图、去除背景等功能 URL 免费/ 付费
civitai Civitai(C站)是一个用于分享AI图像创作模型资源的网站平台,拥有大量模型,已成为SD开源社区主要的模型交流场所 URL 免费
文心一格 百度旗下的文生图和AI图片编辑应用 URL 免费/付费
通义万相 阿里旗下的文生图和AI图片创作应用 URL 免费
美图的奇想智能MiracleVision 美图的文生图应用 URL 免费
ideogram.ai AI 文字生成图片的网站。前谷歌AI绘画4位大牛创立的公司推出的产品 URL 免费
Skybox AI 输入文字生成360度全景图片 URL 免费/ 付费
Microsoft Bing Image Creator Image Creator 是使用 DALL-E 技术创作图片的工具。试用了下生成人像图片不堪入目 URL 免费
remove.bg 一键删除图片背景 URL 免费/付费
简单AI 搜狐旗下的文生图和图片分享网站 URL 免费/付费
ControlNet 能够在一个text2image上训练的扩散模型进行高效finetune,并且结合特定的condition输入,得到可控的效果 Github 免费
StreamDiffusion 实时AI互动图片生成的管道级解决方案 Github 免费
visual-chatgpt 通过 ChatGPT 创作图片 GitHub 免费
DragGAN 一种新的交互式图像编辑方法,允许用户通过简单地在图像上点击并拖动点来进行编辑 GitHub 免费

语音识别-生成字幕

名称 说明 链接 费用
whisper 开源,OpenAPI 开源的通过大规模的弱监督进行鲁棒性的语音识别的模型 GitHub 免费
buzz 开源,基于OpenAI的Whisper识别语音并生成字幕的开源桌面软件,使用CPU进行处理 GitHub 免费
WhisperDesktop 开源,基于OpenAI的Whisper,Windows系统的桌面应用,使用GPU进行处理,GPU性能好的话会比CPU上更快。使用介绍:https://www.appinn.com/const-me-whisper/ GitHub 免费
whisperX 开源,一位来自牛津大学的博士生Max Bain开源的模型,WhisperX可以按照单词对齐时间戳,基本上生成的字幕都是完整的句子。生成结果除了srt还有json文件,里面有每一行里面单词的时间戳,可以根据需要二次整理字幕。还能识别发言人,准确率还可以。使用示例: 1. 在google colab上使用whisperX生成youtube视频字幕的代码:whisperx_youtube_subtitle,可以免费使用colab的GPU,使用GPU T4,2小时40分钟的视频字幕生成6分钟左右,挺快的。 whisperX 免费
飞书秒记 上传视频或者音频可转录为文字,并可一键导出到飞书文档。处理速度很快,一个将近 2 个多小时的视频,约 6 分钟完成。 URL 免费,有企业付费版
通义听悟 阿里旗下的语音转录应用 URL 免费/付费
whisper-web 在浏览器中运行ML驱动的语音识别! 使用Transformers.js构建。Demo链接 GitHub 免费

文字转语音

名称 说明 链接 费用
剪映 文本朗读有很多的音色选择 URL 免费/vip
微软Azure 文本转语音 目前最好用最真实的语音工具,包括自媒体配音最常见的云希和晓晓的声音;教程:免费使用微软的Azure;Azure使用详细教程 URL 付费/每个月有50万字符的免费额度
TTS-Online 提供超过160种声音选项 美真人配音选择,包含主流的小帅 小美 微软的一些语音,如果你是二次元游戏迷之类网站还提供超过1000+的动漫游戏角色的声音。网站可以提供api。分享者:issue URL 免费
配音神器 有网页端、windows客户端工具,使用比较方便 URL 付费/非 VIP 每天可试用 5 次
coqui-ai/tts 用于文本到语音的深度学习工具包
在线体验Demo网页:https://huggingface.co/spaces/coqui/xtts
Github 免费
elevenlabs 文字转语音的服务,提供多种语言 URL 免费/付费
netease-youdao/EmotiVoice EmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 Github Free

声音克隆

名称 说明 链接 费用
剪映 目前只有APP端有声音克隆的功能,朗读一小段文字就能完成音色的克隆,音色效果很牛。当你添加文本时,在“文本朗读”那个功能中,点击“我的”tab,就能看到这个功能了 URL 限免
豆包 字节跳动的AI聊天应用,豆包app中声音设置可以选择“创建我的声音”,回答问题的时候就可以用克隆的声音来回答了 URL 免费

语音翻译

名称 说明 链接 费用
Seamless 可以实时翻译100多种语言,延迟不到2秒钟,说话者仍在讲话时就开始翻译。Seamless翻译不仅仅是文字上的转换,还能保持说话者的情感和语气、语调等,使得翻译后的语音更加自然和真实。Seamless模型统一了SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能。旨在实现多语言、表达性和流畅的语音翻译。在线体验Demo地址 Github Free

语音合成

名称 说明 链接 费用
so-vits-svc So-vits-svc(也称Sovits)是基于VITS、soft-vc、VISinger2等一系列项目开发的一款开源免费 AI 语音转换软件,用户只需准备几十分钟到几个小时不等的语音或歌声数据,就能制作属于自己的 AI 声库,将一段语音或歌声转换为你想要的音色。更多介绍 B站视频:手把手教学!如何自己训练一个AI歌手 - sovits本地&云端训练教程 GitHub 免费
open-mmlab/Amphion 开源音频、音乐和语音生成工具包, 在线使用:https://huggingface.co/amphion
文章介绍:机器之心:霉霉演唱《稻香》,国内团队的Amphion音频生成火了
Github 免费

语音处理

名称 说明 链接 费用
vocalremover 分离人声和伴奏 URL 免费
lala.ai 从任何音频和视频中提取人声、伴奏和各种乐器 URL 有免费的试用额度/付费

AI生成音频-音效-音乐

名称 说明 链接 费用
suno.ai URL 使用AI通过文本来创作音乐
应用示例:
韩雪:【AI音乐家】我在古镇用AI写歌!
免费/付费
suno-ai/bark 文本转音频模型 Github 免费
audiocraft Meta开源的一个用于音频/音乐生成的开源库,其中主要包括两个模型,MusicGen:文本到音乐模型,AudioGen:文本生成声音模型。MusicGen在线Demo GitHub
免费
Stable Audio stability.ai旗下的AI音乐、音效生成应用 URL 免费/付费

AI视频创作

名称 说明 链接 费用
Sora OpenAI的文本生成视频的模型。Sora技术报告:https://github.com/ikaijua/Awesome-AITools/discussions/54, Sora的访问权限未完全开放,部分视觉艺术家、设计师和电影制作人获得了访问权限 URL -
Runway Gen-2: 文本/图像 AI生成视频
Gen-1: 根据视频AI生成视频
应用示例:
B站视频:数字生命卡兹克/我用AI做了一部《流浪地球3》的预告片
URL 付费/有一定的免费试用额度
剪映 字幕生成语音、识别语音、一键图文成片,还有很便捷、强大的视频剪辑功能 URL 免费/vip
Fliki 將文字生成音频和视频的网站 URL 免费/付费
d-id 根据文字生成数字人的配音视频 URL 付费,有一定的免费试用额度
HeyGen 根据文字生成数字人的配音视频 URL 付费,有一定的免费试用额度
AnimateDiff Animatediff是香港中文大学团队开源的AI视频生成方法,基于Stable DIffusion的开源基建,8月份开源模型之后,一个月就把AI视频生成的质量提高了几个等级。
介绍文章:这款工具让你一秒成AI版宫崎骏,AI视频“ChatGPT时刻”快到了
Github 免费

学术科研

名称 说明 链接 费用
gpt_academic 为GPT/GLM提供图形交互界面,特别优化论文阅读润色体验,模块化设计支持自定义快捷按钮&函数插件,支持代码块表格显示,Tex公式双显示,新增Python和C++项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持清华chatglm等本地模型。兼容llama,rwkv,盘古大模型等。 GitHub 免费

OCR图像识别文字

名称 说明 链接 费用
微信 微信对话框中的图片有提取文字的选项,识别效果很好,使用了几次基本没有什么识别错误。
2021-03月份 微信AI对OCR功能的介绍:三年磨一剑——微信OCR图片文字提取
免费
Umi-OCR 开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。内置多国语言库。 Github 免费

视频内容总结

名称 说明 链接 费用
ChatGPT for YouTube Chrome 插件,快速总结 Youtube 视频內容,需要登录chatgpt账号或者apikey URL 免费
Chat Youtube 给一个Youtube 链接,它能给出总结,还可以向它提视频內容相关的问题 URL 免费
BibiGPT 开源项目,音视频内容 AI 一键总结:哔哩哔哩、YouTube、网页、播客、会议、本地文件等 GitHub 免费

评测

大语言模型评测

  • B站视频:酷玩实验室/5大AI模型测评,带你一天上班摸鱼4小时!, 2023-08-18
  • B站视频:【AI对决】让ChatGPT4出题!结果你绝对想不到!!
  • B站视频:阿里版GPT【通义千问】,和我的预期不一样:
    通义千问在自然科学和专业知识方面表现比较优秀,比如代码能力明显强于文心一言,甚至可以与chatgpt3.5掰掰手腕。在中文表达或者文学创作方面还有待提高,逊色于文心一言。
  • B站视频:chatgpt挑战知乎热门问题-GPT3.5 对战 GPT4

精选文章

chatgpt相关文章

  • Sparks of Artificial General Intelligence:
    Early experiments with GPT-4: 该论文是一篇长达154页的对 GPT-4 的测试。微软的研究院在很早期就接触到了 GPT-4 的非多模态版本,并进行了详尽的测试。这篇论文不管是测试方法还是测试结论都非常精彩,强烈推荐看一遍。
  • 《GPT-4 ,通用人工智能的火花》论文内容精选与翻译: Sparks of Artificial General Intelligence:
    Early experiments with GPT-4 这篇论文的精选和中文翻译。

后记

回顾这篇关于AI实用工具的分享,我深感AI技术的强大与魅力。从最初的简单应用到如今的深度融合,AI正在以它独特的方式改变着我们的世界。

在探索AI的过程中,我发现了许多令人惊叹的工具,它们不仅提高了我们的工作效率,更为我们的生活带来了无尽的乐趣。而更让我欣喜的是,这些工具大多数都是免费的,让我们在探索AI的道路上无需承担过多的经济压力。

然而,AI技术的发展仍然是一个不断进化的过程。我相信,在不久的将来,我们将会有更多、更强大的AI工具涌现出来,为我们带来更多的惊喜和便利。

最后,我要感谢每一位阅读这篇文章的朋友。希望这篇文章能够为大家带来一些启发和帮助,让我们共同期待AI技术的美好未来!


原文 : https://github.com/ikaijua/Awesome-AITools/blob/main/

你可能感兴趣的:(学术之路,人工智能,AI大模型)