每日一看大模型新闻(2023.11.13)自定义GPT最受欢迎Top 9名单发布;清华系ChatGLM3发布,多模态挑战GPT-4V;GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒

1.产品发布

1.1清华系ChatGLM3发布,多模态挑战GPT-4V

发布日期:2023-11-13

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

主要内容:智谱AI发布了清华系ChatGLM3,全自研、适配国产芯片,多模态模型挑战GPT-4V,搭载国产Code Interpreter,实现代码交互能力。ChatGLM3在多模态视觉、代码生成、网络搜索等方面迭代升级,全面挑战GPT-4V的综合能力。智谱AI开源了ChatGLM3-6B(32k),并通过高效推理技术提升推理速度,成本更低,展现了开源创新的实力。 推出可在手机端部署的1.5B和3B端测模型,支持多种手机平台,提供性能直逼ChatGLM2-6B的体验,拓展了应用场景。

1.2 vivo X100系列发布:首款搭载AI大模型的手机问世

发布日期:2023-11-13

vivo X100系列正式发布:打造AI大模型手机

主要内容:vivo于11月13日晚发布了X100系列,成为首批在终端调通的手机中搭载了百亿大模型的AI手机。新系列首发搭载联发科最新移动平台“天玑9300”,其CPU采用“4+4”全大核架构,GPU和APU性能相较上一代产品有显著提升。用户还可使用内置的“蓝心小V”智能助手,其技术支持来自蓝心大模型。vivo X100系列将于11月21日正式开售,起价3999元。

1.3智源研究院开源JudgeLM 可评测各类大模型并输出评分

发布日期:2023-11-13

MSN

主要内容:智源研究院推出JudgeLM裁判模型,JudgeLM裁判模型成本仅为GPT-4的1/120,能在多场景中高效评判各类大模型。 JudgeLM有三个参数版本,分别为70亿、130亿和330亿,随参数规模增大,能力和表现提升。智源研究院除了开源JudgeLM,还提供了包含训练和验证样本的数据集,致力于进一步完善裁判模型。

项目地址:

https://link.zhihu.com/?target=https%3A//github.com/baaivision/JudgeLM

2.技术更新

2.1 GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒

发布日期:2023-11-13

GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒-文章|元宇宙投融邦

主要内容:对此,加利福尼亚大学洛杉矶分校(UCLA)顾全全教授领导的通用人工智能实验室发布了一份研究报告,针对大语言模型(如 GPT-4)在问题理解上的歧义问题提出了一种创新的解决方案。该方案的核心在于让大语言模型对提出的问题进行复述与扩写,以提高其回答的准确性。研究发现,经 GPT-4 重新表述的问题变得更加详细,问题格式也更为清晰了。这种复述与扩写的方法显著提高了模型的回答准确率。实验表明,一个良好的复述之后的问题,使回答的准确率从原本的 50% 提高到了接近 100%。

论文地址:https://arxiv.org/pdf/2311.04205.pdf

项目地址:

Rephrase and Respond: Let Large Language Models Ask Better Questions for ThemselvesRephrase and Respond: Let Large Language Models Ask Better Questions for Themselves

3.商业动态

3.1星巴克出资2亿元在中国成立创新科技公司,含AI应用软件开发业务

发布日期:2023-11-13

星巴克出资2亿元在中国成立创新科技公司,含AI应用软件开发业务_凤凰网

主要内容:根据国家企业信用信息公示系统的记录,最近星巴克(中国)创新科技有限公司成立了。该公司是由星巴克咖啡(开曼)控股有限公司全资拥有的。根据营业执照信息显示,罗金鹏是星巴克(中国)创新科技有限公司的法定代表人。注册资本为2.22亿元人民币。该公司的经营范围包括软件开发、软件销售、人工智能(AI)应用软件开发、人工智能基础软件开发、人工智能理论与算法软件开发、物联网设备制造、计算机系统服务、大数据服务、供应链管理服务等。

3.2 Intel官宣Vision 2024大会,AI仍将是关键中的关键

发布日期:2023-11-13

Intel官宣Vision 2024大会,AI仍将是关键中的关键_凤凰网

主要内容:Intel官方宣布将于2024年4月8-9日在美国亚利桑那州凤凰城举办Vision 2024大会。该大会不仅关注行业趋势和公司项目进展,还会介绍新产品的进度和成果。过去的大会中,Intel宣布了多个项目,如Project Endgame计算服务、Project Apollo II人工智能部署服务、Gaudi2 AI加速器、四代可扩展至强处理器和Arctic Sound-M数据中心GPU加速卡。2023年,他们介绍了“芯经济”(Sliconomy)概念,展示了Intel芯片在数字化转型和AI、边缘计算方面的创新。今年的大会内容尚未透露,但提到了AI、边缘、云、下一代系统和未来技术等关键词,并强调“驱动未来,由此开始”。AI仍然是重点关注的领域,结合各种硬件和开发平台的支持,将打造完整的生态系统。在9月份,Intel举办了以“AI Everywhere”为主题的2023年度技术创新大会。

4.其他资讯

4.1自定义GPT最受欢迎Top 9名单发布

发布日期:2023-11-13

百度安全验证

主要内容:The Rundown的创始人Rowan Cheung发布了一个网站,该网站用于搜索、过滤和提交最佳的自定义GPT。在24小时内,该网站收到了超过500次的提交。Rowan Cheung总结了社区最受欢迎的Top 9名单,包括以下GPT模型:

Designer GPT: 帮助创建并托管网站,可为任何业务设计网站。

Spotify Explorer GPT: 连接GPT与Spotify,提供歌曲相关信息和音乐链接。

Grimoire GPT: 一句话构建网站,简便易用。

Healthy Chef: 食谱大全和营养顾问,根据需求生成全面的饮食方式。

Market Analyst GPT: 分析曲线图,提供市场建议,助力决策。

Screenplay GPT: 根据图片设计故事情节和场景,包括详细人物描写。

Kraftful GPT: 产品管理助手,回答关于产品管理的问题。

Drawn to Style: 根据不同风格生成多样化的图片,丰富原作品。

Recipe Snap GPT: 根据实物照片快速生成菜谱,为烹饪提供灵感。

网站地址:Discover the Best GPTs

4.2 微软发布 MathVista 多模态数学推理基准及 122 页测评报告

发布日期:2023-11-13

GPT-4V数学推理如何?微软发布MathVista基准,评测报告长达112页_腾讯新闻

主要内容:微软最近发布了名为 “MathVista” 的全新多模态数学推理基准数据集,同时提供了一份涵盖 112 页的详细评测报告,专注于大型多模态模型的数学推理表现。这一基准测试对于目前最先进的模型,如 GPT-4V,来说也是一项挑战,显示了这些模型在多模态数学问题解决方面的局限性。报告还深入分析了 GPT-4V 在自我验证、自洽性和多轮对话能力的研究潜力。

论文地址:https://arxiv.org/abs/2310.02255

项目地址:MathVista: Evaluating Math Reasoning in Visual Contexts

HF 数据集:https://huggingface.co/datasets/AI4Math/MathVista

数据可视化:https://mathvista.github.io/#visualization

Leaderboard:https://mathvista.github.io/#leaderboard

你可能感兴趣的:(gpt,人工智能,自然语言处理,prompt,数据分析,语言模型,embedding)