【AI】Interesting Applications

【AI】Interesting Applications_第1张图片

文章目录

  • 【盘古】
  • 【嗜睡检测】
  • 【3D AI 生成】
  • 【多模态——指哪打哪】
  • 【AlphaDev:汇编版 AlphaZero】
  • 【ChatExcel】

【盘古】

2023年7月,华为正式发布盘古大模型3.0,并提出3层模型架构。

  • L0:基础大模型,包括自然语言、视觉、多模态、预测、科学计算;

  • L1:N个行业大模型,比如政务、金融、制造、矿山、气象等;

  • L2:更细化场景的模型,提供“开箱即用”的模型服务

【AI】Interesting Applications_第2张图片

【嗜睡检测】

基于Python和MediaPipe,嗜睡检测系统搭建代码实战

思路:疲劳驾驶的司机大部分都有打瞌睡的情形,所以我们根据驾驶员眼睛闭合的频率和时间来判断驾驶员是否疲劳驾驶(或嗜睡)。
【AI】Interesting Applications_第3张图片

【AI】Interesting Applications_第4张图片

【3D AI 生成】

3D AI生成出新玩法了:无需数小时,只要45秒,单张图片即可生成 3D模型

【AI】Interesting Applications_第5张图片

Project Page: http://one-2-3-45.com

Paper: https://arxiv.org/pdf/2306.16928.pdf

Code: https://github.com/One-2-3-45/One-2-3-45

Demo:https://huggingface.co/spaces/One-2-3-45/One-2-3-45

【AI】Interesting Applications_第6张图片
【AI】Interesting Applications_第7张图片

【多模态——指哪打哪】

仅靠“口才”就能解决视觉任务!商汤提出Shikra:新一代多模态大模型

《Shikra: Unleashing Multimodal LLM’s Referential Dialogue Magic》

https://arxiv.org/pdf/2306.15195.pdf

https://github.com/shikras/shikra

基于 CLIP 做的
【AI】Interesting Applications_第8张图片

【AI】Interesting Applications_第9张图片
会拼图
【AI】Interesting Applications_第10张图片

会分辨谁是镜子中的人
【AI】Interesting Applications_第11张图片
【AI】Interesting Applications_第12张图片
点作为输入也可以

【AI】Interesting Applications_第13张图片
【AI】Interesting Applications_第14张图片
Reffering Expression Generation
【AI】Interesting Applications_第15张图片
Referring Expression Compression
【AI】Interesting Applications_第16张图片

【AI】Interesting Applications_第17张图片

【AlphaDev:汇编版 AlphaZero】

谷歌DeepMind打破十年算法封印,AlphaDev惊世登场,颠覆人类算法格局!

Alpha」家族再添新成员AlphaDev!谷歌大脑DeepMind合体后首发力作,全新AI系统将排序算法提速70%,C++排序库十年来首次更改。AI创造AI的时代要来了?

【AI】Interesting Applications_第18张图片
谷歌 DeepMind 的研究者相信,在这个较低的层级中存在许多可改进的空间,而这些改进在更高级的编程语言中可能很难发现。

【AI】Interesting Applications_第19张图片

AlphaDev:汇编版 AlphaZero

【AI】Interesting Applications_第20张图片

【ChatExcel】

老罗落泪!北大团队搞出ChatExcel,说人话自动处理表格,免费且不限次使用

你可能感兴趣的:(Speech,/,Course,人工智能)