关于可信的ChatUI

前天在网易数帆北京峰会上,我们正式发布了可信ChatBI产品,就是通过对话就可以看数(对话即数据分析,网易数帆ChatBI做到了)。这种产品好几家都在做,我们也不算最早宣传的,但我感觉我们是把可信度做到最高的。

大家都知道大模型将带来ChatUI交互范式,比尔说过这话。这当然是方向,我之前也写过专门的文章(ChatGPT让现在的软件都土掉渣了),但做起来并不容易,关键是要做到可信。

大家知道大模型技术根本不可能解决犯错误的问题,随时都有可能会犯错误,即便是在一些非常简单的地方。所以现在很多人说大模型就像个文科生,做些不要求精确的文创工作很好,但做要求精确的理科生就不大行了,但要做到ChatUI,就得做到高度精确,大家对软件的质量要求是很高的,在GUI交互下,你清楚的知道点击一个按钮或者输入一个表单软件会做什么。

用户对软件的正确性要求很高,但大模型又做不到这么高的正确率。怎么办?方法是换个评价,不再强求正确率,而是追求可信。

可信不是指正确,以当前的大模型技术,在可预见的未来最多也就只能做到80-90%的正确率,在很多行业场景落地的时候,如果不经过运营正确率还远低于这个数。

可信是指用户很够知道结果是否正确,虽然模型会出错,但用户要知道,这是所有技术方案的关键。虽然正确率至多只有90%,但对可信的要求就高多了,至少得有个99%。

我们这次做的ChatBI是Query,我们也已经在做Command,也就是通过对话调API。

一个应用最主要就是Command和Query,所以架构上才会有CQRS这样的说法。

所以如果同时做到Comnand和Query,基本上就可以通过对话实现完整的应用功能了。

这些技术demo都很多,但关键是要做到可信,而且是基于可私有化交付的大模型。做不到这两点都是胡扯。

前天会后有朋友说他已经看过三个ChatBI的发布了,我们问有什么区别,他说只有我们是自己的大模型,其他两家都是调API。

对Query的可信要求相比Command还是要稍微低一些,所以我们先做Query,积累经验,然后再做Command。

让行业共同努力,一起推动新交互时代的到来。

你可能感兴趣的:(关于可信的ChatUI)