人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”

目录

文心一言初体验

一、登录体验难易对比

 二、测试对比--哲学类

第一个问题:《三体》的作者是谁?

第二个问题:总结以下《三体》的核心内容,如果要续写的话可以从哪个角度出发?

第三个问题:你认为智能交通最适合在哪个城市发展?

三、测试对比--理科类

四、测试对比--绘图类 

五、测试对比--程序代码类

1、代码生成:html+js+css编写一个爱心代码

2、代码分析:帮分析一段代码实现了什么功能;

3、找BUG测试


2月7日上午,经百度确认,类似Chat GPT的项目已经确定命名为文心一言,因为命名ERNIE Bot,3月16日,下午14点,召开新闻发布会,完成内测,面向公众开放。据发布会消息,目前该产品已经可以在百度上面申请体验!

相关链接:文心一言 (baidu.com) 

当然,作为一个中立者,我也会在体验之后,比较一下文心一言和Chat GPT的异同和体验感满意程度在哪里。所以,跟随我的脚步,我们出发咯!


文心一言初体验

由于是刚开始公测,需要到“百度智能云”上面去填报自己的个人信息,才能通过体验请求!

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第1张图片

经过一天的申请等待时间,终于得到了体验的机会,那作为一名开发者,我就来一次理性的测试一下文心一言和ChatGPT之间的差异是什么,,这边通过几项测试关卡来对比,那跟着我的步伐,一起来看一看!


一、登录体验难易对比

对于“文心一言”,大家只要在百度云网站体检实名申请,提交申请之后等待审核通过,就可以了。申请通过,我们进入到测试界面!如下,

再,点击“开始测试”,我们就进入到了内测的界面,如下:

 登录网址:文心一言 (baidu.com)

 那接下来,我们看一看chatGPT的登录体验的准备操作:

首先,因为chatGPT,再国内没有办法直接登录体验,需要使用国外的电话账号,加上国外的VPN,再此之前,捣鼓了好久才搞定了chatGPT的登录;

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第2张图片

在一系列的操作之后,才进入到了opanAi,才使用上了,chatGPT!

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第3张图片

 虽然,这个步骤我轻描淡写一笔带过,但是有能使用到OpenAI的小伙伴,就能知道使用GPT的前期工作还是相对而言很麻烦的!在登录体验两者方面,对比起来,那就是文心一言方便于GPT,毕竟是自己国内的内测体验,只需要认证申请就大概率能申请得到,当然,也要看你脸红还是脸黑,要是脸黑,那还是申请不了的!所以,个人而言,在这一关卡,文心一言在我心中优胜一点!


 二、测试对比--哲学类

这个项目,决定使用当天“文心一言“新闻发布会上所展示的几个问题,以相同的问题来问一下chatGPT,看看以下两者给出的答案有什么不同!

第一个问题:《三体》的作者是谁?

对于这个问题,由上图来看,二者的回答几乎相差不大,文心一言回答的更加的详细,GPT相比较就更像一问一答的回答模式,所以这一对比,给一个平局!


第二个问题:总结以下《三体》的核心内容,如果要续写的话可以从哪个角度出发?

 文心一言的回答:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第4张图片

GPT的回答:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第5张图片

对于这个问题,文心一言只是回答了角色塑造、艺术背景、哲学的方面总结了三体的内容,但是没有在续写方面提及到建议;而GPT在总结方面在自然灾难、文化危机和哲学这三方面进行总计,在续写方角度也罗列方向,所以这一回合GPT优胜一局!


第三个问题:你认为智能交通最适合在哪个城市发展?

GPT的答案:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第6张图片 文心一言的答案:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第7张图片

二者相比而言,GPT直接罗列了四个适合发展的城市,文心一言没有罗列出来,以一个较为笼统委婉的回答来回答!


三、测试对比--理科类

接下来,我们来问个理科类的问题来测试两个人工只能,看看他们给出的答案有什么不一样!

问题:鸡兔同笼游戏。鸡有2个脚1个头,兔子4只脚1个头,那么在一个9头40只脚的笼子,应该有多少只鸡和兔子?

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第8张图片

 我们根据上图,可以看得出来chatGPT给出了完整的答案(也提示题目有误),而文心一言给出了一个题目出错的答案!一个是给出了详细的解题过程,一个给出了相对俏皮的回答,感觉就像一个是理科生一个是文科生!

接下来,我们将40只脚改为30只脚,看看二者的回答!

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第9张图片

 由此我们可以看到,两者都给出了正确的答案,只不过一个严谨一i但,一个相对于俏皮,那么你喜欢哪一种风格呢?


四、测试对比--绘图类 

我们问题问题是:为2023世界智能交通大会制作海报;

这其实是一个相对超纲得问题,那我们看看两者给出得回答是什么?

GPT:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第10张图片

GPT给出得答案是:作为一款文本AI,它无法生成图像和海报,但是GPT罗列出制作海报方面得建议!那我们看一下文心一言给出得答案:

文心一言:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第11张图片

 相对于GPT,文心一言直接给我们制作了一张海报,这一比还是文心一言更加胜一筹!


五、测试对比--程序代码类

作为开发人员,还是需要这两款AI能在程序方面能给与到一些辅助作用的,那么我们就从测试生成代码和代码分析以及找BUG三个方面测试对比以下二者!

1、代码生成:html+js+css编写一个爱心代码

GPT: 

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第12张图片

 效果:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第13张图片

 GPT得爱心代码效果:可以在浏览器中打开此 HTML 文件,点击页面上的爱心,就可以看到爱心变成了实心红色,再次点击则变回原来的样子,个人觉得还是可以的;程序不到50行!

那我们测试以下文心一言:

文心一言:

效果:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第14张图片 相比于上面GPT,还是可以的,有种中国人的浪漫!个人还是喜欢第二种,可能我是颜控吧!哈哈哈!


2、代码分析:帮分析一段代码实现了什么功能;

这里我们使用到一个:求直角三角形两个边长的长度:已知斜边长度L,求2个直角边:X,Y长度;的这么一个程序题,看看二者能不能分析出来!

题目:

#include 
 
#include 
 
void main()
 
{
 
  float a,b,R,L,r;
 
  printf("请输入斜边长度:");
 
  scanf("%f",&L);
 
  printf("请输入其中一斜角度数:");
 
  scanf("%f",&r);
 
  R=r/180*3.1415926;  //计算弧度
 
  a=sin(R)*L;  //计算一直角边
 
  b=cos(R)*L; //计算另一直角边
 
  printf("%.2f\n",a);
 
  printf("%.2f\n",b);
 
}

GPT的回答:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第15张图片

文心一言的回答:

 由此可以看出,二者还是不相伯仲,都能分析出程序的正确回答!所以这一关,两个还是平手!


3、找BUG测试

我们将第二题的程序分析里面的float改成char类型,scanf写成scan,看看二者能不能找到程序的错误!

GPT的回答:

人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”_第16张图片 文心一言的回答:

 这一关上面,GPT给出了再到的错误分析,但是文心一言没有找到,只是复制了我改错的代码就没下文了,所以GPT优胜一筹!

好了,对比总结下来,GPT和文心一言都各有各的优缺点,个人觉得文心一言的缺点还是训练时间不够长,训练模型还不够,所以加油吧,毕竟好不容易申请到内测的机会,提出了自己的宝贵意见!个人保持中立且理性的看法去看待二者!都加油吧!我是丘比特惩罚路!喜欢的话,给个关注吧!

你可能感兴趣的:(程序员的浪漫,笔记,人工智能,ai,智能云)