人机交互30年

　　　　　　　　　　　　　　　　　　　　　　　　　　　　人机交互30年

自1982年ACM成立人机交互专门兴趣小组SIGCHI(Special Interest Group on Computer-Human Interaction)以来，人机交互(Computer-Human Interaction，CHI)已走过了近30年历程。键盘的出现，将计算机带入了字符用户界面时代。1964年，美国人道格·恩格尔巴特（Doug Engelbart）发明了鼠标（图1），图形用户界面（Graphical User Interface,GUI）随之出现，才有了计算机的主机时代和个人计算机时代，为此，恩格尔巴特也获得了1997年的图灵奖。自图形用户界面出现至今的几十年中，人机交互技术经历了几代人的努力，成就了PC时代的辉煌。

图1 Doug Engelbart和他发明的鼠标

　　70年代Xerox研究中心的Alan Kay提出了Smalltalk面向对象程序设计等思想，并发明了重叠式多窗口系统。

　　1989年Tim Berners-Lee在日内瓦的CERN用HTML及HTTP开发了WWW网，随后出现了各种浏览器（网络用户界面），使互联网飞速发展起来。

图2 Alan Kay和Tim Berners-Lee

　　由于笔式交互、触摸、语音、以及基于视频等自然交互设备的出现，新的计算模式被提出，人机交互进入了普适计算(Pervasive Computing)时代。

90年代美国麻省理工学院N.Negroponte领导的媒体实验室在新一代多通道用户界面方面（包括语音、手势、智能体等），做了大量开创性的工作。

90年代美国Xerox公司PARC的首席科学家Mark Weiser首先提出“无所不在计算（Ubiquitous Computing）”思想。

　　人机交互是研究人类所使用的交互式计算系统的设计、实施、评估以及相关主要现象的学科，用户界面（User Interface,UI）是人与计算机之间传递、交换信息的媒介和对话接口，是计算机系统的重要组成部分，用户界面是人机交互技术的物质表现形式。所以在普适计算时代自然交互是其研究的重要主题，人机交互的历史也是从人适应计算机到计算机不断地适应人的发展史。回顾人机交互的发展史，主要经历了以下几个阶段（图3）：

　　1、早期的手工作业阶段；

　　2、作业控制语言及交互命令语言阶段；

　　3、图形用户界面（GUI）阶段；

　　4、网络用户界面的出现；

　　多通道、多媒体的智能人机交互阶段。

图3 界面范式的发展过程

　　在早期的命令语言用户界面时代，人和计算机的交互主要是通过键盘来完成的。而此时的计算机主要是大型机，用来进行科学计算，接受文本命令；随着图形界面和鼠标的出现，计算机进入了个人PC时代，接受GUI命令，并帮助我们我们实现了办公自动化。WIMP界面范式是图形界面电脑所采用的界面典范。在人机互动领域之中是最普遍的电脑互动界面，WIMP堪称无人能出其右，举凡微软的Windows、苹果电脑的MacOS，甚至其它以X-Window为基础的操作系统，均采用WIMP此一界面典范。WIMP是由“视窗”（Window）、“图标”（Icon）、“选单”（Menu）以及“指标”（Pointer）所组成的缩写，其命名方式也指明了它所倚赖的四大互动元件。曾经有人这样评价图形用户界面：“PC plus GUI made the history”。但随着计算机硬件设备的进步和软件技术的发展，WIMP界面的缺点逐渐地体现出来。目前研究者们将研究的焦点聚集到下一代的用户界面的研究上，提出了Post-WIMP(或Non-WIMP)的界面形式。

用户界面技术的每一次飞跃都需要认知心理学成果的支撑，在人机交互的心理学研究当中，自然、智能用户界面目标是：帮助计算机了解用户，帮助用户更好地使用计算机。WIMP界面概念模型中，认知主体和计算机的交互过程如图5所示，认知主体通过击键或指点向应用程序输入指令，应用程序通过窗口、图标、菜单以及文本向认知主体反馈信息。这种界面模型将认知主体的注意力集中在如何使用计算机上而不是任务的本身。

图4 人机交互的适应发展 图5 传统WIMP界面范式的交互过程

　　人机交互大师Turk曾给自然地用户界面下过如下定义：最自然的人机交互技术是指那些能够利用人类自然地认知和感知能力、社会技能以及我们从小就养成的行为习惯。由图6的五种人的感知通道所衍生出的界面形式称为可感知用户界面（Perceptual User Interface, PUI）

图6 PUI的几种感知通道

　　可感知用户界面(PUI)目前主要集中在以下几大领域：触控交互、笔式交互、机器视觉交互、语音交互、脑-机交互、其他传感器类交互以及多通道交互领域。

触控交互技术已普遍渗入到人的生活当中，触控手机和平板电脑就是这类交互技术的应用实例。美国苹果公司（Apple）将电容屏应用到智能手机当中，推出了iPhone、iTouch以及iPad智能手机和智能平板电脑系列，随后这种触控交互的电子产品风靡全球，几乎将现在所有的智能手机的交互方式都更新了一遍。

图7 iPhone和iPad

　　微软（Microsoft）是多点触控技术的先行者，Microsoft Surface强调使用更为直觉，不需使用任何鼠标及键盘。搭配30寸的大型显示器，其机构外型很像张桌子，可以同时让很多人在上面触控操作。与一般触控式电脑最大不同在于提供了多点触控(Multi-Touch)功能，可以同时辨识多点的触控资讯，可让多人同时使用一台Surface电脑。严格意义上来讲，像Surface这类交互设备应属于机器视觉交互的范畴，图8右图是Surface的内部构造，它是由位于底部的一个摄像机来获取到人手指的位置和运动信息然后进行分割识别处理而得到交互语义的。但是在交互过程中不存在机器视觉交互的“金手指”问题，所以它更具备触控交互的特点。

图8 微软Surface应用和构造

　　笔式交互技术应该也属于触控交互，但由于在交互设备上需要用一支电子笔，所以将其单独划为一类。“汉王”的手写设备就是这类交互方式的典型代表。这类设备和上面的触控设备相比不同处除了多了一只电子笔外，其所用的触屏多是电阻屏。笔式交互提倡回归文明、回归自然，特别是对于具有悠远文字文明的我们，笔式交互让我们更贴近汉字文明。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　图9 笔式手写设备

　　视觉通道是人与人之间进行交流的一种重要途径，尽管有很多其他方法可以替代视觉进行交流，但人们更原意采用可视的途径交流，因为这样更符合人们的交流习惯－面对面的交流。基于视觉的交互也称为基于视觉的用户界面（Vision Based Interface, VBI），在人机交互上下文环境中，使用计算机视觉技术来感知用户称为基于视觉的交互。VBI是PUI的一个研究子域，它更多地关注于用户的视觉感知行为。这是一个多学科交叉领域，它结合了计算机视觉、图像处理、模式识别、人机交互、行为心理学等研究成果。视觉用户界面试图回答以下问题【Turk 1998】

　　1、存在和位置：有人在那里么？有多少人他们在哪里？[人脸检测、身体检测、头部和身体跟踪]

　　2、身份：他们是谁？[人脸识别、步态识别]

　　3、表情：用户正在微笑、皱眉、大笑还是说话？[面部表情识别、表情建模和分析]

　　4、注意焦点：用户正在看什么？[头部/面部跟踪，目光跟踪]

　　5、身体姿势和运动：用户的整体姿势和运动是什么？[身体建模和跟踪]

　　6、手势：用户的头部、手、身体的运动表达了什么样的语义信息？[手势识别、头部跟踪]

　　7、行为：用户正在做什么事情？[人体运动分析]

利用视觉手势可以方便、有效地完成以下任务：

1、代替鼠标完成指点和勾画任务；

　　2、虚拟环境中漫游以及操纵虚拟对象；

　　3、控制家电设备（例如电视、CD播放机等）和指挥机器人；

　　4、通过手语进行交流。

　　目前，基于视觉的交互是人机交互领域的一个研究热点。如智能相机、Anote 数码笔以及微软的XBOX体感游戏机都是这一领域的研究成果。严格地讲，Anote数码笔虽然采用了视觉处理技术，但应该属于实物操作界面（Tangible User Interface, TUI）的范畴。实物操作界面倡导的是周围环境中的物体都是交互的接口（World will be interface.）。Anote数码笔是由数码纸和数码笔组成的，所谓的数码纸就是普通的纸，数码笔就是一支普通的圆珠笔。它通过微型摄相头读入笔尖高速书写的笔迹和Anote 数码纸的微点坐标，微处理器分析处理后通过蓝牙无线或USB等方法转送到电脑或携带手机之中。们只需用「Anote 数码笔」在「Anote 数码纸」上与平常一样书写与记录、就可以将信息简便的输入电脑。

　　　　　　　　　　　　　　　　　　　　 图10 Anote数码笔和TUI交互

　　视觉交互技术的另一项商业化应用就是东芝公司推出的具有手势识别功能的笔记本。东芝Qosmio G55可通过摄像头来识别用户的手势，之后软件可把手势转换成指令进行相关操作。用户通过手势可进行音乐、视频播放以及PowerPoint演示等操作，使用者在摄像头前3英尺到10英尺的范围内做出手势便可。

（1）　　　　　　　　　　　　　　　　　（2）　　　　　　　　　　　　　　　　（3）

　　　　　　　　　　 图11 （1）为东芝Qosmio G55可手势识别笔记本；（2）CamSpace；（3）微软体感交互家庭游戏机。

　　由CamSpace小组开发的视觉交互软件基于实际物体的颜色特征，可在短时间内创建一个自己的游戏控制器。真正做到了“any game, any webcam”。只是精确度上要比任天堂的WII手柄略逊一筹。

　　视觉交互领域另一个不得不提的里程碑式的应用就是微软的体感控制器KINECT，它将以色列人的深度传感器推向了商业化应用。KINECT的出现弥补了彩色摄像头的不足，使得普通摄像头下无法解决的难题迎刃而解。自从2011年11月KINECT发布以来，这项技术已被应用到诸多领域，而且以后还会得到更长远的发展。KINECT是一款基于Light Coding技术的立体成像传感器。它可以实时（目前是每秒30帧，实际应该比这个还要高）地捕获到空间的三维信息。微软将其用于对人体动作的识别领域，通过肢体分割和动作识别可以分析出人的动作然后转化成相应的控制信号对虚拟人物或其他设备进行控制。

　　语音交互技术已发展多年，微软的Windows操作系统从Vista版本以后都集成了语音指令操作功能。用户可以通过语音操作指令来完成基本的操作功能，如打开文件、输入字符等。其实，微软在早期就发布了TTS（Text to Speech）语音发音包和语音识别包，开发者可以利用这两个语音包实现语音发音和语音识别的功能；此外，IBM/Via Voice连续中文语音识别系统经过不断改进，也已广泛应用于Office/XP的中文版等办公软件和应用软件中，在中文语音识别领域有重要影响。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　 图12 语音识别

　　脑-机交互目前只能在实验室中见到，脑-机交互也称之为“意念交互”、脑-机接口(Brain-computer interface, BCI)。利用脑电信号实现人脑与计算机或其他电子设备的直接通讯和控制。 BCI技术结合了神经科学、心理认知科学和智能信息处理等领域的最新成果。

　　　　　　　　　　　　　　　　　　　　　　　 图13 脑-机交互

　　除了上述的交互领域，我们还会看到很多基于其他传感器的交互方式，如任天堂的WII操作手柄。这是一款主要面向游戏娱乐的操作设备，它里面包含了固态加速计和陀螺仪，可以实现倾斜和上下旋转、倾斜和左右旋转、围着主轴旋转（像使用螺丝刀）、上下加速度、左右加速度、朝向屏幕加速和远离屏幕加速等功能。类似的设备在现实中也较为常见，如PPT控制器也属此类，一般通过蓝牙技术与主机进行通信。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　图14 WII手柄和WII操作场景

　　多通道交互(Multi-Modal Interaction, MMI)是一种使用多种通道与计算机通信的人机交互方式。采用这种方式的计算机用户界面称为“多通道用户界面”。通道(Modality)这个词源于心理学的概念，涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法，如言语、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉或味觉等。

按照摩尔（Moore）定律，计算机硬件每18个月就翻新一代，计算机软件每5年升级一代，而用户界面则要15到20年更新一代。迄今为止，用户界面的发展经历了三个主要的时代。这三个时代可以用三种截然不同的界面风格来划分。每一种界面风格都持续了若干年，并不断被当时新的硬件技术所优化，然后形成进入下一个时代。每一个新的时代都较前一个时代而言，能更大限度地拓展人机交流的带宽，提高用户的生产力。在60年代到70年代，用户界面主要是字符界面，键盘是主要的交互设备；80到90年代进入了图形用户界面时代，鼠标作为主要的指点和定位设备；21世纪将会进入用户界面的新时代。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　 图15 人机交互范式和用户的生产力

　　计算机的运算速度、存储能力、以至整体计算能力一直在按照Moore定律成倍翻新。另一方面，人的认知能力（包括记忆、理解能力）是不随时间成倍增长的。因此人和计算机的交互就会存在严重的不平衡。人机交互技术，从本质上讲，是为了减轻人的认知负荷，增强人类的感觉通道和动作通道的能力。所以新一代的用户界面将会秉承“无所不在的计算思想”，在五个“any”（ access Any body, Any thing, Any-where, at Any time, via Any device）上进行延伸。计算机将会从我们的“眼前”消失融入到我们周围的环境中去。在这个过程中，图形用户界面（GUI）不会被替代，而是会被增强。图形用户界面将在以下几方面继续发展：

　　1、从直接控制到非直接控制（smart X, agents, SUI简易用户界面）；

　　2、从二维到三维视感；

　　3、更准确的语音、手势识别；

　　4、高质量的触觉反馈设备；

　　5、更方便的界面开发工具；

　　6、增强“智能代理”功能；

　　7、用视频摄像来识别用户的身份、位置、眼动和姿势。

　　人机交互作为一个年轻的学科其实并不年轻，在计算机诞生的那刻起人机交互就随之诞生了。在美国马里兰州召开的第一届人机交互大会，掀开了这一学科的展新篇章。转眼间，它已走过了30年。在这30年中，从理论到实践都取得了巨大的发展，相信未来几十年人机交互会给我们带来意想不到的惊喜。

最有影响的一些事件和成果：

(1)1945年，美国罗斯福总统的科学顾问Bush(1894~1974)在大西洋月刊上发表的《As we may think》的著名论文，提出了应采用设备或技术来帮助科学家检索、记录、分析及传输各种信息的新思路和名为Memex的一种工作站构想，影响着一大批最著名计算机科学家。

(2)1963年，美国麻省理工学院Sutherland开创了计算机图形学的新领域，并获1988年ACM图灵奖，他还在1968年开发了头盔式立体显示器，成为现代虚拟现实技术的重要基础。

(3)1963年，美国斯坦福研究所的Engelbart发明了鼠标器，他预言鼠标器比其他输入设备都好，并在超文本系统、导航工具方面取得了杰出的成果(Augmented Human Intellect Project)，获1997年ACM图灵奖，鼠标器经过不断地改进，成为影响当代计算机使用的最重要成果。

(4)20世纪70年代，当时在Xerox研究中心的Alan Kay提出了Smalltalk面向对象程序设计等思想，并发明了重叠式多窗口系统，后经苹果、微软、麻省理工学院等单位的不断研究和开发，形成了目前广泛使用的图形用户界面的标准范式。

(5)1989年，TimBerners Lee在日内瓦的CERN用HTML及HTTP开发了WWW网，随后出现了各种浏览器(网络用户界面)，使互联网飞速发展起来

(6)20世纪90年代，美国麻省理工学院Negroponte(他早在30年前就提出了交谈式计算机概念)领导的媒体实验室在新一代多通道用户界面方面(包括语音、手势、智能体等)做了大量开创性的工作他是畅销书数字化生存(Being Digital)的作者。

(7)20世纪90年代，美国Xerox公司PARC的首席科学家Mark Weiser(1952~1999)，首先提出无所不在计算(Ubiquitous Computing)思想，并在此领域做了大量开拓性的工作。

本文提到的用户界面结构；
CHI

----GUI

----PUI

　　　　----VBI

----BCI

----TUI

----SUI

基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
使用PyTorch实现的DeepSpeech模型: 强大的语音识别利器毕艾琳
使用PyTorch实现的DeepSpeech模型:强大的语音识别利器deepspeech.pytorchSpeechRecognitionusingDeepSpeech2.项目地址:https://gitcode.com/gh_mirrors/de/deepspeech.pytorch在今天的数字化世界中，语音识别技术已成为人机交互的关键组成部分。deepspeech.pytorch是一个由Sea
JavaScript基础不蒸馒头曾口气 Vue javascript 开发语言前端学习笔记
1JavaScript介绍1.1JS简介1.JavaScript是一种运行在客户端（浏览器）的编程语言，实现人机交互效果。2.作用——网页特效（监听用户的一些行为，让网页作出对应的反馈，如轮播图、下拉菜单等）——表单验证（针对表单数据的合法性进行判断，如输入邮箱的判断）——数据交互（后台的数据，渲染到前端）——服务端编程（node.js）3.JavaScript的组成ECMAScript:(js的
Ubuntu: 配置OpenCV环境达柳斯·绍达华·宁 ubuntu opencv linux
从从Ubuntu系统安装opencv_ubuntu安装opencv-CSDN博客文章浏览阅读2.3k次，点赞4次，收藏14次。开源计算机视觉(OpenCV)是一个主要针对实时计算机视觉的编程函数库。OpenCV的应用领域包括:2D和3D功能工具包、运动估计、面部识别系统、手势识别、人机交互、移动机器人、动作理解、物体识别、分割和识别、实体影像立体视觉:来自两个摄像机的深度感知、运动跟踪、增强现实等
人机交互--鬼佬对人心智模型的分析 iteye_6451 Other mental model
心智模型英文为MentalModel，又叫心智模式。心智模型的概念：人们在研究人机交互的时候，提出了一个关于人处理信息和与人交流的简单模型——MentalModel。简单的描述是这样的，人通过传感器，也就是眼睛耳朵等，接受外界信息以后会在脑中形成一个思维的模型来描述或者说刻画外部世界这个思维的模型范围很广，可以是具体事物的抽象。【例如：上街没事溜达的时候看见从身边不断超过的四个轮子的封闭式铁壳子，
人机交互与现代战争人机与认知实验室人机交互
人机交互技术在现代战争中的应用越来越广泛，它可以帮助士兵更好地完成任务，提高作战效能，减少人员伤亡。人机交互与认知在军事应用方面的进展有很多，比如：（1）虚拟现实和增强现实技术：这些技术可以为士兵提供沉浸式的训练环境，模拟各种战斗场景和任务，帮助他们提高技能和决策能力。（2）语音识别和自然语言处理：通过语音识别和自然语言处理技术，士兵可以通过语音指令与武器系统、通信设备等进行交互，提高操作效率和减
乐鑫ESP-HMI方案人机交互，设备彩屏显示新体验，启明云端乐鑫代理商启明云端wireless-tag 乐鑫方案物联网乐鑫无线方案交互显示屏
在数字化浪潮的推动下，人机交互的方式正在经历一场深刻的变革。用户对于智能设备的需求不再局限于基本的功能操作，而是期望能够通过更加直观、自然的方式与设备进行交流。这种需求催生了一系列创新的芯片方案，它们通过集成高性能的计算核心和丰富的外设接口，为智能设备赋予了新的生命。这些芯片不仅能够处理复杂的数据和算法，还能够通过触摸、语音甚至视觉识别来响应用户的指令。在数字化时代，用户体验成为了产品设计的核心。
大学课程-人机交互期末复习海海不掉头发每天学习一点点人机交互
绪论什么是人机交互技术？⭐⭐是指关于设计、评价和实现供人们使用的交互式计算机系统，并围绕相关的主要现象进行研究的学。狭义的讲，人机交互技术主要是研究人与计算机之间的信息交换，它主要包括人到计算机和计算机到人的信息交换两部分。简单介绍人机交互技术的研究内容？⭐⭐人机交互的研究内容十分广泛，涵盖了建模、设计、评估等理论和方法，以及在Web、移动计算、虚拟现实等方面的应用研究，主要包括以下内容：人机交互
人机交互中的当斯定律人机与认知实验室人机交互
当斯定律（Dunbar'sLaw）通常是在社交网络和组织行为中讨论的一个理论，源于人类社会学和计算机科学领域。它由英国人类学家罗宾·邓巴（RobinDunbar）提出，最初与人类社会中社交关系的数量有关。在人机交互和计算机科学中，当斯定律也被用来理解用户和系统之间的互动复杂性。当斯定律的核心概念涉及：1.社交圈限制：当斯定律最初指的是人类大脑的社交圈的限制，即一个人能够维持稳定社会关系的最大数量。
基于mediapipe+opencv+autopy的人机交互系统python源码+文档说明+运行截图奋斗奋斗再奋斗的ajie 毕业设计人机交互
文章目录源码下载地址项目介绍项目功能界面预览项目备注源码下载地址源码下载地址点击这里下载代码项目介绍手势识别的人机交互系统基于mediapipe+opencv+autopy的人机交互系统功能通过手势实现对电脑的操作，如鼠标左右键，键盘的上下键（可对PPT进行翻页）运行gesture_control_Win.py即可所需环境python==3.8mediapipeopencv-pythonnumpy
工业互联网之数字孪生（Digital Twins in IIoT）丁肇之
“数字孪生”是基于工业互联网技术，对现实世界中各种“智能互联产品”的数字化模拟和展现；它是一种新型的数字化技术解决方案和“人机交互”界面，将有力地推动和深化“产品即服务”或服务型制造等商业模式的进一步发展。https://mp.weixin.qq.com/s?__biz=MjM5NzU5ODEzNg==&mid=2247484399&idx=1&sn=842f4f1e604e13f9a9b2918
Python简易IDE工作界面制作 urhero Python编程儿童编程 python 开发语言学习简易程序界面编程
、休闲一下，学习编程还是要学习一些界面编程，能够根据需要制作图形操作界面，这样我们开发的程序才能方便操作和使用，同时获得更友好的人机交互体验。下面是一个用PyQt5制作的简易界面，供大学参考。如下图所示：以下为程序代码，较为简陋，制作简单的IDE程序可在此基础上做更复杂的设计完善。importsysfromPyQt5.QtWidgetsimportQApplication,QMainWindow,
基于深度学习的人类行为模仿 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的人类行为模仿是指利用深度学习技术构建模型，使计算机系统能够学习、理解、并模仿人类的行为。通过模拟人类的动作、决策过程、情感反应等行为，相关技术在机器人、虚拟助手、人机交互等领域具有广泛的应用前景。1.背景与意义1.1人类行为的复杂性多模态数据：人类行为包含视觉、听觉、触觉、语言等多种感知信息，如何综合分析这些多模态数据以理解和模仿人类行为是一个挑战。情境依赖性：人类行为通常依赖于特定
基于STM32开发的智能语音控制系统 stm32发烧友 stm32 嵌入式硬件单片机
目录引言环境准备工作硬件准备软件安装与配置系统设计系统架构硬件连接代码实现系统初始化语音识别与指令处理控制设备OLED显示与状态提示Wi-Fi通信与远程监控应用场景家庭环境中的智能语音控制办公环境中的语音交互常见问题及解决方案常见问题解决方案结论1.引言随着智能家居的发展，语音控制成为了人机交互的重要方式。本文将介绍如何使用STM32微控制器开发一个智能语音控制系统，通过语音识别模块、OLED显示
全网爆火的第一本程序员的Agent入门书籍——《大模型应用开发动手做AI Agent》 AI大模型-搬运工人工智能大模型程序员 AI Agent AI大模型 LLM promp
AIAgent火爆到什么程度？OpenAI创始人奥特曼预测，未来各行各业，每一个人都可以拥有一个AIAgent；比尔·盖茨在2023年层预言：AIAgent将彻底改变人机交互方式，并颠覆整个软件行业；吴恩达教授在AIAscent2024演讲中高赞：AIAgent是一个令人兴奋的趋势，所有从事AI开发的人都应该关注。Agent是未来最重要的智能化工具。对于程序员来说，是时候将目光转向大模型的应用开发
论大模型在金融行业的应用场景何小朝金融人工智能
摘要：众多的金融机构及金融科技企业都在积极拥抱大模型的到来，除了已经涌现出若干金融垂域大模型以外，应用场景的探索也是重中之重。目前为止，相当多的金融大模型应用层出不穷，百花齐放，但仔细观察可以发现，大多还集中在改变或提升人机交互的方式方法层面，如智能客服、文档协助处理与生成、NL2SQL等全行业耳熟能详的领域。那么，大模型能否更加深入与广泛地与金融业务或科技需求融合以推进金融科技水平发生阶跃性的升
HCIA复习重启服务！！！网络
目录一.OSI/RM---开放式系统互联参考模型二.TCO/IP模型---TCP/IP协议簇一.OSI/RM---开放式系统互联参考模型---1979---ISO---国际标准化组织核心思想---分层应用层---提供各种应用程序，抽象语言转化为编码，人机交互的接口表示层---编码转化为二进制会话层---维持网络应用和网络服务器之间的会话连接传输层---实现端（应用）到端（应用）的传输端口号0-65
WebKit的语音交互新篇章：Web Speech API深度解析 2401_85742452 前端 webkit 交互
WebKit的语音交互新篇章：WebSpeechAPI深度解析随着技术的进步，人机交互的方式正在不断演变。WebSpeechAPI作为现代Web技术的一部分，为浏览器提供了语音识别和语音合成的能力。这项API在WebKit中的支持为开发者带来了创建具有语音交互功能的Web应用的可能性。本文将详细介绍WebKit对WebSpeechAPI的支持，并提供实际的代码示例。一、WebSpeechAPI简介
WPF的XAML事件 Mrhuangjimin C#wpf windows
开发工具与关键技术：WPFC#作者：黄济民撰写时间：2021年9月25日一、XAML事件事件（Event）1、Windows消息机制中重要概念之一，最常见的人机交互手段之一2、XAML帮助应用管理用户输入，执行不同的行为3、引入增强型事件处理系统-RoutedEvent（路由事件）4、事件常常被用于控制更改通知操作事件基础语法：XAML：C#：//事件privatevoidButton_Click
自然语言处理（NLP）技术的概念及优势刘小董学习心得自然语言处理
自然语言处理（NLP）是人工智能领域的一个重要分支，其目标是使计算机能够理解、处理和生成人类自然语言的形式和含义。NLP技术的优势包括：实现人机交互：NLP技术可以使计算机与人类之间实现自然的语言交互，使人们可以通过语音识别、语义理解等方式与计算机进行交流。大规模文本处理：NLP技术可以对大规模文本进行自动化处理和分析，提取关键信息和知识，从而实现文本分类、情感分析、信息检索等任务。自动化翻译：N
商品评论分析1 小白的数据
相较于客户行为（点击习惯、访问深度、需求关联等）或者客户属性（年龄段、性别、地区等），客户的正面询问与反馈尤为重要。正面询问的目前大概了解的是2个方向，一是客户来电语音转文本后进行的智能归档，二是人机交互（ASR或在线文本）；反馈的方面则是用户的建议、评价或问题等等。本文进行的是反馈方面的分析。一是正面询问的信息往往是企业内部才有，二是反馈分析也有重要意义。个人见解，对企业，反馈分析可以了解用户关
【探索AI】四：AI（人工智能）自然语言处理（NLP）美少女战士1@ 学习笔记 AI 人工智能自然语言处理
自然语言处理（NLP）的概念自然语言处理（NaturalLanguageProcessing，NLP）是一门交叉学科，涉及人工智能、计算机科学和语言学等领域，旨在让计算机能够理解、分析、生成和处理人类语言。NLP技术致力于使计算机能够与人类以自然语言进行交流，从而实现更加智能、便捷的人机交互。在自然语言处理中，常见的任务包括但不限于：文本分类：将文本按照预定义的类别进行分类，如垃圾邮件分类、新闻分
一些大佬的可解释人工智能的优质资料整理及总结（更新中） Trouville01 人工智能
针对Transformer系列模型的模型可解释性分析：1.关于Transformer可解释性的介绍：Transformer模型的可解释性内容总结：2.关于VIT模型的可解释性研究介绍：VisionTransformer的可解释性内容总结：3.关于Human-in-the-loop的可解释性算法介绍：深度学习的可解释性XAI-6-人机交互类解释（Human-in-the-loopExplanatio
软考笔记--信息系统开发方法（下）赤露水笔记
信息系统是一个极其复杂的人机交互系统，它不仅包含计算机技术，通信技术和网络规划以及其他的工程技术，而且，它还是一个复杂的管理系统，需要管理理论和方法的支持，因此，与其他工程项目相比，信息系统工程项目的开发和管理显得更加复杂，面临的风险也更大。上篇已经介绍完结构化开发方法以及面向对象开发方法，下面接着介绍面向服务开发方法和原型化开发方法。一.面向服务方法OO的应用构建在类和对象之上，将相关对象按照业
听课笔记02 爱小黄笔记
人机交互的小故事图形化界面打开图形麻烦操作系统没有界面os发明操作界面的人是谁呢做os的大公司不快进图形化界面的样子这段内容简单了一点说一下操作系统的历史图形界面的发展屋外有车融雪为什么要用图形化界面cmd就是操作系统看不起不会使用电脑的普通人，这是不对的黑马创建大学非常厉害winr输入cmd不小心打开知乎，认真上课课外的扩展，桌面是一个文件夹。desktop取之于互联网，用之于网。打开cmd的方
网易云音乐设计协同演进之路前端aigc
本文作者：刘甲万字长文带你了解云音乐设计协同的演进之路，干货满满~序言前端和设计师一直以来都在致力于为用户提供出色的人机交互体验。在这个过程中，如何为双方提供高效的协同产品，降低设计师与前端的沟通成本，以及提升双方的工作效率，都是非常有价值的探索点。笔者来自网易云音乐-公共技术部，目前是云音乐设计中台的技术负责人。从2021年7月入职网易到现在，一直在「前端与设计协同」领域里探索和实践，期间沉淀了
云计算网络HCLA Andrewav 笔记
OSI:开放术系统互联（参考模型）控制层:应用层表示层会话层数据层面:传输层网络层数据链路层物理层应用层:接收用户数据，人机交互的接口，面向应用程序。表示层:将逻辑语言转化为机器语言（二进制）翻译加密.会话层:针对传输的每一种数据建立一条虚链接.传输层:作用是区分流量和定义数据传输方式。端口号:portID数值范围1到165535静态端口:流量与静态端口一一绑定,范围为1到1023。动态端口:未与
花费200元，我用全志H616和雪糕棒手搓了一台可UI交互的视觉循迹小车 DOT小文哥全志H616 智能硬件 ui 交互循迹小车全志 H616
常见的视觉循迹小车都具备有路径识别、轨迹跟踪、转向避障、自主决策等基本功能，如果不采用红外避障的方案，那么想要完全满足以上这些功能，摄像头、电机、传感器这类关键部件缺一不可，由此一来小车成本也就难以控制了。但如果，有这样一款视觉循迹小车，它可以完全自己手搓，并用成本极低的雪糕棒来搭建车体架构，不仅保留了传统循迹小车具备的所有功能，还额外适配上一块小屏幕并配上UI界面用于升级人机交互方式。更重要的是
人机交互新研究：MIT开发了结合脑电和眼电的新式眼镜，与机器狗交互 xwz小王子 LLM机器人强化学习及自动驾驶人机交互智能操作具身智能
还记得之前的AI读心术吗？最近，「心想事成」的能力再次进化，——人类可以通过自己的想法直接控制机器人了！来自麻省理工的研究人员发表了Ddog项目，通过自己开发的脑机接口（BCI）设备，控制波士顿动力的机器狗Spot。狗狗可以按照人类的想法，移动到特定区域、帮人拿东西、或者拍照等。而且，相比于之前需要使用布满了传感器的头套才能「读心」，本次的脑机接口设备以一幅无线眼镜（AttentivU）的形式出现
人机工程学和人机交互理论：智能座舱设计 UI设计前端开发一线员工人机交互
hello家人们...本人熟悉PS、Xd、Ai、Sketch、Figma、墨刀、即时设计、mastergo、Pixso等行业设计软件以及前端开发等技能，拥有10年+的UI经验，我们可以通过关注评论私信交流以帮助到您解决UI工作中的烦恼！谢谢人机工程学与人机交互理论：智能座舱设计的基石随着科技的飞速发展，汽车已经从单纯的交通工具转变为集成了大量先进技术的移动智能空间。智能座舱作为汽车智能化的重要体现
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

人机交互30年

你可能感兴趣的:(人机交互)