improve100

几个常见的语音交互平台的简介和比较

1.概述

最近做了两个与语音识别相关的项目，两个项目的主要任务虽然都是语音识别，或者更确切的说是关键字识别，但开发的平台不同，一个是windows下的，另一个是android平台的，于是也就选用了不同的语音识别平台，前者选的是微软的Speech API开发的，后者则选用的是CMU的pocketsphinx，本文主要将一些常见的语音交互平台进行简单的介绍和对比。

这里所说的语音交互包含语音识别（Speech Recognition，SR，也称为自动语音识别，Automatic Speech Recognition，ASR）和语音合成（Speech Synthesis，SS，也称为Text-To-Speech，简记为TTS）两种技术，另外还会提到声纹识别（Voice Print Recognition，简记为VPR）技术。

语音识别技术是将计算机接收、识别和理解语音信号转变为相应的文本文件或者命令的技术。它是一门涉及到语音语言学、信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能的交叉学科。在语音识别系统的帮助下，即使用户不懂电脑或者无法使用电脑，都可以通过语音识别系统对电脑进行操作。

语音合成，又称文语转换（Text to Speech）技术，能将任意文字信息实时转化为标准流畅的语音朗读出来，相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术，是中文信息处理领域的一项前沿技术，解决的主要问题就是如何将文字信息转化为可听的声音信息，也即让机器像人一样开口说话。

下面按平台是否开源来介绍几种常见的语音交互平台，关于语音识别和语音合成技术的相关原理请参见我接下来的其他文章。

2.商业化的语音交互平台

1)微软Speech API

微软的Speech API（简称为SAPI）是微软推出的包含语音识别（SR）和语音合成（SS）引擎的应用编程接口（API），在Windows下应用广泛。目前，微软已发布了多个SAPI版本（最新的是SAPI 5.4版），这些版本要么作为于Speech SDK开发包发布，要么直接被包含在windows 操作系统中发布。SAPI支持多种语言的识别和朗读，包括英文、中文、日文等。SAPI的版本分为两个家族，1-4为一个家族，这四个版本彼此相似，只是稍微添加了一些新的功能；第二个家族是SAPI5，这个系列的版本是全新的，与前四个版本截然不同。

最早的SAPI 1.0于1995年发布，支持Windows 95和Windows NT 3.51。这个版本的SAPI包含比较初级的直接语音识别和直接语音合成的API，应用程序可以直接控制识别或合成引擎，并简化更高层次的语音命令和语音通话的API。SAPI3.0于97年发布，它添加了听写语音识别（非连续语音识别）和一些应用程序实例。98年微软发布了SAPI4.0，这个版本不仅包含了核心的COM API，用C++类封装，使得用C++来编程更容易，而且还有ActiveX控件，这个控件可以再VB中拖放。这个版本的SS引擎随Windows2000一起发布，而SR引擎和SS引擎又一起以SDK的形式发布。

SAPI5.0 于2000年发布，新的版本将严格将应用与引擎分离的理念体现得更为充分，所有的调用都是通过动态调用sapi.dll来实现的，这样做的目的是使得API更为引擎独立化，防止应用依赖于某个具有特定特征的引擎，这种改变也意图通过将一些配置和初始化的代码放到运行时来使得应用程序的开发更为容易。

2).IBM viaVoice

IBM是较早开始语音识别方面的研究的机构之一，早在20世纪50年代末期，IBM就开始了语音识别的研究，计算机被设计用来检测特定的语言模式并得出声音和它对应的文字之间的统计相关性。在1964年的世界博览会上，IBM向世人展示了数字语音识别的“shoe box recognizer”。 1984年，IBM发布的语音识别系统在5000个词汇量级上达到了95%的识别率。

1992年，IBM引入了它的第一个听写系统，称为“IBM Speech Server Series (ISSS)”。1996年发布了新版的听写系统，成为“VoiceType3.0”，这是viaVoice的原型，这个版本的语音识别系统不需要训练，可以实现孤立单词的听写和连续命令的识别。VoiceType3.0支持Windows95系统，并被集成到了OS/2 WARP系统之中。与此同时，IBM还发布了世界上首个连续听写系统“MedSpeak Radiology”。最后，IBM及时的在假日购物季节发布了大众化的实用的“VoiceType Simply Speaking”系统，它是世界上首个消费版的听写产品(the world’s first consumer dictation product).

1999年，IBM发布了VoiceType的一个免费版。2003年，IBM授权ScanSoft公司拥有基于ViaVoice的桌面产品的全球独家经销权，而ScanSoft公司拥有颇具竞争力的产品“Dragon NaturallySpeaking”。两年后，ScanSoft与Nuance合并，并宣布公司正式更名为Nuance Communications，Inc。现在很难找到IBM viaVoice SDK的下载地址了，它已淡出人们的视线，取而代之的是Nuance。

3）Nuance

Nuance通讯是一家跨国计算机软件技术公司，总部设在美国马萨诸塞州伯灵顿，主要提供语音和图像方面的解决方案和应用。目前的业务集中在服务器和嵌入式语音识别，电话转向系统，自动电话目录服务，医疗转录软件与系统，光学字符识别软件，和台式机的成像软件等。

Nuance语音技术除了语音识别技术外，还包扩语音合成、声纹识别等技术。世界语音技术市场，有超过80%的语音识别是采用Nuance识别引擎技术，其名下有超过1000个专利技术，公司研发的语音产品可以支持超过50种语言，在全球拥有超过20亿用户。据传，苹果的iPhone 4S的Siri语音识别中应用了Nuance的语音识别服务。另外，据Nuance公司宣布的重磅消息，其汽车级龙驱动器Dragon Drive将在新奥迪A3上提供一个免提通讯接口，可以实现信息的听说获取和传递。

Nuance Voice Platform(NVP)是Nuance公司推出的语音互联网平台。Nuance公司的NVP平台由三个功能块组成：Nuance Conversation Server 对话服务器，Nuance Application Environment （NAE）应用环境及Nuance Management Station管理站。Nuance Conversation Server对话服务器包括了与Nuance语音识别模块集成在一起的VoiceXML解释器，文语转换器（TTS）以及声纹鉴别软件。NAE应用环境包括绘图式的开发工具，使得语音应用的设计变得和应用框架的设计一样便利。Nuance Management Station管理站提供了非常强大的系统管理和分析能力，它们是为了满足语音服务的独特需要而设计的。

4）科大讯飞——讯飞语音

提到科大讯飞，大家都不陌生，其全称是“安徽科大讯飞信息科技股份有限公司”，它的前身是安徽中科大讯飞信息科技有限公司，成立于99 年12月，07年变更为安徽科大讯飞信息科技股份有限公司，现在是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的企业，在中国语音技术领域可谓独占鳌头，在世界范围内也具有相当的影响力。

科大讯飞作为中国最大的智能语音技术提供商，在智能语音技术领域有着长期的研究积累，并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。03年，科大讯飞获迄今中国语音产业唯一的“国家科技进步奖（二等）”，05年获中国信息产业自主创新最高荣誉 “信息产业重大技术发明奖”。06年至11年，连续六届英文语音合成国际大赛（Blizzard Challenge）荣获第一名。08年获国际说话人识别评测大赛（美国国家标准技术研究院—NIST 2008）桂冠，09年获得国际语种识别评测大赛（NIST 2009）高难度混淆方言测试指标冠军、通用测试指标亚军。

科大讯飞提供语音识别、语音合成、声纹识别等全方位的语音交互平台。拥有自主知识产权的智能语音技术，科大讯飞已推出从大型电信级应用到小型嵌入式应用，从电信、金融等行业到企业和家庭用户，从PC到手机到MP3/MP4/PMP和玩具，能够满足不同应用环境的多种产品，科大讯飞占有中文语音技术市场60%以上市场份额，语音合成产品市场份额达到70%以上。

5）其他

其他的影响力较大商用语音交互平台有谷歌的语音搜索（Google Voice Search），百度和搜狗的语音输入法等等，这些平台相对于以上的4个语音交互平台，应用范围相对较为局限，影响力也没有那么强，这里就不详细介绍了。

3.开源的语音交互平台

1）CMU-Sphinx

CMU-Sphinx也简称为Sphinx（狮身人面像），是卡内基 - 梅隆大学（ Carnegie Mellon University，CMU）开发的一款开源的语音识别系统，它包括一系列的语音识别器和声学模型训练工具。

Sphinx有多个版本，其中Sphinx1~3是C语言版本的，而Sphinx4是Java版的，另外还有针对嵌入式设备的精简优化版PocketSphinx。Sphinx-I 由李开复（Kai-Fu Lee）于1987年左右开发，使用了固定的HMM模型（含3个大小为256的codebook），它被号称为第一个高性能的连续语音识别系统（在Resource Management数据库上准确率达到了90%+）。Sphinx-II由Xuedong Huang于1992年左右开发，使用了半连续的HMM模型，其HMM模型是一个包含了5个状态的拓扑结构，并使用了N-gram的语言模型，使用了Fast lextree作为实时的解码器，在WSJ数据集上的识别率也达到了90%+。

Sphinx-III主要由Eric Thayer 和Mosur Ravishankar于1996年左右开发，使用了完全连续的（也支持半连续的）HMM模型，具有灵活的feature vector和灵活的HMM拓扑结构，包含可选的两种解码器：较慢的Flat search和较快的Lextree search。该版本在BN（98的测评数据集）上的WER（word error ratio）为19%。Sphinx-III的最初版还有很多limitations，诸如只支持三音素文本、只支持Ngram模型（不支持CFG/FSA/SCFG）、对所有的sound unit其HMM拓扑结构都是相同的、声学模型也是uniform的。Sphinx-III的最新版是09年初发布的0.8版，在这些方面有很多的改进。

最新的Sphinx语音识别系统包含如下软件包：
 Pocketsphinx — recognizer library written in C.
 Sphinxbase — support library required by Pocketsphinx
 Sphinx4 — adjustable, modifiable recognizer written in Java
 CMUclmtk — language model tools
 Sphinxtrain — acoustic model training tools
这些软件包的可执行文件和源代码在sourceforge上都可以免费下载得到。

2）HTK

HTK是Hidden Markov Model Toolkit（隐马尔科夫模型工具包）的简称，HTK主要用于语音识别研究，现在已经被用于很多其他方面的研究，包括语音合成、字符识别和DNA测序等。

HTK最初是由剑桥大学工程学院（Cambridge University Engineering Department ，CUED）的机器智能实验室（前语音视觉及机器人组）于1989年开发的，它被用来构建CUED的大词汇量的语音识别系统。93年Entropic Research Laboratory Inc.获得了出售HTK的权利，并在95年全部转让给了刚成立的Entropic Cambridge Research Laboratory Ltd，Entropic一直销售着HTK，直到99年微软收购了Entropic，微软重新将HTK的版权授予CUED，并给CUED提供支持，这样CUED重新发布了HTK，并在网络上提供开发支持。

HTK的最新版本是09年发布的3.4.1版，关于HTK的实现原理和各个工具的使用方法可以参看HTK的文档HTKBook。

3）Julius

Julius是一个高性能、双通道的大词汇量连续语音识别（large vocabulary continues speech recognition，LVCSR）的开源项目，适合于广大的研究人员和开发人员。它使用3-gram及上下文相关的HMM，在当前的PC机上能够实现实时的语音识别，单词量达到60k个。

Julius整合了主要的搜索算法，高度的模块化使得它的结构模型更加独立，它同时支持多种HMM模型（如shared-state triphones 和 tied-mixture models等），支持多种麦克风通道，支持多种模型和结构的组合。它采用标准的格式，这使得和其他工具箱交叉使用变得更容易。它主要支持的平台包括Linux和其他类Unix系统，也适用于Windows。它是开源的，并使用BSD许可协议。

自97年后，Julius作为日本LVCSR研究的一个自由软件工具包的一部分而延续下来，后在2000年转由日本连续语音识别联盟(CSRC)经营。从3.4版起，引入了被称为“Julian”的基于语法的识别解析器，Julian是一个改自Julius的以手工设计的DFA作为语言模型的版本，它可以用来构建小词汇量的命令识别系统或语音对话系统。

4）RWTH ASR

该工具箱包含最新的自动语音识别技术的算法实现，它由 RWTH Aachen 大学的Human Language Technology and Pattern Recognition Group 开发。

RWTH ASR工具箱包括声学模型的构建、解析器等重要部分，还包括说话人自适应组件、说话人自适应训练组件、非监督训练组件、个性化训练和单词词根处理组件等，它支持Linux和Mac OS等操作系统，其项目网站上有比较全面的文档和实例，还提供了现成的用于研究目的的模型等。

该工具箱遵从一种从QPL发展而来的开源协议，只允许用于非商业用途。

5）其他

上面提到的开源工具箱主要都是用于语音识别的，其他的开源语音识别项目还有Kaldi 、simon 、iATROS-speech 、SHoUT 、 Zanzibar OpenIVR 等。

常见的语音合成的开源工具箱有MARY、SpeakRight、Festival 、FreeTTS 、Festvox 、eSpeak 、Flite 等。

常见的声纹识别的开源工具箱有Alize、openVP等。

4.小结

本文介绍了几种常见的语音交互平台，主要是语音识别、语音合成的软件或工具包，还顺便提到了声纹识别的内容，下面做一个简单的总结：

以上总结的表格希望对读者有用！

参考文献

[1]语音识别-维基百科：http://zh.wikipedia.org/wiki/语音识别
[2]语音合成-百度百科：http://baike.baidu.com/view/549184.htm
[3] Microsoft Speech API：http://en.wikipedia.org/wiki/Speech_Application_Programming_Interface#SAPI_1
[4] MSDN-SAPI：http://msdn.microsoft.com/zh-cn/library/ms723627.aspx
[5] 微软语音技术 Windows 语音编程初步：http://blog.csdn.net/yincheng01/article/details/3511525
[6]IBM Human Language Technologies History：http://www.research.ibm.com/hlt/html/history.html
[7] Nuance: http://en.wikipedia.org/wiki/Nuance_Communications
[8] 科大讯飞：http://baike.baidu.com/view/362434.htm
[9] CMU-Sphinx: http://en.wikipedia.org/wiki/CMU_Sphinx
[10] CMU Sphinx homepage：http://cmusphinx.sourceforge.net/wiki/
[11] HTK Toolkit：http://htk.eng.cam.ac.uk/
[12] Julius：http://en.wikipedia.org/wiki/Julius_(software)
[13] RWTH ASR：http://en.wikipedia.org/wiki/RWTH_ASR
[14] List of speech recognition software: http://en.wikipedia.org/wiki/List_of_speech_recognition_software
[15] Speech recognition: http://en.wikipedia.org/wiki/Speech_recognition
[16] Speech synthesis: http://en.wikipedia.org/wiki/Speech_synthesis
[17] Speaker recognition: http://en.wikipedia.org/wiki/Speaker_recognition

转载 http://ibillxia.github.io/blog/2012/11/24/several-plantforms-on-audio-and-speech-signal-processing/

2022-11-27 生活周报雪利酒9566
现在是周天下午4点半，坐在家中感觉很心安的开始准备写一下这周的事情。快12月份了，天气有些冷，家里开着暖气，很舒服。先整理周一咨询完的要点和作业：1）多关注事情背后的原因，拒绝进一步发展两个工作机会的原因是因为我看重工作的多元化（可以更宏观的锻炼全局意识，多元化的吸入行业知识）。2）我一直希望做职业规划，但是由于完美主义并没有开始行动，需要先做起来再说，不能被开始卡着不行动，必须要开始行动才能迭代
莆田鞋代理怎么加入？教你如何成为一名合格莆田鞋代理美表之家
莆田鞋代理怎么加入？教你如何成为一名合格莆田鞋代理莆田鞋是莆田市特有的一种产业，因其复刻、仿制品质高，造型精美，而被广大消费者所喜爱。如何成为一名合格的莆田鞋代理，开始赚取你人生的第一桶金呢？下面来为大家详细介绍。微信:a40273(下单赠送精美礼品)一、了解莆田鞋行业知识需要对莆田鞋有足够的了解。可以通过网络、书籍等方式研究莆田鞋的类型、款式、工艺、价格、市场需求等方面的信息，尽量掌握更多行业知
供应链金融翻译,英译中如何翻译比较好英信翻译公司金融人工智能大数据
在供应链金融领域，英文翻译是一项至关重要的任务。由于供应链金融涉及多个行业、多方参与者和错综复杂的金融操作，翻译人员需要具备深厚的专业知识和精湛的翻译技巧。那么，供应链金融英文怎么翻译成中文，北京哪个翻译公司比较专业呢？翻译的首要之务，便是深入理解原文的精髓。对于供应链金融领域的专业术语、行业知识以及金融操作的内涵，翻译者需有透彻的领悟。唯有如此，才能确保译文的准确无误。其次，选择合适的词汇成为关
说实话，你会从事你不感兴趣的行业吗？狗杞
我入职之前，自己可选的公司有两家，两个都是做抖音短视频，而且都是单休。要命，找个双休的有那么难吗？经过权衡之后，我选择离我朋友家近那家，上班只要挤公交就好了，两三个站；住行这一块，还是省了比较多的。通勤时间比另外一个缩减了一半，房子也不用自己另外租。上了两三天班之后，发现自己并不喜欢这一行业，连行业知识都不想去了解。上班到了下午就是煎熬时刻，中午一个半小时，灯是不关的，老板们还喜欢在办公室刷抖音，
投资银行在网络安全生态中的作用岛屿旅人网络安全行业分析 web安全大数据网络人工智能金融安全架构安全
文章目录一、投资银行的含义（一）并购·买方。（二）并购·卖方。（三）IPO辅助。（四）投资银行业务的另一方面是帮助这些交易融资。二、从投资银行角度看网络安全产业（一）行业的短期前景三、复杂的网络安全并购（一）行业知识对投资银行业务很重要（二）在网络安全领域，技术是将赢家与其他人区分开来的关键因素。（三）涉及战略买家的交易要求银行能够讲述一个并非基于数字的故事。四、网络安全投资银行类型（一）以网络安
读财报 | 小家电浙江美大小妞妞都放假
做事要专业：业余的人会有几次成功的投资，但是不能系统地保证稳定的回报。结论：利润的绝对值不高，但是财务指标都超级优秀的。是一家被低估的公司~一生活常识&行业知识核心业务：公司主要从事厨电细分行业－－集成灶产品的设计研发、生产和经营，是集成灶行业的首创者和领军企业。该产品集吸油烟、灶具、消毒柜、蒸箱、烤箱等多种功能于一体，油烟吸除率达99.6%以上。产品拥有专利151项，其中国际专利9项，发明专利2
2019-04-28 朱非凡
上海361期《六项精进》反省二组【日精进打卡第369天】【知～学习】《六项精进》3遍共908遍《大学》1遍共315遍••••••【经典名句分享】自律给我自由【行～实践】一、修身：阅读走路健身英文口语学习二、齐家：三、建功：产品发布，邮件回复，询盘处理，采购，出运，ppt制作，汽配行业知识学习｛积善｝：发愿从2018年3月19日起1年内365善事。今日1善，累计175善。【省～觉悟】【感谢】感谢一直
行业知识图谱是什么悦数图数据库知识图谱人工智能
行业知识图谱是一种将行业知识从业务场景抽象到计算机可读的知识结构。它是指在行业内业务领域中，对各种业务实体、概念、属性以及关系的一种结构化描述。是一种通过知识表示、推理和查询的手段，将行业知识以图形化方式表示出来。它可以被用来建立企业的知识库，解决企业中存在的信息不全、信息不一致等问题，使企业能够快速掌握新市场、新产品的相关信息，提高市场反应速度和决策能力。实现知识的互联互通在企业中，知识是有边界
读财报 | 人工景点宋城演艺小妞妞都放假
做事要专业：业余的人会有几次成功的投资，但是不能系统地保证稳定的回报。结论：没有什么同类公司可以做对比。财务指标都很优秀，但是最近几年股价波动不大，此时股价处于高位。持续跟踪~一生活常识&行业知识核心业务：行业排名：结合生活常识对这家公司点评：老板人品（网络搜索）：对企业分红的分析：二财务报表附上“财报说”的报表对CBS的五个维度进行分析：（找到行业中PE75的企业进行分析跟踪投资）一现金流量=公
多学知识认知搜索期刊
为什么项目经理每天在不断学习各种知识，需要了解领导期望、客户期望、行业知识，企业文化组织等等。既要站在高级管理者角度，又有去盯着每一行系统代码细节，还需要了解系统的未来，知道系统的过去。我们每做一个项目对于每个参与的人的性格了解的透透的，知道和谁沟通有答案，知道和谁没答案。但这些都不是因为我们有神机妙算，而是在和他们沟通交往处处碰壁。好的项目经理本身是孤独的群体，需要不断拓展知识，需要不断了解周围
记性不好了，又没有时间。将如何通过考试海东
我是一位爱学习的人，但是现在精力和记忆力、时间都不够。我在想办法，学习掌握相关知识。你是怎么做的。欢迎与我交流。我也下定决心，虽然考试结束。但是对机电行业知识的学习，没有停。一定要努力出彩！！
用爬虫自建行业知识库铅笔楼笔记 python
一几年前用Python写过一个程序，自动抓取各市文化局网站相关栏目文章，然后把抓到的文章，写成离线网页，发到指定邮箱。当时针对每个网页写一个爬虫，对每一个网页都进行分析。比如，标题是什么，发布时间在哪，正文内容如何保存等等。因为工作量慢慢变大，后来就把它放到代码库里吃灰。现在，每天要采集整理各地文旅信息，去年年底又重新捡起之前的代码。重构了一遍代码，大体实现自动抓取全省16个市局、文化报、旅游报、
知识库是什么产品经理必须知道的行业知识 2301_81909718 笔记
现如今，我们生活在一个知识爆炸的时代。对于产品经理来说，信息不再是稀缺资源，如何高效地管理和利用这些信息，是他们面临的重要问题。这时，知识库便悄然成为产品经理必备的工具。所以，什么是知识库呢？怎样去使用它呢？产品经理们需要知道些什么呢？一篇文章，让你明了这个行业知识！（一）知识库是什么？简单来说，知识库就是一个集中存储、管理和分享专业知识的电子库。它可以包含文档、教程、常见问题解答、案例研究，甚至
我的故事谭美美
昵称：谭美美爱好/技能：阅读，写作和拍分享视频职业/标签：快消品采购，育儿博主最有成就3件事：1.2018年入职世界500强第一，2022即将入职国内行业龙头企业。2.在家人鼓励下已坚持日更60天不间断无压力感，并养成阅读的习惯。3.结婚生子，有过家庭矛盾和争吵，但最终找到合适的家庭运行模式。只管奋斗，家是温暖的港湾。我能提供什么：1.快消品行业知识2.科学育儿经验2022年的写作目标：获得创作者
2023年社群淘客大佬有哪些高省APP
社群淘客是指通过在社交媒体平台上建立粉丝和用户群体，利用社群运营的方式来进行商品推广和销售的淘客。社群淘客大佬是在这一领域做得非常出色并有影响力的人物。以下是社群淘客大佬常见的几种类型：1.内容创作者型：这类社群淘客大佬通过自己的独特风格和深入的行业知识，在社交媒体上发布有趣、实用和吸引人的内容。他们会定期分享商品购买心得、使用技巧、评测和推荐等，激发用户的兴趣与购买欲望。他们通常拥有较高的粉丝数
No.265 个人成长｜如何有效地学习-下蒙娜丽莎2021
当我们清楚地知道自己为什么要学习，并且以终为始确定了要学习的内容后，如何在聚焦的领域有效的学习呢？有效地学习分为了解知识、运用知识、搭建体系、传授他人四个阶段。第一阶段：了解知识在聚焦的领域学习专业知识，比如岗位相关的人事、行政、财务、市场等；行业知识，新媒体、医药、健康等；管理知识，项目、领导力等知识；通用类技能，沟通、逻辑思维、谈判等知识。这个阶段主要学习的是基本概念、基础的理论、基本原理等，
创业连载之我是如何实现财富自由（三）岛上书店已关门
我们工作是为了什么？又到了周六，前期，大家都很难熬。销售要熟悉行业知识，然后去搜索引擎里面找客户。实操起来很枯燥，那时候gov.还是让用GOOGLE的。作为外贸从业人员，这个搜索引擎是毫无争议的成为我们必需品。我列了几种搜索方法，比如：关键词搜索，邮件后缀搜索，公司名字搜索，电话+人名搜索,行业展会搜索，各种黄页搜索，google翻译他国语言再用关键词去搜索等。总而言之，万物则可搜索，只要客户曾经
Java开发实践01-0122 yyy001.. Java开发实践 java 开发语言 ide
一、前言自我介绍：我来自山西省运城市，大二，学习的专业是软件工程。对于个人的整个学习生涯是希望可以终身学习，在自己的学习道路上，我只坚信自己一步一脚印的努力，千锤百炼，百炼成金，希望可以在这个平台上和其他程序员们共同努力，相互学习。二、今日内容1、分享行业知识2、搭建环境JAVA_HOME=bin所在上一层目录PATH=%JAVA_HOME%\bin3、编写Hello程序代码见Hello4、安装I
书生·浦语大模型实战营第四节课笔记及作业 zpc1219 笔记
XTuner大模型单卡低成本微调实战1Finetune简介大语言模型LLM是在海量的文本内容基础上，以无监督或半监督方式进行训练的。海量的文本内容赋予了大模型各种各样的行业知识。但是如果直接把大模型的知识用于生产实践，会发现回答不大满意。微调的目的就是让LLM在具体的场景或领域中能够得到更好的回答。1.1指令跟随微调如下图所示，海量的预训练数据训练出来的模型是Base模型。在没有进行指令微调之前，
十年规划——坚持、努力、不放弃肃南277盛玉霞
我是一名年轻的幼儿教师，2012年回到家乡参加工作。图片发自App图片发自App我的十年规划图是我构思了很久，结合自己实际情况而完成的。图中一只可爱的小熊拿着许多气球，抬头仰望天空，心中无限遐想。图片发自App我把气球用三种颜色分开，也代表我将自己的十年规划分为三个阶段：第一阶段是刚工作的两年，这两年的我是初为人师的羞涩、担心和无措，还有刚步入教师行业知识的缺乏。第二阶段，也是我现在正经历的阶段，
创业的时，需要面对的旅行中的你
勇气+运气+特殊环境+特殊人脉现在的人要怎么赚到钱？商业环境+商业知识+行业知识+商业人脉+互联网创业的三个准备：1.商业人脉的建立这样你的问题才有人可以问，工作中有人提拔你，平时有人介绍资源给你。无法打造你的人脉网络，就不适合出来创业。2.环境的了解首先要找到商机，商机=商业知识+商业环境+人脉+指导。你要创造的产品要符合现在的消费环境、能力和意识，应该从过去、现在和未来的分析中找趋势。3.商业
大模型开启应用时代数钉科技一锤定音资讯全球科技
叮叮叮叮！数钉智造大模型，“定音”强势发布！随着科技的飞速发展，大模型技术已逐渐成为推动产业变革的核心力量。在这一浪潮中，数钉科技凭借深厚的技术积累和敏锐的市场洞察力，成功利用大模型技术搭建起智能制造数字化应用平台，为制造业从业者和智能制造探索者们提供了技能提升和优化的崭新天地。数钉科技团队依据行业知识地图，在基础大模型平台之上，构建了专项行业模型，名为定音智造模型，并以此驱动应用平台的搭建。这一
丽兹行面试经历逍遥猫
这段经历是9月中旬的时候了，离现在已有半月。我来回忆一下，记录一下。丽兹行的HR从Boss直聘上找到了我的简历，联系我的当天下午就给我打了电话，了解我的情况，还有介绍丽兹行。我当时唯一的疑惑也是最大的怀疑就是，为何一个豪宅销售的工作，找小白去做？我以为他们是用这个岗位的噱头来坑人的。因为在我看来，豪宅的销售是要阅历自身，且行业知识深厚的，不然，你去跟大富翁打交道沟通，跟别人无法平等对话，也拿不下来
微商成交必备的销售沟通技巧千杯敬自由2018
微商成交必备的销售沟通技巧沟通成交有一个前提，就是你要先了解产品，了解行业知识。这些知识要非常熟练，甚至专业，因为我们要对我们的客户负责任，在顾客问你问题时你能对答如流，那你就算具备了应有的知识了。如果还不能解答每一个问题，抓紧去充电学习，这个很重要，不能偷懒！具备了这个前提，接下来的沟通交流就有基础了。注意，沟通交流，也是需要一定的流程和步骤的，一般情况下是：询问——诊断——产品介绍——价格促成
笔记：解决问题的底层逻辑芦苇阅读
很多时候做事情靠经验和直觉，虽然一些事情能做成，但总体感觉在做个案，无法积累迭代。而这套方法论，就是解决问题的底层逻辑。1.明确问题才有可能解决问题。明确问题需要熟悉专业知识、行业知识，考虑到岗位的点、公司的面、行业的体，问题才能被定义清楚。2.解决问题的过程像PDCA。有了P解决方案计划，在做中试错D，检查执行的效果C，根据检查结果进一步处理A，PDCA循环。3.展示结果。解决问题的底层逻辑对了
非技术出身的产品经理如何控制产品质量？产品讲学堂
软件工程是一门用工程化方法构建和维护软件，并有效、实用地解决软件行业相关问题的软件学科。它涉及需求分析、程序设计、开发语言、数据库、软件开发工具、测试及维护等方面。产品经理不仅需要有丰富的行业知识，同时也需要有深厚的软件工程思想。具备软件工程思想的产品经理才能更好地将行业知识与软件知识结合起来，才能设计出更优秀的软件产品。很多产品经理只关注产品的生产前端（产品定位、可行性研究、需求分析、产品设计）
DataFunSummit：2023年知识图谱在线峰会-核心PPT资料下载百家峰会人工智能知识图谱 AIGC 知识图谱人工智能 AIGC
一、峰会简介AIGC，ChatGPT以及发布的GPT-4相信已经给大家带来足够的冲击，那么对于知识图谱的应用产生哪些变化和变革？知识图谱在其中如何发挥作用呢？通过LLM是否有可能辅助创建通用大规模知识图谱？AIGC时代下行业知识图谱的新机遇有哪些？本次峰会共包含了：统一知识表示与复杂推理、大规模知识图谱构建与更新、海量知识存储与计算、知识问答与推荐、知识图谱与AIGC、最佳行业知识图谱实践等6大论
读财报 | 特钢大冶特钢小妞妞都放假
一生活常识&行业知识核心业务：公司主导产品轴承钢、齿轮钢、工模具钢、系泊链钢、高压锅炉管坯、耐热合金。公司所属行业为特种钢铁行业，主要业务范围是钢铁冶炼、钢材轧制、金属改制、压延加工、钢铁材料检测。报告期内，公司的主营业务未发生变化。公司主要生产齿轮钢、轴承钢、弹簧钢、工模具钢、高温合金钢、高速工具钢等特殊钢材，拥有1800多种品种、规格，产品被广泛应用于航空、航天、石油开采、工程机械、汽车、铁路
宏电股份荣膺国家知识产权优势企业称号，科技创新与研发实力获国家级认可宏电物联网物联网信息与通信
近日，国家知识产权局公布了2023年度国家知识产权优势企业的评审结果，宏电股份凭借强大的技术实力和创新能力，荣获“国家知识产权优势企业”荣誉称号。这一荣誉是对宏电股份在技术创新和知识产权创造、运用、保护及管理方面的高度认可，也是宏电股份持续推动产业升级和创新发展的重要里程碑。宏电股份建立了完善的知识产权管理体系，注重行业知识产权人才的引进与培养，积极开展知识产权的培训，通过在知识产权创造、运用、保
D2 片仔癀背景调查 Vicky_d1e4
我们买车买手机买衣服等等都会货比三家，调查一下品牌、试摸手感，但我们投资一家公司，很多人可能什么也不看，仅凭各种消息、或者感觉就直接买入，真是细思极恐！现在我们知道投资前要做很多功课，除了课程里我们要重点学习的看懂公司财报，我们还有两条腿，通过自己的生活常识和行业知识来验证财报。如果说财报占比60%的话，那生活常识和行业知识就各占比20%。巴菲特说：不要投资自己不懂的东西！以“片仔癀”（60043
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

几个常见的语音交互平台的简介和比较

1.概述

2.商业化的语音交互平台

1)微软Speech API

2).IBM viaVoice

3）Nuance

4）科大讯飞——讯飞语音

5）其他

3.开源的语音交互平台

1）CMU-Sphinx

2）HTK

3）Julius

4）RWTH ASR

5）其他

4.小结

参考文献

你可能感兴趣的:(行业知识)