ddf1463

GitChat·人工智能 | 除了深度学习，机器翻译还需要啥？

本文开始要写作的时候，翻译圈里出了一个“爆炸性”的事件。6月27日下午，一个同传译员在朋友圈里爆料：某AI公司请这位译员去“扮演”机器同传，制造人工智能取代人工同传的“震撼”效果。

这个事件瞬间在译员群体的朋友圈、微博、微信群引爆了隐忍已久的火药桶。因为过去几个月来，隔三差五就冒出一个号称要取代同声传译的翻译机，尤其是一篇题为《刚刚宣告:同声传译即将消亡!》的微信文章，在六月下旬铺天盖地的充满了一堆有关的或者无关的公众号，不知道带来了几个10万+。几乎每个翻译行业的从业者，都收到了朋友略带同情关切的口气转过来的那篇文章，从一开始的“呵呵”到逐渐不堪其扰，终于被上面这个事情彻底激怒了。微博上的@同声翻译樱桃羊呛声道：

还有台上的演讲嘉宾，光鲜亮丽的，德高望重的，一边享受着我们的服务，一边儿说以后同传都要失业，骨子里透着对这个行业的轻慢——“你们以后都是要被替代的工种，我们何必在乎你们的感受？”有本事不要请我们，既然请了我们，在说这句话之前，能不能跟现场辛苦工作的同传说声抱歉？

“积怨”深到了什么样的程度，可见一斑。

这件事后来有了一个略带戏剧性的转折。两天后，《消亡》文中被吹捧的晓译翻译机的制造者，科大讯飞（注意：没有证据表明上面的造假和讯飞有关）在其公众号上发布了一篇题为《拒绝神化人工智能技术需踏实前行》的文章。重点在这两段：

目前，机器翻译已经取得非常大的进步，在衣食住行等常用生活用语上的中英翻译可以达到大学六级的水平，能够帮助人们在一些场景处理语言交流的问题，但距离会议同传以及高水平翻译所讲究的“信、达、雅”还存在很大的差距。

讯飞一直所努力的，是希望通过语音转写和翻译技术帮助同传提高工作效率、减少失误，形成人机耦合的同传新模式，并不是去替代同声传译。

好吧，原来是“被神化”，原来“我是拒绝的”。但是不管怎么样，此文一出，又收获了不少不明真相群众的交口称赞。而义愤填膺的译员们，也迅速恢复了低调内敛的幕后工作者姿态。甚至连揭发造假者的呼吁，也立马无声无息了。

作为一个混迹在人工翻译圈的机器翻译工作者，我感觉到，这个事情暴露出了一些对翻译行业的很深的误解，无论是普通大众还是机器翻译/人工智能工作者。本文的主题，初衷就是探讨人机结合对于机器翻译发展的重要性。所以，有必要首先澄清一下这些误解。GitChat的读者们可能更期待技术深度，一开始我也打算写得更技术流一些。但是，上面这个事件出现之后，我觉得在关心人机结合模式的技术实现之前，我们还是得多探究一下问题的本质。雄心勃勃要替代人工的同行们，也得先知道要替代的到底是神马样的存在，不是么？

误解一：翻译就是简单机械的语言转换

对翻译工作的误解非常多，这点是最核心的，很多其他误解（比如会外语就能做翻译、翻译人才遍地都是、翻译不需要理解专业就能做等）和由此产生的轻慢（翻译没有技术含量、随便可以替代、不值钱等），正是根源于此。

为什么这么多人“一致”相信翻译即将被替代？除了博眼球的自媒体之外，“替代党”包括了太多的互联网大佬，比如库兹韦尔、李彦宏、李开复、王小川等等。我们来看看这背后的逻辑是什么。

李开复在其新书《人工智能》中提出了一个“五秒钟准则”：一项本来由人从事的工作，如果人可以在5秒以内对工作中需要的思考和决策的问题做出相应的决定，那么，这项工作就有非常大的可能被人工智能技术全部或部分取代。

然后基于“五秒钟准则”，该书预测：从事翻译、新闻报道、助理、保安、销售、客服、交易、会计、司机、家政等工作的人，未来10年将有约90%被人工智能全部或者部分取代。

显然，翻译不幸被首当其冲的归入“五秒钟”可以解决的问题。大概是同声传译这个带着光环的工种给大家带来了一个幻觉：翻译不就是几秒钟就出来的吗？而且，据说同传还是所有翻译工作里最难最贵的，那其他翻译岂不是更不在话下？

事实上呢？口译员们知道，为了准备一场会议口译，事先要提前做多少天的功课，会前要做多少沟通协调，会中要多注意随机应变；更不用说，达到可以做同传的水准，要经过多少年鬼知道经历什么的刻苦训练。用“台上一分钟，台下十年功”来形容口译员的工作，再贴切不过。而笔译的工作，也一点都不轻松，也同样需要多年的磨练才能产出合格的译文。

进一步说，这个误解实际上包含两个论断：

翻译只是语言转换。
语言转换是简单机械的。

实际上，这两个论断都是不成立的。

对于第一个问题，我们要追问一下翻译的本质。翻译是一种语言服务。对于语言服务，近期看到广东外语外贸大学的李瑞林教授给出的定义，我认为最接近其本质：语言服务是以语言资源为基础，以致知、赋能、移情为目标，实现知识和经验人际或组织间转移的社会经济过程（见《语言服务概念框架的再反思：存在依据、普遍本质及实践逻辑》）。可见，语言是翻译这种服务实现的一个载体，而不是服务本身。翻译工作带来的知识、经验和情感，才是最关键的东西。而这些东西，相信开复们都不会认为是机器很容易处理的（记忆性的静态知识除外）。

对于第二个问题，则要进一步追问“语言”的本质。我们知道，语言是信息的载体。比如我们要传达“苹果”的信息给另一个人的时候，不用非得拉着他去水果店或者某高科技体验店去才行。但是这个信息载体并不是无损的，我们用“苹果”这个概念，显然无法把具体的形状、颜色、触感、气味、效用等信息都全部传输过去，得靠对方把其他信息“脑补”出来。因此，语言实际上只是信息处理过程中的一个经过编码了的“快捷方式”。能否把快捷方式所代表的信息解码出来，对信息接收者的认知结构是有要求的。这就是所谓的“一千个读者就有一千个哈姆雷特”。一个翻译工作者既要做解码者，又要做编码者，必须在短时间内使自己的认知结构接近原文作者的预期，又要考虑到另外一种语言的读者的认知结构的差异。转换的难度可想而知。

因此，翻译这个事情，不是想当然的那么简单。在本文的预告贴里，我列举的几个语言特性中，“开放性”、“歧义性”、“演化性”等问题，给翻译带来了极大的困难。我们想要让机器翻译达到或者超过人工翻译，首先得正视其困难和价值，而不是靠将对方“简化”为某种形式的机器。否则的话，我们岂不就相当于靠把国乒搞垮来实现“让国足达到国乒的水准”？

误解二：人工翻译就是“好翻译”

这点可能是人工智能工作者普遍的误解，但也是目前大家对机器翻译普遍非常乐观的一个原因。受“图灵测试”思想的影响，我们会把“让机器翻译给出好的译文”这个问题转化为“如果机器翻译给出的译文，人无法分辨是人还是机器做的，就是好的译文”。所以绝大部分的机器翻译训练，无论是统计机器翻译还是人工神经网络，都以和人工译文语料库的“最大似然度”为训练目标。也就是，想办法让机器译文看起来和平行语料的对译关系最接近。

这个假设又包含以下几个子假设：

人工翻译水平是质量刻度线上的一个黄金分界点。
我们可以从平行语料（只要足够多）中学习到这个分界点。
普通双语人士可以很确定的分辨出译文质量是否过了这个分界点。

很遗憾，这几个假设，也是我们为了让问题有更良好的形式化定义，以及有相对一致的评价标准，而做出的简化假设。在我们离问题的“完美”解决方案还很远的时候，这些假设对于我们做出切实有用的近似解决方案，是非常有帮助，也是必须的。但是如果把在这些假设下得到的局部最优解的大幅进步等同于非常接近全局最优解了，就会产生即将冲破临界点的幻觉。这对于探求真正的真理，是不利的。

我们逐个说一下上面几个子假设。

第一，人工翻译水平显然不是质量刻度线上的一个点，而是上下界离得很远的一个区间，比如从30分到99.99分。其下界低于机器翻译的水准，是最正常不过的事情了。更要命的是，这个刻度线上的刻度值（如果以所需投入的努力作为间距衡量单位）并不是等距离分布的。打个比方，59分到60分如果间隔1厘米的话，95分到96分的间隔可能是1米，而98分到99分可能是几公里……所以，试问我们应该把哪个位置设为人工翻译的水平线呢？这里面学问可就大了——比如把分界点设在60分，让机器翻译从30分提高到57分，是不是可以说目标达成90%了？即使我们设定了99分的高标准，机器翻译从39分提高了30分到69分，离99分还有30分的时候，我们能宣称走完一半的路了吗？恐怕万里长征只是第一步。可是我们很容易想当然的这么来炫耀我们走过的路。比如去年谷歌GNMT的那篇论文，就是这样计算出来提升了87%（某个语种方向上，大家可以去找来原论文分析一下其评测数据和结论之间的关系），已经可以看到胜利在凯旋门下招手了……

第二，相比别的一些自然语言处理任务，机器翻译显得更成功，就是因为有平行语料这种天然带标的数据资源。只要平行语料是人工翻译的，我们似乎就可以将其作为衡量质量的黄金标准。然而，问题在于：

语料是有限的，但语言是开放的，和语料不匹配的，不代表是“不好的”。
语料是静态的，但语言是动态演化的——过去好的，现在未必好。在一个领域好的，换个领域未必好。对一部分人或场景好的，对其他人或场景未必好。
语料本身的质量可能是参差不齐的（因为人工翻译的质量是参差不齐的，参考上述第一条，暂且不说很多语料的来源也是机器翻译），尤其是海量规模的时候，也就是说，近似的也未必是好的。

因此，基于双语语料的质量标准，也是没有更好办法的办法，“黄金”度还是不够高的。

第三，假设我们确实可以找到足够好的人工译文作为质量标准，那么是不是任何一个双语人士都有足够的判别能力，来正确区分人工译文和机器译文呢？也就是说，会不会出现这种情况，一个机器译文确实是有瑕疵的，但某些人就是看不出来它与参考译文不一致的地方到底是好还是不好？答案是肯定的。这就像机器写诗，普通人的鉴赏能力或阅历经验有限，可能已经分辨不出它是不是机器写的，所以才有微软的机器人小冰潜伏在各个文学社区也没被发现。但是对文字敏锐的人，还是可以筛选出来哪些是好的诗歌——小冰出版的诗集，其实也是经过人工“精选”的。既然如此，不同资历、不同专业、不同文化、不同目标、不同条件的人，对翻译质量的认知也是不一样的。找什么样的人来作为图灵测试的鉴别者，也是一个需要仔细考量的事情。

三个子假设都与现实问题存在一定的差距，可见，我们目前所以为据的评价体系，还不足以带来足够充分的反馈。这点正是和下围棋的AlphaGo的最大不同。我们知道，AlphaGo最强大的地方，就是可以通过自己和自己下棋来不断提升水平，而自我对弈的前提，是明确的胜负判别标准。而翻译孰好孰坏，还没有很好的评价机制。也正因为如此，今年火的一塌糊涂的生成对抗网络（GAN）在机器翻译中虽然验证有效，但效果并不太惊艳。要想取得突破，在评价机制上必须多花点心思了。

误解三：翻译市场就那么大，机器做得多了，人的饭碗就小了

的确，我们如果把翻译市场比作围棋棋盘，人工翻译执黑，机器翻译执白，双方你死我活、拼命厮杀、攻城掠地、此消彼长，那就会存在所谓的“替代”问题。

可是，现实的翻译市场格局是怎样的呢？我们来看下面这张图。

这张图出自行业研究报告。如果把企业中的文字内容比作一个金字塔：

顶端的部分，是目前由人工翻译来完成的，包括产品资料、营销文案、品牌形象、法务合同等。
底端的部分，是目前由机器翻译来完成的，大多数是由用户发起的公开网页浏览等。
中间的部分，比如实时支持和FAQ、用户生成内容、企业内部知识库等，其实是没有被翻译的。

而这些没被翻译的内容，竟然占到了99%！

也就是说，无论对于人工翻译还是机器翻译，都有大片的处女地等待开垦，而且其中很大比例，可能需要人和机器携起手来，才能够给出可行的解决方案。

君不见，如今机器翻译用得最多的那些场景，比如旅游、电商、聊天社交，之前也并不是人工翻译的菜。而未来在客服、知识库、UGC等场景下的语言支持，基本上都要求既要有机器的快捷，又要有人工的可靠性或温度，一定是人机结合才能做到的。

更何况，上面的这个金字塔的体量也不是一成不变的，随着互联网和人工智能的发展，全球信息加速流动，内容规模不断膨胀，整体需求只会不断扩大，试问人机双方何时才能够在楚河汉界上兵戎相见？

进入正题板面的做法和配料

等等，预订时说好的内容呢？为什么总是在讲这些误解？

实际上，关于翻译行业或职业的误解还有很多，为什么就挑这三点来讲？不单是因为这三点最要害，更是因为澄清了这三点，我们的正题及预定通告中的第一问（为什么需要人机结合）的答案就非常清楚了。

机器翻译要替代人工翻译，还有很远的路要走。
人工和机器相结合，才能给出更好的解决方案，释放出原先被压抑的更大需求。
翻译是知识、经验和情感的转移，人是实现这种转移的主体，现阶段只有通过人，才能更好的获取机器翻译所需要的知识和数据。
缺少好的评价机制，很快将成为制约机器翻译进步的关键瓶颈，而语言的特性决定了，评价反馈不能来自语言本身，而只能来自于语言使用场景中的人。

对于致力于机器翻译/人工智能的同行，希望这篇文章，可以引起大家的一些思考。上述观点不一定正确。但是在密切跟进深度学习最新成果的今天，也许我们也应该适当低头想想，我们还缺什么，在可见的成果收割之后，还可以做些什么。

翻译圈的朋友，看到机器翻译还代替不了人工翻译的时候，是不是了松一口气？然而，这并不意味着机器翻译不会使现有的译员失业。再下一篇文章里，我将回答预定通告中的第二问（人机结合翻译怎么做）。顺带说说，机器翻译让译员失业的N种可能性。

转载于:https://www.cnblogs.com/xxr1/p/7406828.html

有一种过年的快乐是这样的天福悟道
“嘿嘿嘿，呵呵，嗯哼，嘿嘿，哼哼……”婴儿铃铛般欢快的笑声，传入耳中，感染着听到它的男人。此刻，男人忙活了一天的疲惫瞬间被这串笑声冲淡了许多。男人的脸上露出了甜甜的微笑。难道，孩子们的笑声是父母疲惫的解药？这一天的忙活，都是为了孩子们的欢笑，值了。男人在心里这样权衡着。后天就是春节。男人已将年货备齐，不需要再去采购了。男人这几天除了工作，就尽为春节忙活了。昨天去超市采购年货，那个人挤人啊，真想抽身
信而泰×DeepSeek：AI推理引擎驱动网络智能诊断迈向 “自愈”时代
DeepSeek-R1：强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力，融合了自然语言处理（NLP）、深度学习、大规模数据分析等前沿技术。DeepSeek-R1具备卓越的逻辑推理、多模态分析（文本/图像/语音）和实时交互能力，能够高效处理代码生成、复杂问题求解、跨模态学习等高阶任务。凭借其开源、高效、多模态
NLP论文速读|chameleon：一个即插即用的组合推理模块Plug-and-Play Compositional Reasoning with Large Language Models Power2024666 NLP论文速读自然语言处理人工智能机器学习深度学习 nlp 语言模型
论文速读|Chameleon:Plug-and-PlayCompositionalReasoningwithLargeLanguageModels论文信息：简介:该论文介绍了一个名为Chameleon的人工智能系统，旨在解决大型语言模型（LLMs）在处理复杂推理任务时存在的固有限制，例如无法访问最新信息、使用外部工具以及执行精确的数学和逻辑推理。Chameleon通过插入即用模块增强LLMs，使其
AI深度噪音抑制技术
这两年人工智能快速发展，AI已经渗透到了各行各业。在噪音抑制技术领域，AI也同样发挥了巨大的作用。AI深度噪音抑制技术是一种利用人工智能和深度学习算法来动态处理和减少音频信号中的噪声，从而提升音频的清晰度和质量。与传统的噪音抑制技术相比，AI深度噪音抑制能够更智能、更精准地分辨出背景噪音与有用的语音或音乐信号，尤其在复杂、多样的环境下表现尤为出色。1.工作原理AI深度噪音抑制技术基于深度神经网络（
读经营十二条第十七天格雷_Jacky张
宁波市北仑格雷塑料制品有限公司读书会张镇第二章经营者必备的三种力量第一种“他力”：得力的副手及全体员工的力量今天在学习的本小节中，稻盛先生告诉我们，经营者除了能够实践“经营十二条”的自力，还必须要具备两种他力。第一种就是“得力的副手及全体员工的力量”。这里首先提到的就是得力的副手。经营如果只是依靠经营者一个人的力量（自力），是有限的，需要有得力的搭档或者副手来分解经营的压力。没有一个人是“完人”，
秋园（五，田四送人，仁受离世）博学的毛婆婆
昨天讲了，秋园一家到了要靠讨米过日子，但讨米终究不是长久办法，仁受、秋园一家接下来怎么填饱这么多肚子呢？仁受还在关押，一家人除了吃饭整天就在大路上看路的尽头，盼望仁受能早日回来。而在这期间第5个孩子田四出生。第7天上仁受回来了，秋园看着沧桑憔悴的仁受忍不住哭了。转眼间，冬天到了5口之家，仅有一场破棉絮，仁受提议有一外甥欠自己的钱就没还过，可以去他家里看看能否救济一下。秋园带着之骅去了，一进门没提还
岁月流淌的洋峪河（五）关中文苑
王东海五箩圈腿的哥哥嘿嘿嘿一笑，‘这有啥呢！说就说嘛。’他一拍自己的胸脯再一拍身边的弟弟继续说道，‘我叫吴连喜，我弟弟叫吴连福，我俩是双胞胎，我比他只大了半天；我的家在商州东城青石桥街，是当地有名的猎户，十六岁那年冬天，我跟爷爷出猎五峰山时，突然的一场暴风雪耽搁了行程，歇在黑风崖一户周姓人家，认识了比我大两岁的彩凤姑娘，我俩一见倾心，彼此爱慕，她的父母更是欢心满意，放开让我们谈心相处，几天下来我们
【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
数据集标准化:软件2.0的基石工程 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
数据集标准化,软件工程,数据质量,机器学习,人工智能,数据治理,数据可信度1.背景介绍在当今数据爆炸的时代，数据已成为企业和组织的核心资产。然而，海量的原始数据往往杂乱无章，格式不统一，质量参差不齐，这严重阻碍了数据价值的挖掘和应用。数据标准化作为解决这一问题的关键技术，已成为软件2.0时代不可或缺的基石工程。软件2.0时代，人工智能、机器学习等技术蓬勃发展，对数据质量提出了更高的要求。传统的软件
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
电子电气架构 --- 从软件质量看组织转型路径汽车电子实验室电子电器架构开发流程 EV（电动汽车）常规知识必备架构电子电气架构电气电子架构开发的应对策略开发语言 ECU刷写与busoff原则
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
电子电气架构 --- 汽车软件全生命周期汽车电子实验室电子电器架构开发流程车载电子电气架构架构汽车电气电子架构开发的应对策略开发语言 ECU刷写与busoff原则电子电气架构
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
世界上没有真正的感同身受——找自己媛儿妙不可言
“世界怎么这么安静，感觉被所有人抛弃生活这么拼命努力，是不是也算一种远离这世上除了我，只有千万个你逃离那些让你，波动情绪的事情世上没有真的感同身受，面对其实只有一个人一个人在夜里哭着，哭到头疼直到睡着没有人能真的理解你啊，觉得虚伪你逢场作戏我一直都会记得一句话，强大到无往不利世界怎么这么安静，感觉被所有人抛弃生活这么拼命努力，是不是也算一种远离这世上除了我，只有千万个你逃离那些让你，波动情绪的事情
聚好推网盘拉新项目，新人到入门精通的三大步骤！无忧达人
聚好推是最新上线的网盘拉新，聚好推这个渠道是有着多年互联网项目经验的平台，已经推出了多个互联网项目，在市面上有着非常多的用户，而且这个平台的口碑是相当不错。这次的聚好推也是重磅发布，尤其是聚好推上线的网盘拉新组队奖励，除了正常的佣金团队收益之外，聚好推推出的组队奖励单人最高可拿28w，这也是行业中首次推广的全新奖励。聚好推注册入口及推广教学放在文末了，划到文章结尾即可注册聚好推聚好推网盘拉新项目优
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
人的价值就是能让别人生活得更有价值——读荆志强老师的书有感花婆婆
最近读了荆志强老师的专著《快乐地做教育》，前言就提到：教育的本真，就是通过激励为学生赋能，帮助学生产生足够的“自我效能感”，让学生主动获取知识技能、培育情感态度；帮助学生建立自主深度学习的能力。荆志强老师倡导的“赋能教育”主要从两个方面建构：激励型课堂、自主化管理。其中，他还谈到生本教育的学习观：学习是生命成长的过程，它是人自身的一种需要，而不是外在压力的结果。教育的一切行为都应该是为了满足儿童的
娱乐主播怎样吸引大哥，讲讲我的经验糖葫芦很甜
在当今这个多元化的网络直播时代，娱乐主播作为连接观众与虚拟世界的桥梁，其吸引并维护“大哥”（即忠实且高消费能力的粉丝）的能力显得尤为重要。免费加入，一对一指导扶持↓作为一名有经验的娱乐主播，我深知要在这个竞争激烈的行业中脱颖而出，不仅需要独特的个人魅力，还需要一系列策略与技巧。以下是我根据亲身经历总结的几点经验，希望能为同行们提供一些启发。真诚是吸引任何人的基石。在直播中，主播应勇于展现真实的自我
RAG 助力教育个性化：重塑学习体验的科技引擎 hy098543 学习科技
一、引言1.1研究背景与动机随着自然语言处理（NLP）技术的飞速发展，大语言模型（LLM）在众多任务中展现出了强大的能力，如文本生成、问答系统和机器翻译等。然而，传统的大语言模型在知识存储和更新方面存在一定的局限性。一方面，模型的知识主要依赖于预训练阶段所接触的数据，这导致其知识更新滞后，难以应对快速变化的现实世界信息。例如，对于一些新出现的事件、技术或研究成果，模型可能无法及时给出准确的信息。另
ChatGPT 之后的下一步是什么？四个迫在眉睫的进步 iCloudEnd
OpenAI的文本生成器ChatGPT进入公共领域已经两个半月了，该机器人令人印象深刻且深思熟虑的答案已经引起了1300万日常用户的注意，他们已经将其用于一般问题、开发想法和写作全长文章。尽管ChatGPT存在重大缺陷（例如一些事实不准确），但许多人担心这可能对劳动力、学校、新闻业等产生影响。然而，我们可能正处于一场巨大的人工智能革命的开端。OpenAI总裁兼联合创始人GregBrockman于1
在恩施去吃茶，穿越千年的油茶汤施南风物
我国的茶文化历史悠久，据陆羽《茶经》所记载茶之为饮,发乎神农氏,闻于鲁周公。上溯至神农尝百草而成为饮品，兴于鲁周公。后唐宋年间茶事活动记载颇多，也就是这个时期将茶饮逐步发展成一种文化，在中国这种“文化”就好比日本所说的“道”一样，是一种除了基本的生活之外的人生追求。我们的茶也从这个时期传遍了世界，例如而后茶传到日本形成的日本茶道，改变了日本人的生活方式。唐朝吃茶在历史上吃茶是一种主流的表达茶的方式
Javascript 严格模式use strict详解滴水成川 JavaScript学习记录 javascript use strict
一、概述除了正常运行模式，ECMAscript5添加了第二种运行模式："严格模式"（strictmode）。顾名思义，这种模式使得Javascript在更严格的条件下运行。设立"严格模式"的目的，主要有以下几个：-消除Javascript语法的一些不合理、不严谨之处，减少一些怪异行为;-消除代码运行的一些不安全之处，保证代码运行的安全；-提高编译器效率，增加运行速度；-为未来新版本的Javascr
畸形的爱2023-07-20 敬夜里的百合
昨晚陪他搬家，陪他同事喝酒吃饭我买单，而他却是对我只有甜言蜜语，我只有一遍忍受各自家庭的痛苦，还需要忍受他的各种没心没肺。突然感觉到很累，不愿意过这种生活了，只想一个人过，一个人生活。我想找个地方，一个人静静地待上一阶段，太累了。我心情不好，说不吃，他就没有做早餐，自己喝了牛奶吃了香蕉，给我什么也没有给吃。现在浑身发酸没有力气，不想自己去吃饭，想把自己虐待的到晕倒，到自己不省人事乱，烦，。。。。
有时候觉得好累，多想你抱抱我懒猫暖暖
我什么都没想，这是个什么都不是的重点，对我来说如夏夜的凉风，相比热烘烘的白天有一股鲜甜。我什么都没想，多好！什么都不想就是完全占有灵魂。什么都不想就是全身心体验生活的潮水涨落……我什么都没想。除了……仿佛是扭伤，后背痛，或后背半边，我精神的嘴巴涌上一股苦味，因为，毕竟我什么都没想，不过真的，什么都没，都没……~《想象一朵未来的玫瑰：佩索阿诗选》曾经有人说:你那么努力，一定很累吧累么？或许当你回答累
喜爱购有什么新消息？如何打造百城万店氧惠好物
自2020年10月起，西安喜爱购商贸商贸股份有限公司全力打造的“百城万店”新零售商业模式应运而生。在探索新零售的道路上,通过互联网、大数据、云计算、人工智能等新技术,重构“人、货、场”商业元素,秉持“舍利差赚服务”经营理念,在全国至少一百个城市的“一千户以上的中高端社区”,打造至少两万家“一区一店”社区生活超市。大家好！我是氧惠最大团队&联合创始人氧惠达人导师。氧惠佣金更高，模式更好，终端用户不流
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
嘉兴地区可以做亲子正规鉴定的15个医院地址（附2024年机构汇总）国医基因孙主任
嘉兴地区可以做亲子鉴定的医院在哪里？嘉兴国医基因可以做亲子鉴定，地址在嘉兴市南湖路16号。今天小编整理了嘉兴可以做亲子鉴定采样的15个医院采样中心，排名不分先后，部分医院不确定能否做亲子鉴定，还需要根据业务范围选择希望对大家有所帮助。嘉兴亲子鉴定医院中心机构名录：南湖区2、国医基因嘉兴市第一医院亲子鉴定采样中心机构地址：嘉兴市南湖区中环南路1882号秀洲区3、国医基因嘉兴市王店人民医院亲子鉴定采样
时代广场的蟋蟀《续写》 66a1db3bd067
自从柴斯特回乡下去到时候，亨利和塔克就忘记了这一件事，他们每天除了吃了睡，睡了吃，就没事干了。这天，塔克说：“嘿嘿，老兄，醒醒，我们那一次说好了是不是要去找柴斯特呢？”“哦，对呀，我差点把这件事给忘了。”亨利说。于是亨利和塔克就跑到了火车站里。突然，只听到了一个尖叫声，原来，那是塔克的尾巴不小心被人们踩了一脚，痛得大叫“啊，我的尾巴。！”亨利看了一眼就说：“老兄，没事，我们继续走吧。”于是，塔克就
初识：我们的那一年露娜2005
那一年我们都还是懵懂的少年，刚刚走出象牙之塔，带着无限的憧憬步入社会。幸运的是我们相遇在一个初创公司，除了老板和合伙人（不知为何在公司里我们一直称呼他们为老师），其他同事都是同龄应届毕业生。老板在公司不远的小区租了两套房子，给我们当男女生宿舍（当然每个月还是要从工资中扣除一部分房租费用）。因此，最开始的几个月似乎都没有进入职场的感觉，仿佛只是走进了另一座象牙塔里而已。不知是机缘巧合，还是命中注定，
冒充顺华文庭内部群胜天半子毛顺华就是骗子，中粮仓智慧农业虚拟盘及早远离切勿被套！昌龙律法
人到老年，就怕手头没钱。一些不法分子利用老年人信息闭塞、认知较弱等特点瞄准了老年人的“钱袋子”花样百出实施诈骗老年人损失财产的同时还饱受精神打击不能忍！这些套路，应该让爸妈知道智慧农业，低碳环保双探交易市场，数字体育，人工智能十选五就是骗局我们曾曝光了无数种金融骗局，不知道能有多少人看到，能帮一个是一个，再次曝光一种炒股诱导做慈善参加数字经济的骗局，相信作为股民，大家都会经常接到一下分析个股，或者
人工智能真的能编程吗？研究勾勒出自主软件工程的障碍 WSSWWWSSW 人工智能软件工程
想象一下这样一个未来：人工智能悄然承担起软件开发的繁重工作：重构杂乱无章的代码、迁移遗留系统以及排查竞态条件，这样人类工程师就可以专注于架构、设计以及那些机器仍然无法解决的真正新颖的问题。最近的进展似乎让这个未来近在咫尺，但麻省理工学院计算机科学与人工智能实验室（CSAIL）以及其他几家合作机构的研究人员发表的一篇新论文指出，要实现这个潜在的未来，需要认真审视当前面临的挑战。这篇题为《面向软件工程
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

GitChat·人工智能 | 除了深度学习，机器翻译还需要啥？

误解一：翻译就是简单机械的语言转换

误解二：人工翻译就是“好翻译”

误解三：翻译市场就那么大，机器做得多了，人的饭碗就小了

进入正题板面的做法和配料

你可能感兴趣的:(GitChat·人工智能 | 除了深度学习，机器翻译还需要啥？)