|
行业观察 | 何文忠:人类技艺与人工智能人类技艺与人工智能 浙江大学翻译学研究所 何文忠 全文16639字,怕大家没耐心看完,给大家整个脱水版: 【脱水版】生成式人工智能是不同于人类历史上任何其他工具的全新工具,赋能的不是我们的体力,而是我们的智力。人类技艺与人工智能不是零和游戏(zero-sum),传统翻译技艺不仅仍可在人工智能翻译时代发挥重要作用,而且拥有高超翻译技艺的译者通过AI赋能增效,将会成为超级译者,牢牢占据金字塔顶端。用不了人工智能的场合仍然要靠传统技艺。原本就不具备翻译技艺的人哪怕掌握了超级译者同样的人工智能,也很难胜任翻译工作,很容易被AI误导,掉入一个个陷阱而不自知。 一、再说一遍,今年的国际翻译日主题 确实很糟糕 国际译联面向全球公布的2024年国际翻译日主题是Translation, an art worth protecting,强调了译作的原创性及创新性,呼吁全社会予以重视和保护。出发点是好的,但是事情没办好,给大家造成了错觉,认为翻译面对人工智能已经处于极为弱势的地位了。代表全世界翻译工作者的国际译联都已摆出一副弱者模样,可怜兮兮地恳求保护,这无疑不利于吸引有志翻译的人才加入这一宏伟的事业,所以这篇小文,并不是要收回我所说的话,而是要进一步明确前文中某些语焉不详的地方。 前文其实已经说了,这句口号极具误导性。因为大家看到的第一眼,一定会认为意思是“翻译:值得保护的艺术”。对“translation”一词的理解一定是翻译这种工作或者这种活动(关于translation一词的分析大家可以参看前文。),“art”一词也会被理解为“艺术”。可是过后仔细一想,再查查词典,就会知道art也还有另一个义项,“技艺”(“如果你把某个活动描述为一门技艺,你的意思是它需要技巧,人们通过本能或经验来学习,而不是通过事实或规则来学习。”),所以国际译联大概率是想表达“art”一词的这个意思。 小丑竟是我自己吗?其实不然,这锅我不想背。除了翻译,我也在浙大教本科生和研究生“技术传播”这门课。技术传播的一条重要准则是“不要让我猜你是什么意思”(“Don't make me think.”),从这个角度来看,这也是一个糟糕的口号,因为它有歧义。 不管是理解为“艺术”还是“技艺”,这个口号都表明国际译联对翻译的认知非常落伍,对形势的理解十分错误。按照第二个理解,我要探讨的问题其实就变成了“翻译是值得保护的技艺吗”?正好,现在很多人也对传统技艺在生成式人工智能时代的地位存在很大误解。借此机会,我跟大家聊一下二者之间的关系,它们必定是零和游戏(zero-sum)的关系吗? 二、强调原创性与创新性实际上 又把翻译限在一个狭隘的领域 翻译中的原创性与创新性重不重要?当然重要。文学翻译和创意翻译中可能存在许多的原创性与创新性,体现译者对原作的独特理解和语言文字运用的独特风格。但其实现代翻译生产是机器化大生产,工业化大规模生产最大特点就是流程化、自动化、标准化、信息化、产品符合一定的质量标准,产品或产品的部件可以复用(reusable)和互用(interchangeable),产业的产出物就是产品。这种生产方式中,准确性和一致性才是更加优先考虑的问题,而原创性与创新性从来都不是翻译质量的衡量指标。手工劳动则是十分个性化,每次的产出都独一无二,不可复制,产量极低,具有稀缺性和原创性。 所谓准确性,指的是译文在内容和意义上与原文的相符程度,是衡量翻译质量的首要标准。我认为翻译的准确性包括信息的准确性、立场与意识形态的准确性、文体风格的准确性、情感与与口吻的准确性、文化转换的适切性。而其中信息的准确性又包括信息传递完整,没有故意歪曲、误译、漏译,没有夹带译者的私货,术语正确,然后是用词准确,语法无误,语言地道,语篇连贯,不过其重要性略次于前面几点,前面是“质”的方面,后面是“文”的方面,当然,后者依然重要。当然翻译时,出于其特殊的翻译目的、受众需求、传播效果等考量,译者会对原文进行相应的改写、删节,以服务于组织目的。比如删除或者柔化某些意识形态的话语、暴力色情的话语、极具争议性的话语等,以及调整译文的可读性等级等。(各位看官请注意,这里不是严格的学术界定,而只是长期实践的一些经验总结。) 所谓的一致性,仅就术语来而言,就是必须保证术语的前后一致(consistency),这个前后一致不仅指文档内部的一致性,也指翻译项目内部的一致性,还指组织内部的一致性,话语体系内部的一致性,后面这两点经常容易被人忽视。这里的组织,最大的是国家,小的可能是一个企业或者一个部门,可能是公共部门,也可能是私营部门,而话语体系,可能是中国话语体系,也可能是其下位的政治话语体系、法律话语体系、文化话语体系、经济话语体系等。技术传播中强调,整个组织必须用一个声音说话(speak in one voice),才不至于导致所指不明,理解混乱,起不到应有的传播效果。比如我国的时政、外交、新闻等翻译中,术语选择的背后是意识形态、立场、态度、话语体系等,不是你想原创就可以的。只有首译,才有可能具备原创性和创新性,一旦定译,后来者就只是查证,而不是翻译,就再没有多少原创性与创新性可言。你要原创与创新,可能就跟国际译联一样,好心办坏事。术语错误,是比较严重的翻译质量问题。我这里所说的术语,跟术语学里的定义相比,要广得多,包括专业术语、专有名词(包括人名、地名、机构名、官职名、报刊杂志电影电视节目名)、引文等,主要是为翻译实践考虑,而不是机械遵循术语学的严格界定。 这样来看,国际译联的口号实际上又把翻译活动限定在个体的完全人工翻译的狭隘领域了。 还有一点,国际译联似乎有点健忘,或者选择性无视了。上世纪90年代计算机辅助翻译技术问世后,大量的翻译和本地化(主要是实用翻译,比如技术文档的翻译)都是基于记忆库(memory-based)来进行的,CAT软件查找当前待翻译或待本地化的文件和项目中的句子是否与记忆库里的句子相匹配,如果是上下文匹配或者100匹配,就自动传播(auto-propagation)了,还会被锁定,根本没有你原创的机会,剩下75%-99%匹配的句子,译者也只能改不匹配的那一小部分。后来的片段匹配技术(uplifting)更是开始组装以前翻译过的只言片语,以减少你翻译当前句子的劳动。这种翻译谁会强调原创性与创新性呢?这些情况下,原创你就输了。 从另一个角度来说,人类高级译员之所以能有这样的语言鉴赏力和驾驭力,是基于他们以前所阅读的前人所创造的文本,基于全人类共同的精神文化,基于所在言语社区的言语习惯与语言规约,而前人又是基于更前的人,所以其实大家在语言文字上创新的空间是很小的,否则你就容易偏离言语社区的语言规范。大语言模型的语言文字生成能力是凭空产生的吗?不是,它也是基于人类生产的语料来训练的,非得说有什么区别,那便是AI比我们读得多、读得快、学得快。从这个意义来说,你要说人类译员的翻译是原创,是创新,那大语言模型的翻译凭什么就不能算原创和创新?这就又有点双标了。 也许你要说,每个人都有自己的独特风格,都会在自己的文本中留下自己独特的指纹(fingerprint)。但翻译毕竟不是母语写作,这种指纹必定是混合了原作的指纹,原文毕竟是套在译者头上的紧箍咒,一旦你越轨,紧箍咒必然会响起。即便你顽固坚持你的观点,那我问你,不同的大语言模型就不会在译文中留下各自的指纹吗?即便是同一个模型翻译同一段文字,每次输出不也都有差异吗?这个就不是创新? 如果按读者对译联口号的第一眼理解,翻译是艺术,我们也必须强调,翻译其实更多的是一种复制的艺术,或者再现的艺术。你再想创新,也必须在原文划定的范围里。 退一步讲,严肃认真的翻译项目在人工智能翻译的基础上都会有富有经验的中高级译者把关,进行修改润色。译联既然认为人类译者具有原创与创新性,那在这一过程中其原创与创新仍然是可以得到体现的,并不是就没有用武之地了,除非他们抱着差不多就行了的态度,不充分发挥自己应有的作用。 三、何为人类技艺、何为翻译技艺 人工智能出现之前,技艺是人类的专属技能,指的是富于技巧性的表演艺术、工艺或技能等。比如艺术领域的音乐演奏、声乐表演、舞蹈表演等表演技艺,书画、摄影等创作技艺,或是工艺领域的玉石雕刻、陶瓷漆器、刺绣剪纸等制作技艺,或是其它专业领域的特定能力,比如医生的医疗技艺,工程师的工程设计技艺,以及厨师的烹饪技艺等等,不一而足。其中有的技艺属于传统技艺,具有历史传承性、独特的工艺方法和文化内涵,其中的很多属于非遗项目。翻译很难说具有这些特征。点到为止,后面再谈。 人工智能已经侵入了人类的这些专属领地,它可以画画,可以作曲,可以生成极具现实感的照片,可以生成好莱坞电影式的视频,可以写程序,可以写文章等等。有人惊呼:“人工智能时代,人类的专属技能不多了。”——这可能也是让许多人包括国际译联自乱阵脚的原因。 技艺需要长期实践,从中摸索,总结和积累经验,不是靠上几堂课,看几本书就能掌握的。比如,我家儿子还小的时候,生病了去校医院看病(那时还没有被附二接管),总是看不好,医生也说不出是什么原因,后来去儿保,还不是什么主任医生,就是普通医生,也不用这样那样一大堆检查,一次就给你医好了。“无他,唯手熟尔。”那里的医生见得多了,经验丰富(可不可以问儿保要点广告费?)。 每个人从事某门技艺性工作的潜质不同,对这门工作的热爱程度也不一样,所以不是每个人都能拥有该领域里高超的技艺,更不用说成为大师了。技艺也有瓶颈,大多数人终其一生,都突破不了,悟不了道,无法向更高的层级跃升,这里面有天分,有机缘,也有努力。这个时候,倘得高人点拨,也许机会会大点。但是只要你刻苦努力,不断实践,不断钻研,不断试错,不断总结经验,进入二八定律中的那20%,绝不是没有可能。我们也不是非得成为顶尖的那几个,因为高处不胜寒。我这么说,意思是,不是每个人都具备从事翻译这个行当的潜质,哪怕你是外语专业的学生,或者老师,甚至教授,主要是驾驭语言文字的能力不够,或者是受学术八股文毒害太深。有的人即使入了行,对这个行当也没有多少热爱,投入不了全部的激情,当然也就无法向金字塔的顶端跃进了。孔子曰:“知之者不如好之者,好之者不如乐之者。”(《论语·雍也》)如果你真的对翻译是乐在其中,迟早是会开悟的,一定会跃升到比较高的层级。 一门技艺也无法总结为几条简单的规则或者是几个明确的步骤,正如上面提到的英语“art”的义项中所说,无法通过学习事实或规则来掌握,而是只能“通过本能或经验来学习”。每个人的本能和经验不可能完全一样,因此没有两个人的技艺是一样的,总是有这样或那样独特之处。例如,哪怕两个人都是宜兴紫砂壶工艺美术大师,各自还是有些独门的技艺的。 以前的技艺或是家传,从小耳濡目染;或是师承,拜师学艺。我记得乡下的木匠,学三年才能出师。那是师父,不是师傅(据说有好些人搞不清楚这两个称呼的区别)。出师了,也要做几年,有名气了才能接到好活。 以前老人常说,一技伴身,生活不愁。我要是没考上大学,估计会去学厨师,因为好(第四声,不是第三声)吃,也不会饿着。以前我的学生来找我咨询就业方向的时候,我经常跟他们说,不要去做什么这种或者那种工作(不点名了,免得得罪了一个庞大的群体,被他们声讨)。其中一个跟我说想去恒大地产的时候,我跟他说房地产是夕阳产业,不要去,过了两年,恒大暴雷了。难道去了趟山西,我就跟花格刘一样穿越了?我还没去王莽岭啊。因为我说的这些工作相对来说缺少专有技能,而且你多年的专业学习也派不上大用场。好了,不瞎扯了,回到正题。 那什么是翻译技艺呢?虽然做了这么久这么多翻译,也教了这么多年的翻译,我还是没法给出一个准确的答案。(乖乖,难道我已经到了“不知道自己知道”的境界了吗?) 大语言模型告诉我,翻译技艺是指在翻译过程中所运用的各种技巧和能力的总和,包括语言转换能力、文化理解与传达能力、风格与语气把握与再现能力。好像对,又好像不太全面。 翻译学里面没有翻译技艺这个概念,似乎最相近的概念是翻译技巧和翻译能力。学界和业界有几个有影响的翻译能力模型,比如PACTE模型、EMT模型等等。我比较喜欢后者,图附在下面。但能力不等于技艺,技艺显然有能力的运用和表现,有经验的介入,还有些难以言传的东西。而翻译技巧,似乎又低了一个层面,只是操作层面的东西,没有包含认知层面和能力层面的东西。这些模型是将不同的东西置于同一个层面,可能还是有些不足。 ![]() 既然没有相应界定,在下斗胆在这里做个尝试,思考得不是很成熟,在此抛砖引玉,求教于方家。窃以为翻译技艺包含四个层次的东西,分别是认知层面、能力层面、操作层面和结果层面,也就是说从业者必须对翻译传播有正确的认知,并能将这种认知转化成翻译传播能力,能落实这些能力进行具体翻译传播实践,然后产出客户、受众和业界认可的达到预期传播目的的翻译产品。所谓认知层面,就是做翻译的底层逻辑,说的是你要知道何为译、为何译(许钧教授语),了解翻译的流程,对语言文字有较高的鉴赏力,熟悉社会文化心理,理解传播模式与流程等等(限于篇幅,只能就此打住,再者这个问题也不能一次性在这里说透,否则下次我就没法再攒一篇小文了)。能力层面和操作层面以前学界探讨得很多,我就不再罗嗦了。最后的结果层面,如果你翻译出来的东西不被客户、受众和业界认可,你做的就是无效的翻译,也就很难说你具备翻译技艺了。人家做出来的菜色、香、味、营养俱全,悦目、怡舌、沁鼻、赏心、益胃,最后的光盘子你都恨不得去舔一舔(It's finger-lickin’ good,KFC能不能给我份霸王餐?),而你做出来的半生不熟,甚至上吐下泻,你能好意思说你是大厨? 四、人工智能不同于人类历史上 其他任何工具 漫长历史上,人类有过无数的重大发明,创造过无数令人惊艳的工具,其中许多对人类文明产生了巨大的推动作用,人类的发展史就是工具的进步史。但是我们必须看到,历史上没有哪一个工具能与今天的人工智能特别是生成式人工智能相提并论。 帕梅拉·麦考黛克在其《人工智能往事:精英、文化与思维》(虞晶怡、杨丽凤译,格致出版社、上海人民出版社,2024)写了这么一段话:“很长一段时间以来,我们是地球上唯一能够操作符号的生物。现在,随着越来越智能的计算机出现,我们终于有了能够操作符号的伙伴。一场伟大的对话已经开始,这场对话将在很长时间内不会结束。” 那么人工智能与历史上那些工具究竟有何不同? 最核心的一点是,以往的工具主要是赋能人类的硬件,即弥补人类体力的不足。比如你走不了那么快、那么远,人类就创造新的交通出行工具;你拿不了那么多、那么重,人类就创造装载运输工具;你吼不了那么响、那么远,人类就创造新的通讯工具,等等。我们为什么不害怕这些工具呢?因为你不用它,它也不会对你怎么样,它们完全处在人类的掌控之下。而生成式人工智能则是赋能人类的软件系统,即扩充我们智力的边界。正如尤瓦尔·赫拉利所说,人工智能入侵了人类文明的操作系统,掌握了人类文明的万能钥匙。这种对人类软件能力的扩展可能导致人工智能在没有人类直接控制的情况下,做出一些预想不到的事情。设想一个这样的场景,一位经验丰富的玉石雕刻家正在雕刻一个玉佛,手中的人工智能刻刀对他说:“阿弥陀佛,施主,这一刀应该这样雕。” 用AI模仿花格刘的口吻来说,那就是:“以前的工具呢,我们人类使用它们的时候,它们只是被动地按照我们的指示去干活。比如我们用锤子敲钉子,锤子自己不会主动去做什么别的事情。但是人工智能就不一样,它会自己学习、自己思考一些问题。它不只是单纯地听从我们的命令,还能给我们出主意、帮我们解决各种复杂的问题。所以说呀,人工智能不同于人类历史上其他任何工具。” 生成式人工智能可以理解人类语言,可以思考,可以推理,可以生成人类语言,可以用人类语言与人互动,还体现一定的情绪情感。面对这样一个工具,人类有些害怕,有些排斥,也是自然反应。但未来已来,奇点已至,AI大势,浩浩荡荡,顺之者昌,逆之者亡——当然不是人真的挂了,是你的职业挂了。 五、翻译面临三千年未有之变革 生成式人工智能的出现确实是颠覆了翻译生产,为翻译带来了三千年未有之变革。 前文已经说过,生成式人工智能冲击的不只是翻译行业,而是各行各业。对翻译行业的冲击也不仅限于翻译实践和翻译教育,翻译技术界也被冲击得七零八落。因为在生成式人工智能出现前投入了很长时间、大量人力、财力开发的翻译工具或者软件,在生成式人工智能推出后,瞬间不香了,落伍了,甚至不需要了。或者在生成式人工智能推出后,辛辛苦苦基于ChatGPT开发的工具,ChatGPT一迭代,这些功能它都包括了,于是这些初创公司立马就死翘翘了。原本做翻译你需要用到好多的软件和工具,是笔不小的开支,大语言模型(LLMs)一来,大部分不需要了。问一问,现在还有多少人会花钱添置双语文档对齐工具或者术语提取工具?(不点名了,因为我跟这些公司一直保持着友好关系,犯不着为了一篇既不算学术成果又没有稿费的小文导致关系破裂)这些冲击,对翻译技术公司来说是坏事,但对译员来说却是大好事。生产活动中,我们要开源节流,开支少了,自然意味着利润增加了。(这个事关翻译管理和语言服务企业的可持续发展,准备再攒一篇小文专门探讨)。在生成式人工智能时代苟延残喘的翻译技术公司,如果不AI赋能,死期也不远了。 ![]() 不仅如此,大语言模型其实是抹平了技术鸿沟,大大减少译员学习掌握各种翻译技术软件的时间,极大减轻了他们的学习负担。你可以通过自然语言的提示词与大语言模型交流互动,而不是步骤复杂的软件操作,更不是通过程序语言。国外把这个称之为“提示词工程”(prompt engineering)(这算不算语言的腐败?),山东师范大学徐彬老师很不喜欢这个叫法,我也不太喜欢,只不过我不说出来,既然徐老师说了,我要声援一下。因为这个叫法把提示词拔的太高了,而且会吓退翻译圈很多原本打算拥抱人工智能的人。它没有那么高大上,你就把大语言模型当成一个虚拟的伙伴,跟它对话,告诉它你想要它做什么,怎么做,具体、明确、简明就可以了。不管是CRAFT(context,role,action,format,target)模式还是CO-STAR(context,objective,style,tone,audience,response)模式,亦或是CoT模式(思维链)、启发式模式、CoL模式(逻辑链),还是苏格拉底模式,其实都很简单(具体什么意思,看官自己去查,去问,去学)。只要你跟真实的人交流的时候,能够准确表达出你的意图,就可以轻松掌握。如果你跟人交流都说不清楚,让人一头雾水,那么表明你的认知层面和能力层面上都不具备成为大厨的潜质,趁早去端盘子吧。 你也没有太大必要一定要使用国外的ChatGPT,Claude或者Gemini,一则人家本来就不想给你用,二则还要国外的信用卡、电话号码,还有某个更大的风险,大家都懂的。就做翻译这件事来说,区别真的没那么大。而且既然所有大语言模型翻译的译文都不可能达到直接交付的质量,多费5%-10%的功夫修改也不是什么不能承受之重。 人工智能主要有两大作用,一是增效,二是赋能。所谓增效,就是这件事情你原来也可以做到,但是耗时耗力,而人工智能可以简化流程,降低重复机械劳动,从而显著提高做事效率。所谓赋能,是指某件事情你原来做不了,现在借助人工智能可以做了。下面我给大家举例说明。 先说增效。当前,文本翻译之外,音视频翻译的需求越来越大。人工智能出现之前做过音视频翻译的老师们可能深有体会,特别是没有字幕文件的视频翻译(有字幕文件的就跟文本翻译没有特别大的差别了)。大家需要在电脑上打开音视频播放器,播放一下按一下暂停,然后记下刚才听到的那一句,再按播放,再按暂停,又记下第二句,这样循环往复,直到把整个视频听写完毕。这还不是最麻烦的事情,你还要做时间轴,第一句话是几分几秒出现的,到几分几秒结束,第二句话,又是几分几秒出现的,到几分几秒结束。这样的音视频翻译实际上是非常耗时耗力的,你不要他几百块钱一分钟那真的对不起自己。你的大部分时间其实都花在这些跟翻译无关的技术问题上,真正用于翻译的时间可能相对比较少。而现在有了生成式人工智能,音视频翻译工作的非翻译部分变得前所未有的简单(大家可以试试深圳云译科技的transwai.com,纯友情推荐,没拿广告费。用过的都说好。)。你只需把视频文件拖进去,软件就会开始自动切分时间轴、自动语音识别、自动进行人工智能翻译。如果没有高的质量要求,也就是基于你的目的、场合、利益攸关度、容错率、开支等考虑,只是想在社交媒体或者非正式平台上播放,让大家结合原声,了解主要意思,那么到这里翻译质量其实已经达到了要求。但是如果你想在正式的媒体上播放,或者客户有更高质量要求,利益攸关度更大,容错率更小,那么就需要进行后续的人工的审校,包括调整字幕出现或者消失的时间,校准自动语音识别不准确或者错误之处,调整人工智能翻译的结果,以达到更高质量水平,更完美地艺术再现人物的性格与人物的关系,更符合当时的语境与情境。甚至还可以人工智能配音,克隆说话人的声音,做到嘴形同步。没有人工智能前,这是不可想象的。 再举一个例子。以前你要把一个单语或者双语文档中的术语和专有名词全部提取出来,是件很耗时耗力的工作。你或者手工提取,这个准确,但对比较长的文本或者整个项目来说,相信大家会崩溃。另一种做法是用术语提取工具,你又会发现你想要提取的没有给你提取,不想要的给你提取了一大堆。这是因为以前的自然语言处理技术还不能胜任这项工作。图书翻译中,我们可以将图书后面的索引变为术语表,以前这需要用到正则表达式(regular expressions),第一步先在搜索框输入“,\d+(.*?)\r”,再在替换框中输入“\r”;第二步在搜索框输入“\(w+), \(w+)”,再在替换框中输入“$2 $1”(以上都不包含引号),剩下的少数漏网之鱼手工调整一下就可以了。这样我们就可以得到一个单语的术语列表,将其上传至谷歌翻译或者DeepL获得译文,然后将原文和译文的两个术语列表粘贴到Excel电子表格里,就得到你想要的双语术语表了。当然还可以将这个电子表格拖到Glossary Converter里面转换成SDLTB格式的术语库,或者TBX格式的术语库。正则表达式其实是比较简单的,10分钟即可入门,但很多人很畏惧(应该是自我设限)。而现在,有了生成式人工智能,你甚至都不需要这么做了。(关于术语,其实很值得单独说道说道。) 生成式人工智能极大提升了术语提取的效率、准确性和全面性。现在市场上已经有了许多基于AI的术语自动提取工具(北大高志军博士也曾为小米公司开发过一个),Github上也有好些开源程序。这些我不想多谈,因为又会增加大家的开支或者学习负担。 下面我给大家汇报一个我做过的实验。 英国著名主持人、作家、历史学家Jonathan Dimbleby曾经写过一本关于香港回归的书The last governor : Chris Patten & the handover of Hong Kong,这本书被翻译成繁体中文,在我国港澳台地区出版发行。我必须要声明一下,我没有看过这本书,这里只是谈论翻译问题,不谈论其中的内容。当时,香港读者黄国钜(现任香港浸会大学人文及创作系副教授)曾经撰文严厉批评该书的翻译,大家可以根据标题《黄国钜挑战<彭定康--香港末代总督>》搜一下这篇文章,至少瞄一眼。他指出译本存在三个方面的问题: “1.一些香港人名、地方名、机构名称,译者没有认真查证中文原名,顺手捻来,造成大量荒谬的错误,对认识这些人物的香港读者,更觉怪诞可笑。 2.译者英文水平严重不足,把原文误译、错译、漏译,甚至不解文意,乱译一通的地方比比皆是,平白糟蹋了一本文句精炼漂亮的英文作品。 3.编辑、校订方面,没有做好统筹的工作,三位译者各自为政,导致很多译名前后不一,造成混淆。” 总结一下,译者不具备翻译技艺。 有天准备讲座PPT的时候,我突然想是不是可以拿这本书来测试一下,人工智能的术语提取和术语翻译是不是比这几位译者靠谱很多,于是我上传了这本书的电子版(word格式,PDF也可以哦)到豆包,给了它下面的提示词: Prompt:你是一位顶尖英汉翻译,也是一位香港问题研究专家,还是一位术语专家,我给你上传了一个关于香港回归的文档,请你将文档中的人名、地名、机构名以及其他跟香港相关的专有名词和术语提取出来,并翻译成汉语,生成一张英汉对照的双语表格,如果一次不能完成,请分几次,直至所有专名和术语提取和翻译完毕,请注意译名的准确性,目标读者是中国大陆以及港澳台地区的汉语读者,如果两岸三地译名有差异,请用括号标注香港本地译名。 如我所料,结果令人惊艳。就这么一个提示词,很快就保质保量完成了我交给它的任务。卖个关子,结果就不在这里展示了,大家自己去试一下。当然如果我还是想用index来做,借助大语言模型也简单多了。提示词如下: Prompt:你是一位顶尖英汉翻译,也是一位香港问题研究专家,还是一位术语专家,我给你上传了一个关于香港回归的图书的索引,我请你认真阅读这个索引,完成以下三项工作: 1. 每个索引条目后面是该条目出现的页码范围,这些页码范围都是我不需要的,请你将它们删除,只保留索引条目; 2. 条目如果以介词“in”、“of”、“at”或者连词“and”开头或者结尾,请将这些介词和连词连同后面的空格一起删除; 3. 请你上述两步完成后的结果翻译成汉语,生成一张英汉对照的双语表格,如果一次不能完成,请分几次,直至所有专名和术语提取和翻译完毕,请注意译名的准确性,目标读者是中国大陆以及港澳台地区的汉语读者,如果两岸三地译名有差异,请用括号标注香港本地译名。 当然,既然上面一个方法已经可以做到那么完美,就完全没有必要采取第二种方式了。 效率是不是大大提升?准确度也大大提升。就问你服不服?当然更重要的是问那几位译者服不服。我想大概率是服的,五体投地。至于该译本中的其他问题大家也可以去用AI试试,或者让你的学生用AI试试。 AI搜索引擎和大语言模型也极大地提升了我们查找和查证信息的效率。大家可以试试这三个AI搜索引擎:1. perplexity.ai; 2. thinkany.ai; 3. explorer.globe.engineer。AI搜索可以给我提供精准、相关的结果,无需再从一大堆传统搜索引擎提供的结果中一一筛选。试过一次,你绝对就再也不想碰某度。 再看赋能。本来公平起见,也该只举两个例子的,但我实在太喜欢AI这方面的功能了,就多举两个吧。 我最喜欢的AI赋能方面是这个,即我想表达某个意思,但一时想不出一个合适的词,这时往往抓耳扰腮,只恨自己积极词汇量不够。假设啊,我想表达“乱穿马路”这个意思,这个时候查词典是不管用的。词典是用来告诉你词的意思和用法,你得先知道这个词,但我此刻是先有意思啊。大家可以试试问ChatGPT“乱穿马路”这个意思可以用英语中的哪个词来准确表达,它立马告诉你“jaywalk”,这种行为是“jaywalking”。或者可以问问豆包“固定衬衣领口的饰扣用英语怎么说”,它会告诉你“collar stud”。当然这个答案对不对,那要再反向问一下,或者查一下词典,这也是有经验的译者的惯常做法,查,反向查,反复查,交叉查,很多具体的物件还可以查谷歌图片。这是AI时代的搜商和问商。(以后再说这个问题。我是不是画的饼太多了?)大家可以试试别的意思,我现在没意思了。清华大学推出了一个基于AI的以意查词工具“万词王”,虽然目前还不是那么完善,但方向是对的,大家有这个需求。 第二个例子。比如你是一位口译,被临时征召去参加明天的一场新能源技术国际研讨会,你并不了解新能源技术,举办方又没给你纸质或者电子材料,怎么办?你有两个选择,一是谢绝,免得砸了自己的牌子,但坏处是可能损失潜在的长期客户。二是接受邀请,那么问题是怎么较好地完成这个口译任务呢?当然,我必须坦白,我没有做过口译,给出的解决方案并不一定是那么靠谱,请各位看官自己判定。我觉得我们可以让大语言模型快速生成新能源技术领域的主要术语,并且给你详细介绍这些术语的意思,以及这些技术背后的原理,从而快速了解这个领域的相关知识。你并不需要像技术专家那样知其然还知其所以然,满足口译需求就够了。而在以前,这是很难做到的。 再以上面的影视翻译为例,没有生成式人工智能之前,你觉得我们可以克隆说话者的声音,并且做到口型同步吗?绝无可能。而借助AI,以后人们的观影体验将极大提升,尤其是外语不太好的人,原声加字幕的模式将很快消失。 还有一种影视翻译活动,叫做“口述影像”(audio description),或者“无障碍影视解说”。就是视障人士去看电影,由于他们是看不清或看不到画面的,这时就需要一个专业人士坐在影院某个地方,手持麦克风,将画面描述给视障人士听。当然这样的观影活动就必须是专场,不然会对其他视力正常的观众产生干扰。这其中的翻译技艺不同于传统的影视翻译。我前面谈过,翻译是跨越障碍的手段。这里跨越的是符际障碍,将视觉符号转化成语音,造福视障人士这一弱势群体。但这样的专场比较很少,平时在家里是不可能有口述影像的专业人士在场的。ChatGPT4o已经展示了一种强大功能,通过手机摄像头,然后结合ChatGPT4o,就可以将摄像头捕捉到的画面用声音描述给视障人士。也就是说,以后每个视障人士都可以有自己的随身口述影像翻译官了,甚至以后都不需要导盲杖、导盲犬了。这种AI,是大家都很欢迎的。我觉得这才是AI的正确发展方向,而不是让许多普通人觉得自己没有存在的价值了。 人工智能在笔译中的运用,可以参看下图,我就不啰嗦了,否则变不成“1001夜”也要变成“10日谈”了。向大家特别安利一款国内外职业译员都夸的工具GT4T(国外专业译者的评价:“要是没有GT4T,我的翻译瞬间回到旧石器时代。”),极大减轻了工作量,完全没有申请各种机器翻译引擎和大语言模型账号和API的麻烦。想要研究不同引擎与模型翻译表现的学者,也可以在这工具中一并获得结果。本人是这一工具的重度使用者(UI按照我的建议进行了重新设计,ID更符合逻辑,UX更好了)。 ![]() 效率就是金钱,AI助力可以显著提高单位时间产量,减少当前工作的劳动强度。当然,老板或者你自己肯定不会让你闲着,一定会给你更多的活,所以人工智能并不能真正解放我们,而是会让我们处于技术的压迫之下,变得更累。我还是怀念八十年代和九十年代那没有电脑、互联网和手机或者它们还不普及的时代。(暴露自己的真正态度了。)而且那个年代外语人才更受尊重。 ![]() 六、翻译技艺会以新的形式运用于 人工智能辅助的翻译生产 在很多人眼里,生成式人工智能强大如斯,是一个十分恐怖的存在,翻译行当中似乎没有多少人类译员的空间了。这又是一种误解,是说AI这也不行那也不行的另一个极端。 事实胜于雄辩,我们以实例来说明。 比如上一节里,关于增效的那一小节中提到的视频翻译,你要达到高质量交付,就仍然必须要对其中的视频出现或消失的时间进行调整。这是个技术活,是属于操作层面的技艺,更重要的是译文是否艺术再现了原文的意思和语气、语言是否准确地道和流畅自然、是否与人物的性格相吻合、是否与语境和情境相吻合、是否注意了衔接与连贯,这些都是认知层面和能力层面的技艺,也有些操作层面的技艺,这些也是我们在没有生成式人工智能的时候做视频翻译所体现的技艺,这些技艺并没有因为人工智能的介入而变得无用或过时。 再举一个文本翻译的例子,这个例子我在很多次讲座中一再使用。这是我带学生为浙江大学出版社翻译的一本书,还没出版,但已进入编审环节了。以下节选的是其中关于《发条橙》的那一章中的一段。之所以选这段,是因为AI翻译这一段的时候出了好几个问题,当然翻译初学者(研究生)也出了些类似问题。我们应该注意,有的问题是人与AI都会有的问题,有些是人会出现AI不会出现的问题,有的则是AI会出现但人不会出现的问题。大家平时可以注意观察,收集些语料,写篇文章,我这里就不展开说了,也不画饼了。 这一段原文如下: Kubrick contacted Malcolm McDowell, asking him to read the book, before offering him the lead role, and filming began in September 1971, lasting twenty-three weeks, until February 1971. A Clockwork Orange was made using a small mobile crew, on location, with only a few sets built where suitable locations couldn’t be found, resembling the shoots of his earliest feature films (Fear and Desire through to The Killing). He did all of the handheld shooting himself, which, combined with the film’s lack of stars, made it a relatively cheap production at just $2 million. During the shoot Kubrick extensively rewrote the dialogue during long rehearsals with the actors, especially McDowell. He worked on Alex’s voice-over until March 1971, when he began postproduction. Working seven days a week, he completed the film by the end of the year. The film premiered in New York City on December 20, 1971, and in Britain on January 13, 1972. Two years later Kubrick himself withdrew the film in the United Kingdom and it was not rereleased there until after his death, on March 17, 2000. 语言不难懂,都是些简单的词汇与句式。我不说“文”的部分,直说“质”的部分,也就是信息的准确性。我把人和AI出问题的地方粗体标记了。我先是在2023年上半年用当时的几个国内、国外语言模型测试了一遍,时隔一年,今年上半年我又用这些模型的迭代版本测试了一遍。限于篇幅,我只列出ChatGPT3.5和ChatGPT4o的译文。我将上面原文对应的地方也粗体标记了。 ChatGPT3.5 库布里克联系了马尔科姆·麦克道威尔,要求他阅读这本书,然后才向他提供主演角色,并于1971年9月开始拍摄,历时23周,直到1971年2月结束。《发条橙》使用了一个小型流动摄制组,在实地取景,只在找不到合适的场地时建造了一些片场,类似于他早期的几部长片(从《恐惧与欲望》到《杀戮》)。他亲自进行了所有的手持摄影工作,再加上电影缺乏明星,使其成本相对较低,仅为200万美元。在拍摄期间,库布里克在与演员(尤其是麦克道威尔)进行漫长排练时广泛改写了对话剧本。他一直在进行亚历克斯的旁白工作,直到1971年3月开始后期制作。他每周工作七天,最终于年底完成了电影。该电影于1971年12月20日在纽约首映,于1972年1月13日在英国上映。两年后,库布里克本人在英国撤回了该电影,直到他于2000年3月17日去世后才重新上映。 ChatGPT4o 库布里克在提供主演角色之前,联系了马尔科姆·麦克道尔,要求他阅读这本书。影片于1971年9月开拍,历时二十三周,直至1971年2月完成。《发条橙》采用了一个小型移动摄制组进行拍摄,主要在外景地取景,仅在无法找到合适地点时搭建少量布景,这与他早期的故事片(从《恐惧与欲望》到《杀手》)的拍摄方式相似。库布里克亲自完成了所有手持摄影,加上影片缺乏明星阵容,使得制作成本相对较低,仅为200万美元。在拍摄过程中,库布里克在与演员,尤其是麦克道尔的长时间排练中,大幅度重写了对话。他一直工作到1971年3月,才开始后期制作,期间对亚历克斯的画外音进行了反复修改。库布里克每周工作七天,最终在年底完成了影片。该片于1971年12月20日在纽约市首映,并于1972年1月13日在英国上映。两年后,库布里克亲自在英国撤回了这部影片,直到他去世后,才于2000年3月17日重新上映。 没有翻译技艺的人看不出AI翻译的任何问题,轻易就掉入了一个个的陷进而不自知,要他们修改基本上是无从下手,而翻译技艺高超的人看AI的翻译满是问题。第一句粗体有的大语言模型的前代和迭代版本翻译成了“电影拍摄于1971年9月开始,历时23周,至1972年2月结束。”这说明大语言模型有一定的上下文意思,意识到这里原文有错,但想当然地认为是一个简单的加法错误,后面的结果错了。学生要么是没有意识到问题,照原文翻译了,要么也是想当然地把后面的时间改成了1972年,全然没有看到更后面的内容,如果是1972拍摄完成,怎么可能1971年12月首映?其实是第一个年份错了,应该是1970年。第二个粗体部分,需要查证这部电影在中国的约定俗成译名是什么,维基百科、豆瓣、百度百科上都是“《杀手》”。第三个粗体部分,IMDb互联网电影数据库上说该电影是1971年12月19日洛杉矶首映,所以这个存疑。最后一句,ChatGPT3.5和大部分前代大语言模型都明显翻错了,迭代的ChatGPT4o的译文也有歧义,当然其他大语言模型的迭代版本翻译正确的多了。人类初级译员也像ChatGPT3.5那样,全然没有理解death后面那个逗号的作用。前期翻译准备阶段我们了解到库布里克死于1999年3月7日。只要译者的语言能力够强,就不会理解错这个逗号的用意。如果库布里克真是2000年3月17日去世的,那原文这个逗号就用错了。 所以这么一段简单的文字,就有好几个地方考验人类译者和大语言模型。时隔一年对主流大语言模型的测试表明,它们翻译的语言更好了,错误少了,可读性可以接受,但错误依然存在。所以无论是AI还是初级人类译员,其实都缺乏认知层级和能力层级的很多东西,AI确实像一个具备广博知识和很好语言能力但没有多少经验的翻译嫩头青。从它们的表现来看,确实会对翻译初学者和初级译员产生巨大冲击,甚至替代他们。 而我作为一个自封的高级译员,不仅修改润色了文字,改正了错误信息,还在译文中加了译者注,指出原文的问题(由于尚未出版,我就不把修改稿贴在这里了),更是在翻译前,通过互联网、大语言模型、前人翻译的有关库布里克的图书或者撰写的文章,认真了解了库布里克这个人、他的电影、关于他导演艺术以及电影的评论、犹太文化等等。这些认知与能力层面甚至操作层面的很多东西,AI是缺失的,当然翻译初学者也是缺失的。 这个例子说明,人工翻译时代的技艺在AI翻译时代仍有同样用武之地,只不过从翻译阶段转移到了审校修改阶段,从以生成者角色运用变成了以评估者角色运用这些技艺。拿玉石雕刻做个类比,就像你有一块璞玉,人工智能翻译已经给你雕出了一个雏形,剩下的就交由你这个技艺高超的玉石雕刻大师,来精雕细琢,打磨出精品。最终成品的质量与艺术性就靠你这精雕细琢了。 但单靠人工翻译技艺,又无法满足当前翻译生产的需求。时空穿梭者花格刘二十多年前就说过:“人们要习惯跟计算机一起来更好地解决人类自己不好解决和机器自己也不怎么能搞定的需要智能解决的问题。”毕竟是久远过去智者的语言,新新人类可能觉得难懂,我用豆包来解释一下。 Prompt:请用非常浅显明白的语言重新表述下面这句话的意思,好像我是一个中学生:“人们要习惯跟计算机一起来更好地解决人类自己不好解决和机器自己也不怎么能搞定的需要智能解决的问题。” 豆包这样回答: “同学们,这句话的意思呢,就是说我们人类要学会和AI一起合作。因为有些问题呀,我们人类自己很难解决,而AI自己呢,也不太能处理好。但是这些问题又需要有智慧才能解决。所以呢,我们就要和AI一起,共同把这些难题给解决掉。”(我把原文的计算机改成了AI。) 这口吻这语气,妥妥的花格刘现在上课的风格。一言以蔽之,人类技艺与人工智能不是零和游戏(zero-sum),只要我们能人机耦合,二者就是双赢关系。 ![]() 七、结语 点一下题,人工智能时代,翻译传统技艺依然大有用武之地,依然呈现巨大生命力,没有濒危或者灭绝的风险,还不需要保护,更没有到要放到非遗馆里供起来的地步。如前文所说,我们不但仍旧可以将传统技艺用于人工智能翻译,也要考虑用不了人工智能的场合。美军在长期依赖GPS导航之后,国防部下令海空军重新学习利用传统的六分仪和天上的星星来确定方位和寻找方向,以防不时之需。另一方面,拥有高超翻译技艺的译者通过AI赋能增效,将会成为超级译者,牢牢占据金字塔顶端。但我也在每次讲座的最后以这句话结尾:“说一千道一万,翻译的终极还是在语言文字功夫,技术不过是助力罢了。”翻译技艺最核心、最底层的东西是语言文字鉴赏力和驾驭力,缺少这层技艺,你就不够资格从事翻译工作。乔布斯曾经说过:“仅靠技术是不够的。正是技术与文科的结合、与人文学科的结合,才会给我们带来令人心潮澎湃的成果。”所以翻译的关键不在于技术,而在于你的传统技艺,人工智能时代尤其如此,在于你将传统技艺与人工智能耦合,像花格刘所说的那样,“与人工智能形成综合体,以发挥各自的优势。”同时,要记住,要在想这个新世界中取得成功,我们需要更具批判性思维和创造力、好奇心、韧性和适应性,树立成长心态,拥抱终身学习。 我们的学科中,越是科学化、规则化、程序化的东西就越容易被人工智能取代,而“那些富有创造力的部分、令人惊讶的部分、打破规则的部分——不是人工智能,是我们。”(Seth Godin)人文学科必将能在AI时代发挥重要作用,关键是人文学者要找到AI时代的共同目标,摆脱当前研究狭隘、琐碎和孤立的局面,重建人文学科的连贯性,以语言艺术为中心,切实响应社会现实关切。 目前,人工智能远未达到第五级,就像自动驾驶一样,如果你双手离开方向盘,甚至躺在后座睡觉,那你不是蠢就是疯,风险自担,但不要连累别人。签约翻译中,如果你直接把脑子外包给人工智能,出事了,人工智能不会替你赔偿,更不会替你坐牢。 再引用一段花格刘的话,这是他穿越回来后看到我的那篇小文后说的: “没想到,机器的智能以我们人类不理解的方式发展得太快,所以我们担心,我们害怕,我们想寻找一个保护伞,但作为智人谁能保护你呢?唯有我们自己,如果我们不能早日搞清楚‘数据为什么会产生智能’这个问题,数智体也许很快就成为智人之上的存在了,那时说什么可能都晚了……” 德国学者吉仁泽在其《失控与自控:智能世界生存指南》(何文忠、朱含汐、汤雨晨译,中信出版社,2024)第四页上有一段话:“科技公司掌控你的生活只是时间问题,忠实的助手会变成一个卓越的超级智能。我们的孙辈将像一群羊一样,满含敬畏地对他们的新主人或是欢呼雀跃,或是瑟瑟发抖。”在智能世界,算法和人工智能越来越多地渗透进我们的日常生活,我们的工作,甚至决定我们的生活,但我们真的了解这些技术的局限和风险吗?我们应该想清楚如何正确看待人工智能,毕竟它不同于人类历史上的任何其他工具,我们应该思考如何掌控人工智能,从而掌控自己的生活,以免沦为人工智能的奴隶。 【致谢】9月30日那天看到国际译联发布的今年国际翻译日主题,有感而发,急就了一篇小文,10月1号发在了《浙大译学馆》公众号上,只是应景(还没有关注该公众号的麻烦关注一下哦,拉到底,一键三连。我如果能给他们涨点粉,他们就更愿意推送我的小文了,多谢多谢)。里面免不了有些错漏或是不太严谨之处,加之有些话感觉没有说到位,今天再攒一篇小文,请大家继续批评指正。特别鸣谢浙江大学刘海涛老师,没有他的建议,小文的某些部分可能就会比较浅陋。感谢和蔼可亲的外文局黄友义老师和浙江大学许钧老师的鼓励,是两位老师给我注入了继续写这些翻译随笔的强劲动力。也非常感谢浙江大学董燕萍老师、浙江大学冯全功老师、浙江越秀外国语学院王理行老师、山东师范大学徐彬老师、宁波大学陈文安老师、上海大学王晓元老师、北京语言大学韩林涛老师、四川师范大学张静老师、华东理工大学郑国锋老师、浙大宁波理工学院周先武老师对上一篇小文的宝贵意见和对这一篇的启发,还有朋友圈里的同事、朋友、学生(特别是燕俊昊同学和陈前同学非常认真地帮我校对了初稿)以及翻译圈里的同仁,是他们促成了这篇小文。谢谢你们!也谢谢各位读者能有耐心看完这么长的水文。 16639字 2024年10月2日草稿 2024年10月5日修改 作者简介 何文忠,博士,浙江大学外国语学院副教授,硕士生导师。主要研究方向:语料库语言学、语料库翻译学、现代汉语语法、翻译技术、对比语言学。 |