首页 >> 业界新闻 >>精彩活动 >> 实战经验 | 中央民族大学口译智能体探索项目总结
文章
  • 文章
搜索
详细内容

实战经验 | 中央民族大学口译智能体探索项目总结

图片

口译智能体探索

中央民族大学专场

大语言模型赋能翻译系列活动





2024年11月19日晚,博硕星睿翻译技术教育研究院举办大语言模型赋能翻译系列活动之口译智能体探索活动,本期活动围绕中央民族大学雷静老师所在口译智能体团队探索成果展开分享,诚挚邀请北外高翻王华树老师、天外高翻朱华老师、天津理工语言文化学院齐珊珊老师、哈尔滨师范大学西语学院李智老师、北京博硕星睿教育科技有限公司丁羽翔共同参与点评交流。


2.jpg

嘉宾致辞后,中央民族大学翻译系主任雷静教授介绍项目背景及目标:随着信息技术的快速发展,口译人员需要熟练运用AI辅助工具进行译前准备。利用AI技术构建术语库成为提高口译效率和质量的重要手段。但目前市场上主要的术语工具未能很好地满足口译活动的需求。因此,设计一套智能化的口译术语管理工具成为当务之急。

口译智能体探索项目旨在推进翻译技术在专项领域的学习与交流。雷静教授指导和带领项目团队确定以中华文化对外传播为方向,聚焦博物馆讲解口译,开展口译智能体搭建工作。


🔗直播回放链接:

https://ulruj.xetslk.com/sl/2f3N5a




01
项目流程

(一)前期准备


1. 科普会议学习


在天津理工大学齐珊珊老师和北京博硕星睿教育科技有限公司丁羽翔副总的助力下,雷静教授带领团队成员深入学习多模态智能体搭建相关内容,包括语音转文本、提取关键信息及术语、术语库生成、PPT核心内容整理总结等方面,为后续工作筑牢根基。同时了解文本难度分级、讲者停顿标注、口译质量测评等研究用途内容。


3.png

2. 确定项目方向与目标


团队成员经头脑风暴,在雷静老师引导下,最终确定优先探索中华文化对外传播领域的术语智能体搭建,以博物馆场域为方向,针对博物馆讲解口译开展工作。



4.png

3. 前期任务开展


项目前三周确定AI辅助口译方向,开展每日同学分享活动,学习任务涵盖语音识别插件探索、coze代码搭建数据库、运用comic等工具提取PPT内容,学习资源丰富多样,包括研究文章、推文、软件及开源项目等。


(二)项目实施


1. 实地调研(2024年10月)


团队分组前往中华民族博物院、中央民族大学民族博物馆和民族文化宫进行实地调研,详细记录讲解员讲解内容和现场双语内容,并整理调研资料。如10月13日张李静与夏提努尔、李明明和孔子月对中华民族博物院北园展开调研。


5.png

2. 线上检索(2024年11月)


  • 搜集讲解词:以中华民族博物院为例,整理出约4万字文稿,对各展区系统梳理,如藏族馆景区讲解词涵盖藏族多方面内容。

  • 提取术语:采用两种方法,一是手动标注术语并整理;二是利用Language X工具。



3. 术语库搭建


通过网上检索和结合实地调研收获,完善术语库。

4. 工作流搭建
  1. 确定工作流阶段:确定范围跟目标, 收集术语和对象,利用工具构建本体,集成和评估。

  2. 设计提示词:参考北外prompt bank语料库平台并修改,展示4个提示词,如分析讲解受众。

  3. 设计分布工作流:以从中华民族博物院官网链接提取内容为例,展示工作流运行。

  4. 构建完整工作流:术语提取与生成、创建知识库、上传术语表、创建工作流、添加大模型节点、 配置大模型节点、 连接节点、测试工作流以及优化和迭代。

6.png


5. 效果检验


  • 知识库搭建和利用效果:在Coze平台创建知识库上传数据表后,形成知识空间,方便口译员查找术语翻译,提高口译效率和准确性,使讲解更流畅。


  • 工作流创建与定制效果:规范化工作流创建流程助力博物馆讲解,大模型通过定义角色和提示词理解术语含义,提供准确英文翻译。


  • 测试优化阶段的效果:通过输入术语测试,发现工作流问题并优化配置,提高翻译准确性,确保口译术语准确传达原意,提升国际游客参观体验。


02
经验分享


01

中华民族博物院小组的经验


张李静同学总结了尽管博物馆讲解词的理论知识和文化知识丰富,但相关英语翻译资源有限。小组成员需要通过大量文献阅读,积累对特定语境下词汇含义的理解。孔子月同学分享了她在检索和选择翻译资源时的心得,指出了UNESCO Term、AI推荐的网址等资源的利弊。李明明和夏提同学分别强调了在译前准备工作中文献积累和细心筛选的重要性。


7.png

(一)中华民族博物院小组的经验
02

中央民族大学民族博物馆小组的经验


梁钊瑀小组总结了译前进行全面准备准备的重要性,包括了解博物馆背景、展品内容,熟悉讲解员风格,准备口译资料和工具,模拟练习,以及确认讲解内容与时间安排。这些准备工作有助于提升译员的文化理解、专业知识和口译能力。

8.png


(一)中华民族博物院小组的经验
03

民族文化宫小组的经验


民族文化宫小组通过实地实践,加深了对文化内涵的理解。小组成员通过细致梳理展览内容,体会到中华文化的丰富多元。在术语整理方面,小组追求系统与完善,从不同途径检索术语并进行科学分类,将注释转化为清晰准确的定义阐释。

9.png



(一)中华民族博物院小组的经验
04

经验共性和个性


三个小组的经验共通之处在于,都认识到中华文化类术语翻译的难度和资料收集整理的重要性。各小组的亮点分别为:中华民族博物院组侧重词汇翻译钻研,中央民族大学民族博物馆组全面流程切入,民族文化宫组则在文化内涵体会和术语整理上有所侧重。

(一)中华民族博物院小组的经验
03
难点反思


1
实地考察难点


  • 背景资料的广泛收集的任务量巨大

  • 博物馆部分文物存在实物、介绍残缺的现象


2
术语整理难点


术语选取与对应表达的疑问:在回顾术语表时,小组成员发现某些术语在不同文化背景下可能存在理解偏差。


3
术语库的更新与维护难点


术语库不是一次性的工作,它需要定期更新现有条目,删除过时的条目以及添加新出现的条目。


4
大语言模型工具的使用难点


  • 数据集的难以理解性:大语言模型(LLM)面临的第一个挑战是数据集的难以理解性。在实际应用中,大模型需要考虑现实中真实的API(应用程序编程接口(Application Programming Interface)的缩写)但现有工作往往没有考虑或者考虑的API太少,多样性差。

  • 在线对齐工具的挑战性:以Tmxmall在线对齐工具为例,虽然它支持术语提取服务,但是它也有其局限性。



04
小结


本次分享会并非局限于对口译智能体探索项目阶段性成果的展示,其更是一场团队成员与专家学者、翻译爱好者之间深度互动的交流盛宴以及相互促进的学习之旅。专家们的精准点评以及细致入微的专业指导,为项目团队注入信心与动力。我们必以更为饱满的热情,继续口译智能体探索,为口译领域的智能化发展以及中华文化对外传播做出更大的贡献。


企业新闻
关注我们
关于我们
业界新闻
更多

咨询电话:15811379550

公司邮箱:yuxiang.ding@lingotek.cn

翻译技术教育研究院

seo seo