请输入关键字!
2024-04-25   星期四   农历三月十七   
蒋丽平:非物质文化遗产汉英平行语料库的创建与应用
来源:“中国非物质文化遗产”微信公众号 作者:蒋丽平 创建时间: 2022.07.06 16:42:00

【摘要】非物质文化遗产具有非常明显的地域性和活态性,蕴含着深厚的民族文化特色,因此,非遗的外宣翻译具有巨大的挑战性。汉英双语平行语料库为非遗翻译研究提供了新视角。以广东省为例,从建设非遗平行语料库的必要性、语料构成、语料来源、语料的标注与检索等方面,全面地介绍广东非遗双语语料库的创建方法,并探讨其在非遗翻译语言特征研究、翻译质量评估、计算机辅助非遗翻译教学模式等方面的应用,以此助力基于实证语料的非遗翻译研究。

【关键词】非物质文化遗产;语料库;双语;平行语料库;翻译方法

非物质文化遗产(以下简称“非遗”)具有鲜明的民族文化特色,同时被赋予了丰富的文化多样性和人类创造力①。非遗的翻译研究对展现和对外宣传我国传统文化具有至关重要的作用,但是由于非遗文本具有鲜明的民族文化特点,因此非遗翻译具有巨大的挑战性。语料库技术为翻译研究提供了新的视角和研究范式。基于语料库对非遗翻译进行研究,可以更深入地发掘和认知非遗文本在语言运用层面的规律和特征,从而归纳和总结出客观且具有一定普适性的非遗翻译原则与方法。英国的翻译理论家莫娜贝克(Mona Baker)首次将语料库应用于翻译研究。随后,她正式提出了语料库翻译学。21世纪以来,国内外基于语料库的翻译研究逐渐兴起,并创建了涉及各个领域的专门语料库,在此基础上,语料库逐渐划分为译文语料库、类比语料库和双语对应语料库三种类别②。理论与实践证明,基于语料库的相关研究已给翻译研究领域带来了很大影响,并产生了丰富、积极的研究成果。本文以广东省为例,探讨非遗双语语料库的构建方法及应用前景,以期为非遗翻译研究提供新的思路和视角。

一、非遗汉英平行语料库建设现状

平行语料库与翻译实践结合得最为紧密,对翻译实践的作用也最为直接。运用平行语料库对非遗文本翻译展开研究是一条行之有效的新路径。然而,将非遗翻译与语料库结合起来的研究不多见,而基于地方非遗创建双语平行语料库的研究更为罕见③。截至第五批国家级非遗名录公布之前,以“语料库”和“非物质文化遗产”为主题词在中国知网进行文献检索,结果显示有19000多条,经过研究分析发现,以非遗为语料创建平行语料库的研究直到最近几年才逐渐兴起。翟秋兰、刘阳创建了小型的广府文化专有项平行语料库,并在此基础上探讨了广府文化翻译的难点与对策④;齐建涛基于语料库对非遗文本翻译研究的路径进行了描述⑤;赵丽丽、宋欣阳基于《中国的非物质文化遗产》(中英文版)建立了小型平行语料库,并在此基础上对语料进行了对比分析⑥;吕靖、李旸构建了小型冀东民俗文化英汉平行语料库,并在此基础上对冀东民俗文化翻译外宣进行了研究⑦。这些研究者基于地方非遗语料自建了小型语料库,并指出了语料库对非物质文化遗产的翻译研究的重要意义,对地方非遗翻译研究做出了一定的贡献。但经检索和研究发现,由于所建语料库样本较小,没有针对非遗类别进行分类建库,且大多并未能实现在线检索,因此应用价值相对有限。整体上看,我国对于非遗的翻译研究尤其是基于双语平行语料库的非遗翻译研究成果比较少,有必要创建非遗双语平行语料库,规范非遗翻译,为非遗翻译实践提供质量保证。

二、创建广东非遗汉英平行语料库的必要性

从全国的非遗数量和分布来看,广东无疑是非遗项目大省。截至目前,广东省共有385项非遗项目被列入我国非遗名录,其中包括粤剧、狮舞、茶艺、蜈蚣舞等国家级非物质文化遗产代表性项目(以下简称“国家级非遗项目”),还有鳌鱼舞、粤语讲古、吴川泥塑、五羊传说等省级非物质文化遗产代表性项目(以下简称“省级非遗项目”)。非遗项目主要分布在广州、佛山、潮汕、中山、江门、东莞和深圳等地区。广东省的非遗项目也是联合国教科文组织非物质文化遗产的重要组成部分,然而,广东省非遗项目的外宣翻译现状与其重要地位并不相符。通过对广东省文化部门相关人士的访谈,以及对省级及各市级的图书系统的检索,发现目前仅有广东世界图书出版公司于2010年出版发行了《广东省非物质文化遗产名录图典(一)》(中英文对照版)⑧,且仅收录了国务院公布的广东省第一批和第二批国家级和省级非遗项目名录。国务院公布的第三批至第五批国家级非遗项目和广东省公布的第三至第七批省级非遗项目暂无中英文对照版;在中国知网输入关键词“广东非物质文化遗产”时,可检索到相关学术论文60多篇,但主题主要围绕对广东省非遗的保护和开发展开;在输入关键词“广东非物质文化遗产外宣”或“广东非物质文化遗产翻译”进行检索时,均显示尚未有研究成果。在广东省文化馆的官网上可查询到非物质文化遗产的相关中文资料和图片等,但网页资料也尚未翻译成其他英文。这些现状表明广东省非遗翻译的研究比较落后,需要引起重视并尽快开展相关工作。

(一)提高非遗英译质量

广东省的非遗项目是中国传统文化的重要组成部分,随着国际文化交流发展的逐步深入,广东非遗资源翻译的重要性越来越凸显。广东省非遗汉英平行语料库在构建过程中,首先要收集广东省非遗资源的语料,其次要对收集到的汉语、英语进行对齐和校对、标注和检索。语料的客观性和完善性是顺利开展翻译研究的基础与保障,能够帮助译者提高翻译效率和译文的质量,进而提升广东省非遗的英译水平。语料库收录了大量的实践例句,这些例句可以为广东省内外各类研究机构在进行广东非遗的翻译研究时提供可靠的帮助,有效推动非遗翻译的发展。规范的翻译及针对广东省非遗的深层次研究,必将催生高质量的非遗英译。

(二)推动传统文化走出去

广东省的非遗项目在全国具有独特性和标识性的特点,加强非遗资源翻译,可以吸引大量海外游客。广东省非遗资源汉英平行语料库具有很强的针对性和实用价值。通过互联网提供在线平台查询,便可成为广东省非遗资源对外宣传的重要窗口,有效提升广东省非遗景点的形象和层次,推动非遗更好地“走出去”;同时,广东省非遗英汉平行语料库可以为今后全国大型非遗资源汉英平行语料库的创建提供真实案例和创建基础。

(三)适应非遗旅游多样化立体化发展的需求

通过创新发展,广东打造出非遗结合“岭南文化”和“红色旅游”的新思路。为了让传统文化活起来,广东省通过建立岭南文化资源博物院,实现扛“文化自信”之魂、溯“岭南文化”之源的历史使命。为了加深国内外游客对岭南传统文化的体验,2021年广东省实施岭南文化“双创”工程打造粤港澳大湾区世界级旅游目的地⑨,以重点项目为引领,传承、弘扬中华优秀传统文化并助力岭南文化创新与发展。这些不断创新的多样化立体化的传统文化旅游资源在对外宣传时,却没有现成的英语翻译。传统文化旅游资源汉英平行语料库里丰富规范的翻译实例可以为宣传广东省创新的旅游形式提供参考。

三、非遗汉英平行语料库的创建

(一)语料库的整体设计

广东省的非遗项目主要分布在广州、深圳、东莞等22个地区,共十大类别。我们根据非遗类别将广东省非遗汉英平行语料库分为十大子库,分别为民间文学、传统音乐、传统舞蹈、传统戏剧、曲艺、传统体育、游艺与杂技、传统美术、传统技艺、传统医药、民俗。分库设计双语语料库,有利于对非遗语料的语言特征、修辞和英汉语言对比情况等进行分门别类的研究;还可以针对某一类别的非遗语料进行详尽而深入的分析研究,提出针对性的翻译策略和方法,有利于提高该类非遗文本的翻译质量。

(二)语料的收集

双语平行语料库的创建首先要保证所选语料的质量和学术性。因此所收集的译文尽量是已出版的英汉对照文本。但是截至第五批国家级非遗名录公布前,全国仅有福建、上海等地出版了中英文对照版的非遗简介文本以及国家音像出版社出版的《中国的非物质文化遗产》(2011年版)。其次,还有一些单类别的非遗中英对照版,比如,中国农业出版社于2019年出版的《九华立春祭》《内乡县衙打春牛》和《三门祭冬》。经过调研和检索发现,国务院公布的第三至第五批国家级非遗项目和广东省公布的第三至第七批省级非遗项目截至目前还没有非常权威的中英文对照出版物。因此,语料的收集主要从以下3个渠道进行。首先,对《广东省非物质文化遗产名录图典(一)》中英文对照版进行扫描和整理,形成可编辑的word格式文本;对于尚未收录进广东非遗名录中的最新非遗项目,从已有零散的中英对照的广东非遗期刊、书籍、音频、视频等正规发行物中收集提取中英文的语料;同时从非发行物,如景点网站、文化部门官网、旅游公众号、旅游宣传资料、景区旅游简介中收集景点介绍中英文对照资料。其次,由理论、实践能力俱强的翻译团队对收集到的资料进行审校,形成英汉对照的word格式文本。最后,对于部分没有英语介绍的非遗语料,通过借鉴已出版的中英非遗语料的翻译策略和方法对其进行翻译和审校,形成英汉对照的非遗word格式文本。

(三)语料的加工和对齐

对收集的语料进行整理,去除图片、误译等内容,先保存为TXT格式,可以用计算机辅助翻译软件SDL Tradors的文本对齐工具Winlaign将中英文本进行自动对齐,也可以采用在线对齐工具Tmxmall对语料进行英汉对齐。本研究采用Tmxmall进行在线左右句级对齐,左边为中文源语文本,右边对应的为英文译文,以便今后的统计分析研究。文本对齐结果如图1。

from clipboard

▲图1 基于对齐工具Tmxmall英汉文本句及对齐范例

根据非遗语料分类,本平行语料库共建十大子库,分别存放于10个不同文件夹。首先,采用语料库分词软件Corpus Word Parser对语料信息进行分词和词性标记;其次,使用语料库词性标注软件Stanford POS Tagger进行赋码,所有过程反复进行两次人工校对,以保证数据的准确性和客观性。含有句法信息和语义赋码的非遗文本语料库才具有广泛的应用价值,至此,广东非遗汉英平行语料库最终建成。

(四)语料的检索结果与分析

广东非遗双语平行语料库采用单文本形式进行保存,即一行中文对应一行英文,中英文之间采用分行隔离,中英文的总行数一致。采用语料分析工具LancsBox 6.0或语料库检索软件WordSmith的词表功能对语料进行检索统计分析,类符表示文本中的词的种类,类符/形符比的数据是用来说明词汇变化和丰富的程度,标准类符/形符比可以在一定程度上反映语料文本的词汇变化情况⑩。由表1可见,汉语文本的词汇表达相对比于英文文本表达要更为丰富一些,但原文的文化特性也因此在翻译过程中丧失掉了。从十大子库的数据对比情况来看,总文本最大和最小的分别是传统技艺子库(239273)和曲艺子库(16570);英汉标准类符/形符比(STTR)相差最大和最小的分别是曲艺子库(20.45)和传统舞蹈子库(17.21),见表1。

from clipboard

(五)基于语料库的广东非遗翻译特点

基于语料库检索软件ParaConc对汉英非遗文本进行检索和分析,可以对译者所采用的非遗翻译方法进行研究。因为非遗蕴含丰富的文化元素和地域特色,本研究将选取非遗的项目名称和汉语的四字表达结构对译者的翻译策略进行研究。

1.广东非遗项目名称的翻译特点

非遗的项目名称是非遗项目的精华浓缩,含有大量的地名、人名和专有词汇。通过检索发现,译者在处理项目名称时,大多采取了“音译+注释”的翻译方法。比如,广东的国家级非遗项目“潮剧”译为“Chaozhou Opera”,“英歌”译为“Ying-Ge Dance”,湛江的“雷州歌”译为“Leizhou Folk Songs”,“瑶族耍歌堂”译为“Shuagetang Songfest of Yao Minority”。“佛山秋色”译为“Foshan Autumn Harvest Celebration”。值得注意的是,广东非遗民俗类别中的“飘色”项目拥有“吴川飘色”“南朗崖口飘色”“台山浮石飘色”等几个子类别非遗项目,除了“吴川飘色”采用“音译+注释”法被译为“The Wuchuan Piaose Parade”,其他3个项目中的“飘色”一词都被意译为“Fluttercolor Show”。但是,从这几个“飘色”的内容简介看,在形式和内容上却无多大差别。此外,有些非遗项目的名称直接采取了“直译法”。比如“广东剪纸”“粤绣”“抽纱”“象牙雕刻”分别译为“Cantonese Paper-cutting”“Cantonese Embroidery”“Fagoting”“Ivory Carving”。还有的非遗项目采取了“意译法”,比如“咸水歌”“乞巧节”“东坑卖身节”分别翻译为“Songs of Boat Dwellers”“The Double-Seventh Festival”“Dongkeng‘Selling-oneself-for-Employment’Festival”。这主要是因为从这些非遗项目的中文名称上看,很难从字面上了解项目的内涵,因此采取了“意译”法,使英文读者第一时间明白项目名称所指。然而,我们也关注到有些非遗项目的名称直接采用了“音译”,从而导致英译名称上很难理解非遗内涵。比如“Dongkeng Dijing”的译文来自汕尾申报的非遗项目“东坑地景”,只有通过项目内容介绍才知道“地景”指的是当地闹元宵巡游赛会活动。因此可采用“音译+注释”的方法改译为“Dongkeng Dijing Parade”。

2.广东省非遗项目表达结构的翻译特点

从语料文本内容分析来看,广东省非遗项目文本具有鲜明的地域性和文化特性,因此对于蕴含大量文化元素的表达进行翻译时,译者主要使用了归化的翻译策略,即对原文进行了灵活处理,但是同时也失去了很多文化意蕴⑪。如广东民俗信宜“镇隆飘色”中对“飘色”这一传统民俗的描述:“镇隆飘色融魔术、杂技、音乐、舞蹈于一体,是粤西地区民间艺术的瑰宝,其通过生动人物造型,展示出家喻户晓、妇孺皆知的神话传说、历史故事和戏剧人物......”该句翻译为 :Fluttercolor Show of Zhenlong blends magic, acrobatics, music, and dance. It is a gem of folk art in western Guangdong. Through vivid character modeling, it displays household-known myths and legends, historical stories and drama characters...,“家喻户晓”与“妇孺皆知”两词被简单地翻译为“house-hold”一词;再比如,佛山民俗非遗陈村花会里有一句“待到花市正式开张时,花街上张灯结彩,看花、买花的人群川流不息、摩肩接踵。”翻译为:When the flower market officially opened, the flower street was decorated with lights, and the crowd watching and buying flowers continued to flow one after another。中文中的“川流不息”与“摩肩接踵”作为修饰词在译文中均被略去。由此可见,由于汉语中并列成语的意思相近或属于次要信息,在翻译成英文时均作简化处理,这样处理比较符合英文语言的表达习惯,使得英文文本的词数和词类较之原文本有一定的减少。

四、语料库的应用

(一)进行基于语料库的翻译理论研究

非遗汉英双语平行语料库语料收集规范性和针对性强,能较好地代表汉语和英语之间的语言关系。首先,通过对广东非遗语料库中词汇、句法、修辞、语篇等分析,可以总结两种语言在字、词、句、语篇,以及文体上的共性和差别,从而指导翻译实践并破解当前许多非遗名称一名多译的困境和景点介绍语言不规范、译文可接受性差等问题,可以为非遗翻译标准和非遗资源翻译文本对比研究等提供可靠、客观的翻译实例,以提高研究的客观性和可信度。其次,通过创建非遗双语平行语料库,获得较为完善和齐全的非遗双语语料,运用检索软件进行统计分析,以英国国家非遗文本为对比语料,对国内现有的非遗翻译质量进行评估,可以揭示非遗翻译现状及译名不统一的问题⑫。比如广东的西樵山是南粤名山,被翻译成“Xiqiao Mountain”“Xiqiao Mount”“Mount Xiqiao”“Xiqiaoshan Mountains”等多种译名,比较混乱。基于非遗双语平行语料,可以在比较并分析大量语料的基础上建设非遗翻译质量评价体系,最终提升非遗翻译质量。

(二)服务非遗活动多样化和立体化需求

广东省传统岭南文化旅游出现蓬勃发展的势头,新的旅游形态不断涌现,如《六祖大典》《醒狮》《佛山剪纸》《粤韵飞扬》等一批常态化的演出节目和“魔幻传奇”“天禅”“天地浪漫”等已经入选国家文化旅游重点项目名录。根据规划,到2025年,广东省将建成10个省级以上文化生态保护区,形成1至2个非遗传播品牌,社会广泛参与非遗保护传承的生动格局将基本形成⑬。这些新型的非遗资源和形态在对外宣传时,没有现成的英语翻译,通过对非遗旅游资源汉英平行语料库里丰富、规范的例句的分析整理,可以为宣传广东省创新的旅游形式提供规范的翻译参考,有利于生成规范译文,更好地服务于广东传统文化外宣工作。

(三)开展基于语料库的非遗翻译教学

可以将非遗汉英双语平行语料库应用于传统文化或旅游翻译教学中,一方面学生可以感受非遗传统文化魅力,并在非遗中汲取营养,从而增强学生的爱国情怀;另一方面,可以通过参与非遗旅游文本资料的回译实践,丰富学生的专业知识和翻译实践能力。通过在双语平行语料库的基础上搭建语料驱动的计算机辅助非遗教学模式,研究语料库与计算机辅助翻译技术在课堂翻译教学环节的应用。学生可以运用比较翻译教学法,基于语料库检索并比较多种译文,自主学习不同译法,还可以利用平行语料库检索软件ParaConc加载参考译文和全部学生的译文,进行检索和对比分析,发现同伴译文的亮点和不足,批判性评价并相互学习以树立信心,培养独立思考能力,以内在形成并建立翻译技巧图式⑭。非遗汉英平行语料库的创建,深化了广东省非遗主题语料库建设,有利于促进广东省非遗文本外宣工作,以更好地向世界呈现广东国家城市新形象和岭南传统文化。

(四)构建基于语料库辅助翻译的非遗术语库

2021年12月中旬,全国非遗名词委成立大会暨第一次工作会议在线上召开,为我国非遗专业术语的界定和发展奠定了基础。非遗术语是非遗领域的专有词或表达方式,非遗术语蕴含着丰富的中国传统哲学思想和文化特色,非遗术语的翻译一直未能实现规范化与标准化。受此影响,各国非遗研究一直缺乏有效沟通与交流。因此,其外宣翻译一直面临着巨大的挑战,这无疑阻碍着非遗外宣翻译的进程。

基于计算机辅助翻译的非遗术语可以为非遗术语对外传播提供良好的借鉴。对非遗平行语料库的双语进行多次校审,对误译、漏译的情况进行及时修订,之后可以转换为计算机辅助的翻译记忆库;然后利用翻译及术语管理工具——SDL Multi-term Extract 2011软件,根据选用的语料文本类型、规模设置相应参数,采用“自动提取+人工审查”的方式提取具有代表性的核心非遗术语,比如非遗名称、景点名称、地名和人名等,并对所提取出的术语进行人工筛选和审查,以确保术语的准确性,最终建成计算机辅助翻译非遗术语库。以广东为代表的地方性非遗术语库建设不仅有助于扩大广东非遗的外宣翻译效果,也能够为“中国特色话语对外翻译标准化术语库”建设带来一定的启示。

(五)服务于传统文化产业发展和民族文化传播

建立计算机辅助的非遗翻译术语库,可以推动非遗译名统一。通过软件检索非遗术语发现,译者在处理非遗文本中的文化因素时,若中文中的专有名词在英文中不存在相关表述,翻译时主要采用直译(音译)的方法⑮,同时补充相关信息,帮助英语读者理解;在翻译中文中特有的成语或叠词等表达时,可以主要采用归化的翻译方法,即使用意译、省译等方法,从而降低文本阅读的难度,使英语读者阅读起来更容易理解原文,可以更好地掌握非遗内涵,有利于非遗知识的传播。因此,基于平行语料库的非遗翻译研究可以服务于中国传统文化产业的发展和民族文化的对外传播。

结语

本文以对广东省非遗双语语料的研究分析及语料库建设为例探讨了非遗汉英双语平行语料库的创建,并对中英文本进行了比较分析,对非遗的十大类别子库的基本情况进行了介绍,可以为其他地方上的非遗文本的翻译提供有价值的参考。本研究创建的双语语料会随着非遗的不断更新而扩充。接下来的重点将在大量语料的基础上提取非遗术语,从而可以指导其他相关文本的翻译实践,同时可以进行更为深入的翻译方法和策略研究。在后续的研究中,可以逐步深入研究非遗平行语料,构建计算机辅助翻译记忆库及术语库,开展基于平行语料库及计算机辅助翻译的非遗翻译教学,促进非遗传统文化的翻译教学与研究。只有如此,才能真正将语料库技术应用于非遗文本的翻译工作中,确保非遗翻译的外宣效果,助力中国传统文化走出去。

本文为教育部人文社会科学研究规划基金项目“国家级非物质文化遗产英汉文本平行语料库的研制与应用研究”(项目编号:21YJA740016)、广州市哲学社科规划课题“广东省非物质文化遗产英汉文本平行语料库的研制与应用”(项目编号:2021GZGJ203)的阶段性研究成果。


作者简介:蒋丽平,广东机电职业技术学院外语商务学院副教授,主要研究方向为认知语言学、文化翻译、商务英语教学研究。

编辑:孙秋玲