这是高翻考研发出的第491篇文章
如果你问我,如果某一天真的要终结翻译全行业,那么最后倒下的是什么类型的翻译?我可能会回答道,是文学翻译;再准确一点,可能是文学翻译里的英译汉。
英译汉的难点,并不只是英文本身难以理解。事实上,对英文的理解,超过很多英语专业的人,而且它在经人纠错之后,能持续改进对原文的理解。对于AI而言,更难的其实是中文。中文为什么难?看一下的回答就知道了:
学习中文是一项复杂的任务,要求模型具备许多不同的能力,包括语法理解、语义理解、知识表示和语境判断等。由于中文的多义性和灵活性,模型很难在不同的语境中进行正确的判断和回答。
另外,训练数据也是一个重要的问题。中文语料库相对较小,且数据质量可能不如英文语料库。因此,模型很难从数据中学习到足够的信息,从而表现出较高的准确率。
最后,语言模型的复杂度也是一个问题。语言模型随着模型大小的增加而变得更复杂,因此训练和评估模型的代价也随之增加。这对于中文语言模型的训练和评估来说尤其困难。
因此,即使是强大的语言模型,学习中文仍然是一个挑战。然而,随着技术的不断提高和语料库的不断扩大,未来中文语言模型的性能有望得到提高。
不外乎三大问题:语言本身;语料库;语言模型。
看来,我们人类不仅要帮助三体人解决“三体问题”,还要帮助解决“三语问题”。
英语句子的语法逻辑更强。经过一番实验,大家会发现,当做英文句子改写的时候,很少出错。但如果你给一段混乱的中文,它可能很难改得那么好。
按照这个逻辑,如果让做英译汉,而英文本身在直译之后,不能变成简明通顺的中文,那么就很难借助自己的能力继续优化中文译文。
恰好,文学文本很多时候是不那么能直译的。这里所说的文学文本,并非严格意义上的纯文学文本,而是泛指广义上具有文学性质的文本。
我们最近的复试冬训营笔译练习有这么一段内容,讨论的是内地县城春节街市的盛况。原文选自The ,文章开头具有较为浓重的文学色彩。要翻译的内容并不多,只有三句话。
A mood of pent-up can be felt in , a along a busy in the south of Henan, a poor .(1)On a , a red , the new-year that will soon hang above and to side of front doors, for good and . (2) Other hawk red , worn for luck. (3) There is food in : for the and that mark this most of , and that were by curbs and for three years. and wide-eyed boxes of tiny , of and pigs’ heads,
对于而言,虽然只是三句话,但要踩的坑其实并不少。
(1)On a ,① a ② red , ③the new-year ④that will soon hang above and to side of front doors, ⑤ for good and .
这句话里,①描摹的是现实场景,容易处理;②是a 的修饰成分,很好理解;③④⑤是-year 的修饰成分,也好理解。
但由于这句话既包含现实场景(卖春联、贴春联),又包含春联的定义、内容和寓意,如果直译,会很容易栽跟头。
(2)Other hawk red , worn for luck.
这句话好理解,但写成中文,不好连缀。连缀的难点,是语句要通顺自然,就像和邻居聊家长里短。
(3) ⑥There is food in : ⑦ for the and ⑧that mark this most of , and ⑨that were by curbs and for three years.
这句话与第一句类似,既包含现实场景(⑥),包含没直接体现在街市,但正在发生的事实(⑦),也包含团聚的意义(⑧),以及过去的情形(⑨)。尤其是冒号这个标点,再加上修饰成分不少,要素过多,AI有点难顶。
直接看的翻译结果。
的译文
上面译文里的问题,很容易看出来。例如,“销售红色春联”的逻辑主语错了;第 (1) 句话的翻译,也许应该分成两句;第 (2) 句话可以接受,但不够地道;第 (3) 句话形式上被原文带偏了,很难说是合格的中文。
我们提供的原创参考译文是:
最近一个工作日,当地人挤满了卖红色春联的街市。这些春联是一种新年标语,用诗意的对句来憧憬健康好运,很快便会张贴在正门上方和两侧。还有商贩叫卖的是红色内衣,穿在身上,图个吉利。街市上食品丰富,源源不断地供应给返乡团聚的人们。春节是一年里最重要的节日,但过去的三年里出行受限、封锁不断,大家很难吃上团圆饭。
原文的第 (1) 句,翻译成中文,被拆成了两句,先讲卖春联的街市,再用“这些”连缀现实与概念,道出春联为何物。这样可以避免一句话太长,内容过杂。
原文第 (2) 句的worn for luck,地道的翻译有很多,也可以是“穿在身上,讨个好彩头”或“穿身上能讨个好彩头”,全看各位喜好。
原文第(3) 句,翻译时不应拘泥于原有结构,可以按照时间顺序重述,先说现在,再说过去。 for the and 这个表述很有意思,我们在翻译的时候,考虑到过去、现在都需要提到“团聚”“吃团圆饭”,显得重复,于是就把这一层意思分成了两次去说——先说现在“返乡团聚的人们”,再说前几年“大家很难吃上团圆饭”。
以上所有这些思考和改动,都让中文读起来更像中文。
我们绝不是要苛责的翻译能力,毕竟它本就不是专为翻译而生。当被问到“Is for ?”这一问题时,的回答(以及对应的中文翻译)是:
No, is not for . It is a AI model that has been on a large of text data from the to human-like text. , it can be used for , but there are out there for this task.
不, 不是专门设计用于翻译的。它是一种会话型 AI 语言模型,已在互联网上的大量文本数据上进行了训练,以生成类似人类的文本。然而,它可以用于机器翻译,但有更好的模型专门用于此任务。
也就是说,可以帮你翻译,但它不是专为翻译而生。
其实,文学翻译英译汉一直是机器翻译的短板。我们又用DeepL翻译了一下这段话,得到的结果如下。
DeepL的译文
所以,我们是否可以说,不是自己不行,而是机器翻译本来就不能胜任文学翻译的任务。
好消息是,我们这些翻译人还能抗一抗;坏消息是,文学翻译的报酬真不算高……
好吧,不开玩笑了。写这篇文章,其实也算是再鼓舞一下士气,不要因为机器翻译演进了,就觉得翻译工作马上要消亡了。中文这块儿,一时半会儿不会被AI攻下,大家平时也多培养一下语感,即便以后汉译英做不过AI,英译汉总比AI多一点优势。
其实,最难受的不是在座的各位,而是林纾同学啊。一百二十多年前,他要是能有这样的翻译工具,估计早就把外国文学全搬到中国的图书馆里了。■
前文:
推荐:
作者/胡学长
翻译小组 /萝北学长
喵学姐
胡学长️
配图/Pedro
胡学长团队出品
上车上车!
初试与复试
数据与分析
资讯与闲聊