Using a laptop for complicated computations

ChatGPT 的优势和不足是什么,为什么说它有可能颠覆本地化行业

Lionbridge 对这一新技术的看法以及挖掘其全部潜力的后续行动

自 2022 年 11 月 30 日推出之后,ChatGPT 迅速进入主流,引起了前所未有的关注和广泛讨论。与 ChatGPT 交谈数日后,笔者总结出了以下几个个人认为非常重要的问题:

  • ChatGPT 有何优势?

  • 有何不足?

  • 有何用途?

想了解这些问题的答案以及笔者对这个全新本地化工具发展前景的看法吗?请继续阅读。我们还将发布一份篇幅更长的白皮书,详细探讨这一话题。

ChatGPT 有何不足?

以下是 ChatGPT 的局限所在:

  1. 所言非实。ChatGPT 会根据自己已掌握的信息和人们的指令讲述内容,而不保证内容的正确性。

  2. 对现实世界一无所知。ChatGPT 对世界的认知全部来源于人们对现实世界的描述,而这并非世界的真实全貌。它会运用这些信息创作非常令人信服的文字,以此展示所学到的内容。

  3. 数学不好。Jonas Degrave 在 Engraved 发表了他让 ChatGPT 进行的模拟,笔者尝试运用更复杂的计算再现此模拟,但得到的结果有误。它确实能正确地尝试将 Python 命令中的两个数字相乘,知道如何模拟,这一点非常了不起。但它就是算不对。

  4. 无法思考。如果笔者提出某个要求,ChatGPT 的回复通常会列出一些准确的前提条件和正确的陈述,但之后在实际应用中却错误百出,尽管如此,它却显得信心十足。从根本上来说,它不会推理;它并非一台有限状态机。

  5. 它看似谦虚,实则自吹自擂,这种表现着实让人尴尬。ChatGPT 字里行间透露出自专自得、骄傲自负,却会不好意思地告诉您它的文字仅供参考,还会在您告诉它做错了时愧疚地道歉。
The vast scope of human intelligence and reasoning

ChatGPT 的优势是什么

在了解了 ChatGPT 的局限性后,让我们看看它作为文本解释器和生成器可以发挥怎样的作用。ChatGPT 可以做到:

  • 在文笔上超越人类。在与 ChatGPT 进行了多次对话后,笔者对这一点深信不疑。它词汇量丰富,可以进行不同难度的写作。在笔者看来,这种生成式人工智能 (AI) 的写作水平超过百分之九十的内容撰稿人

  • 遵照指示。它能以指定的方式出色地修改文本的形式和内容。重要的是,它的回答不会脱离交流语境,即使您以最白话的方式沟通,只要您提到了它之前执行过的任务,它就能理解您的意思。

  • 在保留语义的前提下修改措辞。ChatGPT 可以遵照指示,对任何文本的内容、形式和风格作出修改。它能保留语义,或者根据您的要求对其进行修改。

  • 管理多语言术语,这克服了本地化的一大难题。此工具大规模地应用于翻译是否现实,这一点笔者尚不清楚。但在编辑已经过翻译的材料时,ChatGPT 使用特定术语的效果不错。

  • 检测冒犯性内容。笔者向 ChatGPT 提供了一份含种族主义和恐同内容的诉状节选(摘自联邦刑事案件),然后要求它识别冒犯性内容。它表现得十分出色,而且能够解释出原因。

  • 实体检测。笔者要求 ChatGPT 执行一个常规的实体检测,并标记实体。其中一些它没能检测出来。但在几番提示之下,它还是做到了轻松标记实体。

  • 事物分类。ChatGPT 能够在具体情况中运用常识,这真是超出人们的想象。

我们已经确定 ChatGPT 的回答不一定是真的,也不一定是对的。(这意味着内容创作者必须进行检查,避免它胡言乱语。)但是,如果文本的含义没有问题,ChatGPT 就可以在保留语义的前提下,转换措辞、形式和内容。这对本地化服务提供商来说是个机会,因为我们不必从头开始围绕中心主旨撰写内容。让我们详细了解一下本地化的情况以及 ChatGPT 对我们如今的工作有何影响。这一生成式 AI:

  • 非常善于翻译。与那些先进的翻译引擎直接生成的机器翻译译文相比,只要一种语言有大型语料库,ChatGPT 就算无法在某些方面更胜一筹,也可以说是平分秋色。

  • ChatGPT 似乎能够很好地遵循术语要求。

  • 可以大范围或小范围地应用风格要求。相比之下,机器翻译引擎反而难以完成这类任务。

  • 非常善于将事物(尤其是文本)以各种标准进行分类。这一功能对本地化行业十分有帮助,因为我们可能希望让不同类型的内容遵循不同的要求。

  • 擅长编辑既有文本,这对于高品质本地化服务至关重要。它非常擅长审校和翻译文本的四个主要步骤。

  • 有助于分析内容,分析文本以进行有效处理,做出改进,或提高投资回报率 (ROI)。它可以帮助预测或预防翻译质量问题,提高译文效果,如提升覆盖面、搜索引擎优化 (SEO)、CTA/CTR 表现,以及改善源文本和目标文本的可读性等。

  • 帮助正确编写和编辑代码。资深程序员对于 ChatGPT 能否达到他们的水准意见不一,从实际情况来看,它确实也没达到。但是,当笔者要求它编写一些提取 XML 内容的代码时,它的确生成了可以运行的有效代码。它能够帮助非码农用户更轻松地编写(以及学习编写)代码。

ChatGPT 的出现让我们需要具备新技能并采取新做法

笔者逐渐开始摸索出了 ChatGPT 需要什么样的提示才能更好运作。这种特殊技术仅可理解自然语言。因此,要在生产中使用这项技术,我们需要培养能够提供有效提示的专业人士。如果需要其按照特定规范转换内容,就要给予一系列提示,每个提示将执行不同的任务,包括清理、预处理和后处理等。提示既要符合上下文,又要获得预期的成果,学习在自动化流程中使用这种自然语言提示,将是一种有趣的体验。

The nuances of digital tools

我们该何去何从呢?

现在有一点十分明确,那就是这种生成式 AI 不容忽视。它很可能会颠覆我们的行业。因此,我们必须引领并推动语言自动化的发展,以免被甩在后面。ChatGPT 可以转换文本并为其注释,质量比肩普通编辑人员,甚至效率更高。它可以完成需要具备众多技能才能完成的任务,而人类几乎不可能一人兼备如此之多的技能;它还可以归纳知识并运用到新场景中。

重要的是,它展现出了解决一些问题的潜力,这些问题一直是本地化自动化领域的痛点。当然,使用简单示例与它进行对话是一回事,大规模使用它来完成上述工作是另一回事。为继续发展,我们必须:

  • 大规模执行实际测试,评估上文探讨的各项本地化和编辑任务的错误率。

  • 详细分析本地化价值链中的宏观和微观用户旅程,确定此类文本自动化可能会在哪些方面有所颠覆。

  • 了解如何大规模为 ChatGPT 提供提示和相关语境,记录风险和优秀实践。

  • 开发包含自动化和人工参与的新编辑工作流程,探索这样的 AI 参与流程会对译后编辑和 QA 的未来有何影响。

  • 为本地化从业者和客户设计新的自动化和用户体验 (UX) 交互环境,抓住一切机会予以改进。

  • 确保许可证、部署成本和维护的经济效益对业务有益。

关于语言和实际使用 Chat GPT 的一些想法

在进行复杂的数字运算时,ChatGPT 得出的结果总是与正确答案擦肩而过,这让笔者感到十分震惊。它不偷懒,而是实实在在地从训练它的语言中应学尽学。如果运算数量级较小,则其结果正确;但如果超过了某个数量级,则总是与正确结果失之交臂 — 这一事实告诉我们,首先语言语料库的规模必须够大,其次必须包含有关现实世界的海量知识。此外,这也表明,需要专门的正式知识体系(如数学),才能生成符合现实世界、有意义且准确可靠的信息。

ChatGPT 提醒我们,如果一个系统自成一体,既不参考也不参照外部信息,这样的系统仅凭其自身,是无法真实准确地了解世界的,这值得人们深省。这符合哥德尔的不完备性定理。形式和物质系统是我们认识现实世界的基础,人类虽然具有主观意识,但我们的认知却无法脱离形式和物质,我们也无法抛开现实仅凭语言来做出任何定义。

联系我们

您有翻译或本地化项目吗?需要确保内容表达准确、交付速度快、成本效益高?我们可以运用类似 ChatGPT 的创新生成式 AI 为您提供帮助。立即联系我们,详细了解 Lionbridge 的翻译与本地化服务

linkedin sharing button

Vincent Henderson,语言服务产品总监
作者
Vincent Henderson,语言服务产品总监
  • #technology
  • #blog_posts
  • #translation_localization