译者
四步精翻工作流,产出出版级翻译:分析 → 初译 → 审校 → 终稿。
用法
/translate [--from <lang>] [--to <lang>] [--audience <audience>] [--style <style>] [--glossary <file>] <source>
<source>:文件路径、URL,或直接在对话中贴入文章正文--from:源语言(省略则自动检测)--to:目标语言(默认zh-CN)--audience:目标读者(默认general)--style:翻译风格(默认auto)--glossary:额外术语表文件,与内置术语表合并- 支持语言对:
ZH↔EN、ZH↔JA - 不支持:
EN↔JA直译
读者预设
| 值 | 说明 | 效果 |
|---|------|------|
| general | 普通读者(默认) | 平实语言,术语多加译注 |
| technical | 开发者/工程师 | 常见技术术语少加注释 |
| academic | 研究者/学者 | 正式语域,术语精确 |
| business | 商务人士 | 商务友好,解释技术概念 |
也接受自定义描述,如 --audience "对 AI 感兴趣的普通读者"。
风格预设
| 值 | 说明 |
|---|------|
| auto | 根据分析阶段识别的原文口吻自动匹配翻译风格(默认) |
| storytelling | 叙事流畅,过渡自然,措辞生动 |
| formal | 专业严谨,结构清晰,无口语化 |
| technical | 精确简洁,术语密集,少修饰 |
| literal | 贴近原文结构,最少重组 |
| academic | 学术严谨,复杂从句可接受 |
| business | 简洁结果导向,行动化 |
| humorous | 保留并适配幽默 |
| conversational | 口语化,亲切随和 |
| elegant | 文学性,韵律考究,字斟句酌 |
也接受自定义描述,如 --style "诗意而抒情"。
工作流
第一步:准备
- 根据语言对加载内置术语表:
- ZH→EN / EN→ZH:references/glossary-en-zh.md
- ZH→JA / JA→ZH:references/glossary-zh-ja.md
- 当中日文本中混有英文技术术语、产品名或缩写时,可额外参照 references/glossary-en-ja.md
- 如有
--glossary文件,合并(CLI 优先覆盖内置) - 物化源内容:
- 文件路径:直接读取使用
- URL:优先使用
curl -L请求https://r.jina.ai/http://<url>获取正文 Markdown,保存到translate/{slug}.md- 不要优先使用
urllib之类的默认 HTTP 客户端;这类实现更容易遇到403或被目标侧拦截 - 若返回缺少正文、只拿到导航/摘要、被 paywall 截断、或请求失败,立即停止流程
- 停止时明确告诉用户:当前 URL 无法稳定抓到完整正文,请用户自行下载、复制或粘贴原文后再翻译
- 不允许在正文缺失时继续分析、概括或翻译
- 不要优先使用
- 对话中贴入的正文:直接使用,无需保存文件
- 创建临时工作目录用于中间文件(最终会清理)
- 自动检测源语言(除非指定
--from)
第二步:深度分析 → 01-analysis.md
翻译前深入分析源材料,聚焦直接影响翻译质量的维度。
2.1 概要
3-5 句话概括:内容主题、核心论点、最有价值的观点。
2.2 核心内容
- 核心论点:一句话总结
- 关键概念:作者使用了哪些关键概念?如何定义?
- 结构:论证如何展开?各部分如何衔接?
- 论据:使用了哪些具体例子、数据或权威引用?
2.3 背景语境
- 作者:谁?背景和立场?
- 写作语境:回应什么现象、趋势或争论?
- 目的:试图解决什么问题?影响谁?
- 隐含假设:论证背后有哪些未明说的前提?
2.4 术语提取
- 列出所有技术术语、专有名词、品牌名、缩写
- 与已加载术语表交叉比对
- 不在术语表中的术语,查找标准译法
- 记录到工作术语表
2.5 语气与风格
- 原文是正式还是口语化?
- 是否使用幽默、隐喻或文化典故?
- 考虑目标读者,翻译应采用什么语域?
- 若目标语言为日语,必须在分析阶段先锁定文体:
敬体(です・ます)或常体(だ・である)二选一,并说明选择依据。默认规则:评论、分析、技术文章、博客正文优先常体;面向读者的说明、公告、邮件、FAQ、客服式文本优先敬体。除引语、UI 固有文案、引用原文片段外,正文不得混用
2.6 读者理解障碍
识别目标读者可能遇到困难的地方(根据目标受众校准):
- 领域术语:缺乏广为人知的译法,或直译无意义
- 文化典故:源文化特有的习语、历史事件、流行文化
- 隐含知识:原作者假设读者具备但目标读者可能缺乏的背景
- 文字游戏与隐喻:跨语言无法直接传递的修辞
- 命名概念:有专门名称的理论、效应(如"梳头效应"、"邓宁-克鲁格效应")
- 中国特有名词:平台、App、机构、政策、文化概念等在英语或日语读者中未必熟悉的专名;中译英/中译日时通常保留原名词,并在括号内补一条目标语言简注
每个障碍记录:原文术语/段落 → 为何可能困惑 → 简明通俗解释(用作译注)。若是中译英/中译日中的中国特有名词,可直接记录为:原名词 → 为何陌生 → 目标语言简注。
2.7 修辞与隐喻映射
识别源文中所有隐喻、明喻、习语和修辞表达。逐一分析:
- 原文表达:原句
- 意图含义:作者真正想传达什么
- 直译风险:逐字翻译是否会不自然、丢失内涵或困惑读者?
- 目标语言策略:
- 意译:放弃源语言意象,用目标语言自然表达传达原意
- 替换:用目标语言中传达相同含义和情感效果的习语/意象替代
- 保留:原意象在目标语言中同样有效,保留
同时标记:
- 词语选择中的情感内涵:如"alarming"不仅是客观描述,还传达主观感受——记录需保留的情感效果
- 言外之意:表面简单但含义更丰富的句子——记录作者真正想说什么
2.8 结构与创意挑战
- 需要重组的复杂句式(长从句、嵌套修饰语、分词短语)
- 不可译的结构挑战(双关、歧义)
- 需要创意适配的作者声音或幽默
保存 01-analysis.md,结构:
## 概要
[3-5 句]
## 核心内容
核心论点:[一句话]
关键概念:[列表]
结构:[大纲]
## 背景语境
作者:[谁,背景,立场]
写作语境:[回应什么]
目的:[目标和受众]
隐含假设:[未明说的前提]
## 术语表
[术语 → 译法, ...]
## 语气与风格
[评估]
[若目标语言为日语,额外记录:文体(敬体/常体)、选择依据、允许例外]
## 读者理解障碍
- [术语/段落] → [为何困惑] → [建议译注]
- ...
## 修辞与隐喻映射
- [原文表达] → [意图含义] → [策略:意译/替换/保留] → [建议译法]
- ...
## 结构与创意挑战
[句式重组需求、双关、创意适配需求]
第三步:组装翻译提示 → 02-prompt.md
读取 01-analysis.md,组装完整翻译提示。将风格指令、内容背景、合并术语表、理解障碍内联到提示中。
风格推导
auto模式(默认):从01-analysis.md的"语气与风格"章节提取原文口吻特征,将其直接转化为翻译风格指令。不套用预设模板,而是用具体描述告诉译者"原文是什么口吻,翻译应保持什么口吻"。例如:原文分析为"轻松口语化,频繁使用第一人称和反问句",则风格指令为"保持轻松口语化的语气,延续第一人称叙述和反问句式,译文应读起来像一篇自然的中文随笔而非正式文章"- 显式指定风格(如
--style formal):使用对应预设描述,覆盖原文口吻 - 若目标语言为日语,无论
auto还是显式风格,都必须把分析阶段选定的文体(敬体或常体)写入提示,并要求正文全文保持一致
提示模板见 references/subagent-prompt-template.md。
此提示用于 subagent(分块时)或主 agent 自身(不分块时)。
第四步:初译 → 03-draft.md
长文本分块处理
估算字数。若超过 4000 词:
- 按 markdown 块边界拆分,每块不超过 5000 词
- 保持标题、段落、列表、代码块等结构完整
- 为每个 chunk 创建一个 subagent,全部并行执行
- 每个 subagent 读取
02-prompt.md获取共享上下文,翻译其 chunk - 所有 subagent 完成后,按顺序合并为
03-draft.md - 接缝检查(合并后立即执行):
- 可选译注去重:每个 subagent 独立工作,可能会对同一术语重复加注。合并后扫描全文,只保留真正有助于理解的首次注释;后续重复且不再提供新信息的注释删除
- 语气连贯性:检查 chunk 边界处前后段落的语气、文体是否一致,修正突兀的风格跳变
- 日文文体统一:若目标语言为日语,逐段检查 chunk 边界与全文句尾,确保敬体/常体一致;除引语、UI 固有文案、引用原文片段外不得切换
- 上下文指代:检查跨 chunk 边界的指代词("前面提到的"、"上述"、"如前所述"等),确认指代目标在译文中确实存在且可被读者定位
短文本
直接翻译,保存为 03-draft.md。
翻译原则(所有翻译必须遵守)
- 原文至上:翻译必须基于原文逐段逐句进行,严禁总结、概括、压缩或改写原文内容。不得省略句子或用自己的话重述。段落可以根据标点与分段优化规则重新拆分(允许比原文多分段),但不得合并原文的多个段落为一段。原文的所有标题必须保留,不得省略或合并。如果通过 URL 抓取的内容与原文有出入(被摘要化、截断、付费墙拦截或改写),必须直接停止并要求用户提供完整正文,不得基于残缺内容继续翻译
- 准确第一:事实、数据、逻辑必须与原文完全一致
- 达意而非逐字:翻译作者的意思,而非字面。当直译不自然或无法传达效果时,自由重组以地道目标语言表达相同含义
- 修辞处理:按意图含义理解隐喻、习语和修辞表达。当源语言意象在目标语言中不具备相同内涵时,用传达相同含义和情感效果的自然表达替代。参照第二步的修辞映射
- 情感保真:保留用词的情感内涵,而非仅字典释义。带有主观感受的词(如"alarming"、"haunting")应在目标语言中唤起相同反应
- 自然流畅:使用地道的目标语言语序和句式;当源语言结构在目标语言中不自然时,自由断句或重组
- 日文文体锁定:若目标语言为日语,动笔前先确定敬体或常体。正文叙述、解释、过渡和结论统一使用同一套终止形;仅引语、UI 固有文案、引用原文片段等明确例外可保留不同语体
- 术语一致:优先使用标准译法;仅在首次出现且确实有助于目标读者理解、消歧或检索时,才在译文后括注原文
- 中国特有名词注释:当翻译成英文或日文时,若遇到目标读者可能不熟悉的中国特有平台、产品、机构或文化名词,优先保留原名词,并在首次出现时紧跟目标语言简注。格式:
原名词(target-language explanation)。例如:小红书(a Chinese lifestyle and social commerce platform)、小红书(中国のライフスタイル共有・ECプラットフォーム) - 保留格式:保持所有 markdown 格式(标题、粗体、斜体、图片、链接、代码块)
- Frontmatter 转换:若源文有 YAML frontmatter,保留并做以下变更:(1) 描述源文章的元数据字段加
source前缀(camelCase):url→sourceUrl、title→sourceTitle等;(2) 翻译文本字段值,作为新顶层字段添加;(3) 其他字段保持原样,适当翻译值 - 尊重原文:保持原意和意图;不添加、删除或评论——但句式和意象可自由适配以服务于含义
- 译注:仅在缺少注释会妨碍理解时,为术语、概念或文化典故添加简明解释。常规格式:
译文(原文,通俗解释);若保留原名词本身,使用原名词(target-language explanation)。根据目标受众校准注释深度:普通读者可适度加注,技术/学术/商务读者默认少注或不注。短文本(< 5 句)进一步减少注释,不过度教学化
第五步:批判审校 → 04-critique.md
主 agent 对照原文批判审校初译。此步只产出诊断,不改写。
5.1 准确性与完整性
- 结构对比:统计原文与译文的标题数、段落数。若译文标题数少于原文,或段落数显著少于原文(差异超过 20%),标记为遗漏风险,逐一排查
- 逐段对照原文,逐句比较
- 核实所有事实、数字、日期、专有名词
- 标记任何意外添加、删除或篡改的内容
- 检查术语是否全文一致使用术语表
- 确认无遗漏段落或章节
5.2 翻译腔诊断(按目标语言)
英文目标语言:
- 直译句法:保留中文/日文题述结构、话题先行结构或过度前置状语,导致英文不自然
- 冠词与限定词缺失:
a/an/the、this/that、some/these 等使用不当,暴露源语言迁移痕迹 - 介词与搭配生硬:逐字映射中文/日文搭配,形成非地道英文表达
- 名词化过重:本可用动词推进的句子被写成僵硬抽象名词链
- 指代不清:中文省略主语或日文省略照应直接搬到英文,导致 referent 模糊
- 语域不稳:在自然英文里应简洁处写得过分书面,或在正式文本中过度口语化
- 信息流不顺:句子旧信息/新信息顺序不符合英文读者预期,读起来别扭
中文目标语言:
- 多余连接词:过度使用因此/然而/此外/另外,上下文已暗示关系时不需要
- 被动语态滥用:过多被/由/受到,主动语态更自然时
- 名词堆砌:长修饰链应拆为短句
- 分裂句:从英语"It is...that"硬搬的不自然"是...的"结构
- 过度名词化:动词或形容词更自然时使用抽象名词(如"进行了讨论"→"讨论了")
- 代词冗余:可省略时过度使用他/她/它/我们/你
日文目标语言:
- 敬体/常体混用:正文叙述在
です・ます与だ・である之间来回切换,破坏专业感与连贯性 - 终止形漂移:小标题后的首句、补充说明、总结句或 chunk 接缝处忽然换成另一套句尾
- 片假名过多:可用和语或汉语表达的概念不必要地使用片假名外来语
- 主语过剩:日文常省略主语,过度保留英文的主语结构会不自然
- 被动形滥用:英文被动语态直译为「〜される」,主动表达更自然时
- 名词修饰语连锁:英文的长前置修饰直译不自然,应拆分为后置修饰或独立句
- 不自然的连接词:「しかしながら」「それゆえ」等硬连接词多用,上下文已明确关系时应省略
- 翻译调语序:保持英文语序的不自然日语,应重组为自然语序
5.3 修辞与情感保真
- 对照
01-analysis.md的隐喻映射:所有标记的隐喻/习语是否按建议策略(意译/替换/保留)处理? - 标记直译后不自然或丢失原意的隐喻或修辞表达
- 检查情感内涵:源文中带主观感受的词是否在译文中唤起相同反应,还是被扁平化为中性/客观描述?
- 标记丢失的言外之意:因译者过于贴近表面含义而未传达作者深层意图的句子
5.4 策略执行
02-prompt.md中的翻译策略是否被实际遵循?- 分析中识别的语气和语域是否被应用?
01-analysis.md中的理解障碍是否以适当译注处理?- 术语是否一致使用?
5.5 表达与逻辑
- 标记读起来像"翻译腔"的句子——不自然的语序、硬搬、僵硬措辞
- 检查句间和段间逻辑流
- 识别重组可提升可读性的地方
- 指出遗漏目标语言习惯表达的地方
5.6 译注质量
- 注释是否准确、简洁、确实有帮助?
- 识别遗漏的需要注释的理解障碍
- 检查中译英/中译日中的中国特有名词是否在首次出现时得到足够简明的目标语言解释
- 标记对目标受众显而易见的术语的过度注释
- 检查文化典故是否在需要时得到解释
5.7 文化适配
- 隐喻和习语在目标语言中是否有效?
- 是否有在目标文化中可能困惑或冒犯的引用?
- 是否有因文化语境差异可能被误解的段落?
保存 04-critique.md,结构:
## 准确性与完整性
- [问题]:[位置] — [描述]
## 翻译腔问题
- [问题类型]:[初译示例] → [建议修正]
## 修辞与情感保真
- [直译隐喻]:[原文] → [初译] → [建议意译]
- [扁平化情感]:[原文词/短语] → [初译] → [如何恢复情感效果]
## 策略执行
- [策略]:[遵循/遗漏] — [详情]
## 表达与逻辑
- [位置]:[问题] → [建议]
## 译注
- [添加/删除/修改]:[术语] — [原因]
## 文化适配
- [问题]:[描述] — [建议]
## 总结
[整体评估:X 个关键问题,Y 个改进,Z 个小建议]
第六步:终稿
根据 04-critique.md 的所有发现,对 03-draft.md 进行修订与润色,一步到位产出出版级译文。读取初译和审校发现,也可回溯源文和 01-analysis.md:
- 修正所有审校发现的准确性问题
- 将翻译腔表达改写为自然的目标语言模式
- 按隐喻映射重新意译直译的隐喻和修辞表达
- 恢复被扁平化的情感内涵
- 应用遗漏的翻译策略
- 重组僵硬或别扭的句子以提升流畅度
- 按审校建议添加、删除或修改译注
- 改善段落间过渡
- 按建议适配文化典故
- 若目标语言为日文,逐段扫描句尾与判断句,确认敬体/常体与分析阶段锁定的文体一致,修正局部漂移
- 通读全文——作为独立作品是否流畅自然?
- 确保叙事声音全文一致,一致应用所选翻译风格
- 最终扫描:任何仍读起来像"翻译"而非"写作"的表达都应重铸为自然的目标语言表达
- 全文术语一致性最终检查
- 验证格式正确保留(标题、粗体、链接、代码块)
- 段落与节奏:
- 以目标语言的自然行文为准,不机械照搬源文句法,也不为了形式要求强行拆成单句段
- 仅在可读性显著提升时拆段或断句;每段应服务一个清晰层次或动作
- 中文目标语言使用规范全角中文标点,日文目标语言使用标准日文标点,英文目标语言使用标准英文标点
第七步:输出
默认输出
- 默认直接输出最终译文正文,不额外添加"原文:"头部、导读或编者说明
- 仅当用户明确要求发布版包装(如"加原文链接"、"写一段导读"、"做成译介稿")时,才在正文前附加这些信息
输出格式
根据译文内容自动选择输出格式:
- 含 markdown 格式的内容(标题、粗体、链接、代码块、列表等):用 markdown 代码块包裹输出,让用户可以直接复制源码:
```markdown
{译文内容}
```
- 纯文本内容(无 markdown 格式标记):直接输出,无需代码块包裹
判断依据:译文中是否包含 #、**、[]() 、`、- 等 markdown 语法。只要存在任何 markdown 格式标记,就用代码块包裹。
默认行为:直接输出
默认将最终译文输出到对话中(不写文件)。翻译过程中产生的所有中间文件(01-analysis.md、02-prompt.md、03-draft.md、04-critique.md、chunks/ 目录)在输出前全部删除,临时工作目录也一并删除。
写入文件模式
仅当用户明确要求写入文件时(如"保存到文件"、"写成文件"、"输出到文件"),才将最终译文保存为 translation.md。此时同样删除所有中间文件,输出目录中只保留 translation.md。
图片语言检查
翻译完成后,做轻量级图片语言检查:
- 收集译文中的图片引用
- 识别可能含大量文字的图片(封面、截图、图表、框架图、信息图)
- 若图片主要文字语言与译文语言不匹配,主动提醒用户
- 提醒仅列出清单,不自动本地化图片
提醒格式:
可能需要图片本地化:
- :可能仍含源语言文字
- :文字密集的框架图,检查标签是否需要翻译
摘要
**翻译完成**(精翻模式)
源文件:{source-path}
语言:{from} → {to}
应用术语:{count} 条
若写入文件模式,摘要中额外显示:
输出文件:{output-dir}/translation.md
若发现图片语言不匹配,在摘要后附上提醒清单。