SCI Figure Captioner
概述
用于根据用户提供的 SCI 插图生成或润色图注,默认输出中英双语(中文在前、英文在后),并采用严格面板化写法。输入中图像为必需项,代码与数据为强烈建议项;若证据不完整,必须显式声明缺失信息,不得编造。
工作流
- 执行输入完整性检查:确认图像可读、是否存在多面板标记、是否提供代码/数据/统计信息。
- 执行证据绑定:将图像中的可见事实与代码、数据、方法学、统计描述逐项对齐。
- 选择模板并生成中英双语图注:按照面板顺序逐条描述。
- 执行质控闸门:检查统计、单位、缩写、方法一致性及中英语义对齐。
- 输出四段式结果:中文图注、英文图注、缺失信息与假设、质控清单。
第一步:输入完整性检查(图像必需)
- 必须确认
figure_image已提供;未提供时中止正文生成,仅返回缺失清单与补充要求。 - 检查是否有面板标签(如 A/B/C),若没有,则默认按“从左到右、从上到下”推断面板顺序。
- 检查建议输入:
figure_code、source_data、stats_info、methods_context、panel_map。 - 对输入可用性分级:
- 最小可用:仅图像。
- 推荐可用:图像 + 至少一项证据(代码/数据/统计/方法)。
- 高质量可用:图像 + 代码 + 数据 + 统计 + 面板映射。
第二步:证据绑定(图像-代码-数据-统计)
- 先抽取图像事实:图类型、组别、时间点、趋势、面板结构、可见标注。
- 再绑定外部证据:
- 用
figure_code绑定绘图逻辑(坐标含义、误差线类型、分组规则)。 - 用
source_data绑定数值范围、样本量定义、单位。 - 用
stats_info绑定统计检验名称、多重校正、显著性阈值、P 值表达方式。 - 用
methods_context绑定实验条件(处理条件、染色方式、放大倍数、比例尺等)。
- 发现冲突时,优先保留“可证实事实”,并在“缺失信息与假设声明”中标明冲突点。
第三步:按面板生成中英双语图注
- 强制使用面板化结构:总述句 +
(A) (B) (C)...分面板说明。 - 中文与英文必须逐项镜像:每个面板的核心事实、统计信息、单位、缩写含义保持一致。
- 缩写规则:首次出现必须释义(中文和英文分别首现释义)。
- 统计规则:仅可写入已提供或可证实的统计信息;缺失则写“未提供/待补充”。
- 必须增加“图像意义句”:用 1 句话明确“本图旨在说明什么科学问题/科学意义”,并避免超出证据范围的因果推断。
- 英文部分必须提供与中文“图像意义句”语义等价的对应句。
- 若用户指定期刊风格,保留上述硬规则前提下再做语气和格式微调。
- 模板选择:
- 多面板图优先使用
references/caption-template.md的模板 A。 - 单面板定量图优先使用模板 B。
- 显微图(染色/比例尺/代表图)优先使用模板 C。
第四步:质控闸门(输出前必检)
输出前必须依据 references/quality-checklist.md 逐项检查,至少覆盖:
- 面板覆盖完整性。
- 统计信息一致性(检验、阈值、符号)。
- 缩写首现释义。
- 单位、比例尺、误差线定义。
n的统计对象定义(生物学重复/技术重复/样本数)。- 中英语义一致性。
- 与方法学描述一致性。
- 已包含“图像意义句”,且未超出可证据支持的结论强度。
任一关键项不通过时,允许输出“可发布草稿”但必须在“缺失信息与假设声明”中注明风险。
强制输出格式
默认输出2个markdown文件:
SCI_figure_caption.md:包含第一部分(中文图注)和第二部分(英文图注)。SCI_figure_caption_QC.md:包含第三部分(缺失信息与假设声明)和第四部分(质控清单结果)。
具体格式如下所示:
按以下四段顺序输出,不得缺段:
第一部分:中文图注(面板化)
- 先写图总体说明。
- 增加 1 句“图像意义句”:明确本图针对的科学问题或科学意义。
- 再按
(A) (B) (C)...分面板描述。 - 包含已知统计与缩写释义。
第二部分:English Figure Legend
- 与中文逐项对齐。
- 包含与中文“图像意义句”对应的英文句子。
- 面板顺序与事实点一一对应。
第三部分:缺失信息与假设声明
- 列出待补充字段。
- 列出使用的推断(如无标签时的面板顺序推断)。
- 列出证据冲突点(如有)。
第四部分:质控清单结果
- 使用“通过/不通过 + 备注”逐项列出。
失败模式与安全降级
- 禁止编造以下信息:
n、统计检验、P值、单位、比例尺、处理条件、显微参数。 - 证据不足时执行安全降级:
- 仍输出结构完整的双语图注草稿。
- 将无法确认的事实改为中性表述。
- 在第三部分显式列出待补充字段。
- 无面板标签时:
- 采用“从左到右、从上到下”临时编号。
- 在第三部分明确声明该编号为推断。
- 若图像质量不足(模糊、遮挡、无法辨认):
- 不输出具体数值和因果结论。
- 只输出可见描述 + 缺失项请求。