G2 送审防注入自查

论文中是否无意/有意藏有针对 AI 盲审系统的提示词注入（白底白字、元数据、零宽字符等），送审前自查清理。

必须修改 2核查通过 1

必须修改建议修改提醒

必须修改 G2-001

全文嵌入 130 处 U+2060（WORD JOINER）隐藏字符，送审 PDF 必须清除

📍 位置参考文献全节（印刷 108–115，物理 p122–129）+ 作者简介·发表论文 [1][2][3]（印刷 118，物理 p132）

问题

送审 PDF 文本层中嵌入了 **130 个肉眼不可见的 U+2060（WORD JOINER / 词连接符）**。它们位于每条文献（及作者简介论文 [1][2][3]）末元素与其后英文句点之间（如「…61-72⁠.」「…106600⁠.」「…[S]⁠.」），PDF 渲染上完全看不出，但确实存在于字符流。逐页计数（印刷页）：p108=17、p109=18、p110=19、p111=16、p112=14、p113=14、p114=13、p115=13、p116=3、p118=3 → **合计 130**。

为什么是问题

现象——可见为「…106600.」，实际字符序列为「…106600⁠.」（中间夹 U+2060）；成因——集中在参考文献区：127 条文献几乎每条末尾句点前各 1 个（Zotero/CSL「中国农业大学（自然科学）」样式渲染产物），另 3 个在作者简介论文 [1][2][3]（para 978/979/980）。docx 正文 <w:t> 静态文本中 U+2060 **只有 3 个**（作者简介那 3 条），docx 的参考文献是一个**活动 Zotero 域**（ADDIN ZOTERO_BIBL … CSL_BIBLIOGRAPHY），WORD JOINER 不在静态文本里；但用 Acrobat PDFMaker **导出 PDF 时该域被压平为静态文本**，CSL 样式在每条末尾插入了 WORD JOINER → PDF 里变成 127+3=130 个。后果——① 属 G2「零宽/不可见字符」红线，盲审若用 AI 系统或字符级查重会检出隐藏字符并质疑「是否人为干扰检测系统」，即便本意无害也带来诚信嫌疑；② 知网/Turnitin 等查重切词时隐藏字符可能割裂字符串、造成异常匹配；③ 跨平台显示/检索时可能乱码。**口径澄清**：任务规定 PDF 优先，送审件（权威版）实际承载 **130 处**，必须按 130 处清理，不能只删作者简介可见的 3 处（docx 静态文本仅 3 处的口径只对 docx 正文成立，漏掉了 PDF 中参考文献区被压平产生的 127 处）。客观可检测（codepoint 存在性二值判定）。

修改建议

对**送审 PDF** 做一次全文零宽/不可见字符清理（搜索并删除 U+2060 及 U+200B/200C/200D/FEFF），可在导出后用工具批量删除，或在 Zotero 端换用不插入 WORD JOINER 的 CSL 样式后重新导出；删除作者简介论文 [1][2][3] 页码后的 U+2060（重打这三处页码与句点）；导出后再用工具复扫，确认 U+2060 计数为 0 再送审。

证据 / 原文锚点

PyMuPDF 文本层全 133 页扫描 U+2060 共 **130**；参考文献例「农业机械学报, 51(9):61-72⁠.」「Research, 252:106600⁠.」「NY/T 1628-2008, 玉米免耕播种机作业质量[S]⁠.」；作者简介例 docx para 978「…252: 106600⁠. (SCI, Q1…」、para 979「…243: 111376⁠.」、para 980「…18(5): 26-38⁠.」；docx 静态 <w:t> 内 U+2060=3（仅作者简介），参考文献为活动 Zotero 域；其他零宽/方向控制字符（U+200B/200C/200D/FEFF/202A–E）=0。

必须修改 G2-002

PDF/docx 元数据未净化：作者「yangdy」、标题为模板标题，残留 Zotero + KSO（WPS）痕迹

📍 位置文档元数据 | 全文档 | PDF /Info + XMP（xref 943）、docx core.xml/custom.xml

问题

送审 PDF 与源 docx 的元数据均未替换为本人/本论文信息，且残留两类第三方编辑器痕迹字段： - PDF /Info：Title=中国农业大学学位论文格式、书写要求（模板标题，非论文真实题名）、Author=yangdy（非本人陈飞）、Creator=Acrobat PDFMaker 25 Word 版、Producer=Adobe PDF Library 25.1.250。 - PDF XMP：dc:title=模板标题、dc:creator=yangdy；**KSO（金山 WPS）残留** pdfx:KSOProductBuildVer=2052-10.1.0.7400、pdfx:KSORubyTemplateID=6；**Zotero 残留** pdfx:ZOTERO_PREF_1/2（含 zotero-version="8.0.4"、style id「中国农业大学（自然科学）」、session id、prefs）。 - docx core.xml：<dc:title>中国农业大学学位论文格式、书写要求</dc:title>、<dc:creator>yangdy</dc:creator>、<cp:lastModifiedBy>CPLASF C</cp:lastModifiedBy>、revision=44。 - docx custom.xml：同样含 KSO 两字段 + Zotero（docx 中 zotero-version="9.0.4"、style id「中国农业大学」，与 PDF 的 8.0.4/自然科学略有版本差，说明 docx 与导出 PDF 来自不同 Zotero 状态）。

为什么是问题

现象——pdfinfo 显示 Title: 中国农业大学学位论文格式、书写要求、Author: yangdy、Creator: Acrobat PDFMaker 25 Word 版；后果——① G2 要求送审前清理元数据，避免泄露非本人信息、暴露模板来源与编辑链路；② /Author=「yangdy」非本人、/Title 仍是空白模板标题，属低级疏漏，盲审/归档系统会索引这些字段，一旦比对会质疑文档来源与真实作者；③ KSO/Zotero 残留虽不含恶意，但属「未净化的工具痕迹」，与隐藏字符（G2-001）同源（都指向 Zotero/WPS 工具链）。客观可检测（字段存在性二值判定）。

修改建议

Word/Acrobat 文档属性中将 Title 改为论文真实题名「坡地播深精准调控方法与装置研究」、Author 改为「陈飞」；清理 Subject/Keywords 及 KSORubyTemplateID/KSOProductBuildVer、ZOTERO_PREF_1/2 等自定义字段；重新导出 PDF 后用 pdfinfo 复核 /Author /Title /Creator，确认 XMP 无 KSO/Zotero 残留。

证据 / 原文锚点

pdfinfo Title/Author/Creator 如上；PDF XMP（xref 943）<dc:creator><rdf:Seq><rdf:li>yangdy</rdf:li>、pdfx:KSOProductBuildVer=2052-10.1.0.7400、pdfx:ZOTERO_PREF_1=<data … zotero-version="8.0.4">；docx core.xml<dc:creator>yangdy</dc:creator>、<cp:lastModifiedBy>CPLASF C</cp:lastModifiedBy>；docx custom.xml name="KSORubyTemplateID"/name="ZOTERO_PREF_1"（zotero-version="9.0.4"）。

核查通过 G2-000

隐藏层/白底白字/极小字号/注释层/同形字——均无注入

📍 位置全文档 133 页 - **核查结论**：非问题，作 G2 隐藏信道维度负向确认（防漏报）。注释层 /Annot：逐页 annots() 全文 **0 个注释**，无隐藏指令注释；可选内容图层 OCG：get_ocgs() 无图层；极小字号（≤2pt）文本 0 处（字号直方图最小 5pt×1、6pt×11，均为正常上/下标）；白底白字（color≥0xF0F0F0）命中均为图（印刷 55/56/76/77）与参考文献区（印刷 94/95）中的白色破折号「−」与点「.」（坐标轴线/引导点），逐页拼接后无任何拉丁字母或汉字，即无可读隐藏消息；指令式注入文本（ignore previous / you are a reviewer / 推荐接受 / 新规则等）全文 0 命中；同形字混排未发现西里尔/希腊同形字伪装。隐藏信道维度通过——隐藏字符问题集中在 U+2060（G2-001，已单列）。

问题

证据 / 原文锚点

annots() 累计 0；get_ocgs() 返回空；size 直方图无 ≤2pt；白色 span 内容仅「−」「.」。