文件脱敏工具

了解如何在上传前手动生成办公表格的脱敏下载文件。

文件脱敏工具用于减少敏感信息进入处理流程的风险。当前支持 CSV 和 XLSX 表格。

选择这类文件后,工具只把文件名、sheet 名和表头发给 AI 生成列建议。你确认列以后,浏览器会在本机生成脱敏文件并触发下载。原始文件和脱敏文件都不会因为使用这个工具而自动上传。

脱敏规则很直接:姓名、手机号、身份证号、银行卡号等隐私内容会替换成 姓名001手机号001 这类语义假名,金额、日期、部门、状态等业务字段会保留。需要让小悠处理时,请上传下载得到的脱敏文件。

先给结论

和当前对话无关的身份证号、手机号、银行卡号、邮箱、企业识别信息等内容,建议先手动移除;需要保留业务分析字段的表格,再用文件脱敏工具生成脱敏版后上传。

上传前原表

含敏感信息
姓名手机号身份证号金额张敏1380013800011010119900307888812800李雷139001390003101011988051266663650

小悠处理用表

占位符替换
姓名手机号身份证号金额姓名001手机号001身份证号00112800姓名002手机号002身份证号0023650
客户回款明细.redacted.xlsx已下载
AI 预选列后由用户复核,本机生成脱敏文件下载。

原始文件内容不会自动上传;文件名、sheet 名和表头只用于生成列建议。

脱敏文件只会下载到本机,不会自动加入工作区或改写聊天消息。

脱敏前后有什么变化

脱敏前,表格里可能直接出现客户姓名、手机号、身份证号等原始值。脱敏后,下载文件会把你选中的列替换成语义假名,例如 客户001手机号001,金额、日期、部门、状态等未选中的分析字段保持不变。

处理过程中你会看到几个状态:

  1. 正在分析表头:工具读取文件名、sheet 名和表头,并请求 AI 给出列建议。
  2. 复核列选择:你可以保留、取消或新增要脱敏的列。
  3. 已下载脱敏文件:浏览器本机生成文件并下载,不会自动加入文件列表。
  4. 处理失败:文件格式或表格结构不适合处理,需要你检查后重新选择。

后续对话不会自动改写你输入的原始姓名、手机号,也不会自动沿用某个文件夹里的占位符规则。需要保持一致时,请基于同一份脱敏后的文件继续处理。

常见可识别信息

  1. 手机号、邮箱地址。
  2. 身份证号、银行卡号。
  3. 企业统一社会信用代码、税号等企业标识。
  4. 常见账号、编号、密钥样式文本。
  5. 表格中疑似敏感的字段名和列内容。

需要你注意

脱敏依赖规则和模型判断,不应替代人工安全检查。隐藏列、批注、页脚、图片里的文字、扫描件和附件内容,都可能需要你提前检查。

涉密、极高敏感或有严格合规要求的文件,不建议直接上传给小悠处理。

处理建议

上传前检查

只交给小悠当前对话需要的内容

材料越干净,处理越清楚,也更容易复核。

先删除和当前对话无关的敏感列或附件。
上传前检查表格隐藏列、批注、页脚和图片里的敏感信息。
让小悠把不确定内容列成待确认清单。
正式发送前再人工复核一次结果文件。

失败或不确定怎么办

如果显示处理失败,先检查文件是否是 CSV/XLSX,是否能正常打开,表头是否清楚。仍然不确定时,先手动删除敏感列或复制一份只保留必要字段的表格,再上传给小悠处理。