识别图片、音频和视频

把截图、票据、白板照片、会议录音和视频材料转成可编辑内容。

小悠可以处理当前对话中的图片、截图、音频和视频材料。图片适合识别可见内容和提取文字;音频、视频适合先转写,再整理成纪要、摘要或待办。

上传材料

把文件按用途交代清楚

小悠会看文件内容,但你说明每个文件的作用,结果会更稳定。

项目会录音.m4a

小悠会先转成文字,再整理纪要。

白板照片.jpg

适合提取任务、负责人和时间。

参会人名单.md

帮助小悠判断说话人和负责人。

图片和截图

上传图片或截图后,可以让小悠识别画面、票据字段、白板事项或截图中的表格。需要文字时,直接说明“做 OCR,保留段落和低把握内容”。

常见材料包括票据凭证、表格截图、白板照片、纸质文件照片等。

录音和视频

录音和视频建议先转写成文字,再基于转写内容整理会议纪要、摘要、待办或问题清单。

如果有参会人名单、项目背景或重点关注事项,可以一并上传或写在需求里。说话人无法确认时,小悠会用编号或标为待确认,不应编造姓名。

如何提升识别准确性

图片尽量上传清晰原图,保证文字无遮挡、光线正常、画面不倾斜。

音频和视频尽量使用人声清晰、背景噪音较少的材料。需要逐字稿、摘要还是纪要,要在需求里写清楚。

不确定内容怎么处理

画面模糊、杂音较大、字迹潦草或无法判断的内容,小悠应标为待确认。

这类内容不要直接写入正式文件。建议你回看原始素材,补充或修正后再使用。具体能力可以看 OCR 识别整理录音和视频