识别图片、音频和视频
把截图、票据、白板照片、会议录音和视频材料转成可编辑内容。
小悠可以处理当前对话中的图片、截图、音频和视频材料。图片适合识别可见内容和提取文字;音频、视频适合先转写,再整理成纪要、摘要或待办。
上传材料
把文件按用途交代清楚
小悠会看文件内容,但你说明每个文件的作用,结果会更稳定。
项目会录音.m4a
小悠会先转成文字,再整理纪要。
白板照片.jpg
适合提取任务、负责人和时间。
参会人名单.md
帮助小悠判断说话人和负责人。
图片和截图
上传图片或截图后,可以让小悠识别画面、票据字段、白板事项或截图中的表格。需要文字时,直接说明“做 OCR,保留段落和低把握内容”。
常见材料包括票据凭证、表格截图、白板照片、纸质文件照片等。
录音和视频
录音和视频建议先转写成文字,再基于转写内容整理会议纪要、摘要、待办或问题清单。
如果有参会人名单、项目背景或重点关注事项,可以一并上传或写在需求里。说话人无法确认时,小悠会用编号或标为待确认,不应编造姓名。
如何提升识别准确性
图片尽量上传清晰原图,保证文字无遮挡、光线正常、画面不倾斜。
音频和视频尽量使用人声清晰、背景噪音较少的材料。需要逐字稿、摘要还是纪要,要在需求里写清楚。
不确定内容怎么处理
画面模糊、杂音较大、字迹潦草或无法判断的内容,小悠应标为待确认。
这类内容不要直接写入正式文件。建议你回看原始素材,补充或修正后再使用。具体能力可以看 OCR 识别 和 整理录音和视频。