支持从“文件”选择音频(m4a、mp3、wav 等),自动提取音轨进行识别。
接入阿里云 DashScope / Fun‑ASR 服务,长音频稳定识别;也可根据需要替换/扩展其他引擎。
自动识别多语言语音内容,支持长时段转录,并保留时间信息以便对照与定位。
一键复制转录文本,支持分享、导出,便于在文档、社媒或二次编辑中使用。
对初稿进行 DeepSeek LLM 润色,提高可读性,保留语义与关键信息。
仅在用户主动转录时将音频提供给云端;可使用私有 OSS 配置并通过签名 URL 访问。
在应用中选择本地音频文件。
点击开始,云端完成识别;长音频也可稳定处理。
复制文本或分享导出;如需,可启用文本润色以提升可读性。
提示:Fun‑ASR 录音文件识别需要公网或 OSS 可访问的 URL;本地文件需先上传后再发起转录。
常见音频:m4a、mp3、wav 等;自动提取音轨后再转录。
支持。云端识别能够稳定处理较长音频,并自动识别多语言内容。
仅在您主动发起转录时,音频才会通过配置的云端服务进行识别。若使用 OSS 私有存储,将以签名 URL 方式限时访问。
不是。DeepSeek 润色是可选项,您可在未配置密钥时直接使用原始转录结果。