《人工智能应用基础》教材配套应用合集
登录
搜索
全部
视觉应用
语音应用
机器学习与深度学习
API 调用
AI工具集
智能硬件
阅读材料
音频文件语音识别工具
上传音频文件,使用AI模型将其内容转换为文字
🎵
拖拽音频文件到此处或点击上传
支持 MP3, WAV, M4A, OGG 格式,最大 50MB
✕
识别设置
识别语言
中文
English
日本语
한국어
自动检测
模型大小
Tiny (39MB, 快速)
Base (74MB, 推荐)
Small (244MB, 精确)
输出格式
纯文本
SRT字幕
VTT字幕
JSON详细
显示时间戳
🔍
开始识别
⏹️
取消
📥
下载结果
🗑️
清除
准备就绪,请上传音频文件
准备中...
0%
AI模型状态
模型:
未加载
状态:
待加载
大小:
--
0%
识别结果
文本
时间轴
原始数据
识别结果将显示在这里...
📋
复制文本
💾
导出字幕
🔗
分享结果
使用提示
支持常见音频格式:MP3, WAV, M4A, OGG等
建议文件大小不超过50MB,时长不超过30分钟
清晰的录音质量能显著提高识别准确率
首次使用需要下载AI模型,请保持网络连接
技术说明
使用 Whisper 进行语音识别
支持多种语言和方言识别
处理在服务器端进行,保护隐私
需要稳定的网络连接
© 2025 人工智能应用基础教材配套应用合集. All rights reserved.