VideoSrt简介
VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。基于Golang语言,使用lxn/walk Windows-GUI工具包开发的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。
VideoSrt具有易用的界面和多种强大功能,使其成为处理媒体字幕的理想选择。
VideoSrt需要注册阿里云账号,接入语音引擎,用于语音识别生成字幕文件(和Autosub-ahk功能一样,只不过Autosub-ahk接入的是Google Speech V2 API),也需要注册百度翻译开放平台账号或者腾讯云账号,接入翻译引擎,用于将英文字幕文件翻译为中文字幕文件,具体教程看GitHub简介
VideoSrt应用场景:
-
识别视频/音频的语音生成字幕文件(支持中英互译,双语字幕)
-
提取视频/音频的语音文本
-
批量翻译、过滤处理/编码SRT字幕文件
VideoSrt优势:
-
使用阿里云语音识别接口,准确度高,标准普通话/英语识别率95%以上
-
视频识别无需上传原视频,方便快速且节省时间
-
支持多任务多文件批量处理
-
支持视频、音频常见多种格式文件
-
支持同时输出字幕SRT文件、LRC文件、普通文本3种类型
-
支持语气词过滤、自定义文本过滤、正则过滤等,使软件生成的字幕更加精准
-
支持字幕中英互译、双语字幕输出,及日语、韩语、法语、德语、西班牙语、俄语、意大利语、泰语等
-
支持多翻译引擎(百度翻译、腾讯云翻译)
-
支持批量翻译、编码SRT字幕文件
一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。