一款基于AI大模型的视频翻译和配音工具,软件集音视频翻译、配音、语音克隆于一身,支持横竖屏格式输出,确保在大部分主流平台(哔哩哔哩,小红书,抖音,视频号,快手,YouTube,TikTok等)都能奏效。
注意:需要在本地配置模型,或者配置OpenAI/Whisper/阿里云的API Key。
主要特点和功能:
🎯 一键开始:无需复杂的环境配置,自动依赖安装,即刻使用,全新桌面版本,更易上手!
📥 视频采集:支持 yt-dlp 下载或本地文件上传
📜 精准识别:基于 Whisper 的高精度语音识别
🧠 智能分割:使用 LLM 进行字幕分割和对齐
🔄 术语替换:专业词汇一键替换
🌍 专业翻译:带上下文的 LLM 翻译以保持自然语义
🎙️ 语音克隆:提供来自 CosyVoice 或自定义语音克隆的选定语音音调
🎬 视频合成:自动处理横向和纵向视频以及字幕布局
💻 跨平台:支持 Windows、Linux、macOS,提供桌面和服务器版本
效果演示
下图是导入 46 分钟的本地视频后生成的字幕文件,并一键执行后生成的字幕文件的效果,无需任何手动调整。没有遗漏或重叠,分割自然,翻译质量非常高。
支持的语音识别服务
下表所有本地模型都支持可执行文件 + 模型文件的自动安装;你只需要选择,Klic 会为你准备一切。
| 服务来源 | 支持的平台 | 模型选项 | 本地/云 | 言论 |
|---|---|---|---|---|
| OpenAI 耳语 | 所有平台 | – | 云 | 速度快,效果好 |
| 更快的耳语 | Windows/Linux作系统 | tiny/medium/large-v2(推荐培养基+) |
当地 | 更快的速度,无云服务成本 |
| WhisperKit | macOS(仅限 M 系列) | large-v2 |
当地 | Apple 芯片的原生优化 |
| 耳语Cpp | 所有平台 | large-v2 |
当地 | 支持所有平台 |
| 阿里云 ASR | 所有平台 | – | 云 | 避免中国大陆的网络问题 |
🚀 大型语言模型支持
✅ 兼容所有符合 OpenAI API 规范的云/本地大语言模型服务,包括但不限于:
- 开放人工智能
- 双子座
- 深度seek
- 同义千文
- 本地部署的开源模型
- 其他兼容 OpenAI 格式的 API 服务
【项目地址】
https://github.com/krillinai/KlicStudio
