5 Matching Annotations
  1. Jun 2025
    1. 能力 - 语音转写:支持OpenAI Whisper (本地 & 在线API) - 翻译: 未说明基于什么引擎实现

      问题: - 似乎不支持单独的【翻译字幕文件】任务

    1. 能力 - 语音转录: 基于whisper模型(可本地,也可用OpenAI Whisper API) - 字幕翻译: 支持ollama 和 LM Studio (其实是基于【兼容OpenAI API】设计的 https://chidiwilliams.github.io/buzz/zh/docs/usage/translations

      安装与部署: 基于python包 - 对MacOS和Windows均提供了一键安装包 - 对Linux提供了flatpak和snap包

    1. 👎 2024年12月后无更新了,估计作者已经弃坑

      功能: - 音频转写采用whisper模型 (基于python包openai-whisper实现,需要pytorch支持) - 翻译只支持Azure Translator API

      部署: 基于python 和 ffmpeg

    1. 能力: - 语音转录支持本地(WhisperCpp/FasterWhisper) 和在线(B接口/J接口??) - 字幕翻译支持传统引擎和LLM - 传统引擎: DeepL/微软/谷歌 - LLM: Ollama、DeepSeek、硅基流动以及【OpenAI兼容接口】 (配套提供LLM API中转站)

      安装部署 - Windows提供一键安装包 - MacOS需要自行基于python搭建,且作者说未验证过 👎 。另外本地 whisper 功能尚不支持macos)

  2. Mar 2023
    1. Whisper is a general-purpose speech recognition model. It is trained on a large dataset of diverse audio and is also a multi-task model that can perform multilingual speech recognition as well as speech translation and language identification.

      Whisper는 범용 음성 인식 모델입니다. 다양한 오디오의 대규모 데이터 세트를 학습하고 다국어 음성 인식, 음성 번역, 언어 식별을 수행할 수 있는 멀티태스킹 모델이기도 합니다.