起因是b站的一个网课视频没有字幕功能,3倍速有时候听不清

  1. 省心方案:百度云
    上传到百度云网盘在线观看,开svip享受ai字幕功能
    ae5e636b8b662fa37b878ca4b836c0a
    缺点:一天只能生成10次,导出的字幕为docx

  2. 使用openai的whisper跑本地模型
    用了桌面端Buzz,用Medium模型速度:15分钟视频需要10分钟
    注意模型移动到C:\Users\AppData\Local\Buzz\Buzz\Cache\models\whisper 或 C:/Users/.cache/whisper
    1f4f17de4b292f6a3437179e6f405e2

    https://www.bilibili.com/read/cv23995720/
    https://www.bilibili.com/video/BV15c411j789/?vd_source=2e2950ffb6b9eff2b1e600206af0494e
    https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672

  3. github上的VideoSrt,好用速度快,要用到阿里云oss和智能语音交互

    阿里云的语音识别试用期3个月,每天2小时额度。升级商用版则大约2.5rmb/h,略贵

    image-20241011010721492
    https://github.com/wxbool/video-srt-windows
    https://www.yuque.com/viggo-t7cdi/videosrt
    https://www.yuque.com/viggo-t7cdi/videosrt-pro

  4. 使用剪映或必剪
    剪映每月限9次(不过也许可以把所有视频剪一起再识别字幕?),可以单独导出字幕
    必剪不限,且速度极快,但不能单独导出字幕

  5. Win11自带ai字幕
    Win+Ctrl+L启动!
    很牛,识别很快,缺点是一旦高倍速就准确率下降,不如srt格式稳定
    38859291e4f5e365b770b9c5dcc6d51

    在知乎一堆广告中看到的有用的回答

    Snipaste_2024-10-10_20-37-04
    https://support.microsoft.com/zh-cn/windows/%E4%BD%BF%E7%94%A8%E5%AE%9E%E6%97%B6%E5%AD%97%E5%B9%95%E6%9B%B4%E5%A5%BD%E5%9C%B0%E4%BA%86%E8%A7%A3%E9%9F%B3%E9%A2%91-b52da59c-14b8-4031-aeeb-f6a47e6055df

  6. 通义——实时语音转文字

    没试,应该和5差不多,但是不如5方便且5不要钱
    https://tingwu.aliyun.com/home
    https://tongyi.aliyun.com/efficiency/

  7. 各种在线字幕生成工具(要钱太贵)
    https://www.zimujiang.com/aff?code=aannv4os

综上,本地阿里云是最好的,不着急量大本地,着急量小就阿里云或者剪映

额外:bilidown——b站视频音频下载工具,好用
https://zhouql.vip/bilibili/
https://zhouql.vip/bilibili/pc/


10.28更新

最终选择:阿里云

意外地发现升级商用版后购买的100元/40h的资源包可以用学生认证的300元代金券抵扣,刚好我代金券马上就要过期了还有280多,狂买2~3个,这下再也不用忍受自己电脑风扇呼呼转或者试用版每天2小时的小水管了。果然,用解决的效率是最高的(笑哭)

https://sspai.com/post/79977