Bili2text:轻松将Bilibili视频转换为文字的利器
Bili2text是一款专为Bilibili平台设计的视频转文字工具,利用OpenAI的Whisper模型,实现高清视频的音频提取和精准转录,让文字记录变得简单高效。
Bili2text概览
Bili2text是一款专为Bilibili平台设计的视频转文字工具,用户只需输入视频的AV号即可自动完成整条流程,省去手动下载与分割的麻烦。该工具依托OpenAI的Whisper模型,实现高清视频的音频提取和精准转录,将视频中的语音内容高效转换为可编辑的文本,用户无需手动配置任何参数,全流程无需手动干预,让文字记录变得行云流水般简单。

Bili2text核心功能一览
视频下载
- 基于FFmpeg的流媒体拉取能力,可绕过浏览器限制直接下载Bilibili视频文件
- 对多P、1080P+清晰度兼容良好,并可与you-get等下载器结合扩展格式支持。
音频提取与分割
- 下载完成后,脚本利用FFmpeg抽取纯音轨,避免图像数据占用磁盘。
- 为提升大文件处理效率,音轨会被切分为小段,再交由语音模型并行识别,节省显存与时间。
语音转文字
- 核心依赖OpenAI Whisper,多语言识别精度领先同类ASR模型。
- Whisper采用弱监督大规模数据训练,零样本场景下亦能保持稳定输出。
- 社区博主已实测将模型升级至whisper-large-v3,并提供GUI打包版本,易于上手。
Bili2text适用场景
- 内容创作者:快速获取视频脚本,方便剪辑、字幕校对或二创。
- 教育工作者:将课件视频转写成可搜索的讲义或笔记。
- 研究人员:批量抓取访谈、学术演讲音频并生成文本语料。
Bili2text使用方法
克隆仓库:

git clone https://github.com/lanbinshijie/bili2text.git cd bili2text
安装依赖:安装必要的Python库。

pip install -r requirements.txt
运行脚本:使用Python运行main.py脚本。
python main.py
在提示时输入Bilibili视频的av号。

使用UI界面:

python window.py
在弹出的窗口中输入视频链接,会自动转换为av号,点击下载视频按钮即可完成文件转换。
