查看 43 回复 1

[本站原创]AI智能提取视频硬字幕工具 - 从视频中提取字幕 将sup/sub+idx图形字幕中的字幕文本识别出来

[复制链接]
  • 打卡等级:热心大叔
  • 打卡总天数:135
  • 打卡月天数:3
  • 打卡总奖励:244
  • 最近打卡:2026-06-06 17:54:10

831

主题

119

回帖

5389

影币

YzYY工作组

积分
807

1周年纪念2周年纪念

发表于 2026-4-14 01:22:41|来自: | 显示全部楼层 |阅读模式
基本信息
软件版本(Software type): 免费正版(Free genuine version) 
界面语言(UI Language): 简体 
使用平台(Usage Platform): Windows, 
使用方式(Usage of software): 免安装(Installation-free)
资源体积(Size): (157MB)
网盘(Storage Network Drive): 115 123 百度 
分享说明(Say something): 已打通全家桶服务,支持一码多用,使用影币购买一次授权码,激活后就可以免费使用本站所有的字幕工具
AI 智能提取视频硬字幕工具
官方使用教程 · v2.4.1


开发者:慕静安 · 官方网站:http://bbs.yzyy.asia





一、软件简介与功能概览
AI 智能提取视频硬字幕工具 是一款专为视频字幕提取与转换设计的多功能工具。核心能力如下:

功能模块说明
视频硬字幕提取支持物理级丝滑拖拽,动态呼吸时间轴精准捕捉硬编码字幕
图形字幕拆解支持 SUP 与 IDX+SUB 格式多核并发极速解析,内置便携版 Java 劫持
离线/AI 双提纯v2.4重磅:新增纯本地零成本离线去重引擎,与大模型组合拳降维打击
AI OCR 识别内置防漏财缓存防御机制;独家“所见即所得”繁简死锁
字幕可视化编辑支持智能状态机音符、免死金牌锁定、时间轴精调、字号自适应放大
视频对轴预览内置 VLC 播放器,支持双击空降正中心,内置电影级提词器
多格式与网页导出支持 SRT、ASS、TXT,以及一键生成沉浸式 HTML 图文校对网页
授权一码全通一个授权码激活全站工具,纯绿色免安装,含自动热更新

二、首次使用:激活授权
授权说明

本软件提供 7天免费试用期,试用期内无需激活即可使用全部功能。到期后需购买授权码方可继续使用。

标题栏说明:
  • 试用期剩余 X 天 — 当前处于免费试用阶段
  • 授权仅剩 X 天,请尽快续费 — 授权即将到期(7 天内提醒)
  • 无提示 — 授权正常,无需操作


购买与激活步骤

第 1 步:打开软件,点击右上角 【设置】 按钮,选择 🔑 授权中心 标签页。
第 2 步:记录页面中显示的 本设备机器码(16位字符串)。每台设备的机器码唯一,不可跨设备使用。
第 3 步:点击 「🛒 点击此处使用积分购买授权码」 链接,在官方论坛完成购买。
第 4 步:将购买获得的 YZYY- 开头 授权码填入输入框,点击 💎 立即激活/续费
第 5 步:激活成功后,重启软件以刷新主界面状态。

注意:激活需要联网进行验证,请确保网络畅通。

三、配置 API 密钥
点击右上角 【设置】,打开 ⚙️ API 设置 标签页。

两种 OCR 引擎对比(建议主力使用千问)
引擎优势/劣势适用场景
阿里千问 VL优势:具备自然语言理解力,完美还原原始标点和空格。主力推荐!高精度要求的双语/特殊排版字幕
百度云 OCR劣势:因算法机制,极易吃掉用于断句的空格和微小标点。备用兜底,纯中文实心长句提取


填写完毕后点击 Save(保存),配置即时生效。

四、工作流程一:提取视频硬字幕
本流程适用于处理 硬编码字幕(字幕直接烧录在视频画面中)。

完整操作步骤

第 1 步 · 加载视频
无需繁琐找文件!直接将目标视频 拖拽 进软件黑框即可瞬间加载(支持视频与字幕同屏共存)。也可点击【加载视频】选择。

---

第 2 步 · 🎯 框选扫描区(必须)
点击 【🎯 框选扫描区】,在弹出的窗口中按住鼠标左键拖拽,框选字幕出现的区域。按 回车/空格 确认。
💡 提示:只需划定高度范围即可,宽度方向自动全屏。精确框选可显著提升速度和准确率!

---

第 3 步 · ⚙️ 极简物理引擎
选择抽帧模式:
  • 日常压制直接默认「平衡」。
  • 遇到极短闪现的极限字幕选「逐帧扫描」。

勾选 时段 并填写起止时间,可只扫描部分内容,大幅节省时间。

---

第 4 步 · 提取图片
点击蓝色 【提取图片】 开始扫描。
提取图片中.png

---

第 5 步 · 提纯去重(双轨制核心)
v2.4 提供了两种提纯方式,建议搭配使用:
  • 离线提纯(免费粗筛):调用本地引擎进行零成本去重。搭载“五连斩曝光+空间压缩+死缓判定”黑科技,能自动合并并清理大部分噪点,处理后标记为橙色的 `[待优化]`。
  • AI 提纯(土豪精细):呼叫云端大模型,去重极其精准,但消耗 Token。处理后打上绿色的 `[安全:已提纯]`。

多选删除冗余图片.gif
鼠标拖动批量选择.gif
合并重复字幕.gif
QQ20260415-131736.png
---

第 6 步 · 批量 OCR
点击绿色 【批量OCR】
✨ 防漏财机制: 如果您刚才使用了“AI提纯”,由于文字已在底层缓存,系统将直接秒出文字,绝对不会消耗二次 Token 费用!

五、工作流程二:处理图形字幕(SUP / IDX+SUB)
本流程适用于已有 图形字幕文件 的情况(如蓝光碟提取的 SUP、DVD 字幕 IDX+SUB)。

操作步骤

第 1 步:直接将 .sup 或 .idx/.sub 文件拖拽入软件,或者点击 【加载字幕】
(💡 蓝光 .sup 格式需要 Java 环境。软件已支持便携版劫持:只需在软件根目录建立一个 `java` 文件夹放入 JRE 即可,免除一切系统配置烦恼!)
第 2 步:多核涡轮狂飙,瞬间完成拆解并填满表格。
第 3 步:由于原盘字幕极度纯净,不需要提纯,直接点击 【批量OCR】 提取文字即可。

六、字幕表格编辑指南
双击自适应编辑
双击进入编辑模式。编辑框字体完美继承外部大小!输入 // 导出时会自动转换为换行符。

查找与替换
使用界面第二行的输入框,可快速查找错别字并一键 全部替换(v2.4 已支持对换行符的穿透查找)。

右键快捷菜单(全面支持键盘单键秒杀)
菜单项说明
➕ 插入新字幕 (&I)在选中行下方插入空白字幕行
🎯 OCR 选中行 (&R)仅对选中行执行重新识别
🛡️ 标记为安全 (&S)v2.4新增:颁发免死金牌,保护一闪而过的单字不被引擎误删
♪ 插入音符/双音符 (&N / &B)自带状态机防手抖,智能翻转补充音符
🔗 批量合并 (&M)合并多行文本,并智能保留鼠标当前所指那行的原图
🗑️ 批量删除 (&D)删除选中行

七、视频对轴与同步预览
软件内置高兼容 VLC 播放器(纯绿化免配置),实现丝滑对轴。

  • 狙击级双击空降: 双击表格任意行,视频将瞬间空降至该句字幕生命周期的最正中心(画面最清晰的一帧),百发百中!
  • 电影级提词器: 视频正下方配有巨大的黄色提词器,实时滚动显示当前台词。
  • 自动跟播联动: 视频播放时,命中的字幕行会被 蓝色高亮 并自动滚动到可视区正中间。

八、导出字幕与沉浸式图文包
字幕编辑完毕后,点击 【💾 导出字幕】软件会自动预填好视频所在目录与同名文件名!

格式说明
支持导出通用 SRT 字幕、带样式的 ASS 字幕纯文本 (TXT)。包含“等待AI”、“报错”的未处理行会被自动跳过。

🌟 重磅功能:沉浸式图文包网页
勾选 ☑ 附带图文包 导出后,双击生成的 HTML 网页,即可在浏览器中体验极致舒适的 “左边截图,右边文字” 沉浸式对照表,离开软件也能极其高效地抓出错别字!

九、常见问题 FAQ
Q1:“离线提纯”和“AI提纯”有什么区别?
“离线提纯”是完全免费的本地功能,能帮你省下大量 API 费用,处理后的图片仍需交给 AI 识别;“AI提纯”则调用云端大模型,去重极其精准且自带文字缓存,但会消耗 Token。建议:穷用离线,富用 AI。

Q2:为什么百度云 OCR 识别出来的中文句子,里面的空格全消失了?
这是百度 OCR 等传统基础视觉模型在中文训练集上的固有策略(默认中文排版不含空格)。如果您的字幕含有大量断句空格或特殊标点,强烈建议在设置中切换为「千问 VL-OCR 大模型」,它具备语言理解能力,能真正做到“所见即所得”的排版还原。

Q3:为什么拖入蓝光 .sup 字幕时,弹窗提示“缺少 Java 运行环境”?
本软件自带便携版劫持机制,只需前往官方下载纯净版的 Java 8 (JRE) 压缩包(约40MB),解压后重命名为 `java` 放入软件根目录即可,免除一切环境变量配置烦恼。

Q4:加载视频后右侧黑屏,点击没反应?
请绝对不要把 exe 单独拖到桌面上运行!软件必须和配套的 `_internal` 以及 `vlc` 文件夹待在同一个目录下。

十、更新日志 (v2.4.0 )
🚀 【零成本黑科技:本地离线提纯引擎】
1. 引入 Paddle 引擎作为离线替身,一键过滤绝大多数空白噪点,极大节约 API Token 费用。
2. 搭载史诗级“五连斩极限曝光 + 空间压缩术 + OpenCV线条密度死缓判定”底层核武器,面对“白底白字”或“间距隔着银河”的疑难字幕,宁可错留绝不漏删,容错率拉满!
3. 引入双轨智能匹配机制:短句严格保留标点绝对匹配,长句触发高宽容度模糊缝合,彻底终结残缺字导致的断轴。

🛡️ 【防漏财:免死金牌与缓存穿透防御】
1. 新增“免死金牌”机制:右键单行或多行可「标记为安全」,所有提纯引擎对其秋毫无犯,保护一闪而过的极速短台词。
2. 修复“二次计费”大坑:如果在提纯阶段使用了云端 AI,后续点击「批量 OCR」时,引擎会直接从底层提取缓存文字光速上屏,绝不重复发送 API 请求!
3. 赋予人工合并最高权限:用户手动「批量合并多行」后的空框,会自动获得绿色安全护盾,免遭后续引擎误杀。

【底层稳固:百度云 QPS 突破与体验修复】
1. 针对百度云免费账户严格的 QPS(并发) 限制,实装“动态车道+物理减速带”,彻底消灭大批量提取时的 `Error 18 (QPS Limit)` 报错!
2. 修复了搜索框无法使用 `//` 查找到底层换行字幕的视觉盲区 Bug。

十一、版权与免责声明
  • 本软件由 慕静安 独立开发,著作权归作者所有。
  • 软件使用阿里云 DashScope、百度云 OCR 接口,相关 API 费用由用户自行承担。
  • 本软件仅供个人学习与合法字幕整理用途,严禁用于任何商业侵权行为。
  • 使用本软件即视为同意上述条款;因使用本软件产生的一切法律问题由用户自行承担。

如有问题,请前往 http://bbs.yzyy.asia 发帖反馈,作者会及时响应。感谢支持!

十二、下载链接][/color

https://115cdn.com/s/swfxp7l335y?password=je44&#
AI双语字幕智能合并工具_v3.2.5.zip
访问码:je44


『来自123云盘用户的分享』AI双语字幕智能合并工具_v3.2.5.zip
链接:https://1831509670.share.123pan.cn/123pan/CJe6jv-frmhh?pwd=CVt2#
提取码:CVt2


通过网盘分享的文件:AI双语字幕智能合并工具_v3.2.5.zip
链接: https://pan.baidu.com/s/1_pZegSY37Gvpm8HaZ24x2Q?pwd=wgwn
提取码: wgwn

回复

使用道具 举报

  • 打卡等级:热心大叔
  • 打卡总天数:135
  • 打卡月天数:3
  • 打卡总奖励:244
  • 最近打卡:2026-06-06 17:54:10

831

主题

119

回帖

5389

影币

YzYY工作组

积分
807

1周年纪念2周年纪念

发表于 2026-4-25 15:32:36|来自: | 显示全部楼层
v3.2.5:
更新 AI 模型,全面支持 DeepSeek V4:
底层模型接口同步升级,现已全面对接 DeepSeek V4,推理能力与字幕合并质量显著提升。
回复 支持 反对

使用道具 举报

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

请文明上网,禁止在本站发表任何辱骂性文字。无论是谁的错,骂人的账号一律永久禁言,永不解禁。
娱乐至上,禁谈政治,违者同上。

精选推荐

关闭

站长推荐上一条 /1 下一条

1