1. 研究目的与意义
随着智能设备和网络应用的发展,每个人都有在网络上制作、分享和发布自己原创视屏的机会。对于视频的制作者来说,在视频中添加字幕是一个重要的环节,传统的手动添加字幕往往耗时耗力且效果欠佳,并且会遇到例如时间轴匹配困难、工作量大等问题;
另一方面,对于视频观看者来说,并非其获取的所有视频资源都配有合适的字幕;特别是对于部分外文视频资源,字幕可以更好地帮助观看者理解视频内容;
另外,字幕可以满足听障等特殊人群和特殊场合的收视需求。
2. 研究内容和预期目标
视频字幕自动生成系统的设计与实现
字幕的类型主要包括直接融合在视频图像画面中的内嵌型字幕和以srt文件存储在外部的外挂型字幕文件;本系统利用现有的语音识别、文字翻译API进行整合,将提取出的字幕以srt文件格式存储,并允许用户检查微调字幕的内容与外观格式。
3. 国内外研究现状
Google的实时字幕 (Live Caption) 的新功能。它内置在Android Q中, 可以将手机上播放的音频实时转化为字幕, 适用于播客、视频网站、语音消息和本地拍摄视频等场景;语音识别的技术已相对成熟,苹果公司加大对 iWatch 的研发投入,一时间穿戴式语音交互设备成为了新热点,语音识别在移动终端上的应用也非常广泛,语音对话机器人、语音助手等层出不穷。
国内有部分视频剪辑软件提供字幕生成功能,例如会声会影等,可以在线实现字幕的挂载,但此功能需要支付会员费才能使用,并且转换速度相对较慢,适合于大体量的视频剪辑工作,对于视频的观看者并不具备简单易操作的字幕生成功能。
4. 计划与进度安排
计划从以下5个方面逐个突破,完成相应功能的同时撰写对应的模块报告。
1、分离、识别语音信息,并完成有效的句子分段;
2、利用第三方API完成声音与文字的转换;
5. 参考文献
[1]司玉景,潘接林,颜永红,高杰.基于在线语音流的字幕自动生成系统算法研究与实现[J].网络新媒体技术,2013,2(04):52-54.
[2]郑李磊,谢磊,芦咪咪,王晓暄,杨玉莲,张艳宁.全自动中文新闻字幕生成系统的设计与实现[J].电子学报,2011,39(S1):69-74.
[3]胡中毓.一种通过语音识别和音频分割来自动生成字幕的解决方案[J].数码世界,2019(10):30.
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。