人工智能软件唇语解读对电视嘉宾 准确率约为唇语专家4倍

资料图片
将电视机调成“静音”模式后,人工软件你能“看懂”主持人说的智能专话吗?在这个情景之内,你或许感觉这是唇语唇语一个游戏,但“唇读”已伴随人工智能越来越精准。解读
据BBC报道,对电谷歌最近与英国牛津大学合作开发了一套唇读软件,视嘉通过收看数千小时BBC的宾准倍电视节目来开启唇读功能。令人震惊的确率是,该软件不仅掌握了唇语,人工软件还比唇读专家做得好。智能专
此前,唇语唇语英国皇家检察院雇佣“读唇女王”杰西卡·里斯为英国唯一的解读官方唇读证人,根据英国警方用监控摄像机偷拍下来的对电嫌犯录像,用唇读翻译出录像带中嫌犯的视嘉对话,提供至关紧要的宾准倍证据。她熟练高超的唇读技术,让人很难发现她是一名耳聋者。
值得一提的是,谷歌的人工智能唇读软件,学习了BBC一系列的电视节目,所有视频资料加起来约有11.8 万句话,经过了约5000小时的训练,便迅速掌握了唇读技能。研究人员用人工智能软件对电视节目嘉宾进行唇语解读,准确率为46.8%,而专业的唇语专家在接受同样的测试时,准确率仅为12.4%。
无独有偶,牛津大学的另一独立小组也于不久前开发了一款类似的人工智能唇读软件,在测试中达到了93.4%的准确率,而人类的准确率仅为52.3%。但该测试所用的材料均为志愿者事先录制好的固定句子,没有任何复杂的事件背景可言。以测试视频当中的单词为例,这款类似的人工智能唇读的软件中有51个特殊词汇,而此次谷歌选取的BBC节目数据库却包含了惊人的17500个特殊词汇。在没有任何背景介绍的情况下直接对BBC节目的嘉宾进行唇语解读,如果完全采用人工,工作量之大无法想象,因此对于人工智能而言是一个巨大的挑战。
为了避免视频流与音频流不同步的障碍,团队采取了让计算机先学会完全同步的音视频流,掌握发音与唇形间的关联,进而自行推断音视频流中哪些画面是不同步的,再进行自动修正。
来自牛津大学里普耐特研究团队的阿萨埃尔对此技术的评价是:“我们相信人工智能唇读技术是一种非常实用的辅助性技术,比如更智能的助听器。此外,人工智能技术还可应用于外交、破案等领域,甚至可能在普及之后改变人们的生活。
人工智能业内专家称:“这绝对是建构全自动唇读系统的第一步!现有的各类庞大数据库完全可以支持深度学习技术的发展。”
相关文章
- 艰深质料98例睫毛浓密短小者,其中男50例,女48例,年纪18-40岁,对于LAVER莱薇尔睫毛滋润液妨碍运用跟踪。运用措施天天早中晚三次,右眼外用LAVER莱薇尔睫毛滋润液,涂抹睫毛根部,跟踪试用12025-04-09
- AC米兰俱乐部控股公司菲宁维斯特Fininvest)民间宣告宣告收到了中欧体育8500万欧元的订金AC米兰俱乐部控股公司菲宁维斯特Fininvest)民间宣告宣告收到了中欧体育8500万欧元的订金。菲2025-04-09
- 服饰买手以及时尚编纂服饰买手有睁开远景吗)源头:时尚服饰网浏览:1298服饰妄想行业的替换品有哪些跟服饰相关的行业良多,制作加工,销售搜罗物流等。可是思考到你不是这个业余,以是建议你仍是兢兢业业的从下2025-04-09
- 基因组17q12缺失是一个重大的疾病,治疗措施需要凭证患者的详细情景妨碍总体化拟订。针对于患者泛起的详细症状,好比肾脏下场或者糖尿病,可能接管响应的治疗措施,这可能搜罗药物治疗、手术干涉、饮食规画等,2025-04-09
- 为了可能在相助强烈的手机市场中取患上一部份分额,海信抉择了另辟蹊径,以护眼的水墨屏为重点,将墨水屏与手机散漫,给用户带来如纸质书般的浏览体验。而克日海信旗下的A5 Pro CC版就已经上架,并将在5月2025-04-09
- 位于晋东板块——晋江国内鞋纺城一期)商业中轴名目,已经开工位于晋东板块——晋江国内鞋纺城一期)商业中轴名目,已经开工。名目总修筑面积7.27万㎡,接管双面沿街的措施,分说都市中2025-04-09
最新评论