3499拉斯维加斯官方网站
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 工业互联网促进煤炭领域新动能

    2026-06-11 11:35

    目前我国多数大型煤炭企业已经开始实施对于井下设备的自动化改造,网站开发智能化技术应用已从煤炭大型企业试点示范阶段向普及应用阶段延伸,智能化环节也已从最初的采掘生产延伸到选煤、煤化工、煤机制造

  • 在网站建设中我们应遵循哪些设计的原则

    2026-06-09 16:03

    网站建设设计虽然是一个发散性很强的工作,但是北京网站设计也是有需要注意的规则的,北京网站设计是我们在进行网站建设建设工作的时候一项很重要的工作。每一个设计师对网站的理解不一样,所以做出的设计

  • 常见的商城网站类型你了解吗 商城网站开发要素

    2026-05-29 17:42

    网上商城是一种为个人用户或者企业用户提供人性化的全方位服务的电子网站,在为网站开发用户创造亲切、轻松和愉悦的购物环境的同时,也在不断丰富人们的消费方式。小编依据商城网站的运营形式,给各位说说

  • 警惕某些“看新闻、视频”赚钱的APP,占便宜背后的套路

    2026-05-25 15:25

    在这个互联网时代,万物皆有互联网成为风口的可能性。但是,也不泛违规违法行为借壳上网。近期譬如火爆的移动端北京APP开发“看新闻、刷视频赚取现金”,看似艳丽的画皮之下却是吃相难看,动机不纯的“

  • 北京网站建设之企业站的几大必知要素

    2026-05-22 06:54

    随着互联网信息时代的不断更迭与升级,网站开发设计对于企业站来说,是一种比较常见的网站类型,也通用于各种行业,站如其名,企业网站开发的主要功能就是展示产品或者活动等元素,用户通过北京企业网站去

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-06-10 14:36
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。