开云

    咨询热线(xiàn):021-80392549

    开云 QQ在线(xiàn) 开云 企业(yè)微信
    开云
    开云 资讯 > 人工(gōng)智能(néng) > 正文

    人工智能Audeo能直观地识(shí)别(bié)出在无声的钢(gāng)琴演奏(zòu)视频中演奏的是哪首乐曲

    2021/02/07环(huán)球网1027

    想象一个计算机程序能够直观地识别出在无声的钢琴演奏视频(pín)中演奏的(de)是哪(nǎ)首乐曲,或(huò)许并不夸(kuā)张。然而,一个新的人工智能系统(tǒng)却更进一步,以数字(zì)方(fāng)式逼真地再现了钢琴演奏的声音(yīn)。


    这项技(jì)术(shù)被称为Audeo,由华盛顿大学的一个团队(duì)设计。研(yán)究人员(yuán)使用钢琴家保罗·巴顿的YouTube视频对系(xì)统进行了培(péi)训和测试。培训包括(kuò)约17.2万巴顿演奏(zòu)巴赫和莫扎特等著名古典作曲家(jiā)音(yīn)乐的视频帧。


    人(rén)工智能


    在分析一段无声视频时,所产生的系统首先会观察哪(nǎ)些键被按下的(de)顺(shùn)序,确定各(gè)个(gè)音(yīn)符及其排列方式。也就是(shì)说,它还能感知到每个键被击打(dǎ)的(de)力度和被按住(zhù)的时间--这让它能计(jì)算出每个音符的(de)强度,以(yǐ)及它在随后弹奏的(de)音符下面持续的时间长度。它还考虑到了钢琴(qín)独特(tè)的声学特性。然后(hòu),这些数(shù)据被转换为一种(zhǒng)可以被现有的(de)数字合成器理解的格式。据(jù)报道,当该合(hé)成器回(huí)放(fàng)音乐文件时,它听起来非常像原(yuán)始的钢琴音乐。


    在对Audeo的测试中,它的任务是根(gēn)据巴顿演奏的(de)静(jìng)音视频(pín)重现钢琴音乐,而不(bú)是系统所训练的音乐(lè)作品。当SoundHound等音乐识别应用分(fèn)析(xī)这些再(zài)现时,它们能够以大约86%的准(zhǔn)确率(lǜ)识(shí)别出(chū)乐曲。相比之下,当这(zhè)些应(yīng)用分析相同视频中(zhōng)的原始钢(gāng)琴音频(pín)时,其识别准确率攀升至93%。随着技术的进一步发展,这(zhè)种差距应该(gāi)会缩小。


    “我们希望我们的研究能够实现与音乐互动的新方法,”该研究(jiū)的高(gāo)级作者Eli Shlizerman副(fù)教授说。“例如,未来的一个(gè)应(yīng)用是,Audeo可以扩展到虚拟钢琴(qín),摄像头只记录一个人的(de)手。此外,通过将摄像(xiàng)头放在真实的钢琴之(zhī)上,Audeo有可能协助教(jiāo)学生(shēng)如何演奏的新方(fāng)法(fǎ)。”

    关键词: 人工智能




    AI人工智能网声明:

    凡资讯来源注明为其他媒体来源的信息,均为转(zhuǎn)载自其(qí)他媒体,并不代表本网站赞同其观点,也不代表(biǎo)本(běn)网站对其真实(shí)性负责。您若对该文章内容有任何疑问或质疑,请立即与网(wǎng)站(www.zhuzhou.jiaxing.zz.pingliang.ww38.viennacitytours.com)联系,本网站将(jiāng)迅速给您回应并(bìng)做(zuò)处理。


    联系电话:021-31666777   新闻、技术文章投稿QQ:3267146135   投稿邮箱:syy@gongboshi.com

    工博士人工智能网
    开云
    扫描二(èr)维码关(guān)注(zhù)微信
    扫码(mǎ)反馈

    扫一扫,反(fǎn)馈当前页面(miàn)

    咨询反馈
    扫码关(guān)注(zhù)

    微(wēi)信公(gōng)众号

    返(fǎn)回顶部

    开云

    开云

    相关信息

    "开云 开云咨询为企业提供一站式企业咨询服务。

    更新时间:2025-07-14 18:55 来源:zhuzhou.jiaxing.zz.pingliang.ww38.viennacitytours.com