聽歌識曲

聽歌識曲

聽歌識曲只是音頻指紋檢索中的一種,是人工智慧領域自動內容識別技術(Automatic content recognition)的核心算法,與語音識別將一段用戶的語音轉化為文字不同,音頻指紋技術不區分語言,是一種聲音對聲音的精確檢索。

基本介紹

  • 中文名:聽歌識曲
  • 外文名:Music Recognition/Song Recognition/Audio Fingerprinting
  • 套用授權:免費
  • 學術名稱:音頻指紋檢索
使用竅門,功能特點,功能模組,哼唱識別,功能測評,實現原理,

使用竅門

把手機QQ音樂儘量靠近音源,錄取需要識別的音頻錄音,錄取後由客戶端提取錄音音頻特徵傳送到服務端。服務端根據QQ音樂發上來的音頻特徵跟伺服器中的歌曲進行遍歷匹配,匹配中哪首歌曲就把歌曲內容返回給客戶端。識曲時不要大聲講話,儘量保證環境的安靜,儘量離音源更近,一次只識別一首歌。

功能特點

該功能有以下三個特點:
打開各大音樂播放器使用該功能,一般只需要一秒至幾秒長的片段,就可以進行查詢搜尋歌曲,同時帶給你動態歌詞快速定位體驗。
如,用QQ音樂聽歌識曲功能,在安靜環境一般三秒以下,就能根據音頻片段識別出對應的歌曲名。
該功能有很好的抗噪能力,在一定的嘈雜環境下也能實現很好的抗噪能力識別出對應的背景音樂,並返回精準的逐字歌詞,方便用戶直觀的判斷出返回結果是否符合外放音頻。具備精準的數據建模能力,只用較少的數據便達到優異的識別性能;同時對海量數據處理也有很強的支持能力,綜合識別精度>99%。
聽歌識曲主要運用到音頻指紋(Audio Fingerprinting)的算法來提取每首歌的指紋,建立歌曲指紋庫,當用戶通過錄音請求的時候,聽歌識曲會先對這段音樂提取其音頻指紋,再對該指紋進行比對匹配,找到多語言海量曲庫中匹配度最高的那首歌,算法和曲庫相輔相成。QQ音樂是目前國內識別率最高的音樂APP,能做到市面上99%以上播放的音頻都能搜尋到並返回給用戶。

功能模組

實時聽歌識曲:偶然聽到一首好聽的歌曲,打開聽歌識曲,最快1s就能識別周圍環境中的原唱音樂,並給出歌名和歌曲等相關信息,同時還能立即使歌詞同步當前音樂播放進度。
後台聽歌識曲,就是當你在一個APP中聽到好聽的背景音樂時,聽歌識曲可以在後台識別當前播放的歌曲。 以QQ音樂聽歌識曲為例,進入QQ音樂APP的聽歌識曲頁面後,退出至手機主頁進入其他APP(或直接切換至其他APP),就可以識別另一款APP中正在播放的音樂。
離線返回:當用戶進行識別曲目的時候,如果遇見無法識別成功的音樂或不在曲庫內的曲目時。程式會將音頻指紋信息傳送給雲端數據進行大數據擴展搜尋,找到相關曲目後會離線反饋給用戶所識別的內容。
小程式返回:為了方便用戶使用聽歌識曲功能,QQ音樂已提供小程式版本供廣大用戶選擇。

哼唱識別

與聽歌識曲相似的還有一個功能叫哼唱識別。同樣是以歌搜歌的功能,但區別於聽歌識曲,哼唱識別是指根據人聲的哼曲或清唱,識別出正在哼唱的是什麼歌曲,同樣的識別出來後可對該音頻進行播放、收藏等操作。

功能測評

國內支持「識曲」功能的音樂APP統共有7款,QQ音樂、酷狗音樂、酷我音樂、網易雲音樂、蝦米音樂、百度音樂、咪咕音樂,對這幾款音樂類APP聽歌識曲功能進行測試,測試方法為在封閉房間內,使用一台設備隨機播放電台歌曲,另一台設備依次打開APP進行識曲。
每個App可以對同一首歌有兩次辨識機會。從結果中已經可以看出,QQ音樂擁有最強的識曲能力,應對各種外文歌基本能做到一次識別成功。

實現原理

聽歌識曲,作為音頻信息檢索領域的一項重要課題,主流的歌曲識別技術主要運用到音頻指紋(Audio Fingerprinting)的算法來提取每首歌的指紋,建立歌曲指紋庫,當用戶通過錄音請求的時候,聽歌識曲會先對這段音樂提取其音頻指紋,再對該指紋進行比對匹配,找到資料庫中匹配度最高的那首歌。
聽歌識曲

相關詞條

熱門詞條

聯絡我們