鳥類錄音的管理、編輯與上傳(1/2)
圖、文/洪貫捷、曾奕晴 【中華飛羽300期】
當前,我們有eBird Macaulay Library (eBird ML)與 xeno-canto (XC)兩大鳥類聲音資料庫,可以很容易的查詢想知道的鳥類聲音,但除了成為資料庫的使用者外,我們也能夠對資料庫的內容做出貢獻、成為鳥音資料的提供者。
拜科技所賜,目前數位錄音的門檻已經大大降低,最低成本的錄音機就是大家都有的智慧型手機,配合適當的應用軟體即可錄得鳥類聲音。若再配合外接麥克風(如Rode Videomic系列)就可以較低的成本提高錄音品質,紀錄鳥音再也沒有像以前那麼困難。但錄音和拍照或者錄影一樣,在野外獲得的資料也必須經過系統性的整理才能夠成為有用的資訊,這篇文章,我們就要討論如何管理與編輯野外所收集到的錄音;下篇文章,我們則會分享如何將整理好的錄音上傳聲音資料庫。
以下為錄音的管理與編輯主要步驟:
- 野外錄音筆記
- 錄音歸檔
a.按照日期地點分資料夾
b.標示鳥種、聲音類型、錄音品質等等資訊 - 錄音剪輯、優化
a.保留目標聲音
b.目標聲音前後保持三秒以上的空白
c.保留野外錄音筆記
d.不需刻意移除昆蟲聲音或非目標鳥種聲音
e.若低頻噪音太大干擾目標聲音,可以使用High Pass-Filter 高通濾波器將低頻噪音移除(建議移除250Hz以下的低頻聲音)
f.將目標聲音標準化到 -3dB
g.將野外錄音筆記標準化到-10 dB - 錄音上傳
野外錄音筆記
錄音的器材設備、與觀察的技巧功力是決定錄音品質的重要關鍵,但在這裡我們要談的是主要錄音之外的錄音筆記。錄音筆記,顧名思義就是除了聲音訊號本身,我們還需要紀錄與這筆錄音相關的資訊,這些資訊會使所收集的野外錄音更有系統的分類,也更容易被其他科學研究所採用。以eBird Macaulay Library (eBird ML)與xeno-canto (XC)兩大資料庫來說,他們需要的資訊如下。
- 地點、日期與時間 (註1)
- 錄音目標鳥種、背景鳥種
- 聲音類型(ex: song, call)
- 聲音品質(註2)
- 是否有使用回播(註3)
- 是否有看見(僅XC)
- 性別、年齡、數量(僅eBird ML)
- 器材(僅eBird ML)
--------------------------
註1:粗體為必要資訊。
註2:根據 XC 官方,聲音品質共分五個等級。A:大聲且清楚;B:清楚,但離對象有一段距離,或受到其他來源的聲音干擾;C:還算聽得到,或受到中等程度的聲音干擾;D:很小聲,或受到頗強的聲音干擾;E:幾乎聽不到。eBird ML 使用有一到五顆星的分類,五顆星為最高等級,可直接類比為XC 的分類。
註3:eBird ML 與 XC 都有是否有使用回播 (playback) 之欄位,為的是紀錄鳥音特徵是否與使用回播有關,以利分析之用。
--------------------------
與一般野外調查不同的是,錄音筆記通常會以聲音的方式記錄,而非紙本。實際在野外,會在主錄音結束後,對著麥克風口頭描述上述的資訊做為錄音筆記。錄音筆記看似繁瑣,但若錄音當下有同時使用eBird紀錄,就可以省略地點;若使用帶有日期與時間格式的錄音機,也可以省略日期與時間。但切記,口頭描述錄音的目標鳥種、聲音類型與地點時間,為最主要且必要的資訊,若心有餘力,可再描述棲地類型、聲音來源(底層或樹冠層)、錄音前後特殊的行為、天氣、鳥的數量與距離等等。
就作者本身的經驗,養成在錄音當下保留錄音筆記的習慣,非常的重要,畢竟人的聽覺記憶很有限,此舉不僅可以大大的縮短處理錄音的時間,若遇到未知的聲音時,詳細的描述也會使事後物種鑑定更容易進行。
錄音歸檔
基本上,一次的錄音行程結束後,會將該旅次所有記錄到的音檔放置於同一個資料夾,資料夾的命名為日期與大致地點 (i.e., 20210104-06 馬祖東引)。按照錄音旅次分資料夾,不僅一目瞭然,也可幫助記錄曾野外錄音過的時間與地點。
創建完資料夾後,資料夾內的錄音檔案整理原則上和照片差不多,每個人會有不同的整理方法,像是兩位作者的錄音歸檔方式就有所不同,在這裡分別分享兩種方式,大家可選擇自己較順手的,只要是資訊清楚、且方便操作的都是很好的方式。
方式一:直接在檔案名稱上備註
每台錄音機產生的檔案名稱都不一樣,但一般都是帶有流水號或者日期時間資訊的檔案,結束一次野外錄音的行程回到電腦前,再直接更改、標記既有的檔案名稱,將出現鳥種、鳥類聲音、類型與品質等補到檔名上去,可以文字化的野外錄音筆記也可以一併寫入檔名之中。以下為一種檔案的命名方式與範例:
- 規則:[檔案流水號]+[年月日]+[時分]+[錄音機]+{[鳥種]+聲音類型[Song, Call]+[等級(1-5)] }xN +[是否看見該鳥(Y/N)] + [是否使用回播(Y/N)] + [地點]+[麥克風]+[處理方式(標準化Normalized, 高通濾波器 HPF)]
- 範例:001_20210328_052540_D100紫嘯鶇S4黑枕藍鶲S1_YN_光華_D100小NTG_NORM
- 範例:1577_20210109_071426_MIXPRE3黃羽鶯嘴C5巨嘴鴉C2_YN_東埔山莊_HPF300_NORM
由於所需要填寫的資訊繁瑣,可以在聽錄音的時候先紀錄在純文字編輯器之中,另外也有許多軟體可以協助批次命名處理日期與時間的問題,如ReNamer。
方式二:筆記本/excel清單
如上述,每台錄音機產生的檔案名稱都不一樣,但一般都可以設定,這裡建議檔名必須包含日期與流水號(e.g., 21210411_0001.wav)。在整理音檔時,針對每個錄音旅次,也就是每個資料夾,在筆記本或 excel 上紀錄基本資訊:
- 錄音整理日期(非當天整理,就會與錄音日期不同)
- 錄音日期
- 錄音地點
- 參與人員
- 錄音設備
之後,再針對該資料夾裡的錄音做整理,每一筆錄音,都要創建一個專屬的資訊列,以作者本身為例,每筆錄音需要紀錄的欄位為:
- 音檔流水號
- 目標鳥種
- 聲音品質
- 備註(背景鳥種、聲音類型、野外錄音筆記文字化)
- 是否已剪輯(Y/N)
- 是否已上傳(Y/N)
將一個錄音旅次的聲音都聽完後,完全不用更改檔名,根據所整理的筆記本/excel清單,一對照音檔流水號,即可知道該音檔的相關資訊。其優點為不需要更動到錄音檔本身的預設檔名,可避免誤刪或輸入錯誤,而且檔名可維持簡潔,若需要增加紀錄的資訊,像是錄音長度、棲地類型等等,也只要在筆記本/excel清單上增加欄位即可,十分簡易。與方法一相較下的缺點,則是每每需要知道音檔資訊時,都需要打開筆記本/excel清單比對流水號而得,無法從檔名直接看出資訊。錄音剪輯、優化
市面上有許多免費的聲音編輯軟體,像是Ocenaudio、Audacity、Audiotool、Acoustica等,這邊推薦可以在各大作業系統使用的Ocenaudio 與Audacity,並在以下示範Ocenaudio的操作以及相關設定。
顯示頻譜圖(spectrogram)
頻譜圖為能夠在一個時間軸上顯示不同頻率聲音的強度,橫軸是時間、縱軸為頻率(Hz),顏色濃度為聲音之強度。Ocenaudio預設僅顯示波形圖(wavefrom),在這邊可以按下「CTRL + 3」快捷鍵來調整為同時顯示頻譜圖之狀態(圖一)。
一般設定:這邊請到軟體的Edit→ Preference來設定。
顯示語言:Edit→ Preference→ General:可以在Language 顯示簡體中文或者英文(English)。由於本軟體簡體中文翻譯並不完全,故這邊以英文作為教學。
設定快捷鍵:Edit→ Preference→Key Bindings:
設定常用之快捷鍵,建議設定以下部分:
- 標準化聲音 Normalize:可設定為「N」,將音量放大。由於錄音的時候會避免聲音「爆掉」,也就是超過檔案的寬容度,通常會錄比較小聲,但在編輯的時候我們需要把聲音放大才能比較好播放。聲音的大小單位為分貝(dB),檔案中最大聲的聲音為0分貝。
- 高通濾波器 High Pass-Filter:可設定為「F」,將特定頻率以下的聲音濾除掉。若設定在250Hz的話,就是250Hz以下的聲音濾掉,但須注意不可移除掉目標鳥種的聲音,對於某些聲音頻率較低的物種需特別注意。
- 創造空白片段 Silence:可設定為「S」,以創造一個沒有聲音的空白片段,可以將同一隻鳥在不同檔案所錄得的聲音組合在一起,不同片段間以空白片段作為區隔。
- 改變取樣頻率 Convert Sample Type:可設定為「C」,調整取樣頻率。一般建議錄製無壓縮24bit以上的無壓縮WAV檔案,某些專業錄音機可以錄到48bit以上,但因為XC僅能上傳24bit格式之MP3檔案,故常常需要調整取樣頻率。
頻譜圖設定:Edit→ Preference→Spectrogram:頻譜圖的細節調整
- Settings
- Number of Bins:建議1024或者2048
- Windowtype:Blackman
- Color Settings:
- 「不要」勾選Normalize
聲音編輯之流程
這邊呈現的是2021年1月9日新年數鳥嘉年華塔塔加樣區東埔山莊附近的錄音,當天早上是遇到一群黃羽鶯嘴過馬路並發出叫聲,檔案使用Sound Device MixPre 3與Telinga 集音盤錄製單一音軌,其波形圖與頻譜圖(如圖一)。

圖一:野外錄得尚未編輯之聲音。上面藍綠色為波形圖,下面紫色部分為頻譜圖。
由於MixPre 3錄音機有預錄之功能,現場是聽到鳥叫才舉起麥克風開始錄音,故該檔案前幾秒有許多的雜音。在實際錄音的時候也隨著鳥的移動尋找較好的錄音角度,故由波形圖與頻譜圖可以看到大概該錄音的中後段(20秒後)鳥的聲音才比較突出,故我們僅剪輯原始檔案20秒到約50秒左右的30秒作為上傳之用,在錄音結束的最後兩秒為用聲音描述這個錄音主要目標鳥種,故也將之移除。由於錄音當天風聲較大,在這邊是將300Hz以下的聲音以高通濾波器濾除掉,由於本筆錄音沒有野外錄音筆記,故將整筆錄音標準化到檔案的-3分貝(dB),以避免某些播放裝置爆音,編輯完成後之檔案在軟體當中可以看見目標聲音更為凸顯(如圖二)。

圖二:野外錄得編輯結束之聲音
臺灣會在錄音資料庫備註野外錄音筆記的人不多,可以參考謝孝同老師(Dr. Sheldon Severinghaus)於70年代年的錄音ML8693(如圖三),ML資料庫後製後在錄音的前段加上口述錄音筆記,描述該錄音的編號,以免錄音帶包裝遺失後搞不清楚該筆錄音到底是誰。如果有備註這種錄音筆記,eBird ML資料庫建議將該段落標準化到檔案的-10分貝(dB)。最後這筆黃羽鶯嘴的錄音上傳到eBird ML資料庫後,所得的編號為ML296660881(如圖四),至於如何上傳到eBird ML以及xeno-canto資料庫的細節部分就留待下集再解說了。

圖三:謝孝同老師 (Dr. Sheldon Severinghaus) 於 1969年的錄音,ML 資料庫後製後在錄音的前段加上口述錄音筆記,在這邊是 ML 資料庫錄音的編號 ML8693。

圖四:本錄音上傳到 eBird ML 資料庫後的畫面 (ML 296660881)
