Question 1

多人對話要先做講者分離，還是先去除背景音？

Accepted Answer

建議先做講者分離，且請使用原始錄音。分出各講者後，若個別音軌仍夾帶明顯 BGM 或環境噪音，再個別做去除背景音。單人錄音若主要是被背景音蓋過，則可直接做去除背景音。

Question 2

支援哪些音訊或影片格式？單次可處理多長？

Accepted Answer

支援常見音訊（如 mp3、wav、m4a）與影片（如 mp4、mov，會擷取音軌處理）。單次最長 120 秒，單檔上限 50 MB；較長或過大的影片建議先剪短或轉成 mp3 再上傳。

Question 3

可以用人聲分離後的檔案嗎？

Accepted Answer

不建議。請使用原始錄音上傳，以取得較穩定的講者分辨結果；若素材同時夾帶明顯 BGM，請先完成講者分離，再視需要對個別音軌做去除背景音。

Question 4

適合 Podcast、訪談或多人對話嗎？

Accepted Answer

適合你在 Podcast、訪談或多人對話中參與錄製、需保留自己發言的素材。若多人同時講話、有效發言極短，或音量過小的段落，可能無法產生可試聽音檔，建議換段素材再試。

Question 5

分出來的音檔可以拿去做 Voice Clone 嗎？

Accepted Answer

可以作為 Voice Clone 樣本的前處理步驟，僅限本人或已獲授權之聲音。仍須確保你有足夠長、連續且清楚的發言；樣本品質與完整流程說明可參考音檔優化指南。