VOICEVOX是由ヒホ(ヒロシバ)基於深度學習技術開發的開源、免費的文字朗讀軟體及歌聲合成軟體。
VOICEVOX自稱「免費使用的中等品質文字朗讀軟體·歌聲合成軟體」(無料で使える中品質なテキスト読み上げソフトウェア・歌聲合成ソフトウェア),有著以下特點:
除此之外,軟體本體開源(包括編輯器UI、引擎、內核),其他開發者可以按照開源條例使用、開發新的軟體或者內嵌至其他軟體。
官方簡稱為「ボイボ」。
OS:
GPU: Nvidia
在VOICEVOX中,點擊界面中角色形象右邊帶下劃線的方框即可輸入文本,輸入之後下面的調整框便會有片假名注音。點擊左下角的播放按鈕便可以播放選擇的語句。
點擊右邊的加號可以新增語句,點擊角色形象可以更換所選語句的朗讀角色。
點擊「一つ書く出し」便可將所選語句的音頻輸出成wav文件。
可以通過右邊及下面的調整欄調整所選語句,例如整體的語速或詞的讀法與斷詞。
在鋼琴捲簾點擊即可創建音符,單擊即可選擇該音符,雙擊音符可修改發音。(發音只支持輸入平假名與片假名)
支持導入MIDI、MusicXML、UST格式文件。
點擊「ファイル-音聲を出力」即可導出wav文件。
“ |
在這裡有著性格各異的住民。 |
” |
「ボイボ寮」是VOICEVOX官方給出的設定,在設定中是VOICEVOX的角色所居住的地方。目前的住民(實裝的角色聲庫)有31位:
官網的《ボイボ寮の住民たち》頁面給出了每位角色的設定資料以及對其他住民的稱呼。不過官方也同時表示「ボイボ寮的設定只是製作視頻時供參考用的世界觀」「不需要嚴格遵守設定,隨意改變也沒有問題」。
VOICEVOX Nemo是沒有角色形象的聲庫系列,使用時也無需標記CV名。
Nemo的由來為德語的Nobody。
開發者ヒホ(ヒロシバ)本職是Dwango Media Village的工程師。因為頭像是Windows7回收站的圖標,也有個「垃圾桶頭」的外號。他曾使用深度學習技術開發了變聲工具《yukarinライブラリ》及變聲器《Seiren Voice》。VOICEVOX也同樣使用了深度學習技術。
雖然是不同的合成引擎,但都使用了VOICEVOX的框架(操作界面),界面顏色不同。
由シロワニさん開發,特點是允許用戶自行製作並上傳朗讀聲庫。
|