生成文章、生成美女圖、TTS 文轉語音之後,當然是要將三者結合了!HeyGen 就是一個結合三種人工智能生成技術的平台,幫大家在短時間內生成一條有廣東話主播做介紹的影片,用來做 Presentation 印象分加不少!
HeyGen 網站:按此
HeyGen 提供 ChatGPT 對白生成和修改、主播圖像生成、文字轉語音以至生成影片的一條龍服務,更能運用 AI 來為虛擬主播加上配合對白的嘴形和一點小動作,例如邊說身體邊有輕微搖擺之類。而且生成速度非常快,生成虛擬角色每次 15-30 秒,生成 18 秒影片也只在 3 分鐘內完成。
HeyGen 提供免費試用,登記後可使用所有公開虛擬主播頭像、所有影片樣式、上傳照片作主播、虛擬主播換臉和完成影片編輯器功能,並可以生成 1 分鐘影片,不過影片會有水印。之後就按量收費,Essential 用戶最便宜月費為 US$24(約港幣 $188),可以生成合共 10 分鐘影片,並移除了水印。而 Pro 用戶更可以生成長達 15 分鐘的影片。
生成步驟
Part 1. 建立虛擬主播
- 雖然大家可以透過 HeyGen 的文生圖功能來生成虛擬主播,不過外國人標準未必對大家的胃口。筆者還是使用慣用的 Stable Diffusion WebUI 以 chilledReGenericV3 模型,生成一位東方美女作主播。由於影片有 1920×1080 解像度,所以需要適當地放大生成圖像,並利用插件如 PBRemTool 來生成透明背景的 PNG 圖像。
- 登入 HeyGen 頁面,確認「How do you want to create videos today?」是選擇了「Start with an Avatar(由虛擬主播開始)」,然後就在「My Avatar」下選擇「TalkingPhoto」,並按「Upload or generate photo(上載或生成照片)」 。
- 如果你有正面的照片想親自上鏡,或者上傳自己在 Midjourney 或 Stable Diffusion 生成的虛擬主播的話,就按「Upload」;而如果想一試 HeyGen 自己的圖像生成能力的話就可以按「Generate」。
- 完成上載之後,就將滑鼠移動到虛擬主播身上,點擊左下角的「Create an avatar template」建立主播樣式。
- 這裡可以設定虛擬主播的呈現方式,如 Original 原圖模樣、方形框或圓形。而最重要的就是在 Voice 欄選擇廣東話、語音速度和語調。
- 在 Voice Library 裡選擇「Chinese」,當中會包含大陸的普通話、台灣的國語和香港的廣東話,不過廣東話只有一男兩女聲線可供選擇,雖然比較生硬的,不過在混合多語言上還是很流暢的(只要句子通順的話)。
- 按「Save as Template」就可以會儲存了一個虛擬主播樣式 Avatar Template。
Part 2. 生成影片
- 點擊剛才設定好的 Avatar Template,在彈出的預覽框中把鼠標移至右邊的「+Create Video」上,就可以選擇生成橫向 1920×1080、或直向 1080×1920 影片。
- 進入影片編輯畫面,上方的畫框預設已加入主播,大家可以以拖放的方式加入更多圖像,例如這影片就加入背景、畫框和標誌。
- 介面中段就用作編輯對白,雖然每個場面只可以有 5 段對白,但只要使用 Shift+Enter 轉行,每一段就可以有多行。另外,大家還可以按下面的 ChatGPT 標誌,讓 ChatGPT 為大家修改對白。
- 介面最下面是影片時間線,也是 HeyGen 的一大特點。每條影片可以分成多個場面,編輯期間可以前後調配或複製場面。可以按時間線的播放掣來預覽影片,不過直至按右上角的「Submit」掣落實影片虛擬主播也不會有動作。
- 完成編輯後,就可以按右上角的「Submit」掣來生成影片。這裡要注意兩件事:1. 確認 Submit 後就會扣減 Credit 時間;2. Submit 後的影片不能再編輯,只可以複製影片當作全新影片來修改。
完成的影片
- 生成過程可以在左邊欄選擇「Video」來查看,完成後可以將影片上傳到社交平台或者下載原片,也可以預覽影片、修改字幕。不過只有付費用戶才可以下載 .srt 字幕檔。
HeyGen 生成影片的步驟簡單,介面有足夠說明,生成速度快捷,又有各種生成式 AI 在不同步驟提供支援,想製作不一樣的展示影片實在容易得多。