OmniHuman 1.5 數位人口播影片
上傳 1 張人物圖 + 1 段音訊,生成自然口播影片。適用於帶貨講解、線上課程、虛擬主播與客服解說。
影片生成
0 / 5000
Direct URL to an MP3/WAV file (max 35s). Must be publicly accessible.
Subject check
Verify a human subject exists in the image (slower start).
Auto mask
Automatically generate a mask.
Fast mode
Faster generation with potentially lower quality.
影片預覽
建議:使用正面清晰的人像(胸像/半身),音訊盡量無雜音;生成後記得及時下載保存。
效果展示
涵蓋口播、情緒表演、唱歌節奏、多角色對話等場景。
正在載入範例…
應用場景
OmniHuman 1.5 能做什麼?
把「形象 + 聲音」變成可交付的影片內容,適合快速產出與多場景複用。
帶貨講解 / 產品介紹
以一致形象輸出多條賣點短影片。
線上課程 / 知識科普
講師形象固定,音訊可多語言替換。
客服解說 / 操作指引
把 FAQ 與說明做成可視化講解。
虛擬主播 / IP 形象
涵蓋新聞播報、直播口播、活動主持。
快速上手
3 分鐘完成一次生成
依步驟準備素材即可開始生成。
- 01/ 04
準備參考人像
正面、清晰、無遮擋,建議胸像/半身。
- 02/ 04
加入音訊
上傳音訊或貼上音訊連結(MP3/WAV)。
- 03/ 04
(可選)文字提示微調
以簡短提示控制風格/鏡頭/動作傾向。
- 04/ 04
生成並下載
完成後可預覽與下載,建議及時保存。
最佳實踐
OmniHuman 1.5 生成最佳實踐
重點在於「人像清晰 + 音訊乾淨」。
實作 1:人像清晰、正面
避免側臉、遮擋與過暗光照。
實作 2:音訊乾淨、語速適中
減少噪音與混響,有助於口型穩定。
實作 3:可用短提示控制風格
例如「自然光、半身、輕微點頭」。
常見問題
