AI智能體:一鍵生成教育系列的英語短視頻,教學就是這么so easy
今天解鎖一個有趣的AI英語工作流水,輸入單詞 == 自動出短視頻!

英語教育機構(gòu)還在手動找圖、拼音頻、調(diào)時間軸?為一個單詞視頻折騰半小時?
圖片
輸入單詞,AI秒匹配拓展詞表 - 大模型智能生成權(quán)威釋義
圖文聲一鍵齊活 - 發(fā)音音頻、高清圖解(AI摳圖透明底!)、BGM自動配 時間軸智能對齊 - 語音、字幕、貼紙精準卡點
剪映草稿直接生成 - 導入即用,導出成品只需5分鐘!
省下半天時間,多產(chǎn)10條視頻引流/教學,它不香嗎? 英語老師、知識博主抓緊上車!
一、工作流
圖片
該工作流的設(shè)計邏輯圍繞英語單詞相關(guān)的視頻合成展開,核心目的是根據(jù)輸入的英語單詞生成包含單詞匹配、音頻、圖片及視頻草稿的完整視頻素材。
首先,從表中查詢與輸入英語單詞相關(guān)的匹配單詞列表,將其與輸入單詞一同輸入大語言模型,生成符合特定格式要求的單詞及釋義列表。
接著,對生成的單詞列表進行格式化處理,提取單詞和釋義,再將其合成為音頻。
之后,從音頻合成結(jié)果中提取語音 URL 并獲取音頻時間線,同時使用大語言模型生成英語單詞圖片的提示詞,經(jīng)優(yōu)化后生成圖片并摳出透明背景。
在背景音樂方面,通過關(guān)鍵詞搜索獲取符合要求的音樂并進行格式化處理。
然后,將上述處理得到的背景圖、背景音樂、單詞信息、人聲音頻、單詞配圖及貼紙等元素按照時間線進行整合,生成對應(yīng)的剪映草稿所需的數(shù)據(jù)格式。
最后,創(chuàng)建剪映視頻草稿,并依次添加背景圖軌道、背景音樂軌道、單詞信息、人聲音頻軌道、單詞配圖及貼紙,完成整個視頻合成素材的準備工作。
二、 工作流拆解
1. 查詢數(shù)據(jù)
- 名稱:查詢數(shù)據(jù)節(jié)點
- 功能:從指定數(shù)據(jù)庫中查詢與用戶輸入基礎(chǔ)單詞(en_word)匹配的歷史匹配單詞,輸出包含匹配單詞的列表(outputList)。
圖片
2. 英語單詞匹配助手(大模型)
- 名稱:大模型節(jié)點
- 功能:調(diào)用DeepSeek-R1大語言模型,結(jié)合用戶輸入的基礎(chǔ)單詞(en_word)和歷史匹配列表(outputList),生成符合規(guī)范的7個匹配單詞(包含基礎(chǔ)單詞、音標、中文釋義),輸出結(jié)構(gòu)化JSON格式的單詞列表(words)。
圖片
3. 文案口播數(shù)據(jù)格式化(代碼)
- 名稱:代碼節(jié)點(文案口播數(shù)據(jù)格式化)
- 功能:處理大模型輸出的單詞列表(words),提取每個單詞的"word"和"meaning"字段,生成格式化的word_list(單詞+釋義的字符串列表)和first_word(第一個單詞的中文釋義)。
圖片
4. 語音合成
- 名稱:語音合成節(jié)點
- 功能:調(diào)用語音合成插件(speech_synthesis),將word_list作為文本輸入,生成音頻文件,輸出包含音頻鏈接等信息的結(jié)果列表(outputList)。
圖片
5. 提取語音URL為列表
- 名稱:提取語音URL節(jié)點(audio_link_collector)
- 功能:從語音合成結(jié)果(outputList)中提取音頻鏈接字段(data.lin
圖片
- k),輸出音頻鏈接數(shù)組(links)。
6. 提取文案音頻時間線
- 名稱:提取音頻時間線節(jié)點(audio_timelines)
- 功能:分析音頻鏈接(links)的音頻內(nèi)容,生成每個音頻段的時間線(包含起始和結(jié)束時間,單位微秒)及總時間線(all_timelines)。
圖片
7. 文案人聲audio_infos(剪映數(shù)據(jù)生成)
- 名稱:文案人聲數(shù)據(jù)生成節(jié)點(audio_infos)
- 功能:根據(jù)音頻鏈接(links)和時間線(timelines),生成適合剪映的人聲音頻信息(infos),用于后續(xù)視頻合成。
圖片
8. BGM搜索
- 名稱:BGM搜索節(jié)點(search_bgm)
- 功能:根據(jù)“輕松活潑”關(guān)鍵詞搜索背景音樂庫,輸出包含背景音樂URL、標題、時長等信息的結(jié)果列表(data)。
圖片
9. 提取BGM為列表格式(代碼)
- 名稱:代碼節(jié)點(提取BGM為列表格式)
- 功能:處理BGM搜索結(jié)果(bgmData),提取第一個背景音樂的URL,生成BGM列表(bgm)。
圖片
10. 背景音樂audio_infos(剪映數(shù)據(jù)生成)
- 名稱:背景音樂數(shù)據(jù)生成節(jié)點(audio_infos)
- 功能:根據(jù)BGM鏈接(bgm)和總時間線(all_timelines),生成適合剪映的背景音樂信息(infos),用于后續(xù)視頻合成。
圖片
三、核心工作流節(jié)點關(guān)系
圖片
- 步驟 1: 查詢數(shù)據(jù)節(jié)點,從指定數(shù)據(jù)庫中查詢與用戶輸入基礎(chǔ)單詞(en_word)匹配的歷史匹配單詞,輸出包含匹配單詞的列表(outputList),關(guān)聯(lián)關(guān)系: 為步驟 2提供歷史匹配列表(outputList)
- 步驟 2: 大模型節(jié)點,調(diào)用DeepSeek - R1大語言模型,結(jié)合用戶輸入的基礎(chǔ)單詞(en_word)和歷史匹配列表(outputList),生成符合規(guī)范的7個匹配單詞,輸出結(jié)構(gòu)化JSON格式的單詞列表(words),關(guān)聯(lián)關(guān)系: 接收步驟 1 的歷史匹配列表(outputList),為步驟 3 提供單詞列表(words)
- 步驟 3: 代碼節(jié)點(文案口播數(shù)據(jù)格式化),處理大模型輸出的單詞列表(words),提取每個單詞的"word"和"meaning"字段,生成格式化的word_list和first_word,關(guān)聯(lián)關(guān)系: 接收步驟 2 的單詞列表(words),為步驟 4 提供word_list
- 步驟 4: 語音合成節(jié)點,調(diào)用語音合成插件(speech_synthesis),將word_list作為文本輸入,生成音頻文件,輸出包含音頻鏈接等信息的結(jié)果列表(outputList),關(guān)聯(lián)關(guān)系: 接收步驟 3 的word_list,為步驟 5 提供結(jié)果列表(outputList)
- 步驟 5: 提取語音URL節(jié)點(audio_link_collector),從語音合成結(jié)果(outputList)中提取音頻鏈接字段(data.link),輸出音頻鏈接數(shù)組(links),關(guān)聯(lián)關(guān)系: 接收步驟 4 的結(jié)果列表(outputList),為步驟 6 和步驟 7 提供音頻鏈接數(shù)組(links)
- 步驟 6: 提取音頻時間線節(jié)點(audio_timelines),分析音頻鏈接(links)的音頻內(nèi)容,生成每個音頻段的時間線及總時間線(all_timelines),關(guān)聯(lián)關(guān)系: 接收步驟 5 的音頻鏈接數(shù)組(links),為步驟 7 提供總時間線(all_timelines)
- 步驟 7: 文案人聲數(shù)據(jù)生成節(jié)點(audio_infos),根據(jù)音頻鏈接(links)和時間線(timelines),生成適合剪映的人聲音頻信息(infos),關(guān)聯(lián)關(guān)系: 接收步驟 5 的音頻鏈接數(shù)組(links)和步驟 6 的總時間線(all_timelines)
- 步驟 8: BGM搜索節(jié)點(search_bgm),根據(jù)“輕松活潑”關(guān)鍵詞搜索背景音樂庫,輸出包含背景音樂URL、標題、時長等信息的結(jié)果列表(data),關(guān)聯(lián)關(guān)系: 為步驟 9 提供結(jié)果列表(data)
- 步驟 9: 代碼節(jié)點(提取BGM為列表格式),處理BGM搜索結(jié)果(bgmData),提取第一個背景音樂的URL,生成BGM列表(bgm),關(guān)聯(lián)關(guān)系: 接收步驟 8 的結(jié)果列表(data),為步驟 10 提供BGM列表(bgm)
- 步驟 10: 背景音樂數(shù)據(jù)生成節(jié)點(audio_infos),根據(jù)BGM鏈接(bgm)和總時間線(all_timelines),生成適合剪映的背景音樂信息(infos),關(guān)聯(lián)關(guān)系: 接收步驟 6 的總時間線(all_timelines)和步驟 9 的BGM列表(bgm)





























