3步教你用AI大模型+Python實現(xiàn)web自動化:一套提示詞完成所有AI自動化指令
為什么要用AI大模型+Python做web自動化?
Python因其簡潔易用和豐富的生態(tài)系統(tǒng),成為自動化領(lǐng)域的首選語言。Playwright作為微軟推出的跨瀏覽器自動化框架,支持Chromium、Firefox和WebKit,功能強大且穩(wěn)定。結(jié)合AI大模型的智能對話能力,我們可以讓瀏覽器“聽懂”指令,自動完成復(fù)雜任務(wù),極大提升工作效率。

@
- 為什么要用AI大模型+Python做web自動化?
- 一、環(huán)境的安裝
1、前提條件
2、創(chuàng)建虛擬環(huán)境以及對應(yīng)包
- 二、獲取大模型API
- 三、代碼的編寫
- 結(jié)語
一、環(huán)境的安裝
1、前提條件
- 已安裝 Python(建議 3.7 及以上版本)
- 已配置好 Python 環(huán)境變量(可在命令行輸入?
?python --version?? 驗證) - Windows 操作系統(tǒng)(本文以 PowerShell 為例)
2、創(chuàng)建虛擬環(huán)境以及對應(yīng)包
- 打開 PowerShell,進入你想創(chuàng)建項目的目錄,例如:
cd D:\browser-use- 創(chuàng)建名為?
?browserUse?? 的虛擬環(huán)境:
python -m venv browserUse該命令會在當(dāng)前目錄下生成一個名為 ??browserUse?? 的文件夾,里面包含獨立的 Python 運行環(huán)境。
- 激活虛擬環(huán)境:
.\browserUse\Scripts\activate激活后,命令行提示符通常會出現(xiàn) ??(browserUse)??,表示當(dāng)前處于該虛擬環(huán)境中。

在這里插入圖片描述
- 升級 pip(Python 包管理器)到最新版本,確保安裝包順利:
pip install --upgrade pip- 安裝 browser-use 包:
pip install browser-use- 安裝 Playwright Python 包:
pip install playwright- 安裝 Playwright 瀏覽器驅(qū)動
Playwright 需要下載對應(yīng)的瀏覽器二進制文件,執(zhí)行以下命令:
python -m playwright install該命令會自動下載 Chromium、Firefox、WebKit 等瀏覽器驅(qū)動,確保 Playwright 可以正常運行。
示例圖如下:




二、獲取大模型API
在瀏覽器中打開能用AI API,根據(jù)下面的圖片教程獲取自己的Base_url 和 Api_key。https://ai.nengyongai.cn/register?aff=PEeJ



根據(jù)此步驟我們可以獲取到兩個重要的數(shù)據(jù):
Base_url = "https://ai.nengyongai.cn/v1"
Api_key = "你自己的key"三、代碼的編寫
下面是一個完整示例,演示如何用用AI大模型+Python實現(xiàn)自動打開瀏覽器,搜索“今天的天氣”,并輸出我們想要的結(jié)果。
# 導(dǎo)入所需的模塊和類
from langchain_openai import ChatOpenAI # 用于調(diào)用自研大模型接口
from browser_use import Agent, Browser, BrowserConfig # 瀏覽器自動化相關(guān)類
import asyncio # 異步編程模塊
from dotenv import load_dotenv # 用于加載環(huán)境變量
import os # 操作系統(tǒng)接口模塊
# 加載當(dāng)前目錄下的.env文件中的環(huán)境變量
load_dotenv()
# 設(shè)置Base_url接口地址
Base_url = "https://ai.nengyongai.cn/v1"
# 這里填寫你自己的Api_key,建議放在環(huán)境變量中,避免明文寫在代碼里
Api_key = "你自己的key"
# 將Api_key設(shè)置到環(huán)境變量中,供ChatOpenAI調(diào)用
os.environ["OPENAI_API_KEY"] = Api_key
# 創(chuàng)建一個瀏覽器實例,配置如下:
browser = Browser(
cnotallow=BrowserConfig(
headless=False, # 是否無頭瀏覽器,F(xiàn)alse表示有界面,方便調(diào)試
disable_security=True, # 禁用瀏覽器安全策略,方便跨域等操作
)
)
# 定義異步主函數(shù)
asyncdef main():
try:
# 創(chuàng)建一個Agent實例,負(fù)責(zé)執(zhí)行任務(wù)
agent = Agent(
task="""
1、訪問https://www.baidu.com/,
2、搜索內(nèi)容為“今天的天氣”,
3、將今天的天氣內(nèi)容輸出出來.
""", # 任務(wù)描述,告訴Agent要做什么
llm=ChatOpenAI(
model='gpt-4o-mini', # 使用的模型名稱
base_url=Base_url, # base_url
api_key=Api_key # api_key
),
)
# 運行Agent,執(zhí)行任務(wù),返回結(jié)果
result = await agent.run()
# 打印任務(wù)執(zhí)行結(jié)果
print(result)
except Exception as e:
# 如果運行過程中出現(xiàn)異常,捕獲并打印錯誤信息
print(f"運行出錯: {e}")
# 程序入口,運行異步主函數(shù)
if __name__ == '__main__':
asyncio.run(main())我們直接右鍵運行,這里差不多要等到5-10秒鐘,才能自己執(zhí)行web自動化。(注意:windows如果出現(xiàn)了啟動報錯等問題,那么請直接關(guān)閉殺毒軟件。因為殺毒軟件會阻止我們啟動瀏覽器。)


我們可以看到它根據(jù)提示詞的指示,自動獲取啟動瀏覽器,去完成我們的目標(biāo)。


結(jié)語
用AI大模型+Python做Web自動化,不僅是技術(shù)的結(jié)合,更是緊跟時代以及提升效率的開始。原先的我們需要用到各種定位,現(xiàn)在只需簡單幾步,你就能讓電腦幫你完成繁瑣的瀏覽器操作,希望這篇文章能幫你快速入門,開啟自動化新篇章!
本文轉(zhuǎn)載自????愛學(xué)習(xí)的蝌蚪????,作者:hpstream

















