精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于阿里通義 Qwen3 混合推理模型才是優化 RAG 和 MCP 的最佳范式 原創

發布于 2025-5-13 06:44
瀏覽
0收藏

阿里巴巴推出了全新的 Qwen3 系列模型。令人驚嘆的是,在短短的12個小時內,這個系列在 GitHub 上的星標數就超過了17,000個,而在 Hugging Face 上的下載量更是達到了每小時23,000次的高峰。

更讓人興奮的是,Qwen3 系列這次一共推出了八種不同的模型,包括兩款 MoE 模型:Qwen3-235B-A22B(2350多億總參數、 220多億激活參),以及 Qwen3-30B-A3B(300億總參數、30億激活參數);以及六個 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。


基于阿里通義 Qwen3 混合推理模型才是優化 RAG 和 MCP 的最佳范式-AI.x社區

它們都是混合推理模型,這意味著它們既能快速思考,也能深入思考。這些模型在推理能力、遵循指令、調用工具以及多語言處理等方面都有了顯著的提升,而且它們還刷新了所有國產模型以及全球開源模型的性能紀錄。

接下來結合 Qwen3 構建 RAG 和 MCP 詳細分析之。

1、Qwen3 更強,更多選擇,更低門檻,更適合企業落地

Qwen3 系列模型亮點:混合推理、云端與本地、小尺寸高能、多語言支持

(1)混合推理模型:Qwen3 系列的所有模型都是推理與非推理相結合的混合模型,滿足老板對成本和性能的雙重要求。

(2)MoE 與 Dense 模型:系列包含兩款 MoE(專家混合)模型和六款Dense(稠密)模型,前者適合云端部署,后者在本地表現更優。

(3)小尺寸高能:基于小尺寸的能力升級,只需4張 H20 顯卡即可部署完整的 Qwen3 模型。

(4)MCP 與多語言:支持 MCP 和多語言能力,降低開發成本。

詳解 Qwen3 系列模型的四大關鍵詞:

第一、混合推理模型:Qwen3 系列全部采用混合推理模型,兼具推理(深思熟慮)與非推理(快速反應)能力,符合行業發展趨勢,平衡算力成本與輸出效果。

第二、MoE 與 Dense 模型:包括兩款 MoE 模型和六款 Dense 模型,MoE 模型適合云端,Dense 模型本地表現更佳。


基于阿里通義 Qwen3 混合推理模型才是優化 RAG 和 MCP 的最佳范式-AI.x社區

第三、小尺寸高能:Qwen3 系列訓練數據量達36T tokens,最大模型 Qwen3-235B-A22B 擁有2350多億總參數,但部署成本不高,支持動態量化,僅需4張H20顯卡。

第四、MCP 與多語言:Qwen3 系列支持 MCP,便于與外部數據庫、工具交互,同時支持119種語言和方言,服務全球開發者,助力企業全球業務拓展。

總結:Qwen3 系列模型以其混合推理、云端與本地部署、小尺寸高能、多語言支持等特點,非常適合企業場景中落地,幫助開發者構建性能與成本全面可控的產品。

2、基于推理模式和非推理模式實現 RAG 對比

RAG 的構建流程和步驟詳細看這里《???別搞 GraphRAG 了,擁抱新一代 RAG 范式 DeepSearcher???》,這里不再贅述。下面通過一個具體問題詳細對比剖析。 

基礎數學問題:甲和乙從同一地點出發,甲先走2小時,速度5km/h,乙以15km/h追趕,多久追上?


基于阿里通義 Qwen3 混合推理模型才是優化 RAG 和 MCP 的最佳范式-AI.x社區

第一、基于 Qwen3 推理模式的參考代碼如下:

import os
import time
from openai import OpenAI
os.environ["DASHSCOPE_API_KEY"] = "sk-*************************"
client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
############################################
# Think
# 記錄開始時間
start_time = time.time()
stream = client.chat.completions.create(
    # 模型列表:https://help.aliyun.com/zh/model-studio/getting-started/models
    model="qwen3-235b-a22b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "甲和乙從同一地點出發,甲先走2小時,速度5km/h,乙以15km/h追趕,多久追上?"},
    ],
    # Qwen3模型通過enable_thinking參數控制思考過程(開源版默認True,商業版默認False)
    extra_body={"enable_thinking": True},
    stream=True,
)
answer_content = ""
for chunk in stream:
    delta = chunk.choices[0].delta
    if delta.content is not None:
        answer_content += delta.content
print(answer_content)
# 記錄結束時間并計算總耗時
end_time = time.time()
print(f"\n\n總耗時:{end_time - start_time:.2f}秒")

從答案的質量來看,推理模式成功識別出了這是一個追及問題。它分析了題目中給出的條件,并提出了兩種不同的解題方法和正確的答案。這表明模型對這個問題進行了深入的思考。特別是,它最后提供的 Markdown 格式答案,其中的數學公式顯示得非常精準。

整個過程的代碼運行時間是 35.73秒。

(下面是我們將模型生成的 Markdown 答案轉換成可視化圖像的截圖,為了讓讀者更容易理解)


基于阿里通義 Qwen3 混合推理模型才是優化 RAG 和 MCP 的最佳范式-AI.x社區


基于阿里通義 Qwen3 混合推理模型才是優化 RAG 和 MCP 的最佳范式-AI.x社區

第二、基于 Qwen3 非推理模式的參考代碼如下:

在以上代碼設置中,只需將 `"enable_thinking"` 設置為 `False`。

接下來,讓我們看看非推理模式是如何處理這個問題的:

非推理模式采用逐步求解的方法,使用了常規的相對速度法,并迅速得出了正確答案。

它的總耗時大約是:6.89秒,大約是推理模式耗時的五分之一。可以看出,推理模式相比非推理模式會進行更多的思考。


基于阿里通義 Qwen3 混合推理模型才是優化 RAG 和 MCP 的最佳范式-AI.x社區

這種額外的思考可以使回答內容更加豐富,邏輯性更強。但是,非推理模式的回答速度更快。這兩種模式在處理不同類型的問題時各有優勢。因此,用戶可以根據自己的需求來選擇使用哪種模式。

3、MCP 的支持 

第一、MCP 的支持

Qwen3 在工具調用能力方面表現出色。我們推薦使用 Qwen-Agent 來充分發揮 Qwen3 的 Agent 能力。Qwen-Agent 內部封裝了工具調用模板和工具調用解析器,大大降低了代碼復雜性。

要定義可用的工具,您可以使用 MCP 配置文件,使用 Qwen-Agent 內置的工具,或者自行集成其他工具。

MCP 功能支持的代碼如下所示:

from qwen_agent.agents import Assistant
# Define LLM
llm_cfg = {
    'model': 'Qwen3-30B-A3B',
    # Use the endpoint provided by Alibaba Model Studio:
    # 'model_type': 'qwen_dashscope',
    # 'api_key': os.getenv('DASHSCOPE_API_KEY'),
    # Use a custom endpoint compatible with OpenAI API:
    'model_server': 'http://localhost:8000/v1',  # api_base
    'api_key': 'EMPTY',
    # Other parameters:
    # 'generate_cfg': {
    #         # Add: When the response content is `<think>this is the thought</think>this is the answer;
    #         # Do not add: When the response has been separated by reasoning_content and content.
    #         'thought_in_content': True,
    #     },
}
# Define Tools
tools = [
    {'mcpServers': {  # You can specify the MCP configuration file
            'time': {
                'command': 'uvx',
                'args': ['mcp-server-time', '--local-timeznotallow=Asia/Shanghai']
            },
            "fetch": {
                "command": "uvx",
                "args": ["mcp-server-fetch"]
            }
        }
    },
  'code_interpreter',  # Built-in tools
]
# Define Agent
bot = Assistant(llm=llm_cfg, function_list=tools)
# Streaming generation
messages = [{'role': 'user', 'content': 'https://qwenlm.github.io/blog/ Introduce the latest developments of Qwen'}]
for responses in bot.run(messages=messages):
    pass
print(responses)

第二、軟切換機制

Qwen3 提供了一種軟切換機制,允許用戶在 enable_thinking=True 時動態控制模型的行為。具體來說,可以在用戶提示或系統消息中添加 /think 和 /no_think 來逐輪切換模型的思考模式。在多輪對話中,模型會遵循最近的指令。

以下是一個多輪對話的示例:

from transformers import AutoModelForCausalLM, AutoTokenizer
class QwenChatbot:
    def __init__(self, model_name="Qwen3-30B-A3B/Qwen3-30B-A3B"):
        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
        self.model = AutoModelForCausalLM.from_pretrained(model_name)
        self.history = []
    def generate_response(self, user_input):
        messages = self.history + [{"role": "user", "content": user_input}]
        text = self.tokenizer.apply_chat_template(
            messages,
            tokenize=False,
            add_generation_prompt=True
        )
        inputs = self.tokenizer(text, return_tensors="pt")
        response_ids = self.model.generate(**inputs, max_new_tokens=32768)[0][len(inputs.input_ids[0]):].tolist()
        response = self.tokenizer.decode(response_ids, skip_special_tokens=True)
        # Update history
        self.history.append({"role": "user", "content": user_input})
        self.history.append({"role": "assistant", "content": response})
        return response
# Example Usage
if __name__ == "__main__":
    chatbot = QwenChatbot()
    # First input (without /think or /no_think tags, thinking mode is enabled by default)
    user_input_1 = "How many r's in strawberries?"
    print(f"User: {user_input_1}")
    response_1 = chatbot.generate_response(user_input_1)
    print(f"Bot: {response_1}")
    print("----------------------")
    # Second input with /no_think
    user_input_2 = "Then, how many r's in blueberries? /no_think"
    print(f"User: {user_input_2}")
    response_2 = chatbot.generate_response(user_input_2)
    print(f"Bot: {response_2}") 
    print("----------------------")
    # Third input with /think
    user_input_3 = "Really? /think"
    print(f"User: {user_input_3}")
    response_3 = chatbot.generate_response(user_input_3)
    print(f"Bot: {response_3}")

4、總結

總的來說,這次發布的 Qwen3 系列模型不僅在各個專業領域達到了最佳性能(SOTA),還特別注重實際應用和工程化部署。它們為構建 RAG(檢索增強生成)或智能體(AI Agent)提供了很好的范例,幫助在成本和性能之間找到平衡點。

比如,與 DeepSeek 相比,Qwen3 模型的參數更少,這有助于降低部署成本;支持更多語言,增加了全球開發者的使用便利性;支持 MCP(模型上下文協議),增強了與其他系統的集成能力;還有混合推理模型的設計,讓用戶可以自由選擇是否進行深度推理,從而精確控制輸出成本。

在最近開源的 DeepSearcher 項目(由 Zilliz 開發的深度檢索和報告生成工具)中,現在 DeepSearcher 已經迅速支持了 Qwen3 模型,幫助用戶找到性能和成本之間的最佳平衡點。

Github 地址:

??https://github.com/zilliztech/deep-searcher?tab=readme-ov-file??#configuration-details


本文轉載自??玄姐聊AGI??  作者:玄姐


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-5-13 06:47:02修改
收藏
回復
舉報
回復
相關推薦
欧美 日韩 国产精品| 国产精品永久免费在线| 亚洲av无码一区东京热久久| 国产探花视频在线观看| 99久久久久免费精品国产| 日韩美女激情视频| 中文乱码字幕高清一区二区| 91成人在线精品视频| 丁香五六月婷婷久久激情| 午夜精品一区二区三区在线观看| av手机免费看| 久久午夜精品| 欧美日韩电影在线观看| 最近中文字幕免费视频| 日本一区二区三区视频在线看| 午夜a成v人精品| 中文字幕精品—区二区日日骚| 色丁香婷婷综合久久| 男女男精品视频| 久久久久中文字幕| 5566中文字幕| 九九热爱视频精品视频| 日韩一级片在线观看| 欧美黄色一级片视频| 午夜激情在线| 国产精品成人一区二区不卡| 欧美mv日韩mv国产| 男人天堂成人在线| 国产在线精彩视频| 亚洲欧美激情小说另类| 日本一区免费| 日本高清视频网站| 国产麻豆精品在线| 国产精品吴梦梦| 久久99国产综合精品免费| 精品69视频一区二区三区Q| 色妞一区二区三区| av网站免费在线看| 先锋影音国产精品| 亚洲成人久久一区| 夜夜爽久久精品91| 国产精品xnxxcom| 欧美少妇性性性| 国产第一页视频| 女人高潮被爽到呻吟在线观看| 亚洲精品高清在线| 超碰97在线看| 黄色网页在线看| 国产精品入口麻豆九色| 涩涩日韩在线| www日韩tube| 国产喷白浆一区二区三区| 欧美日韩一区在线播放| 神马电影在线观看| 久久伊99综合婷婷久久伊| 九色91视频| 午夜小视频免费| www.视频一区| 韩国精品一区二区三区六区色诱| 免费国产精品视频| 成人一区二区在线观看| 国产精品对白刺激久久久| 丰满人妻一区二区三区免费| 丁香另类激情小说| 国产三级精品在线不卡| 四虎免费在线观看| 久久亚区不卡日本| 日韩亚洲不卡在线| 一级毛片视频在线观看| 亚洲日本在线天堂| 黄网站色视频免费观看| av不卡高清| 精品久久久久久久久久久| 国产精品亚洲αv天堂无码| 国产超碰精品| 欧美乱妇23p| 国产女主播在线播放| 色老板在线视频一区二区| 亚洲精品一二区| 亚洲综合图片一区| 国内精品久久久久久久影视麻豆 | 91精品久久久久久| jizz中国少妇| 97se亚洲国产综合自在线不卡| 97视频免费观看| 亚洲国产综合久久| 久久精品三级| 国产综合福利在线| 日韩性xxxx| 国产精品美女一区二区| 日本a级片在线播放| 欧美调教sm| 欧美日韩精品三区| 白嫩情侣偷拍呻吟刺激| 欧美日韩中文字幕一区二区三区| 久久久成人av| av网站中文字幕| 国产精品一区二区在线看| 久久影院理伦片| 日本欧美在线视频免费观看| 亚欧色一区w666天堂| 激情五月婷婷久久| 伊人久久噜噜噜躁狠狠躁| 亚洲欧美一区二区三区久久 | 亚洲一二三区不卡| 欧美黑人又粗又大又爽免费| 最新国产精品精品视频| 亚洲欧美日韩在线高清直播| 五月天丁香激情| 日韩高清一区二区| 激情小说综合区| a免费在线观看| 在线观看av不卡| 艳妇乳肉豪妇荡乳xxx| 图片小说视频色综合| 2019中文字幕在线观看| av在线资源观看| 中文字幕成人在线观看| 人人妻人人添人人爽欧美一区| 国产精品国产亚洲精品| 亚洲最新视频在线| 99热国产在线观看| 红桃视频国产一区| 国产精品自拍网| 欧美少妇另类| 欧美日韩午夜视频在线观看| 中文字幕在线视频一区二区| 日本一区二区在线看| 欧洲亚洲免费在线| 日韩有码第一页| 亚洲精品va在线观看| 一区二区三区 欧美| 竹菊久久久久久久| 91av免费观看91av精品在线| 天天操天天摸天天干| 国产一区二区三区免费看| 亚洲v欧美v另类v综合v日韩v| 在线观看爽视频| 亚洲黄色www| 久久久无码精品亚洲国产| 国产美女一区二区三区| 中文字幕一区综合| 亚洲一区二区av| 不卡av电影院| 亚洲av综合色区无码一区爱av| 亚洲精选一二三| 男插女视频网站| 午夜精品亚洲| 99一区二区三区| 色帝国亚洲欧美在线| 日韩精品一区二区三区在线| 欧美爱爱小视频| 成人蜜臀av电影| 18岁网站在线观看| 国产a久久精品一区二区三区| 日本一本a高清免费不卡| 青春有你2免费观看完整版在线播放高清 | 欧美日产在线观看| 伊人影院综合网| 天天做天天爱天天爽综合网| 成人网址在线观看| 中文字幕有码在线观看| 精品少妇一区二区三区免费观看| 九九热精品免费视频| 国产成人午夜精品影院观看视频| 日韩视频一二三| 国产精品115| 欧洲亚洲在线视频| av成人手机在线| 欧美一区二区精美| 国产一级片久久| 97成人超碰视| 亚洲精品久久久中文字幕| jizz国产精品| 午夜精品在线视频| 久久久久久久影视| 69久久99精品久久久久婷婷 | 国产色婷婷国产综合在线理论片a| 最新电影电视剧在线观看免费观看| 欧美久久免费观看| 国产一级特黄视频| 国产亚洲一区字幕| 日韩av福利在线观看| 亚洲激情偷拍| 亚洲永久激情精品| 国产极品模特精品一二| 国产精品白嫩初高中害羞小美女 | 国产精品二三区| 人妻 日韩 欧美 综合 制服| 首页国产欧美日韩丝袜| 日韩人妻一区二区三区蜜桃视频| 极品一区美女高清| 久久久久久久久丰满| 免费黄网站在线| 亚洲国产欧美日韩在线观看第一区| 亚洲天堂网在线观看| 97人妻一区二区精品免费视频| 一色屋精品亚洲香蕉网站| 黄色av电影网站| 美腿丝袜亚洲综合| 免费无码毛片一区二三区| 激情婷婷综合| 岛国视频一区| 久久精品资源| 欧美一级淫片播放口| 成人在线网址| 国产亚洲精品va在线观看| 亚洲精品久久久久久无码色欲四季 | 草视频在线观看| 国产婷婷色一区二区三区| 18深夜在线观看免费视频| 首页亚洲欧美制服丝腿| 国产精品一线二线三线| 99久久夜色精品国产亚洲96| 久久伊人一区| 大奶在线精品| 亚洲aa中文字幕| 国产精品美女午夜爽爽| 欧美又大又粗又长| 国产精品蜜臀| 久久福利视频网| 久久精品视频免费看| 国产亚洲成精品久久| 视频在线观看你懂的| 精品国产乱码久久久久久免费| 中文字幕a级片| 在线观看不卡一区| 麻豆成人免费视频| 欧美日韩国产丝袜美女| 豆国产97在线 | 亚洲| 亚洲精品视频免费观看| 波多野结衣家庭教师在线观看| 337p粉嫩大胆噜噜噜噜噜91av | 久操视频在线免费观看| 午夜精彩视频在线观看不卡| 欧美精品入口蜜桃| 亚洲美女免费视频| 四虎影院中文字幕| 自拍偷自拍亚洲精品播放| 少妇愉情理伦三级| 欧美高清在线精品一区| 国产成人免费观看网站| 久久一区二区三区国产精品| 亚洲av片不卡无码久久| av不卡免费电影| 亚洲中文字幕无码av| 成人av综合一区| 欧美一级片黄色| 91亚洲国产成人精品一区二区三| 国产精品久久久免费观看| 97久久精品人人做人人爽50路| www.88av| 久久婷婷国产综合国色天香| www.狠狠爱| 欧美激情在线一区二区| 亚洲激情图片网| 亚洲桃色在线一区| 久久精品国产av一区二区三区| 午夜伦欧美伦电影理论片| 亚洲图片在线视频| 精品视频免费看| 999av视频| 日韩av一区在线| 国产一级二级三级在线观看| 色偷偷综合社区| 成人黄视频在线观看| 久久久久久久国产精品视频| 高清精品在线| 国产精品视频播放| 日韩三级精品| 久久久神马电影| 成人91在线| 日本大胆人体视频| 在线亚洲欧美| 国产又大又黄又猛| 国产成人在线视频网站| 五月婷婷综合在线观看| 中文字幕成人在线观看| 久草视频在线资源站| 偷窥少妇高潮呻吟av久久免费| 91丝袜一区二区三区| 欧美日本韩国一区二区三区视频| 亚洲第一页在线观看| 亚洲欧美中文另类| 国产黄色在线观看| 欧美一级大片视频| 粉嫩av国产一区二区三区| 九色视频成人porny| 欧美激情777| 久久综合九色综合88i| 美女精品自拍一二三四| 中文字幕99页| 久久久亚洲国产美女国产盗摄| 中文字幕在线有码| 欧美午夜美女看片| 99久久免费国产精精品| 亚洲成人性视频| 毛片在线看网站| 欧洲亚洲女同hd| 成人性生交大片免费看96| 亚洲免费精品视频| 亚洲欧美不卡| 精品无码av一区二区三区不卡| 国产亚洲一二三区| 日本系列第一页| 欧美高清视频一二三区 | 国产精品欧美亚洲| 日韩精品在线观| 欧美24videosex性欧美| 国产精品亚洲自拍| 亚洲桃色综合影院| 国产精彩视频一区二区| 激情成人午夜视频| 久久久久无码精品国产sm果冻 | 男人日女人视频网站| 精品一区二区国语对白| av女人的天堂| 欧美性猛交xxxx乱大交极品| 国产人妖一区二区三区| 中文字幕亚洲一区二区三区五十路 | 一区二区三区加勒比av| 中文字幕人妻色偷偷久久| 亚洲欧美日韩国产中文专区| a'aaa级片在线观看| 91九色蝌蚪嫩草| 中文字幕日韩一区二区不卡| 日本xxxx黄色| 国产欧美精品一区二区色综合| 精品美女久久久久| 亚洲国产精品久久| 高清视频在线观看三级| 国产精品日本一区二区| 亚洲小说欧美另类社区| 亚洲国产欧美日韩在线| 亚洲欧洲国产专区| 91亚洲国产成人精品一区| 正在播放欧美视频| 韩国成人在线| 涩涩涩999| 奇米一区二区三区| 欧洲性xxxx| 精品视频资源站| 日本在线人成| 亚洲va男人天堂| 国产精品va| 精品少妇人妻av一区二区三区| 亚洲狠狠爱一区二区三区| 黄色片一区二区三区| 久久久久中文字幕| 台湾佬综合网| www.色就是色| 国产精品久久久久久久久动漫| 一二三区在线播放| 久久精品国产一区| 136国产福利精品导航网址应用| 日本手机在线视频| 2024国产精品| 中文字幕自拍偷拍| 九九精品在线视频| 欧美黑人做爰爽爽爽| 男人的天堂99| 国产精品美女一区二区在线观看| 国产精品久久久久久久成人午夜| 欧美成人免费全部| 久久亚州av| 爱情岛论坛成人| 亚洲视频一区在线| 刘亦菲久久免费一区二区| 欧美一级电影免费在线观看| sdde在线播放一区二区| 免费黄频在线观看| 亚洲h精品动漫在线观看| 极品美乳网红视频免费在线观看| 国产精品久久久久7777婷婷| 一区二区三区四区在线观看国产日韩| 伊人影院在线观看视频| 欧美性色19p| 免费在线看a| 精品伦精品一区二区三区视频| 视频一区在线视频| 538精品在线观看| 亚洲欧美第一页| 国产精品一站二站| 欧美色图另类小说| 成人免费一区二区三区视频 | 人妻 日韩精品 中文字幕| 自拍偷拍免费精品| 风间由美性色一区二区三区四区| 午夜免费精品视频| 亚洲韩国一区二区三区| 91精彩在线视频| 国产在线欧美日韩| 奇米精品一区二区三区在线观看 | 亚洲一区二区在线免费| 欧美性xxxxxxxx| av中文字幕电影在线看| 亚洲精品视频一区二区三区| 99久久综合国产精品| 国产日本精品视频| 国产精品久久久久久久久久99 |