精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

揭秘大模型的魔法:實現帶可訓練權重的自注意力機制

人工智能
通過深入剖析自注意力機制及其可訓練權重的核心作用,我們揭開了大模型處理復雜任務時那份“魔力”的關鍵一角。自注意力以其獨特的方式,讓模型能靈活聚焦于輸入序列中的重要信息,大幅提升了上下文理解的能力。

大家好,我是寫代碼的中年人。

上一篇我們實現了一個“無可訓練參數”的注意力機制,讓每個詞都能“看看別人”,計算出自己的上下文理解。

雖然實現起來不難,但它只是個“玩具級”的注意力,離真正的大模型還差了幾個“億”個參數。今天,我們來實現一個可訓練版本的自注意力機制,這可是 Transformer 的核心!

01、什么叫“可訓練”的注意力?

在大模型里,注意力機制不是寫死的,而是學出來的。

為了讓每個詞都能“智能提問、精準關注”,我們需要三個可訓練的權重矩陣:

每個詞自己造問題,然后去問別的詞,看看誰最“對味”,然后決定聽誰的意見。

為什么自注意力機制(Self-Attention)中需要三個可訓練的權重矩陣,也就是常說的:

Wq:Query 權重矩陣

Wk:Key 權重矩陣

Wv:Value 權重矩陣

這個設計最早出現在 2017 年 Google 的論文《Attention is All You Need》中,也就是Transformer架構的原始論文。這三個矩陣的引入不是隨便“拍腦袋”的設計,而是有明確動機的:

# ONE

這段論文奠定了 Transformer 的注意力計算基礎。Transformer 后續所有的 Multi-Head Attention、Encoder-Decoder Attention,都是基于這個 Scaled Dot-Product Attention 構建的。

02、我是誰?我在哪?我要關注誰?

其實自注意力就是一種帶可訓練權重的加權平均機制,它做了三件事:

把每個詞向量分別變成三個形態:Query(查詢)、Key(鍵)、Value(值);

計算 Query 和所有 Key 的相似度(注意力權重);

用這個權重加權 Value 向量,得出最終的輸出向量。每個詞都在用“自己的 Query”去看“別人的 Key”,然后決定“我到底該關注誰”。

如果我們想理解這些內容,最好以代碼的形式來逐步理解:

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import matplotlib.pyplot as plt
import numpy as np


plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False




# ------- 定義可訓練的自注意力模塊 -------
class SelfAttention(nn.Module):
    def __init__(self, embed_dim, dropout=0.1):
        super().__init__()
        self.embed_dim = embed_dim
        self.dropout = dropout


        self.q_proj = nn.Linear(embed_dim, embed_dim)
        self.k_proj = nn.Linear(embed_dim, embed_dim)
        self.v_proj = nn.Linear(embed_dim, embed_dim)
        self.out_proj = nn.Linear(embed_dim, embed_dim)


        self.last_attn_weights = None


    def forward(self, x):
        B, T, C = x.size()


        Q = self.q_proj(x)
        K = self.k_proj(x)
        V = self.v_proj(x)


        scores = torch.matmul(Q, K.transpose(-2, -1)) / (self.embed_dim ** 0.5)
        attn_weights = F.softmax(scores, dim=-1)
        attn_weights = F.dropout(attn_weights, p=self.dropout, training=self.training)


        self.last_attn_weights = attn_weights.detach()


        out = torch.matmul(attn_weights, V)
        out = self.out_proj(out)
        return out


# ------- Create a Simulated Dataset -------
# Simulate a small vocabulary and word embeddings
vocab = {"寫": 0, "代碼": 1, "的": 2, "中年人": 3, "天天": 4, "<PAD>": 5}
embed_dim = 16
vocab_size = len(vocab)
embedding = nn.Embedding(vocab_size, embed_dim)  # Randomly initialized word embeddings


# Sentence data
sentences = [
    ["寫", "代碼", "的", "中年人"],
    ["天天", "寫", "代碼", "<PAD>"]  # Pad the second sentence to match length
]
batch_size = len(sentences)
seq_len = len(sentences[0])  # Sentences have the same length (4)


# Convert sentences to indices
input_ids = torch.tensor([[vocab[word] for word in sent] for sent in sentences])  # (batch_size, seq_len)


# ------- Parameter Settings -------
epochs = 200
dropout = 0.1
model = SelfAttention(embed_dim, dropout)
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=1e-3)


# ------- Train the Model -------
for epoch in range(epochs):
    model.train()
    # Compute input inside the loop to create a fresh computation graph
    x = embedding(input_ids)  # (batch_size, seq_len, embed_dim)
    target = x.clone()  # Target is the same as input for this task


    out = model(x)
    loss = criterion(out, target)


    optimizer.zero_grad()
    loss.backward()  # Compute gradients
    optimizer.step()  # Update model parameters


    if (epoch + 1) % 20 == 0:
        print(f"Epoch {epoch+1:3d}, Loss: {loss.item():.6f}")


# ------- Visualize Attention Weights -------
# Visualize attention matrix for the first sentence
attention = model.last_attn_weights[0].numpy()  # (seq_len, seq_len)
sentence = sentences[0]  # ["寫", "代碼", "的", "中年人"]


plt.figure(figsize=(8, 6))
plt.imshow(attention, cmap='viridis')
plt.title(f"Attention Matrix for Sentence: {' '.join(sentence)}")
plt.xticks(ticks=np.arange(seq_len), labels=sentence)
plt.yticks(ticks=np.arange(seq_len), labels=sentence)
plt.xlabel("Key (Word)")
plt.ylabel("Query (Word)")
plt.colorbar(label="Attention Strength")
for i in range(seq_len):
    for j in range(seq_len):
        plt.text(j, i, f"{attention[i,j]:.2f}", ha="center", va="center", color="white")
plt.tight_layout()
plt.savefig("attention_matrix_sentence1.png")
plt.show()


# Visualize attention matrix for the second sentence
attention = model.last_attn_weights[1].numpy()
sentence = sentences[1]  # ["天天", "寫", "代碼", "<PAD>"]


plt.figure(figsize=(8, 6))
plt.imshow(attention, cmap='viridis')
plt.title(f"Attention Matrix for Sentence: {' '.join(sentence)}")
plt.xticks(ticks=np.arange(seq_len), labels=sentence)
plt.yticks(ticks=np.arange(seq_len), labels=sentence)
plt.xlabel("Key (Word)")
plt.ylabel("Query (Word)")
plt.colorbar(label="Attention Strength")
for i in range(seq_len):
    for j in range(seq_len):
        plt.text(j, i, f"{attention[i,j]:.2f}", ha="center", va="center", color="white")
plt.tight_layout()
plt.savefig("attention_matrix_sentence2.png")
plt.show()

上面的代碼執行后輸出:


代碼詳解:

這段代碼實現了一個簡單的自注意力(Self-Attention)模型,并通過一個模擬的中文數據集進行訓練,展示自注意力機制如何捕捉句子中詞語之間的關系。以下是代碼的詳細解釋,以及對自注意力機制的深入分析。

這段代碼的核心目標是:實現自注意力模塊:通過定義一個SelfAttention類,實現自注意力機制,模擬Transformer模型中的核心組件。訓練模型:使用一個簡單的中文詞匯數據集,訓練自注意力模型,使其學習詞語之間的注意力分布。可視化注意力權重:通過繪制注意力矩陣,直觀展示模型如何關注句子中不同詞語之間的關系。

代碼主要分為以下幾個部分:數據集構建:構造一個小型中文詞匯表和兩個短句,模擬自然語言處理任務。模型定義:實現自注意力模塊,包含查詢(Query)、鍵(Key)、值(Value)的線性變換和注意力計算。訓練過程:通過優化模型,使其輸出盡可能接近輸入(一種簡單的自監督學習任務)。可視化:繪制注意力矩陣,展示模型對不同詞語的關注程度。

03、自注意力機制詳解

自注意力機制的核心思想

自注意力是Transformer模型的核心組件,用于捕捉序列中元素(詞、字符等)之間的關系。

其核心思想是:

每個輸入元素(如詞)同時扮演查詢(Query)、鍵(Key)和值(Value)三個角色。通過計算查詢與鍵的相似度,生成注意力權重,決定每個元素對其他元素的關注程度。使用注意力權重對值進行加權求和,生成上下文感知的表示。

數學公式:

# ONE

訓練權重的作用:

在訓練過程中,自注意力機制的權重(W_q, W_k, W_v, W_out)通過優化器更新,目標是使模型輸出盡可能接近輸入(MSE損失)。

具體作用:

學習語義關系:通過調整W_q和W_k,模型學習詞之間的語義關聯。例如,“寫”和“代碼”可能有較高的注意力權重,因為它們在語義上相關。

增強表示:通過W_v和W_out,模型生成更豐富的上下文表示,捕捉句子中詞語的相互影響。

動態關注:注意力權重是動態計算的,允許模型根據輸入內容靈活調整關注重點。

通過深入剖析自注意力機制及其可訓練權重的核心作用,我們揭開了大模型處理復雜任務時那份“魔力”的關鍵一角。自注意力以其獨特的方式,讓模型能靈活聚焦于輸入序列中的重要信息,大幅提升了上下文理解的能力。但這只是開端。在下一章,我們將進一步探討多頭注意力機制,看它如何通過并行處理多組注意力,為模型帶來更強的表達力和靈活性。

責任編輯:龐桂玉 來源: 寫代碼的中年人
相關推薦

2025-08-11 06:17:54

2018-08-26 22:25:36

自注意力機制神經網絡算法

2024-06-28 08:04:43

語言模型應用

2025-04-25 00:20:00

大模型tokenizer

2024-04-03 14:31:08

大型語言模型PytorchGQA

2025-10-16 09:00:00

大模型

2023-05-05 13:11:16

2020-09-17 12:40:54

神經網絡CNN機器學習

2024-12-09 00:00:10

2025-07-16 10:15:51

2024-12-17 14:39:16

2023-01-01 13:31:47

模型訓練

2024-12-04 09:25:00

2025-06-20 10:18:58

大模型

2024-09-19 10:07:41

2023-10-07 07:21:42

注意力模型算法

2024-06-06 09:18:48

2024-10-31 10:00:39

注意力機制核心組件

2017-08-03 11:06:52

2023-12-11 14:21:00

模型訓練
點贊
收藏

51CTO技術棧公眾號

久久精品二区亚洲w码| 欧洲亚洲一区二区| 97免费视频观看| 五月天综合视频| 中文字幕免费高清电视剧网站在线观看| 激情小说一区| 综合久久久久久| 日本欧美一级片| 极品人妻一区二区| 久久日韩视频| 蜜臀va亚洲va欧美va天堂| 亚洲精品成人av| 999久久欧美人妻一区二区| 女人和拘做爰正片视频| 黄色一级视频免费看| 97久久综合区小说区图片区| 中文字幕日韩av资源站| 国产超碰91| 日韩视频中文字幕在线观看| 99热播精品免费| 国产香蕉久久精品综合网| 26uuu亚洲伊人春色| 制服丝袜在线第一页| 国产精品va在线观看视色| 蜜桃视频一区二区| 久久久噜噜噜久久久| 四虎国产精品免费| 欧美成人a交片免费看| 91尤物视频在线观看| 97精品在线视频| 国产ts丝袜人妖系列视频| 美女搞黄视频在线观看| 91色综合久久久久婷婷| 国产成人精品视频| 免费黄在线观看| 久久久久久一区二区三区四区别墅| 亚洲国产成人午夜在线一区 | 91免费在线视频| 蜜桃av免费在线观看| 777午夜精品电影免费看| 久久久久久久久久久99999| 国产成人精品免费久久久久| 久久免费视频6| 欧美综合精品| 欧美优质美女网站| 青少年xxxxx性开放hg| www.五月婷婷| 久久99伊人| 日韩中文字幕在线播放| 免费看91视频| 韩国美女久久| 亚洲人成人一区二区在线观看| 91免费版网站入口| 中文字幕 亚洲视频| 国产高清一区| 欧美大片日本大片免费观看| 国产精品333| 成人在线免费观看| 国产激情一区二区三区四区| 国a精品视频大全| 青草草在线视频| 要久久爱电视剧全集完整观看| 欧美中文字幕一区二区三区| 国产又粗又长又爽视频| 色猫av在线| 激情成人综合网| 91精品久久久久久久久青青| 久久久久亚洲av片无码| 日本在线成人| 欧美日韩中文字幕在线| 亚洲一区二区三区乱码| 国产77777| 日本不卡视频在线| 欧美日产国产成人免费图片| 欧美一区二区三区成人精品| 中文字幕日韩亚洲| 精品久久香蕉国产线看观看gif| 日韩中文字幕av在线| 国产av无码专区亚洲av| 久久久久久久尹人综合网亚洲| 91精品国产高清久久久久久久久 | 日韩三级一区二区| 丝袜美腿亚洲色图| 欧美激情aaaa| 国产激情av在线| 成人激情在线| 亚洲精品视频播放| 亚洲AV成人精品| 粉嫩久久久久久久极品| 欧美另类久久久品| 国产极品美女高潮无套久久久| 在线三级中文| 午夜激情一区二区| 国产肉体ⅹxxx137大胆| 牛牛精品一区二区| 欧美亚洲国产一区二区三区va| 日韩欧美国产片| 亚洲欧美se| 亚洲在线视频网站| 公共露出暴露狂另类av| 天堂а√在线资源在线| 国产欧美精品一区二区色综合| 国产伦精品一区二区三区免费视频| 亚洲香蕉在线视频| 久久久久久婷| 成人在线视频福利| 色婷婷激情五月| 国产成人精品免费一区二区| 成人信息集中地欧美| 欧美 日韩 国产 精品| 寂寞少妇一区二区三区| 国产精品日韩一区二区三区 | 成人性生交大合| 国产专区欧美专区| 在线观看免费黄色小视频| 国产精品一区一区三区| 成人久久精品视频| 五月婷婷久久久| 91啪亚洲精品| 亚洲激情免费视频| 视频在线日韩| 欧美自拍偷拍午夜视频| 亚洲熟女一区二区三区| 欧美丝袜一区| 91国产视频在线| a级片在线免费看| 免费看一级大黄情大片| av观看在线| 在线一区二区三区四区五区| 亚洲AV成人精品| 欧美成人激情| 完全免费av在线播放| 亚洲中字在线| 日韩av免费在线观看| 国产高清视频免费| 中文字幕免费不卡| 丰满爆乳一区二区三区| 日韩08精品| 日韩一级裸体免费视频| 免费又黄又爽又猛大片午夜| 日韩精品一区第一页| 国产欧美精品日韩| 国产熟女精品视频| 成人精品国产福利| 鲁鲁狠狠狠7777一区二区| 国产中文字幕在线看| 亚洲天堂免费看| 日韩爱爱小视频| 亚洲网一区二区三区| 日韩毛片在线看| 午夜偷拍福利视频| 久久久一二三| 久久久久久a亚洲欧洲aⅴ| 成人精品一区二区三区免费| 色综合天天综合在线视频| 天天插天天操天天射| 综合国产视频| 国产精品盗摄久久久| 国产成人精品无码高潮| 亚洲欧洲另类国产综合| 免费成年人高清视频| 成人爽a毛片免费啪啪红桃视频| 欧美成人国产va精品日本一级| 中文字幕日韩一级| 精一区二区三区| 精选一区二区三区四区五区| 91看片在线观看| 亚洲一区二区三区中文字幕| 无人在线观看的免费高清视频| 欧美成人黄色| 久久精品一偷一偷国产| 五月天婷婷激情| 国产精品一区二区无线| 日本道在线视频| 日韩精品视频中文字幕| 欧美激情一二区| 91久久久久国产一区二区| 91女神在线视频| 亚洲狼人综合干| 亚洲澳门在线| 日韩美女写真福利在线观看| 国产最新视频在线观看| 欧美色图天堂网| 草草影院第一页| 欧美aⅴ一区二区三区视频| dy888午夜| 成午夜精品一区二区三区软件| 国产91精品久久久| 在线观看av的网站| 精品成人a区在线观看| 动漫性做爰视频| www.66久久| 隔壁人妻偷人bd中字| 亚洲91在线| 一夜七次郎国产精品亚洲| 91porny在线| 国产高清亚洲一区| 免费在线观看亚洲视频| 成人在线亚洲| 91手机在线视频| 国产激情在线视频| 日韩精品亚洲精品| 国产精品国产av| 中文字幕一区免费在线观看| 在线观看的毛片| 欧美日一区二区在线观看| 成人免费激情视频| 免费毛片b在线观看| 色青青草原桃花久久综合| 这里只有久久精品视频| 久久久国产综合精品女国产盗摄| 国产三级精品三级在线| 91精品国产91久久久久久密臀| 精品国产综合| 九九99久久精品在免费线bt| 超碰精品一区二区三区乱码| 91麻豆国产在线| 色综合久久久久综合体| 久草网在线观看| 99在线精品观看| 午夜国产福利在线观看| 视频一区欧美精品| 日韩av中文字幕第一页| 大型av综合网站| 成人福利视频网| 日韩a**中文字幕| 97免费在线视频| av软件在线观看| 尤物99国产成人精品视频| 天堂中文在线资源| 日韩视频免费观看高清完整版 | 精品视频免费在线观看| 国产精品国内视频| 麻豆视频在线观看免费网站黄| 久久影院资源网| 中文字幕在线视频区| 亚洲色图色老头| 久久久久久av无码免费看大片| 亚洲国产精品久久不卡毛片 | 欧美高清在线观看| 黄色片网站在线| 色偷偷亚洲男人天堂| 大胆av不用播放器在线播放 | 亚洲综合社区网| 美女精品导航| 日韩精品视频在线播放| 成人黄色免费网| 色94色欧美sute亚洲13| 国产稀缺精品盗摄盗拍| 国产精品久久久久一区二区三区 | 久久久久久亚洲av无码专区| 日韩欧美在线字幕| 日本一区二区三区精品| 欧美性xxxxx极品娇小| 日本高清不卡码| 中文字幕一区二区三区在线观看| 舐め犯し波多野结衣在线观看| 久久日韩精品一区二区五区| 国产永久免费网站| 精品一区二区三区免费观看| 国产无遮挡猛进猛出免费软件 | 波多野结衣成人在线| 成人欧美magnet| 国产999在线观看| 欧美va在线观看| 国产精品亚洲一区二区三区| 欧美jizz18| 超碰97在线人人| 牛牛精品成人免费视频| 欧美精品亚洲精品| 在这里有精品| 久久99精品久久久久久水蜜桃| 色婷婷久久久| 91嫩草视频在线观看| 97视频一区| 久久精品二区| 不卡一区综合视频| 中文字幕第50页| 91久久久久| 9色视频在线观看| 999亚洲国产精| 国产一二三四五| 亚洲成人中文| 一本二本三本亚洲码| 精品久久精品| 国产精品波多野结衣| 国内揄拍国内精品久久| 一区二区三区国产福利| 中文字幕一区二区三区欧美日韩| 品久久久久久久久久96高清| 全球成人免费直播| 人妻无码一区二区三区四区| 亚洲国产日韩在线| 老子影院午夜伦不卡大全| 久久久久久穴| 欧美性受xxxx黒人xyx性爽| 羞羞视频在线观看欧美| 91网址在线播放| 一区二区三区导航| 天天干天天草天天| 高清久久久久久| 一二三不卡视频| 亚洲视频综合在线| 国产午夜小视频| 中文字幕在线一区免费| 精品亚洲永久免费| 欧洲精品视频在线观看| 91精品在线视频观看| 日韩va亚洲va欧洲va国产| av网站大全在线观看| 九九热视频这里只有精品| 中文日产幕无线码一区二区| 91久久在线观看| 久久99国内| 国产日韩精品久久| 超碰精品在线观看| 亚洲欧洲精品一区| 欧美少妇性xxxx| 成人午夜视频免费观看| 美女一区二区三区在线观看| 亚洲成人福利视频| 国产精品三级在线观看| 国产亚洲欧美在线精品| 日韩一级高清毛片| 亚洲av成人无码久久精品老人 | 色综合一区二区| 99久久精品免费看国产交换| 亚洲欧美日韩国产精品| 成人1区2区3区| 国产亚洲欧美aaaa| 国产福利小视频在线观看| 一本色道久久综合狠狠躁篇怎么玩 | 亚洲综合自拍一区| 欧美色图在线播放| 国内自拍在线观看| www.99精品| 久久97人妻无码一区二区三区| 日韩一级片在线播放| 一区二区三区视频网站| 日本成人免费在线| 日本精品在线中文字幕| 国产一级特黄a大片99| 成人在线免费观看91| 成人在线观看a| eeuss影院一区二区三区| 日本免费一二三区| 欧美一二区视频| 国产激情视频在线观看| 国产日韩欧美在线播放| 欧美日韩一二| 免费激情视频在线观看| 91麻豆成人久久精品二区三区| 日本三级网站在线观看| 精品国产成人在线影院 | 欧美国产视频一区二区| 亚洲精品不卡在线观看| 亚洲午夜精品国产| 国产欧美日韩一级| xxx在线播放| 国产精品美女久久久久久久 | 国产综合 伊人色| 亚洲婷婷在线| 亚洲av无码久久精品色欲| 亚洲精品五月天| 日本va欧美va国产激情| 亚洲精品日韩在线| 欧美香蕉视频| 在线观看成人av电影| 欧美一区免费| 成人三级视频在线播放| 国产午夜精品理论片a级大结局| 在线观看 亚洲| 色偷偷偷综合中文字幕;dd| 精品美女一区| av磁力番号网| www.色综合.com| 国产微拍精品一区| 亚洲国产精品高清久久久| 美女扒开腿让男人桶爽久久软| 开心色怡人综合网站| 日本不卡123| 蜜桃av.com| 一本大道久久a久久精二百| 你懂的视频在线免费| 久久久精品网站| 国产精品极品在线观看| 欧美亚洲精品一区二区| 久久久精品国产免大香伊 | 黑人巨大精品欧美一区二区三区| 中文字幕在线网址| 欧美美女18p| 欧美韩一区二区| 三级a在线观看| 亚洲国产日韩a在线播放性色| 午夜福利一区二区三区| 国产日韩精品在线观看| 国产一区亚洲| 亚洲av片不卡无码久久| 欧美一级在线免费| jizz在线观看|