AMD頻道最新一期簡介與拆解機器學習、訓練、推論,以及當你使用 AI 時幕後發生的那些事,還包含實作模型示範,打破外界一些迷思。
首先,不論在電腦上進行什麼 AI 運作,底層全都是數學運算,只是規模極其龐大。外界常說的文本,即使是輕量級、小型的聊天機器人(Chatbot),每生成一個字(Word),背後就需要高達 1 兆次 的數學運算。
人們常請ChatGpt生成一張圖片或者合成一張圖片,生成一張中等尺寸的圖片,硬體大約需要處理 100 兆次 或更多的數學操作。
人們常聽到的,什麼叫做推論(Inference)什麼又叫做訓練(Training)呢?所謂推論,即使用者日常與現成 AI 模型互動的過程就是推論。給予輸入(如提問),模型依據已設定好的矩陣路徑跑出對應的輸出。
訓練則是調整數據流經各個矩陣層級的方式(調整權重),藉此修正模型,直到它能精準吐出人類想要的正確答案。
節目中工程師示範在一個28乘以28的中小型尺寸銀幕上寫上數字讓AI去辨識,將 AI 架構比喻為日本的柏青哥/彈珠台(Pachinko)。矩陣中的層級與節點就像是彈珠台上的釘子,輸入的數據(彈珠)會根據節點的配置,最終落入不同的輸出位置。
節目中展示的實體 AI 模型,是由 AMD Kria KV260 評估套件 驅動,該開發板搭載了 AMD Zynq UltraScale+ MPSoC 晶片,是一款專為電腦視覺(Computer Vision)與工業設計打造的高性能嵌入式平台。
歷史上最早的機器學習嘗試(如 Mark I 認知機),需要工程師透過物理馬達去手動旋轉可變電阻的旋鈕來調整參數。初代的 Mark I Perceptron 僅有 400 個輸入像素,以及 500 多個充當「彈珠台釘子」的可變電阻。
當時是以印有字母(如 X 或 E)的卡片來訓練 Mark I。若猜對就不變;若猜錯,機器就會將旋鈕往正確答案的方向微調一點點,經過反覆測試直至產生高準確率。
當今的LLM演算法來自類神經網路模型更進化,神經網路的第一層負責最基礎的像素模式辨識。例如在這部影片中,某些 LED 節點亮起代表「左上角沒有像素」,另一些則代表「底部有一條橫線」,進行初步過濾。
第二層則接收第一層的精簡資訊並進一步深化,用來辨識「這裡有一條曲線加一條直線」,或「沒有交叉線」等更複雜的結構。
在動態書寫時,AI 會即時計算出各數字的「信賴度(Confidence rating)」。如果寫得不清楚,模型會同時在多個數字間猶豫(例如 8 或 2 的燈號同時閃爍),直到字跡明確才鎖定目標。
在處理數據時,面板上的 LED 燈號會看似雜亂地快速閃爍、盲動。主持人指出這極度類似人類大腦在解讀資訊時,神經元(Neurons)集體開火、放電的混沌運作狀態。這是一部了解AI計算運作基礎的最佳影片之一了。