AI：每生成一個字需要高達1兆次的數學運算、1張圖要100兆次

人工智慧

曾智能2026-06-28 16:30

工程師示範AI模型不論在電腦上進行什麼 AI 運作，底層全都是數學運算，只是規模極其龐大。（圖片來源／AMD頻道）

AMD頻道最新一期簡介與拆解機器學習、訓練、推論，以及當你使用 AI 時幕後發生的那些事，還包含實作模型示範，打破外界一些迷思。

首先，不論在電腦上進行什麼 AI 運作，底層全都是數學運算，只是規模極其龐大。外界常說的文本，即使是輕量級、小型的聊天機器人（Chatbot），每生成一個字（Word），背後就需要高達 1 兆次的數學運算。

人們常請ChatGpt生成一張圖片或者合成一張圖片，生成一張中等尺寸的圖片，硬體大約需要處理 100 兆次或更多的數學操作。

人們常聽到的，什麼叫做推論（Inference）什麼又叫做訓練（Training）呢？所謂推論，即使用者日常與現成 AI 模型互動的過程就是推論。給予輸入（如提問），模型依據已設定好的矩陣路徑跑出對應的輸出。

訓練則是調整數據流經各個矩陣層級的方式（調整權重），藉此修正模型，直到它能精準吐出人類想要的正確答案。

節目中工程師示範在一個28乘以28的中小型尺寸銀幕上寫上數字讓AI去辨識，將 AI 架構比喻為日本的柏青哥/彈珠台（Pachinko）。矩陣中的層級與節點就像是彈珠台上的釘子，輸入的數據（彈珠）會根據節點的配置，最終落入不同的輸出位置。

節目中展示的實體 AI 模型，是由 AMD Kria KV260 評估套件驅動，該開發板搭載了 AMD Zynq UltraScale+ MPSoC 晶片，是一款專為電腦視覺（Computer Vision）與工業設計打造的高性能嵌入式平台。

歷史上最早的機器學習嘗試（如 Mark I 認知機），需要工程師透過物理馬達去手動旋轉可變電阻的旋鈕來調整參數。初代的 Mark I Perceptron 僅有 400 個輸入像素，以及 500 多個充當「彈珠台釘子」的可變電阻。

當時是以印有字母（如 X 或 E）的卡片來訓練 Mark I。若猜對就不變；若猜錯，機器就會將旋鈕往正確答案的方向微調一點點，經過反覆測試直至產生高準確率。

當今的LLM演算法來自類神經網路模型更進化，神經網路的第一層負責最基礎的像素模式辨識。例如在這部影片中，某些 LED 節點亮起代表「左上角沒有像素」，另一些則代表「底部有一條橫線」，進行初步過濾。

第二層則接收第一層的精簡資訊並進一步深化，用來辨識「這裡有一條曲線加一條直線」，或「沒有交叉線」等更複雜的結構。

在動態書寫時，AI 會即時計算出各數字的「信賴度（Confidence rating）」。如果寫得不清楚，模型會同時在多個數字間猶豫（例如 8 或 2 的燈號同時閃爍），直到字跡明確才鎖定目標。

在處理數據時，面板上的 LED 燈號會看似雜亂地快速閃爍、盲動。主持人指出這極度類似人類大腦在解讀資訊時，神經元（Neurons）集體開火、放電的混沌運作狀態。這是一部了解AI計算運作基礎的最佳影片之一了。

工程師示範AI模型不論在電腦上進行什麼 AI 運作，底層全都是數學運算，只是規模極其龐大。（圖片來源／AMD頻道）