這一波AI浪潮的一個特點是「生成式」(generative),也就是「GPT」中的「G」。以前人們無論用AI預測分子的化學性質還是下棋打遊戲,都是讓AI完成非黑即白的任務,達成一個簡單結果。現在你無論用ChatGPT寫文章、程式設計,還是用Midjourney畫畫,都是在讓AI幫你「生成」內容,收穫一片繁華景象。
prompt—生成—選擇
比如【圖3-3】是一幅我用Midjourney畫的畫。
畫面中有個巨大的UFO懸浮在一座大金字塔附近的天空中。那個UFO亮著燈,似乎有很多扇窗戶,明顯不是地球文明的產物。地面是一片荒涼的大漠景色。很多人在抬頭看,他們三五成群,或站或坐,也許有幾十或上百人。
在交稿前,這幅畫只有我看過,這就是我的畫。你覺得我在這幅畫的創作過程中做了多大貢獻呢?
其實我的主要貢獻是一句話:「UFO在古埃及飛行。人們抬頭看。」外加幾個參數。
這叫「prompt」,當動詞當名詞都可以,表示對AI提(的)要求,也可以翻譯成「念咒」或「咒語」。
畫面全都是AI生成的。
但我還有別的貢獻,也許是更重要的貢獻。
AI最初生成的是【圖3-4】的4幅畫,都是古埃及壁畫風格。
我認為畫得不夠好,就讓它重新畫。當然,我這麼做只需要點擊一個按鈕,但這畢竟也是一個貢獻。然後它又生成了4幅畫。(圖3-5)
這回我覺得有一幅不錯,就讓它把這幅畫做出幾個變型。(圖3-6)
然後我選定了其中一幅,並且讓它細化成了最前面【圖3-3】展示的那一幅。
這個過程可以重複很多次,AI不怕你折騰,直到你選到滿意的為止。你可以提更細的要求,指定畫面中更多素材、指定繪畫風格……但是歸根結柢,是AI在畫,你只是先提要求(prompt),後選擇。
用GPT生成內容也是這個精神。這與傳統的應用軟體截然不同。用傳統軟體畫畫,畫面中每一個細節都是你自己設計的,電腦是純粹的工具。現在AI則承擔了幾乎全部的創作工作。所以我們才會有一種時代變了、AI要活了的感覺。
當然,你提出prompt和做選擇也是一種創造,因為這個過程體現了你的見識和品位—一個專業科幻畫家肯定比我做得好。我們大概也可以說「念咒即創造」「選擇即創造」。
但關鍵在於這個創造過程不完全屬於你自己:最初是你提的要求,最終是你做的選擇,但是整個過程並不是你完成的。你有掌控感,但是你並沒有—也不需要,也不應該—完全控制。但是你真的很有掌控感。
我們與AI的這種「prompt—生成—選擇」關係,並非新的。
模糊化創造了生成空間
事前提要求,事後決定滿意不滿意,中間盡量少干涉—老闆對員工不也是這樣嗎?甲方對乙方不也是這樣嗎?都是後者在生成,但雙方共同創造了最終結果。
老闆和甲方在這個關係中的美德是尊重生成者的專業技藝。讓AI畫到特別好可能不容易,但我覺得最有意思的是,讓AI「畫不好」更不容易—你很難讓Midjourney生成一幅拙劣的畫。它是由無數專業畫家和大師的作品訓練出來的,只要一出手就至少是專業水準。你固然可以設計這幅畫的大局,但是不管你這大局的設計水準如何,AI總能確保畫的細節達到專業水準。
比如【圖3-7】這幅林中住宅,「咒語」要求是「architectural illustration with retro visuals」(建築插畫呈現復古視覺效果),但什麼是建築插畫和復古效果?你要隨便找個畫家,他恐怕不太容易畫到【圖3-7】這個程度。
筆法就不用說了。單說這個布局和視角,就比我自己想像的好太多了。這就是專業。
這種生成有點像裝修住宅,最理性的做法是你只說一個大概的風格,讓設計師給你做具體設計。你不應該對設計做太多干涉,因為你根本不懂。
雖然給AI提要求通常來說要給具體情境,但是,要求也不要提得太過具體。如果你不太懂專業,那麼保留一定的模糊性,讓AI自行發揮,往往能得到更好的結果。
從憤世嫉俗的角度看,模糊化可能是為了委婉表達,不傷面子。比如你有個想法,如果主管說「你這個想法好」,那就有可能是支持你;如果主管說「你有想法,這很好」,那就形同反對。再比如你要去做一個專案,如果主管說「你放手去做吧」,那可能只是客氣;但如果主管再加一句「總經辦是你的堅強後盾」,那就是真支持。
但是從「提示工程」(Prompt Engineering)的角度看,模糊化創造了生成空間。
劉晗老師在《想點大事》這本書裡有個很有意思的說法。任何一部法律中都有些意思模糊的詞語,比如《中華人民共和國公司法》第五十一條第1款規定,一般的公司要設立監事會,但「股東人數較少或者規模較小的有限責任公司,可以設一至二名監事,不設監事會」。那什麼叫「人數較少或者規模較小」呢?為什麼不規定一個具體的數字呢?
劉晗說,去除模糊性「會使法律規則異常僵化,無法應對變化多端的現實生活」。在發達地區,註冊資本在500萬元以下的公司算小公司,而欠發達地區這就算大公司了,強行規定一個具體數字會讓法律無法操作。所以劉晗說:「法律常常不是為了妥協才故意模糊,而是為了能用才故意模糊。」
模糊,這個事才能辦好。日常管理也是這樣,領導交代下屬任務的時候,最好不要採取事無鉅細、什麼都吩咐的那種「微管理」,只在任務結束後談談感受就好。交代任務就是prompt,談感受就是做選擇。
這裡面有個很微妙的東西。表面上看,模糊的提示詞可能讓你損失了一定的控制權。但實際上,模糊是必要的,而且你並沒有真的喪失掌控權。
擔心AI取代人、政府奴役民眾?
想明白這些道理,我們就能理解為什麼有些人會擔心AI取代人了,因為自古以來就有很多老闆擔心下屬取代他。但我們更能理解這樣的擔心不會具有任何普遍意義,正如絕大多數老闆都沒有被下屬取代。
同樣的,在擔心AGI會不會奴役人類之前,無數智者擔心的是政府會不會奴役民眾。你想想,絕大多數老百姓既不理解政府是怎麼運行的,也不理解各種經濟政策,根本就不關心政治。政府做的很多事情是高度專業化的,它如果不想讓你知道,你就算是個內行也沒用;甚至就算你知道了,發聲了,也沒有多少人在乎。當然現代化國家都有媒體監督,有言論自由,有民主選舉,可是再怎麼樣那也是代議制民主,都是政府在操縱政策。
你看民眾與政府的關係是不是也很像人和AI的關係:民意就是prompt,政府操作就是生成,選舉就是選擇。
那你怎麼能知道政府是不是在為老百姓做事呢?其實還是不用太擔心。
政治學家的一個關鍵認知是,老百姓對政府的各項政策本身確實比較無感—但是對政策變化很敏感。如果大家都支持一個政策,這個政策早就頒布實施了。如果大家都不支持這個政策,這個政策就不會頒布實施。這就意味著任何新政策差不多都是在這樣一個時機下頒布實施的—絕大多數人根本不關心,現在恰好明確支持的人比明確反對的人多了一點點。這些明確的支持者和反對者可能只占有效選民的1%,但他們發揮了大作用。這些人比較在行,相當於理解AGI原理的專家和愛好者。因為別人都不在乎,所以這些人等於代表了民意。政客會小心地聽取這些人的意見—不聽不行,因為還有選舉。
事實證明,政府做得好不好,老百姓還是知道的。研究顯示,老百姓對政府的支持率並不怎麼受總統的花邊新聞之類小事情的影響,主要還是看經濟。【圖3-8】就是美國歷史上消費者情緒指數和民眾對政府支持率的變化情況。
當經濟形勢變好或變壞的時候,消費者情緒會率先變化。東西貴了還是便宜了,自己的錢夠不夠花,其實你心裡有數。但是這個情緒變化不會立即反映到政府支持率上。支持率的變化會比消費者情緒變化遲滯一、兩個季度—但是沒關係,支持率終將改變。
也就是說,如果你政府沒把經濟搞好,老百姓會給你一段時間,但是不會給很久。一旦支持率發生逆轉,再趕上選舉,那你這屆政府就得換人。
政治學家克里斯多夫.萊齊恩(Christopher Wlezien)有個「溫度調節器」理論特別能說明問題。他說公共意見就好像溫度調節器:老百姓不懂經濟是怎麼運行的,這就如同大多數人都不知道空調的運作原理是什麼,我們甚至都不知道房間最理想的溫度應該是多少度。但是,我們能感覺出現在是冷了還是熱了,我們會調節溫度。感覺太冷就開暖氣,太熱就開冷氣,這就足夠了。
所以,借用林肯那句話,政府再厲害也「不能在長時間內糊弄所有的人」。
古代中國沒有民主制度,但是曾經在不同的歷史時期實行過宰相負責制,皇帝只是授權和問責,不做具體行政工作。比如西漢的文景之治、北宋仁宗年間,皇帝代表民意prompt,官員負責生成,然後皇帝再根據結果做選擇,國家其實運行得很好。歷史上英國和日本搞虛君制也是這樣。
現代公司中,股東大會和董事長不過問公司日常事務,也是「prompt—生成—選擇」關係。
讓專業的人做專業的事,而真正的老闆可以提prompt和做選擇,這不但是AI時代的新風尚,也是一種理想的做事模式。