模仿代理與正向循環


上上週在做研究助理的工作,在 40000 個代理組成的網絡中,我們要透過調整 AI 代理和模仿代理的比例,觀察代理之間合作的情況。

其中的 AI 代理會透過機器學習演算法評估長期利益,並考量合作和背叛兩種行動的後果作權衡;而模仿代理則是利益高就往哪去的逐利角色。

最一開始我嘗試把網絡中放滿 100% 的模仿代理,在賽局中背叛獲得的個體利益較合作更高,網絡進行的是十的六次方輪的動態賽局,所以照理來說在一百萬輪後,背叛的比例應該要壓倒性的高,因為模仿代理就是一些專門背刺他人的不合群者。

結果出來後令人意外,網絡中合作者的比例竟然高達七成,也就是說網絡中百分之七十的人正在合作,這個結果讓人詫異。

於是我決定調整行動的報酬,原先選擇背叛相較合作可以多獲得 0.01 的報酬,將其調整為0,也就是背叛和合作的回報是一樣的。

結果再次模擬後,這一次合作者的比例竟達到百分之百,也就是全部四萬個人都在網絡中相互進行合作。
-
三月的時候我第一次去資工系館上 DSA 課,其實我認為看線上影片的效果還是比較好,但因為想聽聽看林軒田教授現場講課,所以在上半學期去上了一次(下半學期會換另一個老師教)。

結果剛進教室就遇到一個大一住宿舍時認識的朋友,是醫學系大四的,看到他後很開心和他打了招呼,也因為這是大一的必修課,那間階梯教室裡幾乎全是生澀的面孔,我們也就理所當然的坐在一起。

三節課的過程中和他聊了很多,一開始我們都好奇的互問為什麼會在這裡,他說他覺得醫學系讀下來用了很多時間在背東西,但還是想要碰一些讓腦袋靈活運轉的科目,於是他向系辦申請暫停系上的必修一學期,這學期他全選了 coding 相關的課,也去旁聽了電機系的機率。

我的回答也相差無幾,會計也顯然是耗費大量時間記憶的領域,正巧當天講課過程中講到 stack 和 queue,這兩個資料結構最大的分別是 LIFO (後進先出)和 FIFO(先進先出),能夠聽到會計名詞覺得十分親切。

在那之後我們偶爾會討論作業,一起試圖在自己主修領域的的九域之外找到自己的初衷,或許大家的專業不盡然有交集,但來到這邊的理由有著異曲同工的交疊之處。

那天聽了他說了一些醫學系的現狀,記得在下課離開前我問他,所以他之後就要往資訊走了嗎,他露出看起來迷惘的微笑。

「應該還是會回去吧,人總要回家的嗎?」
-
忘了是什麼時候無意間看到「show your work」的概念,推崇的是主動向大家分享自己的工作內容和成長。

這裡指的不是自我誇耀、包裝、或是無限上綱的給自己放上虛偽的成就,而是用分享的心態去向大家展現自己做了什麼、想了什麼、學到了什麼,進而創造新的正向循環。

過去有的時候會覺得不想讓別人知道自己在做些什麼,在管院這樣的風氣尤其嚴重,也許少部分的人會刻意深藏自己,也許躲起來偷偷成長,最終再試圖超越他人。

轉過念,其實 show your work 後得到的好處遠大於壞處,甚至能創造指數性的成長效果。

有資源、有經驗的人知道你正在同樣的道路上努力後,能夠幫助你、給你巨人的肩膀;需要你幫忙的人,也才知道你能夠幫上他們,進而有了機會得到進步。

換言之,更大的資源流動被創造了,合作的群體效益往往是最大的。
-
在無數次 debug 後,我發現原先的網絡模型存在邏輯錯誤,因動態賽局在概念上是同時選擇行動,但在程式模擬上並不能做到真正意義「同時」,所以出現漏洞。

調整程式碼後,在四萬名逐利模仿代理中下修到百分之二十的合作率。

以前曾經聽過一個假說,其認為世界是虛擬的,是一個碩大無比的模擬模型,在做過網絡分析研究後,我覺得這個說法很有趣。

程式網絡中我們會設計 rho = 0、alpha = 0.1、gamma = 0.9、epsilon = 0.02,或許大家會覺得和現實世界的概念抽離,但閔氏空間中確實存在許多參數。

重力加速度是 9.8、一年是 365.25 、氫原子的重量是 1.008,這些又是誰設定的、又是誰說了算。

聚散無緣由,劇本猜不透,如果有一天發現我們真的生存在網絡中,或許緣起緣滅終有定數。

希望在那一天之前社會能少一點爭名奪利,多一些相輔相成,蘊藏更多的正向循環。



停車場的日落