國戰會論壇

國戰會論壇/譚傳毅》兩岸的兵棋推演 誰的真、誰的假?

美國陸戰隊戰爭學院教授與學員,正以兵棋推演台海戰事與美軍部署及介入時機。(圖/War on the Rocks)
美國陸戰隊戰爭學院教授與學員,正以兵棋推演台海戰事與美軍部署及介入時機。

文/譚傳毅

根據美國之音11月1日報導,中國軍方已經運用人工智慧科技進行入侵台灣的兵棋推演(Wargame Military Simulation)。

中國人玩兵棋推演的歷史極為悠久,可以溯源到4500年前,當時的中國人使用石塊和木條等在地面演示陣法。近代兵棋由普魯士宮廷顧問馮萊斯維茨(Von Reisswitz)於1811年發明,可以逼真地預測當時戰場的實際作戰活動,特別是針對雙方的作戰決策。

現代兵棋推演的計算非常複雜,必須大量依賴電腦。首先評估與量化敵我雙方作戰部隊編制、武器系統、戰術作為等參數輸入資料庫;接下來的推演由作戰指揮中心、作戰演訓中心及各作戰執行單位指揮所執行重大議題的推演;最後要有戰果與評估。

想要玩兵棋推演,必須具備先進的C4ISR體系作戰能力,而且要有電腦的協助,否則就是「你打你的、我打我的」。兵棋是一個非常有效的虛擬練兵方法,是美國各軍事學院指揮的必修課程。

人工智慧的興起

1956年美國達特茅斯(Dartmouth)會議中,麥卡錫(John McCarthy)等首次提出人工智慧(Artificial Intelligence AI)的概念,當初定義是「用電腦模擬人的邏輯思維」,尚未包括人類學習能力、歸納總結能力、決策能力等。

近些年來,隨著模糊邏輯和遺傳算法、人工神經網路及深度學習的成熟與興起,讓機器學會人類分析、推理、思維乃至決策能力並不是難事。兵棋推演不只存在於作戰模擬,同時也在商業、醫學等領域中流行。

2016年,人工智慧Alpha Go以4比1戰勝世界圍棋冠軍李世乭,2017年初,Alpha Go連續60次戰勝15名世界頂尖的圍棋棋手,2017年5月,Alpha Go再次以3∶0戰勝當今圍棋排名第一的柯潔,人與機器的對抗徹底倒向有人工智慧支撐的電腦。

雖然兵棋推演不能等同於圍棋或象棋,但是在統裁部的控制之下,紅藍軍參演人員在想定的戰場環境中與對手展開指揮、演訓、戰鬥和評估的完整流程。

植入人工智慧的兵推

為節約人力和時間、提高推演效率,出現了電腦兵棋推演,之後又植入了AI。AI所涉及的技術十分廣泛,例如人工神經網路(Artificial Neural Networks ANN)從資訊處理角度對人腦神經元網路建立某種簡單模型,按不同的連接方式組成不同的網路。

而在神經網路技術基礎上發展的「深度學習」(Deep Learning DL)和「強化學習 」(Reinforcement Learning RL),對於人工智慧技術發展非常重要。

具有感知能力的深度學習(DL)是基於神經網路上的再升級,是對大量有效樣本學習並類比人腦,形成對事物特徵的提取、分類和解讀,因此能找出事物內外的關聯、結構和邏輯關係等等。

具有決策能力的強化學習(RL)則充分融入了糾錯機制,並以此與環境溝通,學習最佳(概率)決策,幾乎就是生物適應環境的途徑。

兩者(DL與RL)比較起來,DL的感知能力較強,可在海量數據中提取有用數據,但是缺乏可靠的決策能力。而RL則具有決策能力,但不擅長處理感知問題;而感知和決策是人工智慧技術的核心。現在結合兩者,就可優勢互補,這個思路不但適用於體系作戰,也同樣適用電腦兵棋。

解放軍如何模擬美軍

首先必須說明的是,兵棋推演並不能真實的攻擊敵人。但是兵推系統與聯合作戰系統又是相同的體系,只不過兵推系統是模擬的,而聯合作戰系統是真實的行動。

這種情形就像「戰」與「訓」的關係一樣,一個是演訓、另一個是作戰。演訓就是透過部隊演習和訓練,模擬在兵棋推演室裡面就已制定的作戰方案。這就是為什麼解放軍非常強調「貼近實戰」的原因,任何演訓都必須是真實作戰,儘管只是一種模擬。

因此,每次解放軍前來台海都是一次次貼近實戰的模擬,隨時可以轉化成實戰,像國軍漢光演習那樣的作秀,演習歸演習、作戰歸作戰的自欺欺人是行不通的。

若問人工智慧對兵棋推演的影響,就是在於整合全面(經由各種偵測設備)感知之後的決策。人工智慧能夠帶給我們的服務,就是決策而已,儘管在「棋」與「戰」之間存在著巨大的差異。

若說解放軍以人工智慧對付美軍,還得經過一系列的「棋」與「戰」。兩者的差異表現在於:

第一,無法真實模擬美軍。解放軍兵推的過程往往是自由發揮的「紅軍思想」,無法保證需要支撐深度學習(DL)數據樣本的有效性。相反的,美軍對於解放軍的認識相當深,這就是為什麼近年解放軍非常渴望與美軍正面接觸,這樣才能獲得足夠多的戰術、戰法與戰鬥的DL數據。若無法與美軍接觸,接觸國軍也可以,至少國軍裝備與思想都是美式的。

第二,戰爭決策是不透明的。一般下棋的棋盤是透明的,是典型的開放式訊息感知狀態下的博弈,棋手每走一步都可以根據當前的棋盤狀況做出決策。而戰鬥過程卻是不透明的,有的真、有的假,充滿了戰爭迷霧。

這需要綜合情報偵察和分析來獲取有效、真實戰場態勢,使得兵棋推演是一種不對稱情報之下的動態指揮博弈。此時,解放軍需要強化學習(RL)手段,讓人工智慧具備能夠剝離戰爭迷霧、獲取有用情報的研判和決策能力。

第三,規則的確立。一般棋類博弈的規則是確定清晰的,而在兵棋推演領域,美中兩軍對抗的實力可能不對等、產生衝突的條件可能不對等,使得指揮官只能依賴專業訓練、指揮經驗,與用兵哲學戰爭的不確定性非常高。

儘管如此,兵棋仍可不斷的累積經驗乃至於情感認知的累積,不斷的自我提升其解讀能力與可執行的規則。初期可能會是人與機器的協同(指導),慢慢的才是機器的自主決策。看起來,兵棋是「棋」,但也不全然是「棋」。

棋與非棋

與一般下棋一樣,兵棋具備兩個基本因素:第一,規則制定。第二,決策過程自由。兵棋推演的核心是規則,包括棋子在地圖上的移動規則、以及判定兩支部隊相遇時交戰結果的裁判規則。人工智慧有助於規則的制定。

此外,在推演過程中若遭遇隨機的意外狀況,則以擲骰子決定,絕非主觀判定。在交戰過程中的攻防,是兩軍指揮官根據自己的歷史經驗和用兵哲學自由開展。

這和國軍漢光演習兵推很不一樣,國軍往往主觀的決定兩軍武備與交戰結果,而未根據真實狀況進行推演。例如在度量國軍與共軍戰鬥力數值必然沒有按照經驗的量化,交戰過程中充滿了主觀意識,必然無法正確裁判兩軍的戰鬥結果。

如果國軍真的按照經驗途徑制定規則,相信戰鬥結果必然出乎意料。規則制定,使得兵棋就像一般的「棋」一樣。至於是否貼近實戰,那就是「你打你的、我打我的」了。

但在另方面,兵棋推演往往要展現真實的作戰過程,很難以下棋時你來我往的回合制來體現;例如戰鬥時可能同步發射不同武器,這使得兵棋變得不是「棋」了。

兵棋推演需要能逼真的反應實際作戰過程,雙方根據態勢發展不斷的決策,才能類比出實際的作戰流程及效果。此外,戰鬥還有不可重複性的特點,以同樣的對抗條件、在不同的隨機因素影響之下,必然會產生完全不同的結果。

因此,兵棋推演所需要模擬的作戰情境繁多,而且關係錯綜複雜、態勢瞬息萬變,一般的「 棋」很難盡含這麼複雜的系統,只能使用電腦,而且是基於人工智慧的計算系統。

(作者譚傳毅為台灣國際戰略學會研究員,法國博士,國戰會專稿,本文授權與洞傳媒國戰會論壇、中時新聞網言論頻道同步刊登)