執行摘要
生成式人工智慧 (AI) 是一項使機器能夠創建文字、圖像、程式碼等內容的技術,近年來經歷了爆炸性增長。本白皮書以簡單易懂的語言概述了生成式人工智慧目前無需人工幹預即可可靠地完成的工作,以及未來十年的預期發展方向。我們調查了其在寫作、藝術、程式設計、客戶服務、醫療保健、教育、物流和金融領域的應用,重點介紹了人工智慧在哪些領域可以自主運行,以及哪些領域仍需要人工監督。白皮書也透過現實世界的案例來說明其成功之處和限制。主要發現包括:
-
廣泛應用: 2024年,65%的受訪公司表示將定期使用生成式人工智慧,這一比例幾乎是前一年的兩倍(《 2024年初人工智慧發展狀況 | 麥肯錫》)。應用領域涵蓋行銷內容創作、客戶支援聊天機器人、程式碼生成等。
-
目前的自主能力:現今的生成式人工智慧能夠在極少的監督下可靠地處理結構化、重複性的任務。例如,自動產生公式化的新聞報導(例如公司獲利摘要)( Philana Patterson – ONA 社群簡介)、在電商網站上產生產品描述和評論重點,以及自動完成程式碼。在這些領域,人工智慧通常會接管日常的內容生成工作,從而增強人類工作者的能力。
-
複雜任務的人機協同:對於更複雜或開放式的任務,例如創意寫作、詳細分析或醫療建議,通常仍需要人工監督,以確保事實準確性、倫理判斷和品質。如今,許多人工智慧部署都採用「人機協同」模型,即由人工智慧起草內容,然後由人工審核。
-
近期改進:未來5到10年,生成式人工智慧預計將變得更加可靠和自主。模型精準度和護欄機制的進步,或許能讓人工智慧以最少的人工投入處理更多創意和決策任務。例如,專家預測,到2030年,人工智慧將即時處理大部分客戶服務互動和決策(《重塑客戶體驗轉型:行銷人員必須做到這兩點》 ),一部熱門影片的製作內容中90%可能由人工智慧產生(《工業和企業的生成式人工智慧用例》 )。
-
到2035年:十年後,我們預期自主人工智慧代理將在眾多領域普及。人工智慧導師可以大規模提供個人化教育,人工智慧助理可以可靠地起草法律合約或醫療報告以供專家簽核,自動駕駛系統(借助生成式模擬)可以端到端地運行物流操作。然而,某些敏感領域(例如高風險的醫療診斷、最終法律決定)可能仍需要人類判斷,以確保安全和問責。
-
倫理與可靠性擔憂:隨著人工智慧自主性的增長,擔憂也隨之增加。目前存在的問題包括幻覺(人工智慧編造事實)、生成內容的偏見、缺乏透明度以及可能被濫用於虛假資訊。確保人工智慧在無人監管的情況下仍然值得信賴至關重要。人工智慧領域正在取得進展,例如,各組織正在加大對風險緩解的投入(解決準確性、網路安全和智慧財產權問題)( 《人工智慧現狀:全球調查》| 麥肯錫),但仍需建立健全的治理和倫理框架。
-
本文架構:首先,我們將介紹生成式人工智慧以及自主應用與監督應用的概念。然後,我們將針對每個主要領域(寫作、藝術、程式設計等),討論人工智慧目前能夠可靠地完成哪些任務,以及未來可能實現的任務。最後,我們將探討跨領域挑戰、未來預測,以及負責任地運用生成式人工智慧的建議。
總體而言,生成式人工智慧已被證明能夠在無需人類持續指導的情況下處理一系列令人驚訝的任務。透過了解其當前的限制和未來的潛力,組織和公眾可以更好地為一個人工智慧不再只是工具,而是工作和創造力的自主協作者的時代做好準備。
介紹
人工智慧早已能夠分析數據,但直到最近,AI系統才學會了創作——撰寫散文、創作圖像、編寫軟體等等。這些生成式AI模型(例如用於文字的GPT-4或用於影像的DALL·E)在海量資料集上進行訓練,以回應提示產生新穎的內容。這項突破引發了各行各業的創新浪潮。然而,一個關鍵問題隨之而來:我們究竟能信任AI在無需人工複核其輸出的情況下獨立完成哪些工作?
要回答這個問題,區分監督和自主:
-
人工監督的人工智慧是指人工智慧的輸出在最終定稿前需要經過人工審核或篩選的場景。例如,記者可能會使用人工智慧寫作助理來撰寫文章,但編輯會對其進行編輯和批准。
-
自主人工智慧(無需人工幹預的人工智慧)是指能夠執行任務或產生內容並直接投入使用的人工智慧系統,幾乎無需人工編輯。例如,自動聊天機器人無需人工代理即可解決客戶查詢,或新聞機構自動發布由人工智慧產生的體育賽事比分摘要。
生成式人工智慧已在兩種模式下部署。 2023年至 2025 年,採用率將大幅提升,各組織都在積極嘗試。 2024 年的一項全球調查發現,65% 的公司定期使用生成式人工智慧,而一年前這一數字僅為三分之一( 2024 年初人工智慧現狀 | 麥肯錫)。個人也開始使用 ChatGPT 等工具——據估計,到 2023 年中期,79% 的專業人士至少接觸過一些生成式人工智慧( 2023 年人工智慧現狀:生成式人工智慧的突破之年 | 麥肯錫)。這種快速普及是由效率和創造力提升的前景所驅動的。然而,現在仍處於“早期階段”,許多公司仍在製定如何負責任地使用人工智慧的政策( 2023 年人工智慧現狀:生成式人工智慧的突破之年 | 麥肯錫)。
自主性為何重要:讓人工智慧在無人監督的情況下運行,可以帶來巨大的效率提升——徹底自動化繁瑣的任務——但這也提高了可靠性的要求。自主的人工智慧代理必須做到正確無誤(或了解其限制),因為可能沒有人類即時發現錯誤。有些任務比其他任務更適合這樣做。通常,人工智慧在以下情況下表現最佳:
-
此任務具有清晰的結構或模式(例如,從資料產生常規報告)。
-
錯誤的風險較低或容易容忍(例如,如果不令人滿意,可以丟棄影像生成,而不是醫學診斷)。
-
有大量訓練數據,因此人工智慧的輸出是基於真實的例子(減少猜測)。
相較之下,開放式、高風險或需要細緻判斷的任務如今較不適合零監督。
在以下章節中,我們將探討一系列領域,以了解生成式人工智慧的現況和未來發展方向。我們將透過具體案例——從人工智慧撰寫的新聞文章和人工智慧生成的藝術作品,到程式碼編寫助理和虛擬客服人員——重點介紹哪些任務可以由人工智慧端到端完成,哪些任務仍需要人工參與。對於每個領域,我們都明確區分了當前能力(大約2025年)和2035年可能實現的可靠能力的現實預測。
透過描繪跨領域自主人工智慧的現狀和未來,我們旨在為讀者提供一個平衡的理解:既不過度炒作人工智慧神奇般地萬無一失,也不低估其真實存在且不斷增長的能力。在此基礎上,我們將探討在無人監管的情況下信任人工智慧所面臨的主要挑戰,包括倫理考量和風險管理,最後總結出一些關鍵要點。
寫作和內容創作中的生成式人工智慧
生成式人工智慧最早引起轟動的領域之一是文字生成。大型語言模型可以產生各種內容,從新聞文章、行銷文案到社群媒體貼文和文件摘要。但是,這些寫作有多少可以在沒有人工編輯的情況下完成呢?
目前能力(2025):人工智慧作為日常內容的自動編寫者
如今,生成式人工智慧能夠可靠地處理各種日常寫作任務,幾乎無需人工幹預。新聞業就是一個典型的例子:美聯社多年來一直使用自動化技術,每季直接從財務資料來源產生數千份公司收益報告( Philana Patterson – ONA 社群簡介)。這些簡短的新聞報導遵循範本(例如,「X 公司報告收益為 Y,成長 Z%…」),而人工智慧(使用自然語言生成軟體)可以比任何人類更快地填充數位和措辭。美聯社的系統會自動發布這些報道,大大擴展了其覆蓋範圍(每季度超過 3,000 篇報道),而無需人工撰寫(自動化收益報道成倍增加 | 美聯社)。
體育新聞報道也得到了類似的增強:人工智慧系統可以收集體育賽事統計數據並產生回顧報告。由於這些領域由數據驅動且公式化,只要數據正確,錯誤就很少發生。在這些情況下,我們看到了真正的自主性——人工智慧撰寫內容,內容立即發布。
企業也正在使用生成式人工智慧來撰寫產品描述、電子郵件簡報和其他行銷內容。例如,電商巨頭亞馬遜現在就使用人工智慧來匯總客戶對產品的評論。人工智慧會掃描許多個人評論的文本,並產生一段簡潔的突出顯示段落,重點介紹人們對該產品的喜好,然後將其顯示在產品頁面上,無需手動編輯(亞馬遜利用人工智慧改善客戶評論體驗)。下圖展示了此功能在亞馬遜行動應用程式上的部署情況,其中「客戶評價」部分完全由人工智慧根據評論數據產生:
(亞馬遜利用人工智慧提升顧客評論體驗)電商產品頁面上的人工智慧產生的評論摘要。亞馬遜的系統將用戶評論中的共同點(例如易用性、性能)總結成一個簡短的段落,並向購物者展示「人工智慧根據客戶評論文字產生的評論」。
這些用例表明,當內容遵循可預測的模式或從現有資料中聚合而成時,AI通常可以單獨處理。其他目前範例包括:
-
天氣和交通更新:媒體使用人工智慧根據感測器數據編制每日天氣報告或交通公告。
-
財務報告:公司自動產生直覺的財務摘要(季度業績、股市簡報)。自2014年以來,彭博社和其他新聞機構一直使用人工智慧協助撰寫公司盈利新聞摘要——一旦輸入數據,這一過程基本上自動運行(美聯社的「機器人記者」現在正在撰寫自己的報道 | The Verge )(懷俄明州記者被抓使用人工智能製造虛假引言和報道)。
-
翻譯與轉錄:轉錄服務如今利用人工智慧產生會議記錄或字幕,無需人工打字。雖然這些語言任務並非創造性地生成,但它們能夠自主運行,並具有高精度,從而確保音訊清晰。
-
草稿產生:許多專業人士使用 ChatGPT 等工具來起草電子郵件或文件的初版,如果內容風險較低,偶爾會幾乎不做任何編輯就發送。
然而,對於更複雜的文章,到 2025 年,人工監督仍是常態。新聞機構很少直接發布來自人工智慧的調查性或分析性文章——編輯將對人工智慧撰寫的草稿進行事實查核和修改。人工智慧可以模仿風格和結構,但可能會引入事實錯誤(通常稱為「幻覺」)或不恰當的措辭,需要人類來糾正。例如,德國報紙《快報》引入了一位名為 Klara 的人工智慧「數位同事」來幫助撰寫初始新聞稿。 Klara 可以有效地起草體育報道,甚至可以寫出吸引讀者的標題,為《快報》 11% 的文章做出了貢獻——但人類編輯仍然會審查每篇文章的準確性和新聞誠信,尤其是對於復雜的故事(記者在新聞編輯室使用人工智能工具的 12 種方式 - Twipe )。這種人機合作關係在今天很常見:人工智慧負責產生文字的繁重工作,人類根據需要進行整理和修改。
2030-2035年展望:邁向可信自主寫作
未來十年,我們預期生成式人工智慧在產生高品質、符合事實的文字方面將變得更加可靠,這將拓寬其自主處理的寫作任務範圍。以下幾個趨勢支持了這個觀點:
-
提升準確性:正在進行的研究正在迅速降低人工智慧產生虛假或不相關資訊的傾向。到2030年,經過更完善訓練的高階語言模型(包括即時與資料庫核實事實的技術)將能夠在內部實現接近人類層級的事實查核。這意味著人工智慧可以自動從來源資料中提取正確的引文和統計數據,撰寫一篇完整的新聞稿,幾乎無需任何編輯。
-
領域特定人工智慧:我們將看到更專業的生成模型,這些模型針對特定領域(法律、醫學、技術寫作)進行了微調。 2030年的法律人工智慧模型或許能夠可靠地起草標準合約或總結案例——這些任務結構公式化,但目前需要律師投入大量時間。如果人工智慧接受過經過驗證的法律文件的訓練,其草稿可能足夠可靠,律師只需快速瀏覽一下即可。
-
自然風格與連貫性:模型在長篇文件中保持上下文的能力越來越強,從而能夠產生更連貫、切中要點的長篇內容。到 2035 年,人工智慧有望能夠獨立創作一本像樣的非虛構類書籍或技術手冊的初稿,而人類主要扮演顧問的角色(例如設定目標或提供專業知識)。
這在實踐中會是什麼樣子?常規新聞工作在某些方面可能幾乎完全自動化。我們可能會在 2030 年看到一家新聞機構使用人工智慧系統撰寫每一份收益報告、體育報道或選舉結果更新的第一個版本,而編輯只需抽取幾個內容進行品質保證。事實上,專家預測,越來越多的線上內容將由機器生成——行業分析師的一項大膽預測表明,到 2026 年,高達 90% 的線上內容可能是人工智慧生成的(到 2026 年,非人類生成的線上內容將大大超過人類生成的內容——OODAloop ),儘管這個數字尚有爭議。即使是更保守的結果也意味著到 2030 年代中期,大多數常規網路文章、產品文案,甚至個人化新聞提要都將由人工智慧創作。
在行銷和企業傳播領域,生成式人工智慧很可能會被委託自主運作整個行銷活動。它可以產生並發送個人化的行銷郵件、社群媒體貼文和廣告文案,並根據客戶反應不斷調整訊息內容——所有這些都無需人工文案的介入。 Gartner 分析師預測,到 2025 年,至少 30% 的大型企業外發行銷訊息將由人工智慧合成產生(產業和企業的生成式人工智慧用例),而這一比例到 2030 年只會上升。
然而,值得注意的是,人類的創造力和判斷力仍將發揮作用,尤其是在高風險內容方面。到2035年,人工智慧或許能夠獨立處理新聞稿或部落格文章,但對於涉及問責或敏感話題的調查性新聞報道,媒體機構可能仍會堅持人工監督。未來可能會出現一種分層模式:人工智慧自主製作大部分日常內容,而人類則專注於編輯和製作策略性或敏感內容。本質上,隨著人工智慧能力的提升,「常規」工作的界限將會擴大。
人工智慧產生的互動式敘述或個人化報告等新形式的內容也可能出現。例如,一份公司年度報告可以由人工智慧產生多種風格——高階主管的簡介版、員工導向的敘述版、分析師的資料豐富版——每種風格都基於相同的基礎資料自動產生。在教育領域,人工智慧可以動態編寫教科書,以適應不同的閱讀程度。這些應用程式可以在很大程度上實現自動化,但以經過驗證的資訊為基礎。
寫作的發展軌跡表明,到2030年代中期,人工智慧將成為一位高產量的作家。真正自主運作的關鍵在於建立對其輸出的信任。如果人工智慧能夠始終如一地展現事實準確性、文體品質並符合倫理標準,那麼逐行人工審核的需求將會減少。到2035年,這份白皮書本身的部分內容很可能由人工智慧研究人員撰寫,而無需編輯——只要有適當的保障措施到位,我們對這一前景持謹慎樂觀的態度。
視覺藝術與設計中的生成式人工智慧
生成式人工智慧 (Generative AI) 創造圖像和藝術作品的能力激發了大眾的想像力,從贏得藝術比賽的 AI 生成畫作,到與真實素材難以區分的深度偽造影片。在視覺領域,諸如生成對抗網路 (GAN) 和擴散模型(例如穩定擴散模型、Midjourney 模型)之類的 AI 模型可以根據文字提示生成原始圖像。那麼,AI 現在能否成為自主的藝術家或設計師呢?
目前能力(2025):人工智慧作為創意助手
截至 2025 年,生成模型已能夠按需創建圖像。使用者可以要求圖像 AI 繪製“梵高風格的中世紀日落城市”,並在幾秒鐘內獲得令人信服的藝術圖像。這使得 AI 在平面設計、行銷和娛樂領域中廣泛應用,可用於概念藝術、原型設計,甚至在某些情況下用於最終視覺效果。值得注意的是:
-
平面設計和庫存圖片:公司透過人工智慧產生網站圖形、插圖或庫存照片,從而減少了每件作品都委託藝術家創作的需要。許多行銷團隊使用人工智慧工具製作各種廣告或產品圖片,以測試哪些內容對消費者有吸引力。
-
藝術與插畫:個人藝術家與人工智慧合作,集思廣益或完善細節。例如,插畫家可能會使用人工智慧生成背景場景,然後將其與人類繪製的角色融合在一起。一些漫畫創作者已經嘗試使用人工智慧生成畫板或著色。
-
媒體與娛樂:人工智慧生成的藝術作品已出現在雜誌封面和書籍封面。一個著名的例子是2022年8月刊《Cosmopolitan》的封面,封面上有一位宇航員——據報道,這是第一張由人工智慧(OpenAI的DALL·E)在藝術總監指導下創作的雜誌封面圖像。雖然這涉及人類的提示和選擇,但實際的藝術作品是由機器渲染的。
至關重要的是,目前大多數此類應用仍然需要人工篩選和迭代。 AI 可以產生數十張圖像,然後由人類從中選擇最佳圖像,並可能進行潤色。從這個意義上講,AI 自主生成選項,而人類則引導創作方向並做出最終選擇。 AI 可以快速產生大量內容,但無法保證一次滿足所有要求。諸如細節錯誤(例如,AI 畫的手的手指數量不對,這是一個已知的怪癖)或非預期結果等問題,通常需要人類藝術總監來監督輸出品質。
然而,在某些領域,人工智慧已經接近完全自主:
-
生成式設計:在建築和產品設計等領域,人工智慧工具可以自主創建滿足特定限制條件的設計原型。例如,給定一件家具所需的尺寸和功能,生成式演算法可能會輸出幾種可行的設計(其中一些設計非常獨特),無需人工幹預,使其超出初始規格。這些設計隨後可以被人類直接使用或改進。同樣,在工程領域,生成式人工智慧可以設計出針對重量和強度進行最佳化的零件(例如飛機零件),創造出人類可能從未想過的新穎形狀。
-
電子遊戲素材: AI 可以自動產生電子遊戲的紋理、3D 模型,甚至整個關卡。開發者利用這些來加速內容創作。一些獨立遊戲已經開始融入程式生成的藝術作品,甚至對話(透過語言模型),以極少的人工素材創造出廣闊而動態的遊戲世界。
-
動畫和影片(新興):雖然影片生成式人工智慧不如靜態圖像成熟,但正在不斷發展。人工智慧已經可以根據提示生成短視頻片段或動畫,儘管品質參差不齊。 Deepfake 技術(一種生成式技術)可以製作逼真的換臉或語音克隆。在受控環境下,工作室可以使用人工智慧自動產生背景場景或人群動畫。
值得注意的是,Gartner 預測,到 2030 年,我們將看到一部90% 的內容由 AI 產生的大片(從劇本到視覺效果)(產業和企業的生成式 AI 用例)。截至 2025 年,我們還沒有實現這一目標——AI 還無法獨立製作一部長篇電影。但這個難題的各個部分正在不斷發展:劇本生成(文字 AI)、角色和場景生成(圖像/視訊 AI)、配音(AI 語音克隆)以及剪輯輔助(AI 已經可以輔助剪輯和轉場)。
2030-2035年展望:人工智慧生成的媒體規模化
展望未來,生成式人工智慧在視覺藝術和設計領域的作用將大幅擴展。到 2035 年,我們預計人工智慧將成為主要內容創造者,通常除了初始指導外,幾乎不需要人工幹預即可運作。以下是一些預期:
-
完全由人工智慧產生的電影和影片:未來十年,我們很有可能看到首批主要由人工智慧製作的電影或電視劇。人類或許可以提供進階指導(例如劇本大綱或所需風格),然後人工智慧將渲染場景、創建演員肖像並製作所有動畫。早期短片實驗可能在幾年內完成,到2030年代將嘗試製作長篇電影。這些人工智慧電影最初可能只是小眾產品(例如實驗動畫),但隨著品質的提高,它們可能會成為主流。 Gartner 預測到2030年,90%的電影將由人工智慧產生(工業和企業的生成式人工智慧用例),儘管這項預測雄心勃勃,但也突顯了業界的信念:人工智慧內容創作將足夠成熟,足以承擔電影製作的大部分工作。
-
設計自動化:在時尚或建築等領域,生成式人工智慧很可能被用於根據「成本、材料、X 風格」等參數自主起草數百個設計概念,最終由人類來選擇。這將顛覆當前的格局:未來的設計師不再從零開始創作,或許還會藉助人工智慧來獲取靈感,而是更扮演策展人的角色,挑選出最佳的人工智慧生成設計,並進行調整。到 2035 年,建築師或許只需輸入建築需求,就能從人工智慧獲得完整的藍圖建議(所有這些藍圖都符合結構規範,這得益於嵌入的工程規則)。
-
個人化內容創作:我們或許會看到人工智慧能為個人使用者即時創造視覺效果。想像一下,在2035年,一款電子遊戲或虛擬實境體驗中的場景和角色會根據玩家的喜好進行調整,並由人工智慧即時產生。又或者,根據用戶的一天生活生成個人化的連載漫畫——一個自主的「每日日記漫畫」人工智慧,每天晚上自動將你的文字日記轉換成插圖。
-
多模態創造力:生成式人工智慧系統日益趨向多模態化——這意味著它們可以同時處理文字、圖像、音訊等。透過整合這些內容,人工智慧可以接收一個簡單的提示,例如“為我製作一個產品 X 的行銷活動”,它不僅可以產生文字文案,還可以產生匹配的圖形,甚至是風格一致的短片宣傳影片。這種一鍵式內容套件很可能在 2030 年代初成為現實。
人工智慧會取代人類藝術家嗎?這個問題經常被提出。人工智慧很可能會接管大量的生產工作(尤其是商業所需的重複性或快速週轉的藝術),但人類的藝術才能仍將保留下來,以追求原創和創新。到2035年,自主的人工智慧或許能夠可靠地模仿著名藝術家的風格進行創作——但創造一種新的風格或具有深刻文化共鳴的藝術作品可能仍然是人類的強項(可能需要人工智慧作為合作夥伴)。我們預見到未來人類藝術家將與自主的人工智慧「合作藝術家」一起工作。例如,人們可以委託個人人工智慧持續為家中的數位畫廊創作藝術作品,營造不斷變化的創意氛圍。
從可靠性的角度來看,視覺生成AI在某些方面比文本更容易實現自主化:圖像即使不完美,也可以主觀地“足夠好”,而文本中的事實錯誤則更成問題。因此,我們已經看到了相對低風險的採用——如果AI生成的設計醜陋或錯誤,你根本不會使用它,但它本身不會造成任何損害。這意味著到2030年代,公司可能會放心地讓AI在無人監督的情況下大量生產設計,只有在真正需要創新或有風險的東西時才需要人工參與。
總而言之,到2035年,生成式人工智慧預計將成為視覺領域強大的內容創造者,很可能貢獻我們周圍相當一部分的圖像和媒體。它將可靠地為娛樂、設計和日常交流產生內容。自主藝術家即將出現——儘管人工智慧究竟應該被視為具有創造力,還是僅僅是一個非常聰明的工具,隨著其產出與人類作品越來越難以區分,這一爭論也將持續下去。
軟體開發中的生成式人工智慧(編碼)
軟體開發看似是一項高度分析性的任務,但它也蘊含著創造性的元素——編寫程式碼本質上是用結構化語言創建文字。現代生成式人工智慧,尤其是大型語言模型,已被證明非常擅長編碼。 GitHub Copilot、Amazon CodeWhisperer 等工具可作為 AI 配對程式設計師,在開發人員輸入程式碼時提供程式碼片段甚至整個函數的建議。這在實現自主程式設計方面能走多遠?
目前能力(2025):人工智慧作為編碼副駕駛
到 2025 年,AI 程式碼產生器將在許多開發人員的工作流程中變得普遍。這些工具可以自動完成程式碼行、產生樣板程式碼(例如標準函數或測試),甚至可以根據自然語言描述編寫簡單的程式。然而,至關重要的是,它們是在開發人員的監督下運作的——開發人員會審查並整合 AI 的建議。
一些當前的事實和數據:
-
到 2023 年底,超過一半的專業開發人員已經採用了人工智慧編碼助理( Copilot 上的編碼:2023 年資料顯示程式碼品質面臨下行壓力(含 2024 年預測)- GitClear ),這表明其應用正在快速增長。 GitHub Copilot 是第一批廣泛使用的工具之一,據報道,它平均能產生使用它的專案中 30-40% 的程式碼(編碼不再是護城河。GitHub 上 46% 的程式碼已經是… )。這意味著人工智慧已經在編寫大量程式碼,儘管是由人類來掌控和驗證的。
-
這些 AI 工具擅長編寫重複性程式碼(例如,資料模型類別、getter/setter 方法)、將一種程式語言轉換為另一種程式語言,或產生類似於訓練範例的簡單演算法。例如,開發人員可以註釋“// 按姓名對使用者清單進行排序的函數”,AI 幾乎可以立即產生合適的排序函數。
-
它們還能協助修復和解釋錯誤:開發人員可以貼上錯誤訊息,AI 可能會建議修復方案,或者詢問「這段程式碼是做什麼的?」並獲得自然語言解釋。從某種意義上說,這是自主的(AI 可以自行診斷問題),但是否應用修復方案則由人類決定。
-
重要的是,目前的人工智慧程式設計助理並非萬無一失。它們可能會建議不安全的程式碼,或者幾乎可以解決問題但卻有細微錯誤的程式碼。因此,目前的最佳做法是讓人類參與其中——開發人員像測試和調試人類編寫的程式碼一樣測試和調試人工智慧編寫的程式碼。在受監管的行業或關鍵軟體(例如醫療或航空系統)中,任何人工智慧貢獻都需經過嚴格審查。
目前,沒有一個主流軟體系統是完全由人工智慧從零開始編寫,且無需開發人員監督的。然而,一些自主或半自主的用途正在興起:
-
自動產生的單元測試: AI 可以分析程式碼並產生單元測試,以涵蓋各種情況。測試框架可以自主生成並運行這些 AI 編寫的測試來捕獲錯誤,從而增強人工編寫的測試。
-
低程式碼/無程式碼 AI 平台:一些平台允許非程式設計師描述他們的需求(例如,「建立一個包含聯絡表單和資料庫以保存條目的網頁」),然後系統產生程式碼。雖然目前仍處於早期階段,但這預示著未來 AI 可以自主創建標準用例的軟體。
-
腳本和黏合程式碼: IT 自動化通常涉及編寫腳本來連接系統。 AI 工具通常可以自動產生這些小腳本。例如,編寫一個腳本來解析日誌檔案並發送電子郵件警報——AI 只需極少的編輯甚至無需編輯即可產生可用的腳本。
2030-2035年展望:邁向「自主開發」軟體
未來十年,生成式人工智慧預計將承擔更大比例的編碼工作,使某些類型的專案更接近完全自主的軟體開發。以下是一些預期的發展:
-
完整的功能實現:到 2030 年,我們預計 AI 將能夠端到端地實現簡單的應用程式功能。產品經理可以用簡單易懂的語言描述一項功能(「使用者應該能夠透過電子郵件連結重設密碼」),AI 就能產生必要的程式碼(前端表單、後端邏輯、資料庫更新、電子郵件傳送)並將其整合到程式碼庫中。 AI 可以有效地充當初級開發人員,遵循規範。而人類工程師可能只需要進行程式碼審查和運行測試。隨著 AI 可靠性的提高,程式碼審查甚至可能只是快速瀏覽。
-
自主程式碼維護:軟體工程的一個重要部分不僅是編寫新程式碼,還包括更新現有程式碼——修復錯誤、提升效能、適應新需求。未來的人工智慧開發者很可能會在這方面表現出色。給定一個程式碼庫和一個指令(「當過多用戶同時登入時,我們的應用程式會崩潰」),人工智慧可能會找到問題(例如並發錯誤)並進行修補。 2035年,人工智慧系統可能會在夜間自動處理例行維護工單,成為軟體系統不知疲倦的維護團隊。
-
整合和 API 使用:隨著越來越多的軟體系統和 API 附帶 AI 可讀文檔,AI 代理可以透過編寫黏合程式碼,獨立地弄清楚如何將系統 A 與服務 B 連接起來。例如,如果一家公司希望其內部人力資源系統與新的薪資 API 同步,他們可能會要求 AI“讓它們相互通信”,然後在讀取兩個系統的規範後,AI 會編寫集成代碼。
-
品質與最佳化:未來的程式碼產生模型可能會融入回饋循環,以驗證程式碼是否有效(例如,在沙盒中執行測試或模擬)。這意味著人工智慧不僅可以編寫程式碼,還可以透過測試進行自我修正。到2035年,我們可以想像一個人工智慧在接到任務後,會不斷迭代其程式碼,直到所有測試都通過——這個過程可能不需要人類逐行監控。這將大大提升人們對自主產生程式碼的信任。
我們可以設想這樣一個場景:到2035年,一個小型軟體專案——例如為企業量身定制的行動應用程式——可以主要由人工智慧代理根據高層指令進行開發。在這種情況下,人類「開發者」更像是專案經理或驗證者,負責指定需求和約束(安全性、程式碼風格指南),並讓人工智慧完成實際編碼的繁重工作。
然而,對於複雜的大型軟體(作業系統、先進的人工智慧演算法本身等),人類專家仍將深度參與。軟體中的創意問題解決和架構設計可能在一段時間內仍由人類主導。人工智慧或許可以處理大量的程式設計任務,但決定什麼以及設計整體架構又是另一個挑戰。話雖如此,隨著生成式人工智慧開始協作——多個人工智慧代理處理系統的不同組件——可以想像它們可以在某種程度上共同設計架構(例如,一個人工智慧提出一個系統設計方案,另一個人工智慧對其進行評審,然後它們進行迭代,整個過程由人類監督)。
人工智慧在編碼領域的一個主要預期優勢是生產力提升。 Gartner 預測,到 2028 年,將有 90% 的軟體工程師使用人工智慧程式碼助理(而 2024 年這一比例還不到 15%)( GitHub Copilot 榮登《Visual Studio Magazine》人工智慧程式碼助理研究報告榜首)。這意味著,不使用人工智慧的例外情況將非常少。我們或許也會看到,某些領域的人類開發人員短缺問題可以透過人工智慧填補;本質上,每個開發人員都可以藉助能夠自主編寫程式碼的人工智慧助理完成更多工作。
信任仍將是一個核心問題。即使到了2035年,各組織仍需確保自主生成的程式碼的安全性(AI不得引入漏洞),並符合法律/道德規範(例如,AI不得包含未經適當許可的開源庫中抄襲的程式碼)。我們期待改進的AI治理工具能夠驗證和追蹤AI編寫的程式碼來源,從而幫助實現更自主的編碼,避免風險。
總而言之,到 2030 年代中期,生成式人工智慧很可能承擔大部分常規軟體任務的編碼工作,並在複雜任務中提供顯著的輔助。軟體開發生命週期將更加自動化——從需求到部署——人工智慧有可能自動產生和部署程式碼變更。人類開發人員將更加專注於高階邏輯、使用者體驗和監督,而人工智慧代理則負責處理實作細節。
客戶服務和支援中的生成式人工智慧
如果您最近曾與線上客服聊天互動,那麼很有可能至少有一部分對話是由人工智慧完成的。客戶服務是一個非常適合人工智慧自動化的領域:它涉及響應用戶查詢,而生成式人工智慧(尤其是對話模型)在這方面表現相當出色;而且它通常遵循腳本或知識庫文章,而這些是人工智慧可以學習的。那麼,人工智慧能夠自主地處理客戶問題嗎?
當前能力(2025):聊天機器人和虛擬代理佔據前沿
如今,許多組織已部署人工智慧聊天機器人作為客戶服務的第一個聯絡點。這些機器人種類繁多,從簡單的基於規則的機器人(「按 1 進行結算,按 2 獲取支援…」),到能夠理解自由形式問題並以對話方式做出回應的高級生成式人工智慧聊天機器人,不一而足。要點:
-
處理常見問題: AI 代理擅長解答常見問題、提供資訊(例如營業時間、退款政策、已知問題的故障排除步驟)以及指導使用者完成標準流程。例如,銀行的 AI 聊天機器人可以自主幫助用戶查詢帳戶餘額、重設密碼或解釋如何申請貸款,而無需人工協助。
-
自然語言理解:現代生成模型能夠實現更流暢、更「人性化」的互動。客戶可以用自己的語言輸入問題,AI 通常能夠理解其意圖。多家公司報告稱,如今的 AI 代理比幾年前笨重的機器人更能滿足客戶需求——近一半的客戶認為 AI 代理在解決問題時能夠富有同理心且高效( 2025 年 59 項 AI 客戶服務統計數據),這表明人們對 AI 驅動服務的信任度日益提升。
-
多通路支援: AI 的應用範圍不僅限於聊天。語音助理(例如搭載 AI 的電話 IVR 系統)也開始處理通話,AI 還可以針對客戶諮詢撰寫電子郵件回复,如果回复準確,回复可能會自動發送。
-
當人類介入時:通常情況下,如果人工智慧感到困惑或問題過於複雜,它會將處理權移交給人工代理。目前的系統在許多情況下都能夠很好地了解自身的限制。例如,如果客戶提出一些不尋常的問題或表現出沮喪(「這是我第三次聯繫您了,我非常沮喪…」),人工智慧可能會標記這種情況,以便人工接手。交接的門檻由公司設定,以平衡效率和顧客滿意度。
許多公司報告稱,相當一部分互動問題僅靠人工智慧就能解決。根據產業調查,目前約有70-80%的常規客戶諮詢可以由人工智慧聊天機器人處理,約40%的公司跨通路客戶互動已實現自動化或人工智慧輔助(《你應該知道的52個人工智慧客戶服務統計資料 - Plivo 》)。 IBM的《全球人工智慧採用指數》(2022年)顯示,到2025年,80%的公司將使用或計劃使用人工智慧聊天機器人進行客戶服務。
一個有趣的發展是,人工智慧不僅能回應客戶,還能主動協助人工客服。例如,在即時聊天或通話過程中,人工智慧可能會傾聽並立即向人工客服提供建議答案或相關資訊。這模糊了自主性的界線——人工智慧並非獨自面對客戶,而是主動參與,無需人工明確詢問。它實際上充當了客服的自主顧問。
2030-2035年展望:客戶互動將主要由人工智慧驅動
到2030年,預計大多數客戶服務互動都將涉及人工智慧,許多互動將自始至終完全由人工智慧處理。以下預測和趨勢支持這一觀點:
-
解決更高複雜度的查詢:隨著人工智慧模型整合大量知識並提升推理能力,它們將能夠處理更複雜的客戶請求。未來的人工智慧將不再僅僅回答“如何退貨?”,而是能夠處理多步驟問題,例如“我的網路斷了,我試過重啟了,請問您能幫忙嗎?”,具體方法是透過對話診斷問題,引導客戶進行高級故障排除,並且僅在其他所有方法均無效時才安排技術人員——而這些任務在今天很可能需要人工支援。在醫療保健客戶服務領域,人工智慧可以端到端地處理患者預約或保險查詢。
-
端到端服務解決方案:我們或許會看到人工智慧不僅會告訴客戶該做什麼,還會在後端系統中真正完成這些操作。例如,如果客戶說“我想將航班改到下週一,並添加一件行李”,那麼到2030年,人工智慧代理可能會直接與航空公司的預訂系統交互,執行更改、處理行李付款,並向客戶確認——所有這些都是自主完成的。人工智慧將成為全方位服務的代理,而不僅僅是一個資訊來源。
-
無所不在的人工智慧代理:企業可能會在所有客戶接觸點部署人工智慧——電話、聊天、電子郵件、社群媒體。許多客戶甚至可能意識不到自己是在與人工智慧還是人類對話,尤其是在人工智慧語音變得更加自然、聊天回應更加情境化的情況下。到2035年,聯繫客服通常意味著與智慧人工智慧互動,它會記住你過去的互動,理解你的偏好,並適應你的語氣——本質上,它就是為每位客戶提供個人化的虛擬客服。
-
人工智慧在互動中的決策:除了回答問題之外,人工智慧將開始做出目前需要管理階層批准的決策。例如,如今,人工客服人員可能需要主管批准才能提供退款或特殊折扣以安撫憤怒的客戶。未來,人工智慧可以根據計算出的客戶生命週期價值和情緒分析,在規定的範圍內負責這些決策。 Futurum/IBM 的一項研究預測,到 2030 年,約 69% 的即時客戶互動決策將由智慧機器做出(為了重新構想向客戶體驗的轉變,行銷人員必須做到這兩點)——人工智慧將在互動中有效地決定最佳行動方案。
-
100% AI 參與:每一次客戶互動中發揮作用 2025 年 59 項 AI 客戶服務統計數據),無論是在前台還是後台。這可能意味著,即使人工與客戶互動,他們也會得到 AI 的協助(提供建議、檢索資訊)。或者說,任何時候,客戶的任何疑問都能得到解答——即使人工離線,AI 也始終在線。
到2035年,我們或許會發現,人類客服人員已經變得只專注於處理最敏感或高接觸場景(例如,VIP客戶或需要人類同理心的複雜投訴解決)。從銀行業務到零售業務再到技術支持,常規諮詢將由一支全天候工作的人工智慧客服團隊處理,這些團隊將不斷從每次互動中學習。這種轉變將使客戶服務更加一致、更加及時,因為人工智慧不會讓客服人員長時間等待,理論上可以同時處理無限數量的客戶。
要實現這個願景,需要克服一些挑戰:人工智慧必須非常強大,才能應對人類客戶的不可預測性。它必須能夠應對俚語、憤怒、困惑以及人們千差萬別的溝通方式。它還需要掌握最新的知識(如果人工智慧的資訊過時,那就毫無意義了)。透過投資人工智慧與公司資料庫的整合(用於獲取訂單、停駛等即時資訊),這些障礙是可以克服的。
從倫理道德角度來看,公司需要決定何時披露“您正在與人工智慧對話”,並確保公平(人工智慧不會因為訓練存在偏見而對某些客戶區別對待)。假設這些都得到妥善管理,其商業案例將非常強勁:人工智慧客戶服務可以大幅降低成本並縮短等待時間。隨著企業加強對人工智慧能力的投資,預計到 2030 年,人工智慧客戶服務市場規模將成長至數百億美元(《 2025-2030 年人工智慧客戶服務市場報告:案例》)( 《生成式人工智慧如何推動物流發展 | Ryder 》)。
總而言之,未來自主AI客服將成為常態。獲得幫助通常意味著與能夠快速解決問題的智慧機器互動。人類仍將參與監督和處理邊緣情況,但更多地扮演AI團隊的主管角色。只要AI得到適當的訓練和監控,避免出現過去「機器人熱線」的糟糕體驗,消費者就能獲得更快、更個人化的服務。
醫療保健和醫學領域的生成式人工智慧
醫療保健是一個高風險的領域。在醫學領域,人工智慧無需人工監督即可運作的想法既令人興奮(出於效率和覆蓋範圍),也令人謹慎(出於安全和同理心的考慮)。生成式人工智慧已開始在醫學影像分析、臨床文件甚至藥物研發等領域取得進展。那麼,它能夠獨立完成哪些負責任的工作呢?
目前能力(2025):協助臨床醫生,而不是取代他們
目前,醫療領域的生成式人工智慧主要充當得力助手,而非自主決策者。例如:
-
醫療文件:人工智慧在醫療保健領域最成功的應用之一是幫助醫生處理文書工作。自然語言模型可以轉錄患者就診記錄,並產生臨床記錄或出院小結。一些公司配備“人工智慧抄寫員”,可以在檢查過程中(透過麥克風)聆聽,並自動產生診療記錄草稿供醫生審查。這節省了醫生的打字時間。一些系統甚至可以自動填充部分電子健康記錄。這幾乎不需要幹預——醫生只需糾正草稿上的任何小錯誤,這意味著記錄的撰寫基本上是自主的。
-
放射學和影像學:人工智慧(包括生成模型)可以分析 X 光片、核磁共振成像 (MRI) 和 CT 掃描,以檢測異常情況(例如腫瘤或骨折)。 2018 年,FDA 批准了一款用於自主檢測視網膜影像中糖尿病視網膜病變(一種眼部疾病)的人工智慧系統——值得注意的是,該系統被授權在特定的篩檢環境下無需專家審查即可做出診斷。該系統並非生成型人工智慧,但它表明監管機構已在有限的情況下允許人工智慧自主診斷。生成模型可用於建立綜合報告。例如,人工智慧可能會檢查胸部 X 光片並起草一份放射科醫生的報告內容為「無急性發現。肺部清晰。心臟大小正常」。放射科醫師只需確認並簽字即可。在一些常規病例中,如果放射科醫生信任人工智慧並進行快速檢查,這些報告可能無需編輯即可發出。
-
症狀檢查器和虛擬護理師:生成式人工智慧聊天機器人正被用作第一線症狀檢查器。患者可以輸入自己的症狀並獲得建議(例如,「這可能是普通感冒;注意休息和補水,但如果出現X或Y症狀,請就醫。」)。像Babylon Health這樣的應用程式使用人工智慧提供建議。目前,這些建議通常僅作為資訊性建議,而非權威的醫療建議,並鼓勵患者就嚴重問題尋求人類臨床醫生的後續治療。
-
藥物研發(生成化學):生成式人工智慧模型可以提出新的藥物分子結構。這更多地應用於研究領域,而非患者護理。這些人工智慧能夠自主運作,推薦數千種具有所需特性的候選化合物,然後由人類化學家在實驗室中審查和測試。像 Insilico Medicine 這樣的公司已經利用人工智慧在顯著縮短的時間內產生了新型候選藥物。雖然這不會直接與患者互動,但它是人工智慧自主創建解決方案(分子設計)的一個例子,而人類需要花費更長時間才能找到這些解決方案。
-
醫療保健營運:人工智慧正在幫助優化醫院的排班、供應管理和其他物流。例如,生成模型可以模擬患者流量,並建議調整排班以減少等待時間。雖然這些決策並非直觀可見,但人工智慧只需極少的人工幹預即可做出。
值得一提的是,截至2025年,沒有一家醫院允許AI在未經人類授權的情況下獨立做出重大醫療決策或治療。診斷和治療計劃仍然牢牢掌握在人類手中,AI提供意見。 AI完全自主地告訴患者「您患有癌症」或開藥所需的信任尚未實現,也不應該在沒有經過廣泛驗證的情況下實現。醫療專業人員將AI用作第二雙眼睛或節省時間的工具,但他們需要驗證關鍵的輸出。
2030-2035 年展望:人工智慧將成為醫生的同事(也可能是護士或藥劑師)
在未來十年,我們預期生成式人工智慧將自主承擔更多常規臨床任務,並擴大醫療服務的覆蓋範圍:
-
自動初步診斷:到2030年,人工智慧將能夠可靠地處理許多常見疾病的初步分析。想像一下,診所裡的人工智慧系統可以透過攝影機讀取患者的症狀、病史,甚至他們的語氣和臉部表情,並提供診斷建議和推薦的檢查——所有這些都在人類醫生就診之前完成。這樣,醫生就可以專注於確認和討論診斷結果。在遠距醫療中,患者可以先與人工智慧聊天,縮小診斷範圍(例如,可能是鼻竇感染,還是更嚴重的疾病),然後在需要時將其轉接給臨床醫生。如果人工智慧的診斷結果被證明極為準確,監管機構可能會允許其在正式診斷某些輕微疾病——例如,人工智慧可以透過耳鏡影像診斷出簡單的耳部感染。
-
個人健康監測器:隨著穿戴式裝置(智慧手錶、健康感測器)的普及,人工智慧將持續監測患者並自主發出問題預警。例如,到2035年,穿戴式裝置的人工智慧可能會偵測到異常心律,並自動安排緊急虛擬會診,甚至在偵測到心臟病發作或中風的跡象時呼叫救護車。這進入了自主決策領域——判斷情況緊急並採取行動——這是人工智慧可能用於挽救生命的應用。
-
治療建議:基於醫學文獻和病患資料訓練的生成式人工智慧或許能夠提供個人化的治療方案。 2030年,對於癌症等複雜疾病,人工智慧腫瘤委員會可以分析患者的基因組成和病史,並自主制定治療方案(化療方案、藥物選擇)。人類醫生會對其進行審核,但隨著時間的推移,隨著醫生對方案的信心增強,他們可能會開始接受人工智慧生成的方案,尤其是在常規病例中,並僅在必要時進行調整。
-
虛擬護理師與家庭護理:能夠對話並提供醫療指導的人工智慧可以處理大量的後續護理和慢性病護理監測。例如,患有慢性病的居家患者可以向人工智慧護理助理報告每日指標,該助理會提供建議(「您的血糖有點高,請考慮調整您的晚間零食攝取量」),並且只有在讀數超出範圍或出現問題時才會調用人類護理師。這種人工智慧可以在醫生的遠端監督下基本上自主地運作。
-
醫學影像和實驗室分析—全自動化流程:到2035年,在某些領域,醫學掃描結果的解讀可能主要由人工智慧完成。放射科醫生將負責監督人工智慧系統並處理複雜病例,但大多數正常掃描結果(確實正常的)可以由人工智慧直接「解讀」並簽署。同樣,病理切片分析(例如,在活檢中檢測癌細胞)也可以自主完成初步篩檢,從而大大加快實驗室結果的得出速度。
-
藥物研發與臨床試驗:人工智慧不僅能設計藥物分子,還能產生用於試驗的合成病患數據,或找到最佳的試驗候選藥物。它或許能夠自主運行虛擬試驗(模擬患者的反應),以便在正式試驗之前縮小選擇範圍。這可以減少人工實驗,從而更快地將藥物推向市場。
AI醫師的願景仍然遙不可及,且仍有爭議。即使到2035年,人們仍期望AI能成為同事,而不是取代人類的診療。複雜的診斷通常需要直覺、倫理道德以及透過溝通來理解患者的具體情況——而這些正是人類醫生擅長的領域。即便如此,AI或許可以處理80%的常規工作量:文書工作、簡單病例、監測等等,讓人類臨床醫生能夠專注於那20%棘手的工作,以及與病人的關係。
存在重大障礙:醫療領域自主人工智慧的監管批准非常嚴格(這是理所當然的)。人工智慧系統需要大量的臨床驗證。我們或許會看到逐漸被接受——例如,允許人工智能在缺乏醫生的醫療資源匱乏地區進行自主診斷或治療,以此擴大醫療服務的可及性(想像一下,到2030年,一個偏遠村莊將出現一家“人工智能診所”,由城市醫生定期進行遠程監督)。
倫理考量至關重要。問責制(如果自主AI診斷錯誤,誰來負責?)、知情同意(病人需要知道AI是否參與了他們的照護)以及確保公平性(AI適用於所有人群,避免偏見)都是亟待解決的挑戰。假設這些問題得到解決,到2030年代中期,生成式AI將融入醫療保健服務,執行許多任務,從而解放人類醫護人員,並有可能惠及目前難以獲得醫療服務的患者。
總而言之,到2035年,醫療保健領域很可能會深度整合人工智慧,但主要還是在幕後或扮演輔助角色。我們會相信人工智慧能夠獨立完成許多工作——讀取掃描結果、監測生命徵象、制定計畫——但關鍵決策仍需人工監督的安全保障。最終結果可能是建立一個更有效率、反應更迅速的醫療保健系統,人工智慧負責處理繁重的工作,人類則提供同理心和最終判斷。
教育中的生成式人工智慧
教育是生成式人工智慧蓬勃發展的另一個領域,從人工智慧輔導機器人到自動評分和內容創作,無所不包。教學與學習需要溝通與創造力,而這正是生成式模式的優點。但是,在沒有教師監督的情況下,我們能相信人工智慧能夠進行教育嗎?
目前能力(2025):導師和內容產生器
目前,人工智慧在教育領域的應用主要作為一種輔助工具,而非獨立教師。以下是一些目前應用範例:
-
AI 輔導助理:像可汗學院的「Khanmigo」(由 GPT-4 提供支援)這樣的工具,以及各種語言學習應用程序,都使用 AI 來模擬一對一導師或對話夥伴。學生可以用自然語言提問並獲得答案或解釋。 AI 可以為家庭作業提供提示,以不同的方式解釋概念,甚至可以在互動歷史課中扮演歷史人物。然而,這些 AI 導師通常在監督下使用;教師或應用程式維護人員通常會監控對話內容或限制 AI 的討論範圍(以避免錯誤訊息或不當內容)。
-
教師內容創作:生成式人工智慧可以透過建立測驗題目、閱讀材料摘要、課程計畫大綱等來幫助教師。教師可能會要求人工智慧“產生 5 道二次方程式練習題並附答案”,從而節省備課時間。這是自主的內容生成,但教師通常會審查輸出結果的準確性以及是否與課程大綱一致。因此,它更像是一種省力設備,而非完全獨立的設備。
-
評分與回饋:人工智慧可以自動評分多項選擇題考試(這並非新鮮事),並且越來越多地用於評估簡答題或論文。一些學校系統使用人工智慧對書面作文進行評分,並向學生提供回饋(例如,語法更正、擴展論點的建議)。雖然人工智慧本身並非一項生成性任務,但新的人工智慧甚至可以產生個人化的回饋報告,突顯需要改進的地方。由於擔心細節問題,教師通常會在這個階段仔細檢查人工智慧評分的論文。
-
自適應學習系統:這些平台會根據學生的表現調整學習材料的困難或風格。生成式人工智慧則透過根據學生的需求動態創建新的問題或範例來增強這種能力。例如,如果學生對某個概念感到困惑,人工智慧可能會產生另一個圍繞該概念的類比或練習題。這在某種程度上是自主的,但屬於教育工作者設計的系統。
-
學生用於學習:學生自己使用 ChatGPT 等工具輔助學習——尋求澄清、翻譯,甚至使用人工智慧來獲取論文草稿的回饋(「改進我的引言段落」)。這些操作是自主的,無需教師指導。在這種情況下,人工智慧可以充當按需輔導老師或校對員。挑戰在於確保學生將其用於學習,而不僅僅是獲取答案(學術誠信)。
顯然,到2025年,人工智慧在教育領域將發揮巨大作用,但通常需要一位人類教育者參與其中,負責管理人工智慧的貢獻。人們對此抱持謹慎的態度是可以理解的:我們不希望相信人工智慧會教導錯誤的訊息,也不願相信它能在空洞的環境中處理敏感的學生互動。教師們將人工智慧導師視為得力助手,它們可以為學生提供更多練習機會,並立即解答常規問題,從而讓教師專注於更深入的指導。
2030-2035年展望:個人化人工智慧導師和自動化教學助手
在未來十年,我們預期生成式人工智慧將帶來更個人化和自主的學習體驗,同時教師的角色也將改變:
-
為每位學生配備人工智慧私人導師:到2030年,可汗學院的薩爾·可汗等專家的願景是,每個學生都能接觸到一位在許多方面與真人導師一樣高效的人工智慧導師(其創始人稱,這位人工智慧導師的智力水平比人類高出10倍)。這些人工智慧導師將全天候待命,深入了解學生的學習歷程,並據此調整教學風格。例如,如果一個學生是視覺學習者,正在努力學習某個代數概念,人工智慧可能會動態地創建視覺解釋或互動式模擬來提供幫助。由於人工智慧可以追蹤學生的學習進度,它可以自主決定接下來要複習什麼主題,或何時學習一項新技能——從微觀層面有效地管理該學生的課程計畫。
-
減輕教師日常工作負擔:批改作業、製作練習題、起草教材──到2030年代,這些任務幾乎可以完全交給人工智慧完成。人工智慧可以為一個班級產生一周的定製作業,對上週的所有作業(甚至是開放式作業)進行評分並提供回饋,並提醒老師哪些學生在哪些方面可能需要額外幫助。這幾乎不需要老師的投入,老師只需快速瀏覽一下,確保人工智慧的成績公平即可。
-
自主自適應學習平台:我們或許會看到某些學科完全由人工智慧驅動的課程。想像一下,一門線上課程沒有真人老師,而是由人工智慧代理商介紹學習內容、提供範例、解答問題並根據學生情況調整學習進度。學生的學習體驗可能是獨一無二的,並且是即時生成的。一些企業培訓和成人學習可能會更早地轉向這種模式,到2035年,員工可以說“我想學習高級Excel宏”,然後人工智慧導師就會通過個性化課程進行授課,包括生成練習並評估他們的答案,而無需真人教練。
-
課堂AI助理:無論是在實體教室還是虛擬教室,AI都可以聆聽課堂討論,並隨時為教師提供幫助(例如,透過耳機悄悄給出建議:「有幾個學生對這個概念感到困惑,或許可以再舉一個例子」)。它還可以主持線上課堂論壇,回答學生提出的簡單問題(“作業什麼時候交?”,甚至澄清課堂要點),這樣教師就不會被郵件轟炸。到2035年,在課堂上配備AI助理教師,而真人教師則專注於更高層次的指導和激勵,這可能將成為常態。
-
全球教育普及:自主人工智慧導師可以幫助教師短缺地區的學生接受教育。一台配備人工智慧導師的平板電腦可以作為主要教師,為那些受教育程度有限的學生提供基礎的讀寫和數學指導。到2035年,這或許將成為最具影響力的用途之一——人工智慧將在缺乏人類教師的地區填補教育空白。然而,確保人工智慧教育在不同環境下的品質和文化適應性至關重要。
人工智慧會取代教師嗎?不太可能完全取代。教學不僅僅是傳授內容,它還包括指導、啟發和社交情感支持。這些人類因素是人工智慧難以複製的。但人工智慧可以成為第二位老師,甚至是知識傳授的第一位老師,讓人類教育者專注於人類最擅長的領域:同理心、激勵和培養批判性思考。
需要解決的問題包括:確保人工智慧提供準確的資訊(避免虛假事實的教育幻覺)、避免教育內容的偏見、維護學生資料隱私以及保持學生的參與度(人工智慧需要激勵,而不僅僅是正確)。我們可能會看到人工智慧教育系統的認證或認證——類似於教科書的批准——以確保它們符合標準。
另一個挑戰是過度依賴:如果AI導師過於輕易地給出答案,學生可能無法培養毅力或解決問題的能力。為了緩解這個問題,未來的AI導師可能會被設計成有時讓學生自己摸索(就像人類導師那樣),或者鼓勵他們透過提示來解決問題,而不是直接給出答案。
到2035年,課堂或許會發生翻天覆地的變化:每個學生都將擁有一台連接人工智慧的設備,按照自己的步調進行指導,而老師則負責安排小組活動並提供人性化的指導。教育將變得更加高效和個性化。其承諾是每個學生在需要時都能獲得所需的幫助——一種真正規模化的「私人導師」體驗。風險在於失去一些人情味或濫用人工智慧(例如學生利用人工智慧作弊)。但總體而言,如果管理得當,生成式人工智慧將成為學生學習旅程中隨時可用、知識淵博的伙伴,從而實現學習的民主化並提升學習效果。
物流和供應鏈中的產生人工智慧
物流——運輸貨物和管理供應鏈的藝術與科學——似乎並非「生成式」人工智慧的傳統應用領域,但創造性的問題解決和規劃能力是該領域的關鍵。生成式人工智慧可以透過模擬場景、優化計畫甚至控制機器人系統來提供幫助。物流的目標是提高效率和節省成本,這與人工智慧在分析數據和提出解決方案方面的優勢不謀而合。那麼,人工智慧在營運供應鏈和物流業務方面究竟能達到怎樣的自主性呢?
目前能力(2025):透過人工監督進行最佳化和精簡
決策支援工具應用於物流領域:
-
路線優化: UPS 和 FedEx 等公司已經使用人工智慧演算法來優化配送路線,確保司機選擇最高效的路線。傳統上,這些演算法屬於運籌學演算法,但現在生成式方法可以幫助探索各種條件下(交通、天氣等)的替代路線策略。人工智慧負責建議路線,而人工調度員或管理人員則負責設定參數(例如優先順序),並可根據需要進行調整。
-
裝載和空間規劃:對於卡車或貨櫃的裝載,AI 可以產生最佳裝載計劃(哪個箱子放在哪裡)。生成式 AI 可能會產生多種裝載配置,以最大限度地利用空間,本質上是「創造」可供人類選擇的解決方案。一項研究強調了這一點,該研究指出,在美國,卡車的空載率通常高達 30%,而藉助 AI 進行更合理的規劃可以減少這種浪費(物流領域生成式 AI 的典型用例)。這些 AI 產生的裝載計畫旨在降低燃料成本和排放,在某些倉庫中,這些計畫的執行幾乎無需人工修改。
-
需求預測與庫存管理:人工智慧模型可以預測產品需求並產生補貨計劃。生成模型可以模擬不同的需求情境(例如,人工智慧「設想」即將到來的假期導致需求激增),並據此規劃庫存。這有助於供應鏈經理做好準備。目前,人工智慧提供預測和建議,但最終決定生產水準或訂單的通常是人類。
-
風險評估:全球供應鏈面臨各種中斷(自然災害、港口延誤、政治問題)。人工智慧系統如今會梳理新聞和數據,以識別即將出現的風險。例如,一家物流公司使用生成式人工智慧掃描互聯網,並標記出存在風險的運輸路線(例如,可能因颶風或動亂等原因而出現問題的區域)(物流領域的主要生成式人工智慧用例)。有了這些信息,規劃人員可以自主地重新規劃運輸路線,繞過問題區域。在某些情況下,人工智慧可能會自動建議更改路線或運輸方式,然後由手動審核。
-
倉庫自動化:許多倉庫採用半自動化操作,使用機器人進行揀貨和包裝。生成式人工智慧可以動態地將任務分配給機器人和人類,以實現最佳流程。例如,人工智慧可能會每天早上根據訂單產生機器人揀貨員的作業隊列。這通常是完全自主執行的,管理人員只需監控關鍵績效指標 (KPI)——如果訂單意外激增,人工智慧會自行調整營運。
-
車隊管理:人工智慧透過分析模式並產生最佳維護計劃來幫助安排車輛維護,從而最大限度地減少停機時間。它還可以分組發貨以減少行程。只要滿足服務要求,這些決策就可以由人工智慧軟體自動完成。
整體而言,截至2025年,人類設定目標(例如,「最小化成本,但確保兩天送達」),人工智慧則負責制定解決方案或計畫以實現目標。系統可以日復一日地運行,無需幹預,直到出現異常情況。許多物流環節涉及重複性決策(例如,這批貨物應該何時出發?從哪個倉庫發貨?),而人工智慧可以學習並持續做出這些決策。企業逐漸信任人工智慧來處理這些微觀決策,並且僅在出現異常時才向管理人員發出警報。
2030-2035年展望:自動駕駛供應鏈
在未來十年,我們可以預見在人工智慧的推動下,物流領域自主協調
-
自動駕駛汽車和無人機:自動駕駛卡車和送貨無人機雖然是更廣泛的人工智慧/機器人技術主題,但卻直接影響物流。到2030年,如果監管和技術挑戰得到克服,我們或許能夠擁有人工智慧在高速公路上常規駕駛卡車,或無人機在城市中處理最後一英里的配送。這些人工智慧將在沒有人類駕駛員的情況下做出即時決策(例如路線變更、避障)。其生成性在於這些車輛人工智慧如何從海量資料和模擬中學習,有效地在無數場景中進行「訓練」。一個完全自動駕駛的車隊可以全天候運營,人類只需進行遠端監控。這將從物流運作中消除大量的人力因素(駕駛員),從而顯著提高自主性。
-
自我修復型供應鏈:生成式人工智慧將可能用於持續模擬供應鏈場景並制定緊急應變計畫。到2035年,人工智慧或許能夠自動偵測供應商工廠何時停工(透過新聞或數據回饋),並立即將採購轉移到已在模擬中審核過的替代供應商。這意味著供應鏈能夠在人工智慧的主動作用下「自我修復」。人類管理人員將獲悉人工智慧的操作,而不是主動採取緊急措施的人員。
-
端到端庫存優化:人工智慧可以自主管理整個倉庫和門市網路的庫存。它可以決定何時何地轉移庫存(或許可以使用機器人或自動駕駛汽車),並在每個位置保持適量的庫存。人工智慧基本上負責營運供應鏈控制塔:監控所有流程並即時進行調整。到2035年,「自動駕駛」供應鏈的概念可能意味著系統能夠自行製定每日最佳配送計劃、訂購產品、安排工廠運作並安排運輸。人類將負責監督整體戰略,並處理人工智慧目前無法理解的異常情況。
-
物流領域的生成式設計:我們有望看到人工智慧設計新的供應鏈網路。假設一家公司擴張到一個新的地區,人工智慧可以根據數據為該地區產生最佳的倉庫位置、運輸線路和庫存策略——這正是如今顧問和分析師的工作。到2030年,企業可能會依賴人工智慧的建議來製定供應鏈設計方案,相信它能夠更快地權衡各種因素,並可能找到人類難以發現的創新解決方案(例如不明顯的配送中心)。
-
與製造業的整合(工業 4.0):物流並非孤立存在,而是與生產息息相關。未來的工廠或許會擁有生成式人工智慧 (AI),能夠調度生產流程,及時訂購原料,並指示物流網路立即出貨。這種整合式人工智慧可能意味著整體減少人工規劃,形成一個從製造到交付的無縫供應鏈,由優化成本、速度和永續性的演算法驅動。到 2025 年,高效能供應鏈已經由數據驅動;到 2035 年,它們可能主要由人工智慧驅動。
-
物流中的動態客戶服務:基於客戶服務人工智慧,供應鏈人工智慧可以直接與客戶或客戶互動。例如,如果一個大客戶想在最後一刻更改大量訂單,人工智慧代理可以協商可行的替代方案(例如「由於條件限制,我們現在可以交付一半,下週再交付另一半」),而無需等待人類經理。這需要生成式人工智慧來理解雙方需求(客戶需求與營運能力),並做出既能確保營運順暢,又能滿足客戶需求的決策。
預期效益是打造一個更有效率、更具彈性、反應速度更快的物流系統。企業預計將節省巨額成本——麥肯錫估計,人工智慧驅動的供應鏈優化可以顯著降低成本並提升服務水平,為各行各業帶來數萬億美元的價值增長( 2023 年人工智慧發展狀況:生成式人工智慧的突破之年 | 麥肯錫)。
然而,將更多控制權交給人工智慧也存在風險,例如如果人工智慧的邏輯有缺陷,就可能引發連鎖錯誤(例如,臭名昭著的場景:由於建模錯誤,人工智慧供應鏈無意中導致公司缺貨)。諸如「重大決策者機參與」之類的保障措施,或至少是允許人類快速覆寫決策的儀表板,很可能將持續到2035年。隨著時間的推移,隨著人工智慧決策的有效性得到證實,人類將更加樂意退居二線。
有趣的是,透過優化效率,人工智慧有時可能會做出與人類偏好或傳統做法相衝突的選擇。例如,純粹的優化可能會導致庫存非常少,這雖然高效,但可能會讓人感到風險。 2030年的供應鏈專業人士可能必須調整他們的直覺,因為人工智慧在處理大量數據時,可能會證明其非同尋常的策略實際上效果更好。
最後,我們必須考慮到實體約束(基礎設施、實體處理速度)限制了物流變革的速度,因此,這裡的革命在於更智慧的規劃和資產利用,而非全新的實體現實。但即使在這些限制之內,生成式人工智慧的創意解決方案和持續優化也能在極少的人工規劃下,顯著改善全球貨物運輸方式。
總而言之,到 2035 年,物流可能類似於一台運轉良好的自動化機器:貨物高效流動,路線即時調整以應對中斷,倉庫透過機器人進行自我管理,整個系統不斷從數據中學習和改進——所有這些都由作為操作大腦的生成人工智慧來協調。
金融和商業領域的生成式人工智慧
金融業大量處理資訊——報告、分析、客戶溝通——這為生成式人工智慧提供了沃土。從銀行到投資管理再到保險,各大機構都在探索利用人工智慧來實現自動化和洞察生成。問題是,鑑於準確性和信任在這一領域的重要性,人工智慧能夠在沒有人工監督的情況下可靠地處理哪些金融任務?
目前能力(2025):自動化報告與決策支持
截至目前,生成式人工智慧正在以多種方式為金融領域做出貢獻,而且通常是在人類的監督下:
-
報告產生:銀行和金融公司製作了大量報告-收益摘要、市場評論、投資組合分析等。人工智慧已被用於起草這些報告。例如,彭博社開發了BloombergGPT ,這是一個經過金融資料訓練的大型語言模型,可協助其終端使用者完成新聞分類和問答等任務(生成式人工智慧即將進入金融領域)。雖然它的主要用途是幫助人類找到訊息,但它顯示了人工智慧日益增長的作用。 Automated Insights(美聯社合作的公司)也產生了金融文章。許多投資通訊使用人工智慧來回顧每日市場趨勢或經濟指標。通常,人工會在發送給客戶之前審查這些內容,但這是一種快速編輯,而不是從頭開始編寫。
-
客戶溝通:在零售銀行業務中,人工智慧聊天機器人處理客戶關於帳戶餘額、交易或產品資訊的查詢(融入客戶服務領域)。此外,人工智慧還可以產生個人化的財務建議信或提醒。例如,人工智慧可能會識別出客戶可以節省費用,並自動撰寫一則訊息,建議他們切換到其他帳戶類型,然後在極少的人工幹預下發送。這種大規模的個人化溝通是人工智慧在金融領域的當前應用。
-
詐欺偵測與警報:生成式人工智慧可以幫助創建由詐欺系統偵測到的異常情況的敘述或解釋。例如,如果標記了可疑活動,人工智慧可能會為客戶產生一條解釋訊息(「我們注意到有人從新裝置登入…」)或為分析師產生報告。檢測是自動化的(使用人工智慧/機器學習異常檢測),溝通也日益自動化,儘管最終操作(例如凍結帳戶)通常需要手動審核。
-
財務諮詢(有限):一些機器人顧問(自動化投資平台)使用演算法(不一定是生成式人工智慧)來管理投資組合,無需人工顧問。生成式人工智慧正在進入這一領域,例如,它可以產生關於某些交易原因的評論,或根據客戶需求量身定制的投資組合績效摘要。然而,純粹的財務建議(例如複雜的財務規劃)仍然主要依賴人工或基於規則的演算法;不受監管的自由形式的生成式建議存在風險,因為一旦出錯,就需要承擔責任。
-
風險評估與核保:保險公司正在測試人工智慧自動撰寫風險評估報告,甚至自動起草保單文件。例如,根據某項財產的數據,人工智慧可以產生一份保單草案或一份描述風險因素的承保人報告。目前,這些輸出通常由人工審核,因為合約中的任何錯誤都可能造成高昂的代價。
-
數據分析與洞察:人工智慧可以整理財務報表或新聞並產生摘要。分析師可以使用工具,立即將長達100頁的年度報告總結為關鍵點,或從收益電話會議記錄中提取主要內容。這些摘要可以節省時間,並可直接用於決策或傳達,但謹慎的分析師會仔細檢查關鍵細節。
本質上,目前金融領域的人工智慧就像不知疲倦的分析師/作家,負責產生內容並由人類進行潤飾。完全自主的應用主要集中在定義明確的領域,例如數據驅動的新聞(無需主觀判斷)或客戶服務回應。由於高風險和監管審查,直接將資金決策(例如資金轉移、執行超出預設演算法的交易)委託給人工智慧的情況很少見。
2030-2035年展望:人工智慧分析師與自主財務運營
展望未來,到 2035 年,生成式人工智慧可能會深入嵌入金融運營,並有可能自主處理許多任務:
-
人工智慧金融分析師:我們或許會看到人工智慧系統能夠分析公司和市場,並產生與人類股票研究分析師水平相當的建議或報告。到2030年,人工智慧或許能夠讀取公司的所有財務報告,與產業數據進行比較,並自行產生投資建議報告(基於推理的「買入/賣出」)。一些對沖基金已經在使用人工智慧產生交易訊號;到2030年代,人工智慧研究報告可能會變得非常普遍。人類投資組合經理或許會開始將人工智慧產生的分析作為眾多輸入之一。人工智慧甚至有可能自主管理投資組合:根據預先設定的策略持續監控和重新平衡投資。事實上,演算法交易已經高度自動化——生成式人工智慧可以透過自行產生和測試新的交易模型,使策略更具適應性。
-
自動化財務規劃:面向消費者的人工智慧顧問可以為個人處理日常財務規劃。到2030年,你可以告訴人工智慧你的目標(例如買房、大學儲蓄),它就能為你量身訂做一份完整的財務計畫(包括預算、投資配置、保險建議)。最初,人類理財規劃師可能會審核你的計劃,但隨著信心的增強,這類建議可能會直接提供給消費者,並附帶適當的免責聲明。關鍵在於確保人工智慧的建議符合法規並符合客戶的最佳利益。如果這個問題得到解決,人工智慧可以讓基本的財務建議更容易獲得,而且成本更低。
-
後台自動化:生成式人工智慧或許能夠自主處理許多後台文件-貸款申請、合規報告、稽核摘要。例如,人工智慧可以收集所有交易數據,並產生一份審計報告,標記所有疑點。 2035年的審計人員可能會花更多時間審查人工智慧標記的異常情況,而不是親自梳理所有內容。同樣,在合規方面,人工智慧可以為監管機構產生可疑活動報告 (SAR),而無需分析師從頭開始編寫。這些常規文件的自主生成,以及人工監督轉向異常情況的管理,可能會成為行業標準。
-
保險理賠與承保:人工智慧可以處理保險理賠(提供照片證據等),確定承保範圍,並自動產生賠償決定書。我們或許能夠實現這樣的目標:簡單的理賠(例如資料清晰的車禍)在提交後幾分鐘內就能完全由人工智慧處理。新保單的承保也可能類似:人工智慧評估風險並產生保單條款。到2035年,或許只有複雜或邊緣案件才會上報給人類承保人。
-
詐欺與安全:人工智慧在金融領域偵測和應對詐欺或網路威脅方面可能發揮更關鍵的作用。自主人工智慧代理可以即時監控交易,並在滿足特定條件時立即採取行動(例如凍結帳戶、凍結交易),並給出合理解釋。速度至關重要,因此需要盡量減少人工幹預。人工智慧的生成部分可能在於將這些行動清晰地傳達給客戶或監管機構。
-
高階主管支援:想像一下,一位人工智慧「參謀長」可以隨時為高階主管產生業務報告。只要問一句:“我們歐洲部門本季的業績如何?與去年相比,主要驅動因素是什麼?”,人工智慧就能根據數據生成一份簡明扼要的報告,其中包含精準的圖表。這種動態、自主的報告和分析將變得像對話一樣簡單。到2030年,向人工智慧查詢商業智慧並相信它能給出正確答案,將在很大程度上取代靜態報告,甚至取代一些分析師角色。
一個有趣的預測是:到2030年代,大多數金融內容(新聞、報告等)可能由人工智慧產生。道瓊和路透社等媒體已經將自動化技術應用於某些新聞片段。如果這種趨勢持續下去,考慮到金融數據的爆炸性增長,人工智慧可能將負責大部分數據的過濾和傳播。
然而,信任和驗證才是核心。金融業受到嚴格監管,任何自主運作的人工智慧都需要滿足嚴格的標準:
-
確保沒有幻覺(你不能讓人工智慧分析師發明一個不真實的財務指標——這可能會誤導市場)。
-
避免偏見或非法行為(例如由於有偏見的訓練數據而無意中在貸款決策中劃定紅線)。
-
可審計性:監管機構可能會要求人工智慧的決策具有可解釋性。如果人工智慧拒絕貸款或做出交易決策,必須有可檢驗的理由。生成模型可能有點像黑盒子,因此可解釋的人工智慧技術有望發展,使其決策更加透明。
未來十年,人工智慧與金融專業人士可能會密切合作,隨著信心的增長,逐步實現自主化。早期的勝利將來自低風險的自動化(例如報告產生)。信貸決策或投資選擇等核心判斷將變得更加困難,但即使如此,隨著人工智慧績效的積累,企業也可能賦予其更多自主權。例如,也許一個人工智慧基金將由人類監督者管理,只有在績效出現偏差或人工智慧發出不確定性訊號時才會介入。
從經濟角度來看,麥肯錫估計,人工智慧(尤其是生成人工智慧)每年可為銀行業增加約2000億至3400億美元的價值,並對保險和資本市場產生類似的巨大影響( 2023年的人工智能現狀:生成人工智能的突破之年 | 麥肯錫)(生成人工智能的未來是什麼? | 麥肯錫錫)。這體現在效率和更優的決策結果。為了實現這一價值,許多常規的財務分析和溝通工作可能會被轉交給人工智慧系統。
總而言之,到2035年,生成式人工智慧可能就像一支由初級分析師、顧問和文員組成的大軍,在金融領域工作,自主完成大量繁重工作和一些複雜的分析工作。人類仍將設定目標,並處理高層策略、客戶關係和監管。金融界將謹慎行事,逐步擴大自主權──但方向明確,越來越多的資訊處理甚至決策建議都將來自人工智慧。理想情況下,這將帶來更快的服務(即時貸款、全天候諮詢)、更低的成本,以及更高的客觀性(基於數據模式的決策)。但維護信任至關重要;金融領域一個引人注目的人工智慧錯誤就可能造成巨大的損失(想像一下人工智慧引發的閃電崩盤,或者成千上萬人的福利被錯誤地拒絕)。因此,即使後台流程已經高度自動化,尤其是在面向消費者的行動中,護欄和人工檢查可能仍將持續存在。
挑戰和倫理考量
在所有這些領域,隨著生成式人工智慧承擔起更多自主責任,一系列共同的挑戰和倫理問題也隨之而來。確保人工智慧成為可靠且有益的自主智能體,不僅是一項技術任務,更是一項社會任務。以下我們概述了關鍵問題以及它們正在(或將需要)如何解決:
可靠性和準確性
幻覺問題:生成式人工智慧模型可能會產生看似可信的錯誤或完全虛構的輸出。當沒有人參與其中以發現錯誤時,這種情況尤其危險。聊天機器人可能會向客戶提供錯誤的指令,或者人工智慧編寫的報告可能包含虛構的統計數據。截至 2025 年,不準確性已被各組織視為生成式人工智慧的最大風險( 2023 年人工智慧現狀:生成式人工智慧的突破之年 | 麥肯錫)(人工智慧現狀:全球調查 | 麥肯錫)。展望未來,諸如資料庫事實核查、模型架構改進以及具有反饋的強化學習等技術正在部署,以最大限度地減少幻覺。自主人工智慧系統可能需要嚴格的測試,並且可能需要對關鍵任務進行形式化驗證(例如,如果程式碼產生錯誤,可能會引入錯誤/安全漏洞)。
一致性:人工智慧系統需要長期、跨場景地可靠運作。例如,人工智慧可能在標準問題上表現出色,但在極端情況下卻表現不佳。要確保效能的一致性,需要涵蓋各種情況的大量訓練資料和持續監控。許多組織計劃採用混合方法——人工智慧發揮作用,但隨機樣本由人工審核——來衡量持續的準確率。
故障保護:當人工智慧自主時,讓它辨識自身的不確定性至關重要。系統應該被設計成「知道何時它不知道」。例如,如果人工智慧醫生對診斷不確定,它應該標記並提交人工審核,而不是隨機猜測。在人工智慧輸出中加入不確定性評估(並設定自動人工交接的閾值)是一個活躍的開發領域。
偏見與公平
生成式人工智慧從可能包含偏見(種族、性別等)的歷史數據中學習。自主人工智慧可能會延續甚至放大這些偏見:
-
在招募或入學過程中,如果訓練資料有偏見,人工智慧決策者可能會做出不公平的歧視。
-
在客戶服務中,除非仔細檢查,否則人工智慧可能會根據方言或其他因素對使用者做出不同的反應。
-
在創意領域,如果訓練集不平衡,人工智慧可能無法充分代表某些文化或風格。
解決這個問題需要仔細的資料集管理、偏見測試,甚至可能需要調整演算法以確保公平性。透明度至關重要:公司需要揭露人工智慧的決策標準,尤其是在自主人工智慧影響某人的機會或權利(例如獲得貸款或工作)的情況下。監管機構已經注意到了這一點;例如,歐盟的《人工智慧法案》(將於2020年代中期制定)可能會要求對高風險人工智慧系統進行偏見評估。
問責和法律責任
當人工智慧系統自主運作造成傷害或犯錯時,誰該負責?相關法律框架正逐步完善:
-
部署人工智慧的公司可能會承擔責任,類似於對員工行為負責。例如,如果人工智慧給了錯誤的財務建議,導致客戶遭受損失,公司可能需要賠償客戶。
-
關於人工智慧的「人格」或高階人工智慧是否應承擔部分責任存在爭議,但目前這些爭論更停留在理論層面。實際上,責任將追溯到開發者或營運者。
-
針對人工智慧故障,可能會出現新的保險產品。如果一輛自動駕駛卡車發生事故,製造商的保險可能會承保,類似產品責任險。
-
記錄和記錄人工智慧決策對於事後分析至關重要。如果出現問題,我們需要審核人工智慧的決策路徑,從中學習並追究責任。正是出於這個原因,監管機構可能會強制要求記錄人工智慧的自主行動。
透明度和可解釋性
理想情況下,自主人工智慧應該能夠用人類可理解的術語解釋其推理,尤其是在金融、醫療保健、司法系統等相關領域。可解釋人工智慧是一個致力於打開黑盒子的領域:
-
如果AI拒絕貸款,相關法規(例如美國的《經濟適用法》(ECOA))可能要求申請人提供理由。因此,AI必須輸出一些因素(例如“高債務收入比”)作為解釋。
-
與人工智慧互動的使用者(例如學生與人工智慧導師,患者與人工智慧健康應用)有權了解其如何得出建議。人們正在努力透過簡化模型或建立平行解釋模型,使人工智慧推理更具可追溯性。
-
透明度也意味著用戶應該知道究竟是在與人工智慧打交道,還是在與人類打交道。道德準則(以及一些法律)傾向於要求揭露客戶是否正在與機器人對話。這可以防止欺騙並允許用戶同意。一些公司現在明確標記人工智慧編寫的內容(例如「本文由人工智慧產生」)以維護信任。
隱私和資料保護
生成式人工智慧通常需要資料(包括潛在的敏感個人資料)才能運作或學習。自主運作必須尊重隱私:
-
人工智慧客戶服務代理將存取帳戶資訊以幫助客戶;該資料必須受到保護並且僅用於該任務。
-
如果人工智慧導師可以存取學生資料,則根據《家庭教育權和隱私權法》(美國)等法律,可以考慮確保教育資料隱私。
-
大型模型可能會無意中記住訓練資料中的具體資訊(例如,在複述訓練期間看到的某人的地址)。訓練中的差異隱私和資料匿名化等技術對於防止生成的輸出中個人資訊外洩至關重要。
-
像GDPR這樣的法規賦予個人針對影響自身的自動化決策的權利。如果決策對其造成重大影響,人們可以要求人工審核或要求決策不再完全自動化。到2030年,隨著人工智慧的普及,這些法規可能會有所改進,可能引入解釋權或選擇退出人工智慧處理的權利。
安全和濫用
自主人工智慧系統可能成為駭客攻擊的目標,或被利用來做惡意的事情:
-
AI 內容產生器可能被濫用來大規模製造虛假資訊(例如深度偽造影片、虛假新聞文章),這構成了社會風險。發布極其強大的生成模型的倫理問題備受爭議(例如,OpenAI 最初對 GPT-4 的圖像功能持謹慎態度)。解決方案包括為 AI 生成的內容添加浮水印以幫助檢測虛假訊息,以及利用 AI 對抗 AI(例如深度偽造的檢測演算法)。
-
如果人工智慧控制物理過程(無人機、汽車、工業控制),那麼保護其免受網路攻擊至關重要。被駭客入侵的自主系統可能會造成現實世界的危害。這意味著需要強大的加密、故障安全機制,以及在出現安全隱患時能夠被人為覆蓋或關閉的能力。
-
人工智慧也存在著超越預期界線的擔憂(「流氓人工智慧」場景)。雖然目前的人工智慧沒有自主性或意圖,但如果未來的自主系統更具自主性,就需要嚴格的約束和監控,以確保它們不會執行未經授權的交易或因錯誤設定的目標而違反法律。
道德使用和人類影響
最後,更廣泛的道德考量:
-
工作被取代:如果人工智慧無需人工幹預即可完成任務,這些工作將面臨怎樣的命運?從歷史上看,技術自動化了一些工作,但也創造了其他工作。對於那些技能與自動化任務相關的工人來說,這種轉變可能會很痛苦。社會需要透過技能再培訓、教育,甚至可能重新考慮經濟支持來應對這項挑戰(有些人認為,如果大量工作實現自動化,人工智慧可能需要引入全民基本收入等概念)。調查已經顯示出褒貶不一的情緒——一項研究發現,三分之一的工人擔心人工智慧取代工作,而另一些人則認為人工智慧可以減輕苦差事。
-
人類技能的侵蝕:如果人工智慧導師負責教學,人工智慧自動駕駛負責駕駛,人工智慧負責編寫程式碼,人們會失去這些技能嗎?過度依賴人工智慧在最壞的情況下可能會侵蝕專業知識;教育和培訓計畫需要進行調整,確保即使人工智慧提供幫助,人們仍然能夠學習基礎知識。
-
倫理決策:人工智慧缺乏人類的道德判斷能力。在醫療保健或法律領域,純粹的數據驅動決策可能在個案中與同情心或正義相衝突。我們或許需要將倫理框架融入人工智慧(這是人工智慧倫理研究的一個領域,例如,使人工智慧決策與人類價值一致)。至少,在涉及倫理的決策中,讓人類參與是明智之舉。
-
包容性:確保人工智慧的益處已廣泛普及是一項道德目標。如果只有大公司才能負擔得起先進的人工智慧,那麼小型企業或貧困地區可能會被拋在後面。開源努力和價格合理的人工智慧解決方案有助於實現普及。此外,介面設計應確保任何人都能使用人工智慧工具(例如提供不同的語言、為殘障人士提供無障礙服務等),以免造成「誰有人工智慧助手,誰沒有」的新數位落差。
當前風險緩解:積極的一面是,隨著企業推出新一代人工智慧,人們對這些問題的認識和行動也在不斷提高。到2023年末,近一半使用人工智慧的公司正在積極努力降低諸如不準確性之類的風險( 《2023年人工智慧現狀:生成式人工智慧的突破之年》| 麥肯錫)( 《人工智慧現狀:全球調查》| 麥肯錫),而且這個數字還在不斷上升。科技公司已經成立了人工智慧倫理委員會;各國政府正在起草相關法規。關鍵在於從一開始就將倫理融入人工智慧開發之中(「設計倫理」),而不是事後才採取行動。
關於挑戰,總結一下:賦予人工智慧更多自主權是一把雙面刃。它可以帶來效率和創新,但也需要承擔高標準的責任。未來幾年,我們可能會看到一系列技術解決方案(用於改善人工智慧行為)、流程解決方案(政策和監督框架),以及新的標準或認證(人工智慧系統可能會像今天的引擎或電子產品一樣接受審核和認證)。能否成功應對這些挑戰,將決定我們能否順利地將自主人工智慧融入社會,進而增進人類福祉和信任。
結論
生成式人工智慧已從一項新穎的實驗迅速發展成為一項觸及我們生活各個層面的變革性通用技術。本白皮書探討了到2025年,人工智慧系統如何能夠撰寫文章、設計圖形、編寫軟體、與客戶溝通、總結醫療記錄、輔導學生、優化供應鏈以及起草財務報告。重要的是,在許多此類任務中,人工智慧幾乎無需人工幹預,尤其是在定義明確、可重複的工作中。企業和個人開始信任人工智慧能夠自主執行這些任務,並從速度和規模方面獲益。
展望2035年,我們正處於一個新時代的開端,屆時人工智慧將成為更無所不在的協作者——通常,它就像一支隱形的數位勞動力,處理日常事務,使人類能夠專注於非凡之事。我們期待生成式人工智慧能夠可靠地駕駛汽車和卡車在道路上行駛,在夜間管理倉庫庫存,作為知識淵博的私人助理解答我們的疑問,為世界各地的學生提供一對一指導,甚至幫助發現新的醫學療法——所有這些都將越來越少地依賴直接監督。隨著人工智慧從被動遵循指令轉變為主動生成解決方案,工具與代理之間的界限將變得模糊。
然而,通往自主人工智慧未來的旅程必須謹慎前進。正如我們所概述的,每個領域都有其自身的限制和責任:
-
當今的現實檢驗:人工智慧並非萬無一失。它擅長模式識別和內容生成,但缺乏人類所具備的真正理解力和常識。因此,目前,人類的監督仍然是安全網。識別人工智慧在哪些方面已經準備好獨立自主(以及哪些方面尚未準備好)至關重要。如今,許多成功案例都源自於人機協作模式,而這種混合模式在尚未完全實現自主控制的領域仍將發揮重要作用。
-
未來展望:隨著模型架構、訓練技術和監督機制的進步,人工智慧的能力將持續擴展。未來十年的研發可以解決許多當前的痛點(減少幻覺、提升可解釋性、使人工智慧與人類價值觀相符)。如果是這樣,到2035年,人工智慧系統將足夠強大,能夠被賦予更大的自主權。本文中的預測——從人工智慧教師到高度自主運作的企業——很可能成為現實,甚至可能被今天難以想像的創新所超越。
-
人類的角色與適應:我們預見到人工智慧不會完全取代人類,而是會不斷演變。各行各業的專業人士可能需要熟練運用人工智慧——引導它、驗證它,並專注於那些需要人類獨特優勢的工作領域,例如同理心、策略思考和複雜問題解決能力。教育和勞動力培訓應著重於這些人類獨有的技能,以及人人都應具備的人工智慧素養。政策制定者和企業領導者應規劃勞動市場的轉型,並確保為受自動化影響的人口提供支援系統。
-
倫理與治理:或許最關鍵的是,必須建立一個符合倫理道德的人工智慧使用和治理框架來支持這項技術發展。信任是採用的基石——只有相信人工智慧安全,人們才會讓其駕駛汽車或協助手術。建立這種信任需要嚴格的測試、透明度、利害關係人的參與(例如,讓醫生參與醫療人工智慧的設計,讓教師參與人工智慧教育工具的設計),以及適當的監管。國際合作或許是應對深度偽造或戰爭中人工智慧等挑戰的必要條件,確保負責任使用人工智慧的全球規範。
總而言之,生成式人工智慧是推動進步的強大引擎。如果運用得當,它可以將人類從繁重的勞動中解放出來,釋放創造力,提供個人化服務,並填補人才缺口(在專家稀缺的領域提供專業知識)。關鍵在於如何運用它,放大人類的潛力,而不是將其邊緣化。從短期來看,這意味著讓人類參與引導人工智慧的循環。長遠來看,這意味著將人文價值融入人工智慧系統的核心,這樣即使它們獨立行動,也能符合我們集體的最佳利益。
| 領域 | 當今可靠的自主性(2025年) | 預計2035年實現可靠自主 |
|---|---|---|
| 寫作與內容 | - 自動產生常規新聞(體育、收益)。 - 人工智慧總結產品評論。 - 人工編輯文章或電子郵件草稿。 ( Philana Patterson – ONA 社群簡介)(亞馬遜利用人工智慧提升顧客評論體驗) | - 大多數新聞和行銷內容都是自動編寫的,具有事實準確性。 - 人工智慧在最少的監督下製作完整的文章和新聞稿。 - 按需產生高度個人化的內容。 |
| 視覺藝術與設計 | - 人工智慧根據提示產生圖像(人類選擇最佳)。 - 自主創建的概念藝術和設計變化。 | - 人工智慧製作完整的影片/電影場景和複雜的圖形。 - 符合規格的產品/架構的生成設計。 - 按需創建的個人化媒體(圖像、影片)。 |
| 軟體編碼 | - AI 自動完成程式碼並編寫簡單函數(由開發人員審核)。 - 自動產生測試並提出錯誤建議。 ( Copilot 上的編碼:2023 年數據表明代碼品質面臨下行壓力(包括 2024 年預測)- GitClear )( GitHub Copilot 在 AI 代碼助手研究報告中名列前茅 - Visual Studio Magazine ) | - AI 可靠地根據規格實現全部功能。 - 已知模式的自主調試和程式碼維護。 - 只需很少的人工輸入即可創建低程式碼應用程式。 |
| 客戶服務 | - 聊天機器人回答常見問題,解決簡單問題(交接複雜案例)。 - 人工智慧處理某些管道上約 70% 的常規查詢。 ( 2025 年 59 個人工智慧客戶服務統計數據)(到 2030 年,客戶互動過程中 69% 的決策將是... ) | - 人工智慧端到端處理大多數客戶互動,包括複雜的查詢。 - 即時人工智慧決策服務優惠(退款、升級)。 - 僅用於升級或特殊情況的人工代理。 |
| 衛生保健 | - AI 起草醫療記錄;提出診斷建議並由醫生核實。 - AI 在監督下讀取部分掃描結果(放射學);對簡單病例進行分類。 (到 2035 年,AI 醫學影像產品數量或將增加 5 倍) | - 人工智慧可靠地診斷常見疾病並解釋大多數醫學影像。 - 人工智慧監控患者並啟動護理(例如,藥物提醒、緊急警報)。 - 虛擬人工智慧「護理師」處理常規跟進;醫生專注於複雜的護理。 |
| 教育 | - AI 導師解答學生問題,產生練習題(教師監控)。 - AI 輔助評分(教師評閱)。 ([K-12 教育的生成式 AI] | Applify 的研究報告( https://www.applify.co/research-report/gen-ai-for-k12#:~:text=AI%20tutors%3A%20Virtual%20AI,individual%20learning%20styles%20and%20paces ) |
| 後勤 | - 人工智慧優化配送路線和包裝(人類設定目標)。 - 人工智慧標記供應鏈風險並提出緩解措施。 (物流領域頂級生成式人工智慧用例) | - 大部分自動駕駛送貨(卡車、無人機)由人工智慧控制器監督。 - 人工智慧自動重新安排運輸路線以避免中斷並調整庫存。 - 由人工智慧管理的端到端供應鏈協調(訂購、分銷)。 |
| 金融 | - 人工智慧產生財務報告/新聞摘要(人工審核)。 - 機器人顧問管理簡單的作品集;人工智慧聊天處理客戶查詢。 (生成式人工智慧即將進軍金融領域) | - 人工智慧分析師以高精度提供投資建議和風險報告。 - 在設定的限度內進行自主交易和投資組合再平衡。 - 人工智慧自動批准標準貸款/索賠;人類處理例外情況。 |
參考:
-
帕特森,菲拉娜。 《自動化獲利報告倍增》 。美聯社(2015 年)—描述了美聯社無需人工撰寫即可自動生成數千份盈利報告的過程( 《自動化盈利報道成倍增長》| 美聯社)。
-
麥肯錫公司。 2024年初人工智慧現況:人工智慧普及率激增並開始創造價值。 (2024 年)—報告稱,65% 的組織定期使用生成式人工智慧,幾乎是 2023 年的兩倍( 2024 年初人工智慧現狀 | 麥肯錫),並討論了風險緩解措施(人工智慧現狀:全球調查 | 麥肯錫)。
-
Gartner。超越聊天GPT:企業生成式AI的未來。 (2023年)-預測到2030年,90%的大片內容可能由AI產生(工業和企業的生成式AI用例),並重點介紹了藥物設計等生成式AI用例(工業和企業的生成式AI用例)。
-
Twipe。記者在新聞編輯室使用人工智慧工具的 12 種方式。 (2024 年)—例如,新聞機構的「Klara」人工智慧撰寫了 11% 的文章,所有人工智慧內容均由人類編輯審核(記者在新聞編輯室使用人工智慧工具的 12 種方式 - Twipe )。
-
Amazon.com 新聞。亞馬遜利用人工智慧改善客戶評論體驗。 (2023 年)—宣佈在產品頁面上提供人工智慧產生的評論摘要,以幫助購物者(亞馬遜利用人工智慧改善客戶評論體驗)。
-
Zendesk。 2025年 59 個 AI 客戶服務統計。 (2023 年)—顯示超過三分之二的 CX 組織認為生成式 AI 將為服務增添「溫暖」( 2025 年 59 個 AI 客戶服務統計數據),並預測最終 100% 的客戶互動中將使用 AI( 2025 年 59 個 AI 客戶服務統計數據)。
-
Futurum Research 和 SAS。體驗 2030:顧客體驗的未來。 (2019 年)– 調查發現,品牌預計到 2030 年,客戶互動過程中約 69% 的決策將由智慧機器做出(要重新構想向 CX 的轉變,行銷人員必須做到這兩件事)。
-
Dataiku。物流領域的頂級生成式人工智慧用例。 (2023 年)—描述 GenAI 如何優化裝載(減少約 30% 的空卡車空間)(物流領域的頂級生成式人工智慧用例)並透過掃描新聞來標記供應鏈風險。
-
Visual Studio 雜誌。 GitHub Copilot 在 AI 程式碼助手研究報告中名列前茅。 (2024 年)– Gartner 的策略規劃假設:到 2028 年,90% 的企業開發人員將使用 AI 程式碼助理(高於 2024 年的 14%)( GitHub Copilot 在 AI 程式碼助理研究報告中名列前茅——Visual Studio 雜誌)。
-
彭博新聞。隆重推出 BloombergGPT 。 (2023 年)—詳細介紹彭博針對金融任務的 500 億參數模型,該模型內建於終端,用於問答和分析支援(生成式人工智慧即將進軍金融領域)。
您可能想閱讀以下文章:
🔗哪些工作是人工智慧無法取代的,哪些工作會被人工智慧取代?
本文將從全球視角審視不斷變化的就業格局,探討哪些工作可以免受人工智慧的干擾,哪些工作又最有可能被取代。
🔗人工智慧能預測股市嗎?
深入探討使用人工智慧進行股市預測的能力、限制和道德考量。
🔗生成式人工智慧如何應用於網路安全?
了解生成式人工智慧如何應用於防禦網路威脅,從異常偵測到威脅建模。