我敢肯定,你肯定聽過各種各樣的說法,從「人工智慧每回答幾個問題就要喝掉一瓶水」到「基本上就幾滴水」。但事實遠比這複雜得多。人工智慧的用水量會根據其運作地點、提示資訊的長度以及資料中心伺服器的冷卻方式而有很大差異。所以,雖然存在一個大致的數字,但它背後卻隱藏著許多不確定因素。
以下我將詳細解讀清晰、便於決策的數據,解釋為什麼估算結果會有分歧,並展示建築商和一般使用者如何在不成為永續發展苦行僧的情況下減少用水量。
您可能想閱讀以下文章:
🔗 什麼是人工智慧數據集
解釋了資料集如何實現機器學習訓練和模型開發。
🔗 人工智慧如何預測趨勢
展示了人工智慧如何分析模式以預測變化和未來結果。
🔗 如何衡量人工智慧性能
詳細分析評估準確性、速度和可靠性的關鍵指標。
🔗 如何與人工智慧對話
指導有效的提示策略,以提高清晰度、效果和一致性。
人工智慧用水量是多少?一些實用的小數據📏
-
目前,每個提示的文本量差異很大:在主流系統中,一個中等長度的文本提示的文本通常不到毫升;幾十毫升。例如,Google的生產統計資料顯示,文字提示的文字量中位數約為 0.26 毫升(包含完整的服務開銷)[1]。 Mistral 的生命週期評估表明,一個包含400 個令牌的助手回應的文字量約為 45 毫升(邊際推斷)[2]。上下文和模型至關重要。
-
訓練一個前沿規模的模型可能需要數百萬公升的水,主要來自冷卻和發電過程中消耗的水。一項被廣泛引用的學術分析估計,訓練一個GPT級別的模型大約需要540萬升水現場冷卻消耗的約70萬升水
-
一般而言,大型資料中心:大型站點每天用水量達數十萬加侖,某些園區的用水量高峰較高,取決於氣候和設計[5]。
說實話,這些數據乍看之下似乎前後矛盾。的確如此。而這其中有充分的理由。

AI用水指標✅
一個好的答案應該滿足以下幾個條件:人工智慧用水量是多少?
-
邊界清晰度:
它是否僅包括現場冷卻水,還是也發電廠用於發電的場外水取水量與用水量,並劃分範圍 1-2-3,類似碳核算 [3]。 -
位置敏感度:
每度電用水量因地區和電網組合而異,因此,同樣的提示可能會因服務地點不同而產生不同的用水影響——這是文獻建議進行時間和地點感知調度的[3]。 -
工作負載的現實性:
此數字反映的是中位數生產請求,包括空閒容量和資料中心開銷,還是僅反映尖峰加速器?谷歌強調對整個系統進行全面統計(空閒、CPU/DRAM 和資料中心開銷)以進行推斷,而不僅僅是 TPU 的計算 [1]。 -
冷卻技術方面
,蒸發冷卻、閉環液冷、空氣冷卻以及新興的晶片級直接技術極大地改變了用水量。微軟正在推出旨在某些新一代資料中心冷卻用水的 -
一天中的時間和季節、
溫度、濕度和電網狀況都會影響用水效率;一項有影響力的研究表明,應在用水強度較低的時間和地點安排主要工作[3]。
取水量與用水量比較詳解💡
-
取水量= 從河流、湖泊或含水層中取水(部分水會回來)。
-
消耗量=未返回的,因為水會蒸發或被納入生產過程/產品。
冷卻水塔主要消耗水。發電廠可能會抽取大量水(有時會消耗一部分),具體取決於電廠和冷卻方式。一個可信的AI水量數值會標示它所報告的數值[3]。
人工智慧中的水流向:三個水桶🪣
-
範圍 1 - 現場冷卻
可見部分:資料中心本身蒸發的水。蒸發式冷卻與空氣冷卻或閉環液體冷卻設定了基準 [5]。 -
範圍 2 - 發電
每千瓦時 (kWh) 都可能攜帶一個隱藏的水標籤;混合比例和位置決定了您的工作負載所繼承的每千瓦時升數訊號 [3]。 -
範圍 3 - 供應鏈
晶片製造依賴超純水進行製造。除非邊界明確包含隱含影響(例如,完整的生命週期評估),否則您不會在「每次提示」指標中看到它[2][3]。
供應商數據,細緻入微🧮
-
Google Gemini 提示採用
全端服務方法(包括空閒時間和設施開銷)。文字提示的中位數約為 0.26 毫升水和0.24 瓦時能量;這些數字反映了生產流量和綜合邊界 [1]。 -
Mistral Large 2 生命週期
一項罕見的獨立 LCA(與 ADEME/Carbone 4 合作)顯示,訓練和早期使用需要約 281,000 立方米400 個令牌的推理邊際約為 45 毫升[2]。 -
微軟的零水冷卻目標:
下一代資料中心的設計目標是實現零水冷卻,依靠直接對晶片冷卻的方式;管理用途仍然需要一些水[4]。 -
一般資料中心規模
主要業者公開報告稱,平均每天用水量達數十萬加侖;氣候和設計會使用水量上下波動[5]。 -
早期的學術
基準「渴求人工智慧」分析估計需要數百萬公升水來訓練 GPT 類模型,並且10-50 個中等答案大約相當於500 毫升的瓶子——這很大程度上取決於它們運行的時間/地點 [3]。
為什麼估算結果會有這麼大的分歧🤷
-
不同的邊界。
有些數據只計算現場冷卻;有些數據則加上了電力用水;生命週期評估可能還會加上晶片製造。蘋果、橘子和水果沙拉[2][3]。 -
不同的工作負載
短文字提示不是長時間的多模態/程式碼運作;批次、並發和延遲目標會改變利用率 [1][2]。 -
不同的氣候和電網
在炎熱乾燥地區採用蒸發冷卻≠在涼爽潮濕地區採用空氣/液體冷卻。電網水強度變化很大[3]。 -
供應商方法論方面
,Google發布了系統級服務方法;Mistral 發布了正式的生命週期評估 (LCA)。其他供應商則使用稀疏方法提供點估計。一項備受矚目的「每次提示使用十五分之一茶匙」的說法曾經一度成為新聞頭條——但由於缺乏邊界細節,該說法不具有可比性 [1][3]。 -
技術
發展日新月異。微軟正在部分站點試行無水冷卻技術;即使上游電力仍依賴水,推廣這些技術將減少現場用水量[4]。
今天你可以做些什麼來減少人工智慧的水足跡🌱
-
合理調整模型規模。規模
較小、針對特定任務最佳化的模型通常能在保持準確率的同時,減少運算資源消耗。 Mistral 的評估強調了模型規模與資源佔用之間的強相關性,並公佈了邊際推斷值,以便使用者權衡利弊[2]。 -
選擇節水地區
優先選擇氣候涼爽、製冷效率高、每千瓦時用水強度較低的電網地區;「渴求用水的人工智慧」研究表明,時間和地點感知調度有助於節水 [3]。 -
按時間
調整工作負荷 將訓練/繁重的批量推理安排在節水時段(涼爽的夜晚、有利的電網條件)[3]。 -
向供應商索取透明的指標,
例如每次用水需求、邊界定義,以及資料是否包含閒置產能和設施營運成本。政策團體正在推動強制揭露這些訊息,以便進行公平的比較[3]。 -
冷卻技術很重要。
如果您運行硬件,請評估閉環/直接晶片冷卻;如果您在雲端,請優先選擇投資於輕水冷設計的[4][5]。 -
利用灰水和再利用方案
許多校園可以替代非飲用水源或在循環系統中回收利用;大型業者描述了平衡水源和冷卻選擇,以最大限度地減少淨影響[5]。
舉個簡單的例子來說明(並非普遍規律):將一項夜間培訓工作從盛夏炎熱乾燥的地區轉移到春季涼爽濕潤的地區,並在非高峰時段進行,可以同時改變現場用水量和外部(電網)用水強度。這就是合理安排工作所能帶來的實際有效的成果[3]。
比較表格:快速降低人工智慧用水量的最佳方案🧰
| 工具 | 觀眾 | 價格 | 為什麼有效 |
|---|---|---|---|
| 更小的、針對特定任務調整的模型 | 機器學習團隊、產品負責人 | 低至中等 | 每個代幣的計算量越少 = 冷卻、電力和水的消耗就越少;LCA 風格的報告證明了這一點 [2]。 |
| 按水/千瓦時劃分區域 | 雲端架構師、採購 | 中等的 | 轉向較涼爽的氣候和用水強度較低的電網;配合需求感知路由[3]。 |
| 一天中的不同時段訓練窗口 | MLOps、調度器 | 低的 | 涼爽的夜晚和更好的電網條件降低了有效水強度[3]。 |
| 晶片直接冷卻/閉環冷卻 | 資料中心維 | 中高 | 盡可能避免使用蒸發塔,進而大幅減少現場消耗[4]。 |
| 提示長度和批量控制 | 應用程式開發者 | 低的 | 限制失控的令牌,聰明地批量處理,快取結果;減少毫秒數,減少毫升數[1][2]。 |
| 供應商透明度查核清單 | 首席技術長、永續發展負責人 | 自由的 | 強制明確邊界(現場與非現場)和進行同類報告[3]。 |
| 灰水或再生水源 | 設施、市政當局 | 中等的 | 用非飲用水取代飲用水可以緩解飲用水供應的壓力[5]。 |
| 熱能再利用夥伴關係 | 操作員、地方議會 | 中等的 | 提高熱效率可間接降低冷氣需求,並建立當地良好聲譽[5]。 |
(「價格」一詞本身就比較模糊——具體情況因部署而異。)
深入分析:政策鼓聲越來越大🥁
工程機構呼籲強制揭露資料中心的能源和用水情況,以便買家和社區能夠評估成本和效益。建議包括範圍定義、站點層級報告和選址指導——因為如果沒有可比的、與位置相關的指標,我們就如同在黑暗中爭論[3]。
深度解析:資料中心的飲水方式各不相同🚰
一直以來都有一種誤解,認為「空氣冷卻不需要水」。其實不然。空氣冷卻系統通常需要更多電力,而在許多地區,電力供應中包含了來自電網的隱性水源水冷系統雖然可以減少電力消耗和排放,但代價是需要消耗現場用水。大型業者會根據具體情況,明確權衡這些利弊[1][5]。
深度解析:快速辨別網路謠言的真相🧪
你可能見過一些大膽的說法,例如一次提示相當於“一瓶水”,或者“只需幾滴”。更好的做法是:對數學保持謙遜。如今,可信賴的提示量範圍約為中等量提示(包含全部服務開銷)約為0.26 毫升約為 45 毫升[2]。廣為流傳的「十五分之一茶匙」的說法缺乏明確的界限/方法;把它當作沒有具體城市的天氣預報來看待吧 [1][3]。
簡明問答:人工智慧用水量是多少? (再次用簡單易懂的語言解釋)🗣️
-
那麼,我在會議上該怎麼說呢?
根據型號、長度和運行地點,每次訓練的用水量從幾滴到幾小口訓練需要的是大水池,而不是小水坑。」 然後舉出上面提到的一兩個例子。 -
人工智慧真的一定不好嗎?
它的獨特之處在於其高度集中性:高功率晶片密集排列會產生巨大的冷卻負荷。但資料中心也往往是效率最高的技術最先應用的地方[1][4]。 -
如果我們把所有東西都改成空氣冷卻呢?
這樣可能會減少現場用水,但可以透過電力增加外部用水。經驗豐富的業者會權衡這兩方面[1][5]。 -
未來的技術會如何?
避免冷卻水的設計將徹底改變範圍 1 的格局。一些營運商正在朝著這個方向發展;上游電力仍然攜帶水訊號,直到電網發生變化 [4]。
最後總結-太長了,我沒看完🌊
-
每次提示:根據模型、提示長度和運行位置的不同,提示量從亞毫升到幾十毫升在一個主要堆疊中,提示的中位數約為 0.26 毫升 400 個令牌的回復約為 45 毫升 [1][2]。
-
培訓: 數百萬公升用於前沿模型,使得調度、選址和冷卻技術至關重要[3]。
-
應該怎麼做:選擇合適的型號,選擇節水區域,將繁重的工作轉移到較冷的時間段,優先選擇能夠提供節水設計的供應商,並要求透明的邊界[1][3][4][5]。
最後用一個略有瑕疵的比喻:人工智慧就像一個渴求水分的交響樂團──旋律是計算,鼓點是冷卻系統和電網的供水。調整好樂團,觀眾就能在不被灑水器幹擾的情況下欣賞到美妙的音樂。 🎻💦
參考
-
Google Cloud 部落格 - Google 的 AI 消耗多少能源?我們計算了一下(方法論 +約 0.26 毫升中位數提示,完整服務開銷)。連結
(技術論文 PDF:衡量 Google 規模下 AI 交付的環境影響。)鏈接 -
Mistral AI-我們為全球人工智慧環境標準所做的貢獻(採用 ADEME/Carbone 4 進行生命週期評估;訓練和早期使用約 281,000 立方公尺每次400 個詞元的回應約需 45 毫升連結
-
Li等人-讓AI減少「渴水」:揭示並解決AI模型的隱密用水足跡(訓練數百萬公升水、時間地點感知調度、取水與消耗)。連結
-
微軟-下一代資料中心冷卻過程無需用水(採用直接晶片冷卻設計,旨在特定地點實現無水冷卻)。連結
-
谷歌資料中心-永續營運(逐個站點的冷卻權衡;報告和再利用,包括再生水/灰水;典型的每日站點級使用量級)。連結