「在網路上,凡走過必留痕跡。」這句曾經被我們奉為資安圭臬、甚至用來警惕社群足跡的名言,在今天,恐怕得加上一個巨大的問號。
過去我們相信,Google 就像一座永不打烊的圖書館,任何名字、任何事件,只要被索引過一次,就會永久地留在某個伺服器的角落。然而,現實正在狠狠地打臉這個樂觀的想像。隨著 Pew Research Center 等機構的資料出爐,加上生成式 AI 對搜尋引擎的蠶食鯨吞,業界正關注著人類社會面臨網際網路誕生以來最嚴峻的「數位失憶」危機。
CyberQ 觀察,這個令人不安的現象意味著我們正在失去過去,而未來的一部分呢 ? 卻是由 AI 和一堆電力去拼湊而成的部分假象。
資料會說話,網際網路正在「腐爛」
這種現象被稱為「連結腐爛」(Link Rot)或更廣泛的「數位衰退」(Digital Decay)。
根據 Pew Research Center 在 2024 年發布的調查,截至 2023 年,那些曾在 2013 年至 2023 年間存在的網頁,有高達 25% 已經無法存取。如果我們把時間軸拉長到 2013 年,當年存在的網頁如今已有 38% 徹底消失。
這不僅僅是那些個人部落格或過時論壇的關閉,受災最嚴重的往往是我們認為最需要保存的資料,
新聞媒體,許多中小型媒體因經營不善倒閉,伺服器一關,十年的報導付之一炬。
政府與學術網站,隨著改版或政策更迭,大量 PDF 報告與數據連結失效。
社群媒體,平台政策改變(如 X/Twitter 的 API 限制)或用戶刪文,讓「即時歷史」變得支離破碎。
我們過去依賴搜尋引擎作為「外接大腦」,假設資料永遠都在那裡。但現在,當你點擊一個十年前的參考連結,迎接你的往往是冷冰冰的 404 Not Found。
AI 獵食從搜尋到生成的代價
如果說「連結腐爛」是自然老化,那麼 AI 搜尋引擎的崛起,則可能是一場人為的生態浩劫。
過去的網際網路建立在一種「互惠契約」之上,網站提供內容,搜尋引擎提供流量(點擊),網站靠流量變現來維持伺服器運作。然而,隨著 Google 的 AI Overviews (SGE) 和 ChatGPT Search 等「生成式搜尋」成為主流,這個契約正在崩解。
零點擊(Zero-Click)的詛咒,使用者不再需要點擊連結,AI 直接統整答案給你。這對使用者很方便,但對內容創作者是毀滅性的。在過去,沒有點擊,就沒有廣告收入,沒有收入,網站就有可能會關閉。這是一個惡性循環,AI 吸取了網站的知識,卻餓死了提供知識的宿主。
AI 合成內容的洪水有點氾濫了,根據 Graphite 等 SEO 機構的分析,2024 年底,網路上新生成的文章、社群貼文中,AI 撰寫的比例近然有一度超越人類,後來則因為品質太差而被減少收錄量。網際網路正被大量平庸、重複、甚至幻覺(Hallucination)的合成內容淹沒。未來學術界與產業界要面對的挑戰,不是資料太少,而是如何在垃圾山中挖掘出人類真實的聲音,而且還要是正確的資料,這會有一些難度,甚至可能還需要 AI 來輔助檢驗。
當歷史的真相逐漸失去索引
當原始連結失效,而 AI 又開始根據機率生成內容時,我們將面臨「後真相時代」的終極版本。
試想一下,如果關於某個歷史事件的原始報導連結失效了,而剩下的只有 AI 生成的摘要,或者被大量內容農場亂洗後的版本,我們該如何驗證真偽?
網際網路檔案館(Internet Archive)的 Wayback Machine 是許多人心中的最後防線,但它其實也面臨巨大的法律與資金壓力。近期出版商對 Internet Archive 的版權訴訟,更讓「全面備份人類知識」的理想蒙上陰影。我們不能再天真地認為,會有某個慈善機構替我們保存所有的數位資產。
給未來自己的備忘錄
面對這個逐漸消失的網路,我們需要新的思維與工具來保存數位資產,
擁抱去中心化儲存(Web3),傳統 HTTP 協定是脆弱的(基於位置),而 IPFS(星際檔案系統)或 Arweave 等技術則是基於內容(Content-based)。Arweave 提出的 Permaweb(永久網路)概念,試圖建立一個「付費一次,永久儲存」的機制,這可能是對抗連結腐爛的技術解方。
學術與引用的標準化,哈佛法學院開發的 Perma.cc 是一個很好的範例。它允許學者在引用連結時,生成一個永久的存檔快照。未來的內容創作者與媒體,都應該養成「引用即備份」的習慣。
個人數位策展(Digital Curation),不要再依賴「我的最愛」或瀏覽器書籤。使用如 Obsidian、Notion 搭配 Web Clipper,將你認為有價值的文章完整擷取(Capture)下來。在這個時代,下載到硬碟載體裡的,才是真正屬於你自己能閱讀的資料。
成為數位時代的守火人
CyberQ 認為,網際網路並不是一個固定的形狀或穩固的平台,而是一種看起來是流動中的沙灘,當海浪(AI 與時間)一來,寫在上面的字就會消失。
作為資訊時代的見證者,我們有責任意識到「保存」的重要性,但前提是你要能夠分辨哪些是垃圾資訊,那些要留,那些值得永留存。不要讓未來的人類在挖掘 21 世紀的歷史時,只找到一堆 404 錯誤代碼,以及幾十億條由 AI 生成的廢文和廢話。
凡走過必留痕跡,前提是你得親手把它刻下來才行呢,方法為何呢 ? CyberQ 推薦你下面這一篇做法,提供參考。
首圖由 Google Nano Banana AI 生成










