PTT評價

[討論] PRC評論:"中文網路正在加速崩塌"

看板Tech_Job標題[討論] PRC評論:"中文網路正在加速崩塌"作者
jackliao1990
(j)
時間推噓 8 推:8 噓:0 →:10

中共自媒體人何加鹽主要寫作知名企業和企業家的故事,讀者包括中國最頂級企業家和高階主管、投資人群體。前天他發表評論:〈中文互聯網正在加速崩塌〉,觸怒了中共,該文因"違反《互聯網用戶公眾賬號信息服務管理規定》",接獲"投訴"的微信下架了該篇文章。

以下是該文的備份:

https://www.cnbeta.com.tw/articles/tech/1431972.htm


先問你一個小問題:如果我們在百度上搜尋「馬雲」這兩個字,把時間設定在1998年到
2005年,能搜出來的信息,大概有多少條呢? 是1億條,還是1000萬條,還是100萬條?我在幾個群組問過,大家普遍的猜想是,應該是百萬或千萬的等級。 畢竟,網路資訊如此浩如煙海。 馬雲作為那個時代的風雲企業家,在網路上留下的痕跡肯定是非常多的。

但實際上能搜出的全部結果如下:


用百度搜索,選定日期範圍為“1998年5月22日到2005年5月22日”,含有馬雲的信息,總
共是1條(2024年5月22日數據)。

而僅有的這一訊息,也是虛假的。 點進去會發現,文章的發佈時間其實是2021年,不屬於上面限定的時間段,只是不知怎麼回事,它被莫名其妙地搜尋出來。


也就是說,如果我們想要了解那一段時間關於馬雲的經驗、報道、人們對他的討論、他的講話、公司的發展史等等,我們能得到的有效的原始資訊量,是零。

你可能會覺得,這是不是百度的問題啊? 如果換必應或Google,會不會能搜出來?

我測試過,這兩個網站搜出來的有效信息,和百度沒有太大區別,比百度略多一些,但也只是個位數。 更多的也都是時間紊亂的無效訊息,只不過不知道是什麼技術原因,被錯誤地抓取出來。

你可能還會覺得,是不是因為馬雲屬於比較有爭議的人,由於某種不可描述的原因,所以他的資訊才無法搜到?

但實際上,不只是馬雲的情況如此,我們去搜馬化騰、雷軍、任正非等,甚至是羅永浩和芙蓉姐姐這樣在那個時候紅極一時的網紅,或周杰倫、李宇春那樣曾經火遍全網的明星,結果也都一樣的。 如搜雷軍的情況,結果是這樣的:


在測試過不同網站、不同人名、不同時段之後,我發現一個令人震驚的現象:

幾乎所有在那個年代曾經紅火過的中文網站,如網易、搜狐、校園BBS、西祠胡同、凱迪貓眼、天涯論壇、校內網(人人網)、新浪博客、百度貼吧、以及大量的個人網站等,在某個年份之前的資訊都已經完全消失不見了,甚至大部分網站是所有年份的資訊都消失了。 唯一例外的是新浪網,還能找到一些十幾年前的信息,但也是極少數的寥寥幾條,其他99.9999%以上的內容,全都消失了。

大家都沒有意識到一個嚴重的問題: 中文網路正在快速崩塌,行動網路出現之前的中文網路內容,已經幾乎消失殆盡。

我們原以為,網路是有記憶的,但沒有想到,這種記憶,原來是像金魚一樣的記憶。


我之所以注意到這個問題,是因為何加鹽公眾號的主題是研究牛人,所以我需要經常查找他們的資料。

這兩年來,我有一個非常明顯的感覺:網路上能找到的原始資料,每年都以斷崖式的速度在銳減。 之前還能看到一些原始的報道,後來慢慢沒有了;之前還能找到主人公的演講或者他們寫的文章,後來慢慢找不到了;之前還能看到很多採訪或對談的視頻,後來慢慢消失了。

似乎有一個吞噬網頁的怪獸,它沿著歷史的時間線,從過去向著現在吞噬,先是小口小口,然後大口大口,把中文互聯網的一切內容,以五年、十年為單位,一口吞掉。

等我們回過神來,會發現,在行動互聯網之前曾經存在過的中文互聯網的一切,不管是門戶網站、機構官方網站、個人網頁,還是校園BBS、公眾論壇,還是新浪博客、百度貼吧,還是文件、照片、音樂、影片等,都已消失。

記得十幾年前,我曾經因為換電腦,把一些照片和文章打成一個壓縮包,存在某BBS上,幾年之後發現,那整個BBS都沒有了。 我曾經用過hotmail的信箱,裡面有很多很珍貴的郵件,後來都沒有了。 我還寫過人人網、MySpace,後來全都沒有了。

我們曾經以為網路可以保留一切,但結果是一切都沒能保留。

這讓我想起劉慈欣《三體》裡面提到的「二向箔」。 歌者文明發現了太陽係有智慧生物的存在,出於宇宙先進文明的清除本能,他們向太陽系扔出一張二向箔,於是,整個太陽係以光的速度從三維坍塌成二維,變化成一張酷似梵谷「星空」的畫片。 一切生命、一切文明的痕跡,從此都不復存在。

在網路上,我們已經處於二向箔的吞噬之中。 這種二向箔可以稱之為“時間的二向箔”
,它吞噬的是時間那一維。

太陽係被歌手文明的二向箔拍扁之後,好歹還留下了一幅《星空》圖,而互聯網被時間的二向箔吞噬後,只留下一片虛空。


為什麼會出現這種情況呢? 我猜想,主要原因可能是兩個:

一是經濟原因。

網站的存在,需要伺服器、需要頻寬、需要機房、需要人員運維,還有很多雜七雜八的監管和維護費用,這些都是成本。 如果是有策略價值(例如需要向外展示公司想要展示的資訊),或是有短期流量價值(例如還時不時有較多的人上來看),同時公司帳上也不差錢,那麼還會有動力去維持。

但如果公司在商業上走了彎路,沒錢了,整個網站就會直接死掉。 例如人人網就是典型代表。

即便公司還有錢,從營運的角度來看,如果一個網頁一年到頭都沒有幾個人來點擊,對公司來說,就成了一筆負擔,從經濟上最理性的方法,就是直接關掉。 搜狐、網易早年的內容大量遺失,以及以天涯論壇為代表的BBS集體消亡,都是這個原因。

二是監管原因。

整體而言,網路資訊的監管,是從無到有,從寬到嚴,從嚴到更嚴的過程。 以前可以合法存在的內容,後來不符合監管要求了;或者是以前可以灰色存在的內容,後來被定義為黑色了。 這些內容都會直接被喀嚓掉。

還有一些是隨著時代的變化,輿論的兩極化越來越極端,以前「只道是平常」的內容,在後來的輿論環境中顯得非常尖銳、敏感,儘管不違法,但是可能激化矛盾,形成混亂,監管方也有可能會要求處理掉。

除了官方部門之外,憤怒的網友,也時時扮演輿論監管員的角色。 他們會翻出十幾年前某人無意間說的某句話,揪著不放,把人網暴至「社會性死亡」。

但監管上最重要的影響,還不是監管部門的處理或憤怒網友的攻擊,而是它們會造成公司與個人的「自我審查」。

因為誰也不知道,網站上存在的哪一條內容,某人曾說過的哪一句話,會不會在若干年後,給當事人帶來滅頂之災。 最好的方法,就是直接把這些潛在的「定時炸彈」全部清除,也就是把網站關掉或把內容全部刪除。

當然,除了上述兩個原因之外,還會有其他很多原因。

例如,在南斯拉夫解體之後不久,所有「yu」(南斯拉夫國名Yugoslavia的縮寫)這個國際網域之下的網頁內容全部消失了。 又如,隨著版權保護的加強,曾經隨處可下載的音樂和電影網站,就都消失了。 還有一些機構和個人,純粹是由於自己的原因,不想在對外展示資訊了,就把官網或個人主頁關掉等等。

但這些原因都是次要的、局部的。 整個網路內容系統性的、大規模的消失,主要是因為經濟規律和自我審查。

本質上,網路內容和生命一樣,也受進化論的支配。 其存在的標準只有一條:以盡可能低的成本爭取盡可能多的注意力。

當一個內容能夠在網路上的大量內容中爭取到足夠的注意力,而維持這個內容的成本(包括經濟成本、監管成本和對抗監管的成本)比其他方式更低時,這個內容就有可能存活在網路上。 只不過它有可能會換一種呈現方式,例如從文字變為圖片,從靜圖變為動圖,從動圖變為視頻,未來可能從二維視頻變為三維全息視頻等等。 承載這個內容的平台也會變遷,從門戶網站到BBS,到個人博客,到微博微信,到抖音視頻號,到未來可能一個我們不知道什麼平台。

當一個內容不能再吸引到足夠的注意力,或維持這個內容的成本比其他方式更高時,這個內容就會從網路上消失。 以電腦為瀏覽端、以網頁為載體的傳統網路的集體消亡,只不過是這種「資訊進化競爭」的必然結果而已。

生物的進化秘訣是“物競天擇,適者生存”,而網路內容的進化秘訣是“資訊競,注意力
擇,適者生存”。 由於網路效應,這種競爭比自然還要猛烈萬倍,殘酷萬倍。 傳統網路不是單一物種式的滅絕,而是幾乎所有內容的整體性滅絕。

每一代新的網路崛起,舊有的網路必將崩塌,時間二向箔是所有網站、所有內容無可逃避的宿命。


如果未來的文明是網路的文明。 我們這一代,將是沒有歷史的。 因為網路沒有留下我們的痕跡。

“沒有歷史”,這件事情重要嗎?

當然很重要。

我曾經為了寫邵亦波的文章,想盡了一切辦法,試圖找到邵亦波2007年參加《波士堂》節目的原始視頻,以及他妻子鮑佳欣以“文愛媽咪”網名在寶寶樹社區發了好幾年的貼文
。 最後還是沒有找到,只能深深遺憾。

雖然《紅塵已忘邵亦波》那篇文章,依然很受大家歡迎,短短一周就有70多萬人閱讀,2萬多人轉發,但我十分肯定,我一定還是錯過了某些非常重要的信息。 如果它們能呈現在那篇文章裡,文章品質會更好。

但是我找不到,就只能讓文章以不完美的方式呈現。

你可能會覺得:這只是對何加鹽這樣的研究者和寫作者有用,我又不寫這樣的文章,網路資訊沒有就沒了,對我又沒什麼影響。

真的嗎?

如果我們已經看不到馬雲的所有演講,看不到任正非的以《我的父親母親》和《一江春水向東流》為代表的所有文章,看不到段永平在雪球的所有發帖,你會不會覺得有點可惜?

好吧,你說你不覺得可惜。

那如果我們已經搜不到黃崢的公眾號,看不到張一鳴的微博,上不了王興的飯否,你會不會覺得有點遺憾?

好吧,你說你也不覺得遺憾。

那如果某一天,知乎如同天涯論壇一樣沒了,豆瓣就像人人網一樣消失,B站好比新浪博客一樣已無人問津,你會不會有點心痛?

如果某一天,你喜歡的微博博主所有的微博只顯示“作者已設置只展示半年內微博,此微博已不可見”,你常看的公眾號只顯示“此帳號已被屏蔽,內容無法查看”,你在抖音或
小紅書搜索某些信息,結果顯示“作者已清空全部內容”…

甚至,微博、公眾號、抖音、小紅書,就像曾經存在過的bbs、貼吧、空間、部落格一樣,全部消亡…

你會不會為此難過哪怕是短短的一分鐘?

身為傳統網路的一代人,七零後、八零後已經找不回我們的歷史。 因為它們已經全部消失了。

新生代也許還能看看朋友圈,但是朋友圈也越來越多“三天可見”,越來越沉默不語。

唯一還在熱情髮圈的,只剩下一水的行銷訊息。

未來就連這些行銷訊息,也終將消亡。


如果一件事對我們很重要,而它正在消亡,我們有什麼辦法可以挽救它嗎?

有人曾經作出這樣的嘗試。 美國有一個網站叫做“Internet Archive”,中文翻譯為“
互聯網檔案館”,保存了很多原始網頁。 但是我試過,中文的原始網頁,保存的很少,
而且使用非常麻煩,搜尋功能十分原始低效,和沒保存差不多。

從技術層面來講,保存從中國有互聯網以來,到移動互聯網興起的十來年時間的所有網頁,應該並不難,成本也不高,畢竟比起現在的視頻時代,原始互聯網的那些圖文網頁,佔的空間幾乎可以忽略不計。

問題是,誰來做這件事,有什麼動機?

商業機構不會做。 因為沒有任何商業利益。

政府或許可以像蓋圖書館、博物館一樣,搞一個能保存所有網頁的檔案館。 但是政府為什麼要花錢費力做這件事? 除了保存歷史之外,似乎也沒有其他理由。 再說了,就算是政府做了這件事,對普通網民也沒有任何意義,因為這個檔案館肯定也會需要一定的登陸權限,以免資訊被濫用。

況且,就算是有機構願意做這件事,現在也太晚了。 行動互聯網興起之後,傳統網路的中文內容,幾乎已經消失殆盡了。 粗略估算,99%以上應該都已經沒有了。

從某種意義上,何加鹽寫的牛人系列文章,也為保存這些牛人們存在過的歷史,做出了一點貢獻。 如果我沒有寫他們,很多歷史就已經在網路上找不到了。 但畢竟這也不是原始訊息,只是經過我整合過的二手資訊。

現在的中文網路上,在這個世紀前十年發生過的所有重大事件,所有留下過深深痕蹟的名人,目前還能找到的信息,幾乎已經全是經自媒體編輯過的二手信息,甚至是傳過多手,早已面目全非的訊息。

關於它們的原始報道沒有了,原始視頻沒有了,原始講話沒有了,原始的網友目擊沒有了,原始的評論沒有了…

再過一些年,這些二手資訊和N手信息,也都會消失。 就像那些事件從未發生過、那些人從未存在過。

我們已經無能為力,只能接受現實。

在未來的網路時代裡,回首21世紀的前二十年,將是沒有歷史紀錄的二十年。

我們是網路時代消失的一代。

如果你現在還能看到一些中文網路的古信息,那隻是夕陽的最後一抹餘暉。

如果你明白了它們的轉瞬即逝,可能會像臨死前的浮士德一樣感嘆:

你真美啊,請停留一下。

但那抹餘暉,很快將和你這句感嘆一起,被時間的二向箔吞沒,陷入虛空。

《三體》中,程心和艾AA還能有幸搭乘唯一的一艘曲率飛船,逃離正在二維化的太陽系。

而我們,連曲率飛船都沒有。

逃無可逃。

現在你所看到的、你所創造的幾乎所有內容,連同這篇文章,這個平台,終究也會淹沒在虛空中。



心得:1.人類文化資產無紙化的瓶頸是-維護電子儲存設備也是很高的成本,目前沒有網路企業願意無償承擔這個成本,許多舊網站的資料終將隨著伺服器的磁碟壞軌而無法回復。2.難怪中共的AI輸給美國,因為中共AI收到的訓練資料是刪減過的,垃圾進的結果當然是輸出垃圾


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.131.176 (臺灣)
PTT 網址

bnn 05/24 23:12沒有 其實唐詩三百首以外的散落廢文也還是消失無存

bnn 05/24 23:13就算是紙本 那些非經典的本來也就是會被忘光不儲存

rogergon 05/24 23:43不論何種媒介,除非自己保存,否則很難留下什麼

abccbaandy 05/24 23:56有些是故意不給找的吧,動不動就要人下APP、登入

bitcch 05/25 00:26英文網站也是啊 十年前我的最愛點開來有幾個還能看

mepass 05/25 00:36這也沒辦法 不可能把所有的歷史文獻都留下來

Qinsect 05/25 09:37IPFS跟 matters.town 就是在做網路資料永久留存的

Qinsect 05/25 09:37努力

abccbaandy 05/25 11:28IPFS不就跟BT 87%像,根本就是笑話...冷門也是GG

yudofu 05/25 21:44馬雲這個例子問題更多在於刻意移除、不用講得好像只

yudofu 05/25 21:44是沒人想知道,而是不被允許知道了

Endure 05/25 23:37https://reurl.cc/8v976j

twinmick 05/25 23:52他們那種刻意刪除的就算了,但是現今是資訊量爆炸增

twinmick 05/25 23:53加的速度比儲存媒介進步以及擴充的速度快太多了.

enunion 05/26 12:10是這個作者有問題吧... 重要的東西就存雲端硬碟

enunion 05/26 12:11mail 或他人網站 BBS 上面的資訊本來就會不見

enunion 05/26 12:11跟是不是中文根本無關 誰有義務幫你保存這麼久遠的

enunion 05/26 12:12資訊 如果真的對你來說很重要 就存在雲端硬碟