轉載:如何繞過中共國的防火牆

(轉載自: http://euler.truthbible.net/index.php?entry=entry080714-003159)

思路是:
1. 中共國的防火牆小組不喜歡個別審查每一個案,因此寧願軟件封錯都不會每個封包去查,它們除了簡體中文之外,英文懶都去看;
2. 用軟件去審查網上內容當然是機械式的找關鍵字來封,但軟件唔會明意思,因此常常出現誤封無關政治的網站;
3. 審查網上內容還審查,中共當然不想中國對外互聯的速度因此而變得太慢,慢就會傷害中共國的經濟;
4. 審查網上內容要成本的,中共當然不想因此而支出太多,影響其他IT項目;
5. 審查網上內容的軟件如果不夠精準的話,常常封閉無關的網站的話,中共國會因此要付出不輕的經濟代價;
6. 任何審查網上內容軟件的弱點:
A. 它不知網頁主人本來打算用什麼碼來顯示它的網頁,不可能頁頁、字字都瞎猜的!
B. 它是用中文字的組合及順序來分辨出關鍵字的,而不是用意思,亦不懂中文文法,因此可以針對這一點;
C. 它不懂分辨網頁各種內容(data type)是在表達意思中有什麼作用,它只是機械性的針對中文字,亦不會懂數字可以代替中文,中文亦可代替數字;
D. 它不懂閱讀圖案內的文字,當然亦不知圖案是想表達什麼。

方法:
1. 由中文字可以用6-8種不同的中文編碼來入手,網頁不一定要標正確的中文編碼,它看不懂某字/詞就不可以審查內容,如果某網頁有3種不同的中文編碼,它要 平常費多達512部的功夫,而且因為網頁刻意破壞了關鍵字的連結關係,而無從審查。理論上,一篇有300字的文章如果3種中文編碼是隨機排的.因為它無從 知道什麼是正確的中文編碼,因此它要試6^300次所有組合! 問題是看網頁的人可能會很辛苦,要有專用的轉碼程式,依一定規則來轉碼,以及人為協助就容易,但自動化的話,就算審查軟件知道規則亦試死審查軟件!

2. 在關鍵字中加插空位、數字、符號、別國語文、英文,一般人用一用常理就分到,但對於審查軟件來說,分不清哪一些是無意義的符號,哪一些是有意義的。例如網 頁本來是字與字中間隔空的,忽然中間有個字或符號,審查軟件是分不出字或符號是本來意思的一部份故意放上去擾亂審查軟件的。再進一步的方法,可以用不規則 隔空/分段方式加字或符號來對付審查軟件。

3. 用圖來顯示網頁中的某些字詞,可以是被審查的關鍵詞,可以是無關的字,可以是關鍵詞的一部份,不一而足。其實不少網頁已經用圖來顯示中文字碼顯示不到的 字,每篇加多幾個字改成圖畫是小小的功夫,例如10個字隨機抽一個化成圖晝,在一篇100字的文章,自動化審查的難度多了1024部以上,而且它只看到部 份的字,文章的原意用再高階的系統都無從去猜!

4. 混合不同類別的資料種類,而不按常見的方法去用它,例如六4,6四,陸4,關鍵詞或非關鍵詞還可以用同音異字。讀者一看就明,而審查軟件卻要試所有可能的語音組合,費時失事。

5. 用英文/別國語文來表達關鍵字的意思,字典整個網隨處可見,用網上字典並不犯法,但軟件要先翻譯再檢查就麻煩得多,,更有趣的用法是把被審查的關鍵字及非 被審查的關鍵字的部份用英文/別國語文來表達。寫網頁只要簡單的字典,用自動化的軟件隨機的把不同字眼譯成英文/別國語文。問題是看的人會覺得麻煩,需要 有軟件自動辨認語文及翻譯。

最好有一軟件結合以上辦法,自動辨別自己網頁的內容被中共國的防火牆阻截,立刻用以上任何一種方法隨機改寫網頁內容,只費幾分鐘,但審查軟件卻可能用幾小時去分辨。除非中共可以容忍在奧運時互聯網比日常慢1000倍,否則到時中共的思想統治基石:防火牆將形同虛設!

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s

%d 位部落客按了讚: