這是不是一個很笨的命題?
當你有管過電郵伺服器﹐也許會有不同的視點。郵箱的容量﹐並非為了替用戶儲存多些郵件;面對越來越龐大的垃圾信浪潮﹐服務供應商寧願你「有大吃大」……
兩年之前﹐免費郵箱都是有限 size ﹐比如說要給你 10Mb mailbox ﹐又會把大於 1Mb 郵件(連附件)打回頭。如果我把上述例子稱為 10/1 ﹐那當時比較強一點的服務﹐可能是 50/10。
自從 Gmail 等大件頭免費郵箱登場以來﹐市場很快就淘汰掉 100/2 以下的﹐餘下來可以生存的服務﹐基本上都有 100/10 的等級。
有趣的是﹐以住用戶為了順利把信送到免費郵箱﹐要把內容控制到盡量精簡。而現在﹐若你經常要在 hotmail / yahoo 的垃圾箱中找回有用的信件﹐最好的方法是﹐叫寄信的人每次都 attach 200Kb ~ 2Mb 的檔案給你。
小容量的郵箱﹐往往是死於被 spam mail 塞爆。若一個 email account﹐可以在 google search 得到﹐或是因業務關係被 marketing agent 得知﹐三個月內﹐平均每天寄到該 email 的 spam ﹐總容量可能有 0.5mb 。換句話說﹐若不能由系統直接刪掉部份過濾出的信件﹐100 天不處理的 spam/trash ﹐便已經佔了 50mb 。
對於發放垃圾信的機構來說﹐他們始終受到頻寬限制。若每分鐘可以發出 10 萬封 10kb 以下的信件﹐他們不會改發 5 千封 200kb+ 的信件﹐以免 total yielding 下降到不能運作的地步。是故﹐即使機器越來越強勁﹐頻寛越來越大﹐目前還沒有必要把 200kb 以上的信件﹐看作 spam mail 而 scan 。於是乎﹐attachment 夠大﹐往往會跳過好過檢查程序﹐而被當作可信的郵件。
scan spam 跟 scan virus attachment ﹐loading 有好大分別。前者意味著和最前線的 smtp 同步 stream line 運作﹐後者僅關乎用戶登入和檢查郵件的頻率。如果服務供應商不避免檢查大郵件﹐伺服器的負荷可能會在關鍵的頂峰時間﹐倍大十多倍﹐拖死其餘運作資源。
中等 size ( 200k ~ 10Mb) 的郵件﹐既沒有必要偏執地過濾﹐要過濾也沒有足夠的資源﹐那就等同於最優待的郵件了。
進一步推論﹐如果想減低難以辦別的郵件的比率﹐最好就是讓用戶安心地發大信件﹐習慣發大信件﹐傾向於發大信件…… 若大信件最少有 30Kb 大﹐平均則是 500kb ﹐那 1G 的信箱也只是存得了 2000 封信。若每天遇計可以收發 10 封信﹐那 2000 封信也不過是半年不刪信的存量…
電郵存半年﹐正正是暗底裏的 standard expectation …
若果你看看自己的信箱﹐好過半年內留下的信件都沒有超過 200mb ﹐那與其質疑我﹐倒不如想想會不會有很多該收到的信終於沒有收到?
我有管些 200mb 以下的郵箱﹐經驗之談就是:一般活躍戶口﹐若要維持在這容量以內﹐除用戶本身要勤於清容垃圾信外﹐伺服務直接濾掉的郵件比率﹐要在 66% ~ 90% 才行。
如果我說﹐一個勤力到死的伺服器管理員﹐在 200mb 的框架底下﹐只能做到濾掉 90%+ 垃圾信﹐而損失 <5% 正件。那試問﹐有甚麼理由不把郵箱加到 1Gb 以上﹐而把所有機器濾出的垃圾信通通留在用戶的 bulk / spam folder ?
目前﹐三個大宗派免費電郵服務﹐數 hotmail/msn 濾得最兇狠﹐yahoo 最浪費郵遞時間﹐gmail 保存最多垃圾信。
濾得兇﹐拖得久﹐往往會導致到用戶收不到他願意收的信。事實上﹐server 的負擔也會格外大。
和 yahoo 相比﹐gmail 的現有的活躍用戶量還是很小宗。若兩者拉近了距離﹐gmail 想保持 mail server 的效能優勢﹐難免要負擔數倍甚至數十倍於 yahoo的成本。若僅是數倍成本﹐gmail 還可以靠較佳的廣告嵌件計設﹐較頻密的用量﹐而期望有相對大的收益支持下去。數十倍的話﹐還是會拖個當死。
對於小形 hosting agent 來說﹐管理 mail server 的平均成本﹐實則是 yahoo / google 的千倍萬倍是也﹐規模效益差太遠了。

