
這網際網路是一個繁忙的地方。每秒鐘,大約有6,000條推文。搜索了40,000多個Google查詢;根據國際實時統計項目的網站Internet Live Stats,發送了超過200萬封電子郵件。
但是這些統計數據僅暗示了網絡的大小。截至2014年9月,互聯網上有10億個網站,這一數字隨著網站而倒閉而誕生的數字會波動。在這種不斷變化的(但有點可量化的)互聯網之下,大多數人都是“深網”,其中包括Google和其他搜索引擎沒有索引的內容。 Deep Web內容可以像搜索在線數據庫的結果一樣無害,也可以像黑人市場論壇那樣秘密,只能使用特殊Tor軟件的人訪問。 (儘管TOR不僅用於非法活動,但它在人們可能有理由在線匿名的地方都使用。)
將“表面”網絡中恆定變化與深層網絡的不量化性結合在一起,很容易理解為什麼估算的大小網際網路是一項艱鉅的任務。但是,分析師說,網絡很大並且越來越大。 [互聯網歷史記錄時間表:ARPANET到萬維網這是給出的
數據驅動
網絡擁有約10億個網站,擁有更多單獨的網頁。這些頁面之一,www.worldwidewebsize.com,旨在使用互聯網顧問Maurice de Kunder的研究來量化數量。 de Kunder和他的同事於2016年2月發布了他們的方法論在《科學計量學》雜誌中。為了估計,研究人員向Google和Bing發送了一批50個常用單詞。 (Yahoo Search and Ask.com曾經包括在內,但不再是因為它們不再顯示總結果。)研究人員知道,這些單詞一般出現在印刷中的頻率,使他們可以根據包含參考單詞的文字來推斷出那裡的頁面總數。搜索引擎在它們索引的頁面中重疊,因此該方法還需要估計並減去可能的重疊。 [互聯網會被摧毀嗎?這是給出的
根據這些計算,截至2016年3月中旬,在線至少有46.6億個網頁。但是,該計算僅涵蓋可搜索的網絡,但是不涵蓋深層網絡。
那麼互聯網擁有多少信息?加州大學戴維斯分校的傳播教授馬丁·希爾伯特(Martin Hilbert)說,有三種方法可以研究這個問題。
希爾伯特對Live Science表示:“互聯網存儲信息,互聯網傳達信息,互聯網計算信息。”互聯網的通信能力可以通過多少信息來衡量能轉移或多少信息做他說,在任何給定的時間轉移。
2014年,研究人員在《超級計算邊界和創新》雜誌上發表了一項研究,估計互聯網的存儲能力為10^24字節或100萬個exabytes。一個字節是一個包含8位的數據單元,在您現在讀的一個單詞之一中等於一個字符。 exabyte是10億個字節。
估計互聯網通信能力的一種方法是測量流量通過它。根據思科的視覺網絡指數計劃,互聯網現在處於“ Zettabyte時代”。 zettabyte等於1千萬個字節或1,000個exabytes。根據思科的說法,到2016年底,全球互聯網流量每年將達到1.1個Zettabytes,到2019年,預計全球流量將每年達到2個Zettabytes。
一個Zettabyte相當於36,000年的高清視頻,而這相當於流式傳輸Netflix的整個目錄3,177次,托馬斯·巴內特(Thomas Barnett Jr.)在2011年博客文章中寫道關於公司的發現。
2011年,希爾伯特和他的同事發表了一篇論文在《科學雜誌》估計Internet的通信能力在3 x 10^12每秒千射線,帶寬的量度。這是基於硬件容量,而不是根據任何時刻傳輸多少信息。
在一項特別出色的研究中,一個匿名黑客通過計算使用多少IP(Internet協議)來測量Internet的大小。 IP是數據傳播的Internet的Waypost,並且每個設備在線都有至少一個IP地址。根據黑客的估計,有13億IP地址2012年在線使用。
互聯網已大大改變了數據格局。希爾伯特(Hilbert)和他的同事發現,在2000年,在互聯網使用變得無處不在,電信能力為2.2最佳壓縮的外觀。在2007年,數字為65。此容量包括電話網絡和語音通話以及訪問互聯網的巨大信息儲存庫。但是,研究人員發現,移動網絡上的數據流量已經超過了2007年的語音流量。
物理互聯網
如果所有這些位和字節都有些抽象,請放心:在2015年,研究人員試圖將互聯網的大小放在物理上。研究人員估計,將紙張打印出整個網絡(包括黑暗的網絡)將需要2%的亞馬遜雨林。在跨學科科學主題雜誌中。對於這項研究,他們通過估計平均網頁需要30頁的A4紙(8.27 x 11.69英寸),對在線文本的數量做出了一些重大假設。有了這個假設,Internet上的文字將需要1.36 x 10^11打印硬拷貝的頁面。 (後來的《華盛頓郵報》記者旨在更好的估計並確定網頁的平均長度接近6.5印刷頁面,估計為3055億頁以打印整個互聯網。 )
當然,以文本形式打印互聯網將不包括大量在線託管的非文本數據。根據思科的研究,2015年,每月有8,000 pobytes的IP流量專用於視頻,而每月約3,000 pb,網絡,電子郵件和數據傳輸。 (p pebyte是一百萬千兆字節或2^50總體上說,該公司估計,視頻佔當年大多數互聯網流量的佔34,000 pb。文件共享排在第二,14,000 pb。
希爾伯特(Hilbert)和他的同事們對世界信息進行了刺激。在他們的2011年科學論文中,他們計算出世界模擬和數字存儲的信息能力為295個最佳壓縮的外觀。研究人員寫道,要在CD-ROM上存放295個exabytes,將需要一堆到達月球的光盤(238,900英里,或384,400公里),然後再次從地球到月球的距離四分之一。總距離為298,625英里(480,590公里)。到2007年,有94%的信息已成為數字化,這意味著,如果存儲在CD-ROM上,那麼僅世界的數字信息就會超越月球。它將拉伸280,707.5英里(451,755公里)。
希爾伯特說,互聯網的規模是一個移動的目標,但它卻突飛猛進。當涉及到一系列信息時,只有一種節省的寬限期:我們的計算能力的增長速度比我們存儲的數據量更快。
希爾伯特說,雖然世界存儲能力每三年翻了一番,但世界計算能力每年都會翻倍。在2011年,人類可以執行6.4 x 10^18每秒使用所有計算機的說明 - 類似於每秒神經衝動的數量人腦。五年後,計算能力在大約八個人類大腦的球場上提高。當然,這並不意味著一個房間裡的八個人可以超越世界計算機。在許多方面,人工智能已經勝過人類認知能力(儘管AI仍然遠離模仿一般,人類智力)。在線,人工智能確定了您看到的Facebook帖子,Google搜索中出現的內容以及80%的股票市場交易。希爾伯特說,計算能力的擴展是使數據在線爆炸有用的唯一有用的東西。
他說:“我們從信息時代到知識年齡。”
關注斯蒂芬妮·帕帕斯(Stephanie Pappas)嘰嘰喳喳一個NDGoogle+。跟著我們@livescience,,,,Facebook和Google+。