
这互联网是一个繁忙的地方。每秒钟,大约有6,000条推文。搜索了40,000多个Google查询;根据国际实时统计项目的网站Internet Live Stats,发送了超过200万封电子邮件。
但是这些统计数据仅暗示了网络的大小。截至2014年9月,互联网上有10亿个网站,这一数字随着网站而倒闭而诞生的数字会波动。在这种不断变化的(但有点可量化的)互联网之下,大多数人都是“深网”,其中包括Google和其他搜索引擎没有索引的内容。 Deep Web内容可以像搜索在线数据库的结果一样无害,也可以像黑人市场论坛那样秘密,只能使用特殊Tor软件的人访问。 (尽管TOR不仅用于非法活动,但它在人们可能有理由在线匿名的地方都使用。)
将“表面”网络中恒定变化与深层网络的不量化性结合在一起,很容易理解为什么估算的大小互联网是一项艰巨的任务。但是,分析师说,网络很大并且越来越大。 [互联网历史记录时间表:ARPANET到万维网这是给出的
数据驱动
网络拥有约10亿个网站,拥有更多单独的网页。这些页面之一,www.worldwidewebsize.com,旨在使用互联网顾问Maurice de Kunder的研究来量化数量。 de Kunder和他的同事于2016年2月发布了他们的方法论在《科学计量学》杂志中。为了估计,研究人员向Google和Bing发送了一批50个常用单词。 (Yahoo Search and Ask.com曾经包括在内,但不再是因为它们不再显示总结果。)研究人员知道,这些单词一般出现在印刷中的频率,使他们可以根据包含参考单词的文字来推断出那里的页面总数。搜索引擎在它们索引的页面中重叠,因此该方法还需要估计并减去可能的重叠。 [互联网会被摧毁吗?这是给出的
根据这些计算,截至2016年3月中旬,在线至少有46.6亿个网页。但是,该计算仅涵盖可搜索的网络,但是不涵盖深层网络。
那么互联网拥有多少信息?加州大学戴维斯分校的传播教授马丁·希尔伯特(Martin Hilbert)说,有三种方法可以研究这个问题。
希尔伯特对Live Science表示:“互联网存储信息,互联网传达信息,互联网计算信息。”互联网的通信能力可以通过多少信息来衡量能转移或多少信息做他说,在任何给定的时间转移。
2014年,研究人员在《超级计算边界和创新》杂志上发表了一项研究,估计互联网的存储能力为10^24字节或100万个exabytes。一个字节是一个包含8位的数据单元,在您现在读的一个单词之一中等于一个字符。 exabyte是10亿个字节。
估计互联网通信能力的一种方法是测量流量通过它。根据思科的视觉网络指数计划,互联网现在处于“ Zettabyte时代”。 zettabyte等于1千万个字节或1,000个exabytes。根据思科的说法,到2016年底,全球互联网流量每年将达到1.1个Zettabytes,到2019年,预计全球流量将每年达到2个Zettabytes。
一个Zettabyte相当于36,000年的高清视频,而这相当于流式传输Netflix的整个目录3,177次,托马斯·巴内特(Thomas Barnett Jr.)在2011年博客文章中写道关于公司的发现。
2011年,希尔伯特和他的同事发表了一篇论文在《科学杂志》估计Internet的通信能力在3 x 10^12每秒千射线,带宽的量度。这是基于硬件容量,而不是根据任何时刻传输多少信息。
在一项特别出色的研究中,一个匿名黑客通过计算使用多少IP(Internet协议)来测量Internet的大小。 IP是数据传播的Internet的Waypost,并且每个设备在线都有至少一个IP地址。根据黑客的估计,有13亿IP地址2012年在线使用。
互联网已大大改变了数据格局。希尔伯特(Hilbert)和他的同事发现,在2000年,在互联网使用变得无处不在,电信能力为2.2最佳压缩的外观。在2007年,数字为65。此容量包括电话网络和语音通话以及访问互联网的巨大信息储存库。但是,研究人员发现,移动网络上的数据流量已经超过了2007年的语音流量。
物理互联网
如果所有这些位和字节都有些抽象,请放心:在2015年,研究人员试图将互联网的大小放在物理上。研究人员估计,将纸张打印出整个网络(包括黑暗的网络)将需要2%的亚马逊雨林。在跨学科科学主题杂志中。对于这项研究,他们通过估计平均网页需要30页的A4纸(8.27 x 11.69英寸),对在线文本的数量做出了一些重大假设。有了这个假设,Internet上的文字将需要1.36 x 10^11打印硬拷贝的页面。 (后来的《华盛顿邮报》记者旨在更好的估计并确定网页的平均长度接近6.5印刷页面,估计为3055亿页以打印整个互联网。)
当然,以文本形式打印互联网将不包括大量在线托管的非文本数据。根据思科的研究,2015年,每月有8,000 pobytes的IP流量专用于视频,而每月约3,000 pb,网络,电子邮件和数据传输。 (p pebyte是一百万千兆字节或2^50总体上说,该公司估计,视频占当年大多数互联网流量的占34,000 pb。文件共享排在第二,14,000 pb。
希尔伯特(Hilbert)和他的同事们对世界信息进行了刺激。在他们的2011年科学论文中,他们计算出世界模拟和数字存储的信息能力为295个最佳压缩的外观。研究人员写道,要在CD-ROM上存放295个exabytes,将需要一堆到达月球的光盘(238,900英里,或384,400公里),然后再次从地球到月球的距离四分之一。总距离为298,625英里(480,590公里)。到2007年,有94%的信息已成为数字化,这意味着,如果存储在CD-ROM上,那么仅世界的数字信息就会超越月球。它将拉伸280,707.5英里(451,755公里)。
希尔伯特说,互联网的规模是一个移动的目标,但它却突飞猛进。当涉及到一系列信息时,只有一种节省的宽限期:我们的计算能力的增长速度比我们存储的数据量更快。
希尔伯特说,虽然世界存储能力每三年翻了一番,但世界计算能力每年都会翻倍。在2011年,人类可以执行6.4 x 10^18每秒使用所有计算机的说明 - 类似于每秒神经冲动的数量人脑。五年后,计算能力在大约八个人类大脑的球场上提高。当然,这并不意味着一个房间里的八个人可以超越世界计算机。在许多方面,人工智能已经胜过人类认知能力(尽管AI仍然远离模仿一般,人类智力)。在线,人工智能确定了您看到的Facebook帖子,Google搜索中出现的内容以及80%的股票市场交易。希尔伯特说,计算能力的扩展是使数据在线爆炸有用的唯一有用的东西。
他说:“我们从信息时代到知识年龄。”
关注斯蒂芬妮·帕帕斯(Stephanie Pappas)叽叽喳喳一个NDGoogle+。跟着我们@livescience,,,,Facebook和Google+。