当我们在浏览器搜索淘宝并点击进入的时候,发生了什么?你知道吗?
当我们在浏览器输入淘宝的网址并按下回车键的时候,浏览器会首先从DNS服务器查到对应的服务器地址,然后告诉电脑我们要访问的是哪个IP的网站。而DNS服务器就是把域名解析成IP地址,这样访问我们网站就不用记一堆数字的IP地址,记住域名就可以。
查询完DNS服务器以后,不同地区不同网络下的IP地址是不同的,所以就要给我们分配不同的入口,这其中又涉及到了负载均衡。这又是什么呢?举个例子:车站人特别多,于是车站会设多个售票窗口,这样人流就会分配到不同的窗口,这就是负载均衡。
然后我们就访问到了淘宝的实际IP地址了,然后就会产生一个PV(Page View),也就是页面浏览量。每个网站每天的页面浏览量也是衡量一个网站规模的重要指标,据统计,淘宝日常的PV值都在20亿左右。相对于PV值呢,还有一个UV(Unique Visitor),这又是什么呢?
UV(Unique Visitor),就是网站独立访客。一个网站的PV值可能会很高,因为一个页面你可能会不断刷新,每刷新一次就会产生一个PV,但是UV是一个用户访问量,不管你刷新多少次,一个用户都只能产生一个UV。
虽然巨大的流量已经被分配到了不同的入口,但访问淘宝的人数还是非常大,所以就需要成千上万台服务器来处理这些。这一过程非常复杂,需要多个系统协调完成,而其中最关键的就是章文嵩博士开发的Linux Visual Server,世界上最流行的负载均衡系统之一。
经一系列复杂处理,淘宝页面就展示出来了。据统计,双十一当天,淘宝访问量最高达871G/秒。这是个什么概念呢?举个例子,500G的硬盘,眨眼的功夫就给你塞满,这个数字得36万个20M的家庭宽带加在一起才能负担起。这些流量如果集中起来,拖垮一个中小城市的带宽不成问题,但为啥淘宝的访问速度并没受到影响,反而还很快呢?
这涉及到了CDN(Content delivery Network),就是内容分发网络,阿里在全国各地有几百个CDN节点,通过技术手段会让你访问到最近的CDN,这样就实现了将流量分散开的目的。此外还有淘宝的TFS(Taobao FileSystem)系统,来保证网页内容的分发与同步。
而以上的过程只是我们在访问淘宝首页所涉及到的,还不包括用户搜索、下单、大数据分析等技术,而这些也只是淘宝网系统里的九牛一毛。这些,离不开淘宝的几千名顶级工程师的共同努力。有了他们,才有了全民狂欢的双十一,便利的淘宝!
当然,像京东、百度、腾讯等企业的系统也都很复杂,这些网站都是凝聚了无数工程师们的智慧才得以有这样的规模的。
所以最后,向这些工程师们致敬!
数据恢复,越早恢复,效果越好
立即恢复