让每一个企业都拥有适合自己的互联网应用方案-安庆中拓科技   网站首页 > 互联网新动态
 
大型网站需考虑的部分因素
来源:czwzyh.cn 发布时间:2015-7-2
  大型网站面临的高负载和高并发问题,对于大型网站来说,所采用的技术更是涉及面非常广,从硬件到软件、编程语言、数据库、WebServer、防火墙等 各个领域都有了很高的要求,已经不是原来简单的html静态网站所能比拟的。下面和池州网站制作的小编一起简单的看看其需要考虑的的问题及其技术分析;
  1、海量数据的处理
  众所周知,对于一些相对小的站点来说,数据量并不是很大,select和update就可以解决我们面对的问题,本身负载量不是很大,最多再加 几个索引就可以搞定。对于大型网站,每天的数据量可能就上百万,如果一个设计不好的多对多关系,在前期是没有任何问题的,但是随着用户的增长,数据量会是 几何级的增长的。在这个时候我们对于一个表的select和update的时候(还不说多表联合查询)的成本的非常高的。
  2、数据并发的处理
  在一些时候,2.0的CTO都有个尚方宝剑,就是缓存。对于缓存,在高并发高处理的时候也是个大问题。在整个应用程序下,缓存是全局共享的,然 而在我们进行修改的时候就,如果两个或者多个请求同时对缓存有更新的要求的情况下,应用程序会直接的死掉。这个时候,就需要一个好的数据并发处理策略以及 缓存策略。
  另外,就是数据库的死锁问题,也许平时我们感觉不到,死锁在高并发的情况下的出现的概率是非常高的,磁盘缓存就是一个大问题。
  3、文件存贮的问题
  对于一些支持文件上传的2.0的站点,在庆幸硬盘容量越来越大的时候我们更多的应该考虑的是文件应该如何被存储并且被有效的索引。常见的方案是 对文件按照日期和类型进行存贮。但是当文件量是海量的数据的情况下,如果一块硬盘存贮了500个G的琐碎文件,那么维护的时候和使用的时候磁盘的Io就是 一个巨大的问题,哪怕你的带宽足够,但是你的磁盘也未必响应过来。如果这个时候还涉及上传,磁盘很容易就over了。
  也许用raid和专用存贮服务器能解决眼下的问题,但是还有个问题就是各地的访问问题,也许我们的服务器在北京,可能在云南或者新藏的访问速度如何解决?如果做分布式,那么我们的文件索引以及架构该如何规划。
  所以我们不得不承认,文件存贮是个很不容易的问题
  4、数据关系的处理
  我们可以很容易的规划出一个符合第三范式的数据库,里面布满了多对多关系,还能用GUID来替换INDENTIFY COLUMN 但是,多对多关系充斥的2.0时代,第三范式是第一个应该被抛弃的。必须有效的把多表联合查询降到最低。
  网站相关的技术经过这些年的发展,已经细分到很细的方方面面,更多网站建设相关信息资讯,请关注池州网站制作:http://www.czwzyh.cn。