⼤⽤户量访问情况下项⽬的各种优化⽅案
⼀、⼤型⽹站性能提⾼策略:
⼤型⽹站,⽐如门户⽹站,在⾯对⼤量⽤户访问、⾼并发请求⽅⾯,基本的解决⽅案集中在这样⼏个环节:使⽤⾼性能的服务器、⾼性能的数据库、⾼效率的编程语⾔、还有⾼性能的Web容器。这⼏个解决思路在⼀定程度上意味着更⼤的投⼊。
web容器是⼀种服务程序,在服务器⼀个端⼝就有⼀个提供相应服务的程序,⽽这个程序就是处理从客户端发出的请求,如JAVA中
的Tomcat容器,ASP的IIS或PWS都是这样的容器。⼀个服务器可以多个容器。
1、HTML静态化
其实⼤家都知道,效率最⾼、消耗最⼩的就是纯静态化的html页⾯,所以我们尽可能使我们的⽹站上的页⾯采⽤静态页⾯来实现,这个最简单的⽅法其实也是最有效的⽅法。
2、图⽚服务器分离
⼤家知道,对于Web服务器来说,不管是Apache、IIS还是其他容器,图⽚是最消耗资源的,于是我们有必要将图⽚与页⾯进⾏分离,这是基本上⼤型⽹站都会采⽤的策略,他们都有独⽴的、甚⾄很多台的图⽚服务器。这样的架构可以降低提供页⾯访问请求的服务器系统压⼒,并且可以保证系统不会因为图⽚问题⽽崩溃。
在应⽤服务器和图⽚服务器上,可以进⾏不同的配置优化,⽐如apache在配置ContentType的时候可以尽量少⽀持、尽可能少
的LoadModule,保证更⾼的系统消耗和执⾏效率。
3、数据库集、库表散列
⼤型⽹站都有复杂的应⽤,这些应⽤必须使⽤数据库,那么在⾯对⼤量访问的时候,数据库的瓶颈很快就能显现出来,这时⼀台数据库将很快⽆法满⾜应⽤,于是我们需要使⽤数据库集或者库表散列。
在数据库集⽅⾯,很多数据库都有⾃⼰的解决⽅案,常⽤的MySQL提供的Master/Slave也是类似的⽅案。
集通常会使⽤CDN与GSBL与DNS负载均衡技术,每个地区⼀组前台服务器,例如:⽹易,百度使⽤了DNS负载均衡技术,每个频道⼀组前台服务器,⼀搜使⽤了DNS负载技术,所有频道共⽤⼀组前台
服务器集。
库表散列是常⽤并且最有效的解决⽅案。
我们在应⽤程序中安装业务和应⽤或者功能模块将数据库进⾏分离,不同的模块对应不同的数据库或者表,再按照⼀定的策略对某个页⾯或者功能进⾏更⼩的数据库散列,⽐如⽤户表,按照⽤户ID进⾏表散列,这样就能够低成本的提升系统的性能并且有很好的扩展性。
sohu的论坛就是采⽤了这样的架构,将论坛的⽤户、设置、帖⼦等信息进⾏数据库分离,然后对帖⼦、⽤户按照板块和ID进⾏散列数据库和表,最终可以在配置⽂件中进⾏简单的配置便能让系统随时增加⼀台低成本的数据库进来补充系统性能。
4、缓存
缓存⼀词搞技术的都接触过,很多地⽅⽤到缓存。⽹站架构和⽹站开发中的缓存也是⾮常重要。这⾥先讲述最基本的两种缓存。⾼级和分布式的缓存在后⾯讲述。
架构⽅⾯的缓存,对Apache⽐较熟悉的⼈都能知道Apache提供了⾃⼰的缓存模块,也可以使⽤外加的Squid模块进⾏缓存,这两种⽅式均可以有效的提⾼Apache的访问响应能⼒。
⽹站程序开发⽅⾯的缓存,Linux上提供的Memory Cache是常⽤的缓存接⼝,可以在web开发中使⽤,⽐如⽤Java开发的时候就可以调
⽤MemoryCache对⼀些数据进⾏缓存和通讯共享,⼀些⼤型社区使⽤了这样的架构。另外,在使⽤web语⾔开发的时候,各种语⾔基本都有⾃⼰的缓存模块和⽅法,PHP有Pear的Cache模块,Java就更多了,不是很熟悉,相信也肯定有。
5、镜像
镜像是⼤型⽹站常采⽤的提⾼性能和数据安全性的⽅式,镜像的技术可以解决不同⽹络接⼊商和地域带来的⽤户访问速度差异,⽐
如ChinaNet和EduNet之间的差异就促使了很多⽹站在教育⽹内搭建镜像站点,数据进⾏定时更新或者实时更新。
6、负载均衡
负载均衡将是⼤型⽹站解决⾼负荷访问和⼤量并发请求采⽤的⾼端解决办法。
负载均衡技术发展了多年,有很多专业的服务提供商和产品可以选择,我个⼈接触过⼀些解决⽅法,其中有两个架构可以给⼤家做参考
⼆、Php代码编写优化:
1. echo⽐print要快很多。
两个⽅法都会在页⾯上打印东西,不过echo不返回任何值,print会在成功或失败的时候返回0或1。
2. include_once⽐include更加耗时。
因为它需要去检查你要包含的class是否已经被包含进来。
3. 对于长段落的字符串⼀定要使⽤单引号,⽽不是双引号。
因为双引号会去搜索字符串中的变量。⽐如:echo ‘This is long string’.$name就⽐echo “This is long string $name”要快很多。
4. 不要再循环中嵌套使⽤for循环
5. 如果能将函数定义为静态的
那么就不要定义成为成员函数,静态函数⽐成员函数3%。
6. 如果你可以不通过正则表达式就能解决问题
那么就别⽤正则。正则表达式⽐PHP原⽣的函数要慢⼀些。
例如使⽤str_replace取代preg_replae。
7. 尽量不要使⽤相对路径来包含⽂件
在相对路径中查⽂件,会现在当前⽬录中查,然后依次再查。这样查⽂件就很 慢。最好是先定义WEB_ROOT这样的常量,然后使⽤这个常量来包含⽂件。
8. 全等符号===⽐相等==要快
⽽且if(1 == ’1′)会返回true,if(0 == ”)也会返回true,⽽当你使⽤全等符号的时候if(1 ===’1′)和if(0===”)都会返回false。所以当你在程序中需要检测⼀些布尔变量的时候最好使⽤全等符号。
三、针对thinkphp 有以下⼏种⽅式
1. 关闭调试模式
由于关闭调试模式之后,系统会⾃动⽣成项⽬编译缓存以及关闭⽇志写 ⼊,这样可以减少很多的IO加载和⽇志写⼊的开销。
2. 开启页⾯压缩输出
3.1版本开始,增加了OUTPUT_ENCODE配置参数,⽤于控制页⾯压缩输出。
3. 开启缓存
在⽹站部署环境安装APC或者Xcache缓存能够有效提升⽹站运⾏性能和内存占⽤
XCache 是⼀个开源的 opcode 缓存器/优化器, 这意味着他能够提⾼您服务器上 的 PHP 性能. 他通过把编译 PHP后的数据缓冲到共享内存从⽽避免重复的编译 过程, 能够直接使⽤缓冲区已编译的代码从⽽提⾼速度. 通常能够提⾼您的页⾯⽣ 成速率 2 到5 倍, 降低服务器负载.
Alternative PHP Cache (APC)是⼀种对PHP有效的开放源⾼速缓冲储存器⼯具,它能够缓存opcode的php中间码。
4. 字段缓存
默认情况下,字段缓存是⾃动⽣成的,在开发完成之后,基本上数据库的变动变得 ⽐较少,因此可以考虑合并字段缓存到对应的模型类,这样能够减少每次读取字段 缓存的IO开销。合并的⽅法是在Runtime/Data/_fields下⾯到对应的字段缓存⽂件
四、 数据库优化
1、选择正确的存储引擎
以 MySQL为例,包括有两个存储引擎 MyISAM 和 InnoDB,每个引擎都有利有弊。
MyISAM 适合于⼀些需要⼤量查询的应⽤。InnoDB 的趋势会是⼀个⾮常复杂的存储引擎,对于⼀些⼩的应⽤,它会⽐ MyISAM 还慢。但是它⽀持“⾏锁” ,⽀持事务。
2、优化字段的数据类型
记住⼀个原则,越⼩的列会越快。对于⼤多数的数据库引擎来说,硬盘操作可能是最重⼤的瓶颈。所以,把你的数据变得紧凑会对这种情况⾮常有帮助,因为这减少了对硬盘的访问。varchar2最大长度
如果⼀个表只会有⼏列罢了(⽐如说字典表,配置表),那么,我们就没有理由使⽤ INT 来做主键,使⽤MEDIUMINT, SMALLINT 或是更⼩的 TINYINT 会更经济⼀些。如果你不需要记录时间,使⽤ DATE 要⽐DATETIME 好得多。当然,你也需要留够⾜够的扩展空间。
3、为搜索字段添加索引
索引并不⼀定就是给主键或是唯⼀的字段。如果在你的表中,有某个字段你总要会经常⽤来做搜索,那么最好是为其建⽴索引,除⾮你要搜索的字段是⼤的⽂本字段,那应该建⽴全⽂索引。
4、避免使⽤Select *从数据库⾥读出越多的数据,那么查询就会变得越慢。并且,如果你的数据库服务器和WEB服务器是两台独⽴的服务器的话,这还会增加⽹络传输的负载。即使你要查询数据表的所有字段,也尽量不要⽤*通配符,善⽤内置提供的字段排除定义也许能给带来更多的便利。
5、使⽤ ENUM ⽽不是 VARCHAR
ENUM 类型是⾮常快和紧凑的。在实际上,其保存的是 TINYINT,但其外表上显⽰为字符串。这样⼀来,⽤这个字段来做⼀些选项列表变得相当的完美。例如,性别、民族、部门和状态之类的这些字段的取值是有限⽽且固定的,那么,你应该使⽤ ENUM ⽽不是 VARCHAR。
6、尽可能的使⽤ NOT NULL
除⾮你有⼀个很特别的原因去使⽤ NULL 值,你应该总是让你的字段保持 NOT NULL。 NULL其实需要额外的空间,并且,在你进⾏⽐较的时候,你的程序会更复杂。当然,这⾥并不是说你就不能使⽤NULL了,现实情况是很复杂的,依然会有些情况下,你需要使
⽤NULL值。
7、固定长度的表会更快
如果表中的所有字段都是“固定长度”的,整个表会被认为是 “static” 或 “fixed-length”。例如,表中没有如下类型的字
段: VARCHAR,TEXT,BLOB。只要你包括了其中⼀个这些字段,那么这个表就不是“固定长度静态表”了,这样,MySQL 引擎会⽤另⼀种⽅法来处理。
固定长度的表会提⾼性能,因为MySQL搜寻得会更快⼀些,因为这些固定的长度是很容易计算下⼀个数据的偏移量的,所以读取的⾃然也会很快。⽽如果字段不是定长的,那么,每⼀次要下⼀条的话,需要程序到主键。
并且,固定长度的表也更容易被缓存和重建。不过,唯⼀的副作⽤是,固定长度的字段会浪费⼀些空间,因为定长的字段⽆论你⽤不⽤,他都是要分配那么多的空间。
使⽤“垂直分割”技术,你可以分割你的表成为两个⼀个是定长的,⼀个则是不定长的。
8、垂直分割 “垂直分割”是⼀种把数据库中的表按列变成⼏张表的⽅法,这样可以降低表的复杂度和字段的数⽬,从⽽达到优化的⽬的。
例如:在User表中有⼀个字段是家庭地址,这个字段是可选字段,相⽐起,⽽且你在数据库操作的时候除了个⼈信息外,你并不需要经常读取或是改写这个字段。那么,为什么不把他放到另外⼀张表中呢?这样会让你的表有更好的性能,⼤家想想是不是,⼤量的时候,我对于⽤户表来说,只有⽤户ID,⽤户名,⼝令,⽤户⾓⾊等会被经常使⽤。⼩⼀点的表总是会有好的性能。
另外,你需要注意的是,这些被分出去的字段所形成的表,你不会经常性地去Join他们,不然的话,这样的性能会⽐不分割时还要差,⽽且,会是极数级的下降。
9、EXPLAIN 你的 SELECT 查询;
使⽤ EXPLAIN 关键字可以让你知道MySQL是如何处理你的SQL语句的。这可以帮你分析你的查询语句或是表结构的性能瓶
颈。EXPLAIN 的查询结果还会告诉你你的索引主键被如何利⽤的,你的数据表是如何被搜索和排序的……等等,等等。
通常我们可以对⽐较复杂的尤其是涉及到多表的SELECT语句,把关键字EXPLAIN加到前⾯。你可以使⽤phpmyadmin来做这个事。详情见附件explain.doc.
五、前端优化
优化完后端和数据库之后,我们紧接着要做的就是针对输出的页⾯优化你的前端页⾯和资源⽂件,主要包括对图⽚、JS和样式⽂件的优化。
我们建议采⽤下列⽹页性能测试⼯具进⾏检测和分析,会给出相关的优化建议:
PageSpeed ⾕歌开发的⼯具
⽹站管理员和⽹络开发⼈员可以使⽤PageSpeed来评估他们⽹页的性能,并获得有关如何改进性能的建议。
yslow YSlow
可以对⽹站的页⾯进⾏分析,并告诉你为了提⾼⽹站性能,如何基于某些规则⽽进⾏优化。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论