Python 和 PHP 的 Web 服务器性能测试

来源:岁月联盟 编辑:exp 时间:2011-10-21

 

原始出处:keakon的涂鸦馆

 

这几天一直在玩虚拟机,测了几种Python和PHP的Web服务器的性能,顺便记录下来。

 

测试环境:

 

宿主:MacBook Pro MC700

操作系统:Mac OS X 10.6.8

CPU: 2.3GHz Intel Core i5(双核)

内存:4 GB

 

虚拟机:Virtual Box

操作系统:Linux version 2.6.32-5-686 (Debian 2.6.32-35)

CPU: 限制到40%宿主CPU,单核(2.3 * 40% = 0.92GHz)

内存:128 MB

 

数据库:MySQL 5.5.15(基本上是用small配置,禁用了InnoDB以节省内存)

 

Python:2.6.6

gevent:1.0a2

uWSGI:0.9.9.1

Tornado:2.0

amysql (for gevent):2011-09-02(无版本号,只能按更新日期来算。支持MySQL 5.1,MySQL 5.5不能完全通过所有测试,但本文所用的测试没问题。)

MySQL for Python:1.2.3

 

PHP:5.3.8-1

spawn-fcgi:1.6.3

nginx:1.0.6

 

Hello world就不列出了,4个都差不多,大致是PHP > uWSGI > gevent > Tornado。

这里主要模拟比较现实的使用。

准备一个数据表,引擎为MyISAM,字段为id(主键),value(浮点数),随机生成100万条数据插入。

访问前执行“SET GLOBAL query_cache_size = 0;”,禁用查询缓存。

每次访问时生成1~999990之间的随机数r,查询id为r~r+10之间的行,将value相加。重复这个操作10次,即访问10次数据库。最后把这个结果输出,值应该在50左右。

因为是单CPU,所以都只采用1个处理进程。

在宿主上用ab -c 100 -n 1000来测试(100并发,共1000请求)。

 

数据库启动后约剩80MB内存,执行完一次测试后剩40MB,有60多MB缓存。

 

先是gevent,用amysql的同步方式查询:

 

from gevent.pywsgi import WSGIServer

import amysql

from random import randint

 

con = amysql.Connection()

con.connect ('127.0.0.1', 3306, 'root', '123', 'test')

con.query('SET GLOBAL query_cache_size = 0;')

  

def application(env, start_response):

    sum = 0

    for i in xrange(10):

        r = randint(1, 1000000 - 10)

        rs = con.query('SELECT value FROM test WHERE id >= %s LIMIT 10;', (r,))

        for j in rs.rows:

            sum += j[0]

    start_response('200 OK', [('Content-Type','text/plain')])

    return ['%6f' % sum]

  

if __name__ == '__main__':

    WSGIServer(('', 8089), application).serve_forever()

 

启动占用6.8MB内存,测试完占用8.3MB。

结果为154 QPS(每秒处理154个请求),无失败请求。

 

gevent + amysql的异步方式:

 

import gevent

from gevent.pywsgi import WSGIServer

import amysql

from random import randint

 

con = amysql.Connection()

con.connect ('127.0.0.1', 3306, 'root', '123', 'test')

con.query('SET GLOBAL query_cache_size = 0;')

 

def query(r):

    return con.query('SELECT value FROM test WHERE id >= %s LIMIT 10;', (r,))

  

def application(env, start_response):

    sum = 0

    queries = []

  

    for i in xrange(10):

        r = randint(1, 1000000 - 10)

        queries.append(gevent.spawn(query, r))

 

    for q in queries:

        rs = q.get()

        for j in rs.rows:

            sum += j[0]

            pass

    start_response('200 OK', [('Content-Type','text/plain')])

    return ['%6f' % sum]

  

if __name__ == '__main__':

    WSGIServer(('', 8088), application).serve_forever()

 

结果为149 QPS,无失败请求。看来在并发足够多时,异步没有帮助,反而因为要执行更多代码而变慢了。

 

gevent + MySQL for Python:

 

from gevent.pywsgi import WSGIServer

import MySQLdb

from random import randint

 

con = MySQLdb.connect(user='root', passwd='123', db='test')

cu = con.cursor()

cu.execute('SET GLOBAL query_cache_size = 0;')

  

def application(env, start_response):

    sum = 0

    for i in xrange(10):

        r = randint(1, 1000000 - 10)

        cu.execute('SELECT value FROM test WHERE id >= %s LIMIT 10;', (r,))

        for j in cu.fetchall():

            sum += j[0]

    start_response('200 OK', [('Content-Type','text/plain')])

    return ['%6f' % sum]

  

if __name__ == '__main__':

    WSGIServer(('', 8087), application).serve_forever()

 

结果为122 QPS,无失败请求。这个库已经有1年多没更新了,看来已经不够给力了。

 

虽然测试是用的很快的主键查询,但我主要是测试访问数据库和处理响应的速度,数据库的性能不是我关注的重点。

可以看出amysql的同步方式是最好的,所以下面就只用它来测试。

 

uWSGI:

自带了HTTP服务器,因此直接运行“uwsgi -l 1000 --http :9090 --wsgi-file test.py &”即可。

因为数据库连接和生成application的代码都和第一个例子相同,只是无需运行server,就不重复列出了。

共2个进程,启动占用6.1+2MB,测试完占用6.2+2MB。

结果为134 QPS,无失败请求。很奇怪它的表现比hello world差很多,但内存控制还算不错,而且命令很方便。

 

Tornado:

 

import tornado.ioloop

import tornado.web

import amysql

from random import randint

 

con = amysql.Connection()

con.connect ('127.0.0.1', 3306, 'root', '123', 'test')

con.query('SET GLOBAL query_cache_size = 0;')

  

class MainHandler(tornado.web.RequestHandler):

    def get(self):

        sum = 0

        for i in xrange(10):

            r = randint(1, 1000000 - 10)

            rs = con.query('SELECT value FROM test WHERE id >= %s LIMIT 10;', (r,))

            for j in rs.rows:

                sum += j[0]

        self.write('%6f' % sum)

  

application = tornado.web.Application([

    (r"/", MainHandler),

])

 

if __name__ == "__main__":

    application.listen(8000)

    tornado.ioloop.IOLoop.instance().start()

 

启动占用10MB内存,测试完占用14MB。

结果为145 QPS,偶尔会出现1个失败请求。不得不说这个玩意太强了,纯Python写的服务器居然不输C/C++写的,只是内存占用有点大。加上它支持长连接,看上去是个不错的选择。

 

顺带一提,我稍后又测了下Eurasia 3.1:

 

import amysql

from random import randint

 

con = amysql.Connection()

con.connect ('127.0.0.1', 3306, 'root', '123', 'test')

con.query('SET GLOBAL query_cache_size = 0;')

 

from eurasia.web import httpserver, mainloop

 

def handler(httpfile):

    sum = 0

    for i in xrange(10):

        r = randint(1, 1000000 - 10)

        rs = con.query('SELECT value FROM test WHERE id >= %s LIMIT 10;', (r,))

        for j in rs.rows:

            sum += j[0]

    httpfile['Content-Type'] = 'text/plain'

    httpfile.write('%6f' % sum)

    httpfile.close()

 

httpd = httpserver(('', 8080), handler)

httpd.start()

mainloop()

 

结果为145 QPS,无失败请求。此时重测了一下Tornado,为149 QPS。

值得一提的是,引入eurasia.web必须在con.connect()之后,否则会连接失败(RuntimeError: createSocket API returned NULL (0)),这可能是它修改了socket的原因。

虽然它也和Tornado一样支持长连接,不过提供的httpserver并不适合直接开发,要封装出一个好用的接口也很麻烦。于是直接使用wsgiserver应该是更好的选择(测试只比httpserver低1 QPS),不过这也就意味着还需要一个WSGI框架,也会稍微影响一点性能;而Tornado本身就已经包含框架了,所以感觉Tornado是更好的选择。

 

接着试试PHP。

用spawn-fcgi来跑,前端挂了nginx,可能会影响一些性能。

 

<?php

$sum = 0;

$db = new mysqli('p:127.0.0.1', 'root', '123', 'test'); // p:是使用持久连接,因为没法像Python那样重用连接

for ($i = 0; $i < 10; ++$i) {

    $r = rand(1, 1000000 - 10);

    $result = $db->query("SELECT value FROM test WHERE id >= $r LIMIT 10;");

    while ($row = $result->fetch_row()) {

        $sum += $row[0];

    }

    $result->close();

}

printf('%6f', $sum);

?>

 

启动占用5.3MB内存,测试完占用5.3MB。

结果为130 QPS,无失败请求。表现并不算好,但内存控制确实强大。

 

2011年9月5日更新:

刚发现PHP版本还可以使用prepared statement进行优化,于是再次测试:

 

<?php

$sum = 0;

$db = new mysqli('p:127.0.0.1', 'root', '123', 'test');

$stmt = $db->prepare('SELECT value FROM test WHERE id >= ? LIMIT 10;');

for ($i = 0; $i < 10; ++$i) {

    $r = rand(1, 1000000 - 10);

    $stmt->bind_param('i', $r);

    $stmt->execute();

    $stmt->bind_result($value);

    while ($stmt->fetch()) {

        $sum += $value;

    }

}

$stmt->close();

 

printf('%6f', $sum);

?>

 

结果为155 QPS,无失败请求,性能一跃成为最好的了。

值得一提的是Python没提供这种API,所以有失公平。

而且这个例子比较特殊,10次查询都用相同语句,真实环境下一般不会出现这种情况。而如果每次循环都创建$stmt的话,会下降到115 QPS,因此不需要多次使用的话,最好还是用前面的方法。

 

公平起见,拿Tornado + nginx试了下,成绩为138 QPS,无失败请求,性能损失约为5%。也许关闭gzip会提高,但真实环境下一般都要开启。

 

最终测完时还剩10MB内存,75MB缓存,看来128MB的小VPS也很强劲了。不说150 QPS,就算缩小10倍,1天也能处理130万动态请求了。

 

而如果需要扩展的话,CPU是限制QPS的主要原因:

将其设为100%(2.3 GHz)后,Tornado + nginx增加到351 QPS,基本上成正比。

设为双CPU后,启动2个进程,并发数设为500,QPS也增加到502。

设为4 CPU后,启动4个进程,QPS只能跑到582,因为i5虽然可以通过超线程虚拟到4核,但毕竟不是真实的CPU,增长还是有限。

这样看来比较好的服务器(3 GHz,8核)应该能支持2600 QPS,不过这时的瓶颈应该是MySQL了,只能加内存用Redis之类的缓存了。

 

最后,如果采用InnoDB的话,我必须增加虚拟机的内存,最终的内存消耗大概在160MB左右,40MB缓存,Tornado性能下降到132 QPS。但Oracle的评测却说InnoDB比MyISAM快,原因未知

图片内容