Pythonの非同期型TCPサーバのC10K性能

Web花盛りでTwistedやTornadoといったスループット系サーバ実装が色々出てるのは知ってたが,基本的に部外者なんであれこれ名前を聞いてもZopeみたいなアプリケーション・サーバと区別が付かないし,実際のところ性能はどうよ? というのが疑問だったので,以下のベンチマークが非常にためになった(こういうベンチマークの対象になるモノはアプリケーション・サーバではないので区別も付く)

職場でちょっとしたテスト用の(HTTPでない)サーバを書くよう言われたんだが,拠って立つTCPサーバのフレームワークにはEventlet + Greenletを選ぶことにした.Facebookで開発されたTornadoはさすがの性能だがPython 2.5以降でしか使えないので要求を満たさない.次に実行性能が高いGeventは下位レイヤでlibeventからlibevへの乗り換えをしてる等,ちょっとcutting edge過ぎる気がして見送り.ということでEventlet.
性能はかなり良い方だし,API見てもBSDソケットの隠蔽が深すぎてweb専用になってることもないし,ファイル数もそこそこ少な目だし,適当に解凍したアーカイブsys.path.append したら import できるようになったので安心(ライブラリの分際で setup.py install を要求するとか誰得)とまぁ,色々気に入った.Greenletはsetuptoolsの setup.py が添付されてたが,setuptoolsが無くてもdistutilsを使うように書き換えるのは楽で, setup.py build したらディレクトbuild の奥に greenlet.so が作られるディレクトリをやはり sys.path.append でおk.
しかしスクリプト言語で真のスレッドをちゃんと活用してマルチコアに対してスケールする実装はまだまだ足りないですな... JythonScala等のJVM系程度じゃないの? (Mono等のCLR勢も?)