12 3 4 5 / 5 页下一页

论坛徽章:: 44

电梯直达

1楼 [收藏(0)] [报告]

发表于 2014-03-21 16:09 |只看该作者 |倒序浏览

本帖最后由 windoze 于 2015-08-31 23:19 编辑

如果你习惯于写每连接一个线程的程序，那试试这个吧 Fiberized.IO
你可以继续使用原来的模型，只需要把thread换成fiber，并使用库里面提供的stream类处理I/O，程序内部会使用一个m:n的green thread(fiber):kernel thread的映射，把blocking I/O的API替换成底层asynchronous I/O，并发能力和吞吐量都会大幅度提高。
这个库同时还提供C++11兼容的mutex/condition_variable实现，可以用于fiber之间的同步。

软件的文档在这里

2015年8月31日更新
昨天灵机一动，想到了一个简单的办法支持HTTP/1.1 Chunked encoding，本来想歪了以为要大动干戈，所以一直没做这个功能，找对了方法只花了一晚上就搞定了。
现在可以说Fiberized.IO的HTTP/1.1协议部分已经完整了，正在啃HTTP/2，看看有没有什么办法在不伤筋动骨的前提下把它也搞定。

2015年8月30日更新
加入了WebSocket服务端支持，一个简单的WebSocket echo例子在这里
暂时没空管Windows，所以新加入的与HTTP相关的功能还是不能用……

2015年5月28日更新
好吧我还是低估了VC的脑残程度，fibio的基础部分是可用的，但是HTTP部分由于我滥用C++11黑魔法，导致VC连续给我二十几个会心一击。
目前HTTP高地的战斗还在继续……
话说微软什么时候才能推出一个真正的C++编译器啊，现在这个C艹编译器实在是受够了！！！

2015年5月27日更新
项目到今天已经有一年多的历史了，今天Fiberized.IO终于可以在VC2015RC下编译并通过基本测试，这一切都是在至今也没有人给我赞助Windows机器的情况下进行的，有好心人愿意给我捐款不？
然而用CMake生成VC2015RC的工程文件似乎还是有问题，所以我手工创建了一组工程文件，正在检查看有没有绝对路径什么的，如果一切正常将在近期上传至GitHub。
PS. 有人知道怎么创建一个NuGet包吗？网上的教程似乎不是地球人写的，每个字都认得但连在一起什么意思居然不知道？！
PPS. 如果有人打算折腾C++11/14，敬请远离VC，血淋淋的教训呐……

12月2日更新：
支持Redis PUBSUB（终于……）和scan
加入了一个简单的Mustache模板，做HTTP server更简单了。
修了几个bug

11月12日更新
加入Apache Thrift支持，可以使用Fiberized.IO的架构实现Thrift客户端和服务端，比自带的TThreadedServer/TThreadPoolServer/TNonblockingServer更好、更容易的支持大并发。

11月更新
（比较）完整的HTTP服务端框架，支持HTTPS，加入了request routing和基本的cookie/请求参数解析，现在可以拿来写点Servlet干的事了

加入了一个URL client，支持HTTP和HTTPS，支持自动重定向跳转。
加入了一个基本的redis客户端，（几乎）支持所有的redis命令。

7月更新：
Fiber专用同步对象如mutex、condition_variable等的内部状态改用spinlock保护，在多CPU机器上可以提高一些效率。

6月更新：
完整支持C++11 future/promise，Boost.ASIO集成，重写了timeout实现，改正了之前实现中的race condition。

3月28日更新：
清理了io部分代码结构，加入SSL支持

3月24日更新：
在Linux下打开segment stack，Fiberized.IO测试程序已经成功创建1M个fiber，妈妈再也不用担心连接数太多了

test_http_server性能测试，在loopback上用"ab -k -c 100 -n 100000 http://localhost:23456/"，qps超过200k （需要将test_http_server.cpp:128行注释掉，否则程序会自动退出）

完整的echo_server例子源代码在这里

文库|博客

pandaiam

小富即安

论坛徽章:: 3

2楼 [报告]

发表于 2014-03-21 16:55 |只看该作者

厉害啊，
看不懂的路过。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

windoze

版主

论坛徽章:: 44

3楼 [报告]

发表于 2014-03-21 17:12 |只看该作者

本帖最后由 windoze 于 2014-03-21 17:14 编辑

简单的说就是这样，假定你有一个blocking的tcp_stream类，一个echo server大概会是这个样子：

void servant(tcp_stream s) {
while(!s.eof()) {
// 从socket stream中读入一行
std::string line;
std::getline(s, line);
// 向socket中写入一行，std::endl会调用stream.flush()，确保数据都被发送出去
s << line << std::endl;
}
}
int main_entry(int argc, char *argv[]) {
// acceptor本质上就是一个listen socket
io::tcp::acceptor acc=io::listen(12345);
while(1) {
//blocking accept调用，返回一个connected socket，假定它有一个简单的basic_iostream兼容包装叫tcp_stream
tcp_stream stream(io::accept(acc));
// 创建一个工作线程处理该socket，detach说明这个thread不需要被join
std::thread(servant, std::move(stream)).detach();
}
return 0;
}
int main(int argc, char *argv[]) {
std::thread(main_entry, argc, argv).join();
return 0;
}

复制代码

以上是一个极简单的1 connection per thread的echo server，只要并发连接数不多（比如只有几个或十几个，不超过CPU物理核数），它能很好的工作，效率远非任何非阻塞/异步模型可比。
但上面的程序也有致命问题，如果并发连接数太多，比如C10K甚至C100K的时候，CPU和OS无法有效的调度每个线程，甚至无法创建这么多的线程，导致程序效率骤降甚至崩溃。
Fiberized.IO的解决方案是采用coroutine/green thread/fiber（随便你叫什么，反正差不多），将10K甚至100K的fiber映射到一组固定尺寸的线程池上，在用户态进行调度，从程序角度看，它依然适用blocking I/O的模型，但在底层，所有blocking I/O的操作其实都是一个Async I/O的操作，通过适当的处理fiber状态并切换fiber context，保证每个工作线程的利用率最大化，减少线程争用，提高吞吐量和并发能力。
上面的程序很容易修改成fiber based，只需将std::thread换成fibio::fiber，并将main函数改成这样即可：

#include <fibio/fiber.hpp>
#include <fibio/stream/iostream.hpp>
using namespace fibio;
// 之前的程序片段
...
// 4是线程池尺寸，你可以用std::thread::hardware_concurrency()代替以创建和CPU物理核数一致的线程池
int main(int argc, char *argv[]) {
return fiberize(4, main_entry, argc, argv);
}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

OwnWaterloo

实习版主

论坛徽章:: 2

4楼 [报告]

发表于 2014-03-21 20:13 |只看该作者

回复 1# windoze

请教一下coroutine的实现方式？
boost,pth等程序库？Fibter/ucontext等平台特定的api？还是直接汇编地干活？

另外。。。 C++11已经很流行了么。。。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

OwnWaterloo

实习版主

论坛徽章:: 2

5楼 [报告]

发表于 2014-03-21 20:50 |只看该作者

本帖最后由 OwnWaterloo 于 2014-03-21 20:50 编辑

回复 1# windoze

啊，我翻到了。。。
fiber_object.hpp (22)

#include <boost/coroutine/coroutine.hpp>

复制代码

fiber_object.hpp (73)

typedef boost::coroutines::coroutine<after_step_handler_t>::pull_type runner_t;
typedef boost::coroutines::coroutine<after_step_handler_t>::push_type caller_t;

复制代码

继续请教。
如果用stackful的话会不会有移植性方面的问题？
而如果只用stackless会不会有一些限制？比如不能从嵌套的函数里跳出或者重新进入后局部变量不能还原？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

windoze

版主

论坛徽章:: 44

6楼 [报告]

发表于 2014-03-21 22:34 |只看该作者

回复 5# OwnWaterloo

Boost.context/Boost.coroutine可用于不少系统，\兼容性不是大问题，目前支持x86/x64/arm/mips/sparc/sparc64/ppc/ppc64上的Solaris/Linux/FreeBSD/Mac/Windows，基本涵盖了所有常见的系统，经实测在使用ELF的HaikuOS上也能用（虽然要hack一下makefile）。
stackful coroutine最大的好处就是和其它程序/库的兼容性好，因为在切换context之后，任何一个函数都无法“感觉到”新的context有什么不同，即使对于使用sjlj的变态库，只要小心点，也可以完全兼容。当然，使用stackful coroutine也要付出一些性能上的代价，但整体来说处于可接受范围内。

stackless看上去很美，但实际使用的时候会有很多问题。
一般认为stackless会有一些性能上的优势，但实际使用中你会发现stackless coroutine使用类似于CPS的方式串起整个执行链，所有“局部”变量都需要保存在一个执行链上每个块都可以访问到的区域，以C的实际情况而言，这个区域只能在堆上，而过度使用堆会导致cache局部性大打折扣。
另外一个巨大的问题就是错误处理，C++内置的异常处理机制完全不可用，每个pseudo blocking操作要么使用返回值处理异常（类似于node.js的错误处理），要么hack一点，在每个块外捕获异常，随CPS stack frame传递至下一个块重新抛出，直到被用户提供的异常捕获代码处理为止。

在开始这个项目之前，我曾经仔细考虑过这两者，最后还是选择了stackful coroutine，简单、兼容性好、性能损失很小，有这几点就足够了。