协程可以看作一个轻量级的线程,能自己实现调度。有一些轻量的场景,如网络刷新、网络加载、UI刷新、IO读写操作等,可以不需要开启一个线程去执行;线程或进程的调度较重,只需要一个轻量级的线程来维护业务代码,使业务代码更加的轻便灵活;这就是协程的意义。协程,简单的说,就是一个具有异步的性能,却使用同步编程方式的组件。使用者调用协程可以很好的管理业务代码,整个执行过程清晰明了。
多线程异步操作,就是将不同的操作放到不同的线程中进行。异步带来的好处是子模块好规划、程序性能高;缺点是模块间的数据管理异常麻烦。
多线程异步简单示例代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <fcntl.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <sys/epoll.h>
#include <netdb.h>
#include <arpa/inet.h>
#include <pthread.h>
#define ASYNC_EVENT_LENGTH 1024
struct context {
int epfd;
pthread_t thid;
};
void *asyn_callback(void * arg)
{
struct context *ctx=(struct context*)arg;
while(1)
{
struct epoll_event events[ASYNC_EVENT_LENGTH] = { 0 };
int nready=epoll_wait(ctx->epfd,events,ASYNC_EVENT_LENGTH,-1);
if (nready < 0)
{
if (errno == EINTR || errno == EAGAIN)
continue;
else
break;
}
else if (nready == 0)
continue;
int i = 0;
for (i = 0; i < nready;i++)
{
int clientfd = events[i].data.fd;
if (events[i].events &EPOLLIN)
{
char buffer[1024] = { 0 };
struct sockaddr_in addr;
size_t addr_len = sizeof(struct sockaddr_in);
// 从读缓冲区中读取数据
int n = recvfrom(clientfd, buffer, sizeof(buffer), 0, (struct sockaddr*)&addr, (socklen_t*)&addr_len);
printf("recvfrom n : %d\n", n);
// 解析数据
parse_response(buffer);
// 删除事件监听
epoll_ctl(ctx->epfd, EPOLL_CTL_DEL, clientfd, NULL);
// 关闭fd
close(clientfd);
}
}
}
return NULL;
}
int asyn_commit(struct context *ctx)
{
// 创建 socket
int sockfd = socket(AF_INET, SOCK_DGRAM, 0);
if (sockfd < 0) {
perror("create socket failed\n");
exit(-1);
}
// 配置socket相关信息
struct sockaddr_in dest;
bzero(&dest, sizeof(dest));
dest.sin_family = AF_INET;
dest.sin_port = htons(53);
dest.sin_addr.s_addr = inet_addr(DNS_SVR);
// connect目标,探路
int ret = connect(sockfd, (struct sockaddr*)&dest, sizeof(dest));
printf("connect :%d\n", ret);
// 准备协议
//......
// 发送数据
int slen = sendto(sockfd, request, req_len, 0, (struct sockaddr*)&dest, sizeof(struct sockaddr));
// 加入epoll中,监测结果返回
struct epoll_event ev;
ev.events = EPOLLIN;
ev.data.fd = sockfd;
return epoll_ctl(ctx->epfd, EPOLL_CTL_ADD, sockfd, &ev);
}
int asyn_init(struct context *ctx)
{
ctx->epfd=epoll_create(1);
pthread_create(&ctx->thid,NULL,asyn_callback,ctx);
}
int main(int argc;char *argv[])
{
struct context ctx;
asyn_init(&ctx);
for(int i=0;i<100;i++)
{
asyn_commit();
}
getchar();
return 0;
}
协程就是要在一个线程中实现异步操作。
协程主要有几个操作:创建(create)、让出(yield)和恢复(resume)。这后两个操作使用一个关键的动作,switch,即切换。
(1)将socketfd添加到epoll中管理。
(2)然后切换上下文,由协程上下文切换到调度器上下文,这个过程称为让出(yield)。
(3)调度器获取下一个协程上下文,恢复(resume)新的协程。
如此达到异步的操作。
调度器与协程的上下文切换如下图:
epoll_ctl() add和del动作能够保证 sockfd 只在一个上下文中能够操作 IO ;不会出现在多个上下文同时对一个 IO 进行操作。
IO异步操作上下文切换时序图:
执行切换有三种方式:
(1)longjmp / setjmp
(2)ucontext
(3)汇编
”切换“不能使用goto。goto只能在栈内跳转,只能在函数内,不能跨函数。
汇编实现switch可以参考Linux kernel的任务调度方式,在“切换”前保存当前的上下文信息再加载要执行的上下文信息。x86_64 的寄存器有 16 个 64 位寄存器:rax,rbx,rdi,rsi,rdx,rcx,r8,r9,r10,r11,r12,r13,r14,r15,rbp,rsp。
其中:
rax:存储函数的返回值;
rdi,rsi,rdx,rcx,r8,r9:函数的六个参数,如果函数的参数超过六个,那么六个以后的参数会入栈。
rbp:栈指针寄存器,指向栈底;
rsp:栈指针寄存器,指向栈顶。
其余的用作数据存储。
eip:指令指针寄存器,指向CPU要执行的下一个指令。
例如,对于X86-64的汇编切换代码:
__asm__ (
" .text \n"
" .p2align 4,,15 \n"
".globl _switch \n"
".globl __switch \n"
"_switch: \n"
"__switch: \n"
" movq %rsp, 0(%rsi) # save stack_pointer \n"
" movq %rbp, 8(%rsi) # save frame_pointer \n"
" movq (%rsp), %rax # save insn_pointer \n"
" movq %rax, 16(%rsi) \n"
" movq %rbx, 24(%rsi) # save rbx,r12-r15 \n"
" movq %r12, 32(%rsi) \n"
" movq %r13, 40(%rsi) \n"
" movq %r14, 48(%rsi) \n"
" movq %r15, 56(%rsi) \n"
" movq 56(%rdi), %r15 \n"
" movq 48(%rdi), %r14 \n"
" movq 40(%rdi), %r13 # restore rbx,r12-r15 \n"
" movq 32(%rdi), %r12 \n"
" movq 24(%rdi), %rbx \n"
" movq 8(%rdi), %rbp # restore frame_pointer \n"
" movq 0(%rdi), %rsp # restore stack_pointer \n"
" movq 16(%rdi), %rax # restore insn_pointer \n"
" movq %rax, (%rsp) \n"
" ret \n"
);
(1)如果调度器不存在,则创建调度器。调度器作为全局实例。
(2)分配协程内存空间,并设置协程的数据项。如协程的栈空间、栈大小、子过程回调函数、子过程回调参数等等。
(3)将新创建的协程添加到就绪队列中。
切换到最近执行 resume 的上下文。
切换到运行协程实例的 yield 的位置。
resume 与 yield 是两个可逆过程的原子操作。
协程一般包含几个内容:
(1)协程ID
(2)协程上下文
(3)协程入口函数
(4)协程的状态
(5)协程的栈空间
(6)返回值
(7)状态集合
struct coroutine{
uint64_t birth;//创建时间
uint64_t id;//协程ID
struct context ctx;//上下文
void *(*func) (void*);//子过程回调函数
void *arg;//回调函数参数
struct nty_coroutine_status status;// 协程的状态
void *stack;// 栈
size_t stack_length;//栈大小
nty_schedule *sched;//调度器
//状态集合
struct rbtree_node wait;
struct queue_node ready;
struct rbtree_node sleep;
}
typedef struct _nty_coroutine_queue nty_coroutine_queue;
typedef struct _nty_coroutine_rbtree_sleep nty_coroutine_rbtree_sleep;
typedef struct _nty_coroutine_rbtree_wait nty_coroutine_rbtree_wait;
typedef struct _nty_schedule {
uint64_t birth;//创建时间
nty_cpu_ctx ctx;//上下文
struct _nty_coroutine *curr_thread;//当前运行的协程
int page_size;
// epoll 管理
int poller_fd;
int eventfd;
struct epoll_event eventlist[NTY_CO_MAX_EVENTS];
int nevents;
int num_new_events;
//状态集合
nty_coroutine_queue ready;
nty_coroutine_rbtree_sleep sleeping;
nty_coroutine_rbtree_wait waiting;
} nty_schedule;
协程可以让业务代码易于管理,整个流程清晰;自己实现调度器,在单线程中实现异步调度。协程的底层还是使用epoll等IO多路复用器,性能上只能趋近reactor。
协程的单核运行过程: