在native code中使用多线程好处多多,但是Android的bionic并没有完全实现标准POSIX线程库的所有API,例如pthread_cancel()。但是google这样做肯定有原因,被cancel的thread不一定已经把自己拥有的资源释放掉,因此很可能带来内存泄露,锁没有释放等问题。这些问题在移动设备上更加突出。
首先介绍一个指标的方法,使用signal替代cancel调用:
当worker thread超时时,在主线程(或者是监视进程)中调用
- if ( (status = pthread_kill(pthread_id, SIGUSR1)) != 0)
- {
- printf("Error cancelling thread %d, error = %d (%s)", pthread_id, status, strerror status));
- }
在worker thread中加入对SIGUSR1信号的处理
- struct sigaction actions;
- memset(&actions, 0, sizeof(actions));
- sigemptyset(&actions.sa_mask);
- actions.sa_flags = 0;
- actions.sa_handler = thread_exit_handler;
- rc = sigaction(SIGUSR1,&actions,NULL);
- void thread_exit_handler(int sig)
- {
- printf("this signal is %d \n", sig);
- pthread_exit(0);
- }
参考自: http://stackoverflow.com/questions/4610086/pthread-cancel-alternatives-in-android-ndk
最根本的解决方法是重写worker thread,使用poll或者select等处理IO操作防止stuck的发生,下面是Android源码system/libsysutils/src/SocketListener.cpp的处理方法
1,创建worker thread前先创建通讯管道
- if (pipe(mCtrlPipe)) {
- SLOGE("pipe failed (%s)", strerror(errno));
- return -1;
- }
-
- if (pthread_create(&mThread, NULL, SocketListener::threadStart, this)) {
- SLOGE("pthread_create (%s)", strerror(errno));
- return -1;
- }
2,在worker thread的大循环中使用select同时监控管道和IO fd
- while(1){
- FD_SET(mCtrlPipe[0], &read_fds);
- if (mCtrlPipe[0] > max)
- max = mCtrlPipe[0];
- if ((rc = select(max + 1, &read_fds, NULL, NULL, NULL)) < 0) {
- SLOGE("select failed (%s)", strerror(errno));
- sleep(1);
- continue;
- } else if (!rc)
- continue;
-
-
- if (FD_ISSET(mCtrlPipe[0], &read_fds))
- break;
- }
3,需要退出时通过管道通知worker thread
- if (write(mCtrlPipe[1], &c, 1) != 1) {
- SLOGE("Error writing to control pipe (%s)", strerror(errno));
- return -1;
- }