golang协程池的大小应根据cpu核心数、任务类型、系统资源和压测结果确定。1. cpu核心数:协程池大小不应超过cpu核心数太多,一般为1-2倍;2. 任务类型:cpu密集型任务应接近cpu核心数,i/o密集型任务可适当增加;3. 系统资源:需考虑内存等限制,避免oom;4. 压测:通过测试调整大小,观察吞吐量和响应时间等指标找到最佳平衡点。

协程池,简单来说,就是预先创建好一批协程,需要执行任务时,直接从池子里取一个来用,用完放回去,避免频繁创建和销毁协程的开销。Golang标准库本身并没有提供协程池,但我们可以自己实现,或者使用第三方库。

Golang协程池实现方案

实现协程池的核心思路是:维护一个协程队列和一个任务队列。任务来了,就从协程队列里取一个协程去执行,执行完再放回协程队列。
立即学习“go语言免费学习笔记(深入)”;
package main
import (
"fmt"
"sync"
"time"
)
type Job struct {
ID int
Payload int
}
type WorkerPool struct {
JobQueue chan Job
WorkerQueue chan chan Job
Workers []Worker
Quit chan bool
Wg sync.WaitGroup
}
type Worker struct {
ID int
JobQueue chan Job
WorkerQueue chan chan Job
Quit chan bool
Wg *sync.WaitGroup
}
func NewWorker(id int, workerQueue chan chan Job, wg *sync.WaitGroup) Worker {
return Worker{
ID: id,
JobQueue: make(chan Job),
WorkerQueue: workerQueue,
Quit: make(chan bool),
Wg: wg,
}
}
func (w Worker) Start() {
w.Wg.Add(1)
go func() {
defer w.Wg.Done()
for {
// 将自己的JobChannel 注册到 WorkerPool 的 WorkerQueue 中
w.WorkerQueue <- w.JobQueue
select {
case job := <-w.JobQueue:
// 接收到任务
fmt.Printf("worker%d: 处理 job %d, payload %d\n", w.ID, job.ID, job.Payload)
time.Sleep(time.Duration(job.Payload) * time.Millisecond) // 模拟耗时操作
fmt.Printf("worker%d: 完成 job %d\n", w.ID, job.ID)
case <-w.Quit:
// 收到停止信号
fmt.Printf("worker%d: 停止\n", w.ID)
return
}
}
}()
}
func (w Worker) Stop() {
go func() {
w.Quit <- true
}()
}
func NewWorkerPool(workerNum int, jobQueueSize int) WorkerPool {
jobQueue := make(chan Job, jobQueueSize)
workerQueue := make(chan chan Job, workerNum)
workers := make([]Worker, workerNum)
wp := WorkerPool{
JobQueue: jobQueue,
WorkerQueue: workerQueue,
Workers: workers,
Quit: make(chan bool),
Wg: sync.WaitGroup{},
}
// 创建 worker
for i := 0; i < workerNum; i++ {
worker := NewWorker(i+1, wp.WorkerQueue, &wp.Wg)
workers[i] = worker
}
return wp
}
func (wp WorkerPool) Run() {
// 启动所有 worker
for i := 0; i < len(wp.Workers); i++ {
wp.Workers[i].Start()
}
go wp.dispatch()
}
func (wp WorkerPool) dispatch() {
for {
select {
case job := <-wp.JobQueue:
// 从 JobQueue 中取出任务
workerJobQueue := <-wp.WorkerQueue
// 将任务发送给 Worker
workerJobQueue <- job
case <-wp.Quit:
// 收到停止信号
for i := 0; i < len(wp.Workers); i++ {
wp.Workers[i].Stop()
}
return
}
}
}
func (wp WorkerPool) Stop() {
close(wp.JobQueue)
go func() {
wp.Quit <- true
}()
wp.Wg.Wait()
}
func main() {
workerNum := 5
jobQueueSize := 100
wp := NewWorkerPool(workerNum, jobQueueSize)
wp.Run()
// 生产 job
for i := 0; i < 20; i++ {
job := Job{
ID: i + 1,
Payload: i*100, // 模拟不同任务的耗时
}
wp.JobQueue <- job
}
// 等待所有 job 完成
time.Sleep(3 * time.Second)
wp.Stop()
fmt.Println("所有 job 完成")
}Golang 协程池的大小如何确定?

协程池的大小直接影响到程序的并发能力和资源利用率。太小了,并发度不够,浪费资源;太大了,可能导致上下文切换开销过大,甚至OOM。
确定协程池大小需要考虑以下几个因素:
- CPU 核心数: 协程池的大小不应超过 CPU 核心数太多,否则会增加上下文切换的开销。一般来说,可以设置为 CPU 核心数的 1-2 倍。
- 任务类型: 如果任务是 CPU 密集型的,协程池的大小应该接近 CPU 核心数。如果任务是 I/O 密集型的,协程池的大小可以适当增加,因为协程在等待 I/O 时可以切换到其他协程执行。
- 系统资源: 协程池的大小还会受到系统资源的限制,例如内存。如果协程池太大,可能会导致内存不足。
- 压测: 最终,需要通过压测来确定最佳的协程池大小。通过不断调整协程池的大小,并观察程序的性能指标,例如吞吐量、响应时间等,找到一个最佳的平衡点。
Golang 协程池如何处理 panic?
协程中如果发生panic,如果没有recover,会导致程序崩溃。因此,在协程池中处理panic非常重要。
有几种常见的处理方式:
-
在 Worker 中 recover: 这是最常见的方式,在每个 Worker 的执行函数中,使用
recover()来捕获 panic。这样可以防止 panic 扩散到整个程序,保证协程池的稳定性。
func (w Worker) Start() {
w.Wg.Add(1)
go func() {
defer w.Wg.Done()
defer func() {
if r := recover(); r != nil {
fmt.Printf("worker%d: panic recover: %v\n", w.ID, r)
// 可以选择将 panic 重新抛出,或者记录日志
}
}()
for {
w.WorkerQueue <- w.JobQueue
select {
case job := <-w.JobQueue:
fmt.Printf("worker%d: 处理 job %d, payload %d\n", w.ID, job.ID, job.Payload)
// 模拟可能发生 panic 的操作
if job.Payload == 0 {
panic("payload is zero")
}
time.Sleep(time.Duration(job.Payload) * time.Millisecond)
fmt.Printf("worker%d: 完成 job %d\n", w.ID, job.ID)
case <-w.Quit:
fmt.Printf("worker%d: 停止\n", w.ID)
return
}
}
}()
}使用第三方库: 一些第三方协程池库,例如
ants,已经内置了 panic 处理机制。使用这些库可以简化 panic 处理的流程。记录日志: 无论使用哪种方式处理 panic,都应该记录详细的日志,包括 panic 的类型、堆栈信息等。这样可以方便后续的排查和修复。
Golang 协程池有哪些常用的第三方库?
虽然可以自己实现协程池,但使用成熟的第三方库可以省去很多麻烦,并获得更好的性能和稳定性。
以下是一些常用的 Golang 协程池第三方库:
-
ants:
ants是一个高性能的 Golang 协程池库,它具有以下特点:- 高性能:基于无锁队列实现,性能优秀。
- 自动调整:可以根据任务负载自动调整协程池的大小。
- panic 处理:内置了 panic 处理机制。
- 资源回收:可以自动回收空闲的协程。
- 使用简单:API 简洁易用。
package main
import (
"fmt"
"sync"
"time"
"github.com/panjf2000/ants/v2"
)
func main() {
defer ants.Release()
var wg sync.WaitGroup
syncCalculateSum := func(i interface{}) {
n := i.(int)
fmt.Printf("处理 job %d\n", n)
time.Sleep(time.Duration(n) * time.Millisecond)
fmt.Printf("完成 job %d\n", n)
wg.Done()
}
pool, _ := ants.NewPoolWithFunc(10, syncCalculateSum)
defer pool.Release()
for i := 0; i < 100; i++ {
wg.Add(1)
_ = pool.Invoke(i)
}
wg.Wait()
fmt.Printf("运行的 goroutine: %d\n", ants.Running())
fmt.Printf("完成所有任务.\n")
}-
tunny:
tunny是另一个流行的 Golang 协程池库,它支持多种任务类型,例如函数、命令等。tunny的特点是:- 支持多种任务类型:可以执行函数、命令等。
- 灵活的配置:可以配置协程池的大小、超时时间等。
- 易于扩展:可以自定义 Worker 的行为。
选择哪个第三方库取决于具体的应用场景。如果需要高性能和自动调整,ants 是一个不错的选择。如果需要支持多种任务类型和灵活的配置,tunny 也是一个不错的选择。










