Параллельная выборка URL в Go
Одним из наиболее интересных и новых аспектов Go является поддержка параллельного программирования.
Это очень большая тема, которую мы рассмотрим несколько позднее,
а сейчас мы просто попробуем на вкус основные механизмы параллельности Go — go-подпрограммы (горутины
) и каналы.
Наша новая программа называется fetchall
, и она точно так же выполняет выборку содержимого URL,
как и приложение fetch
, но делает это по многим URL одновременно,
так что этот процесс займет не больше времени, чем самая долгая выборка, а не время, составляющее сумму всех времен отдельных выборок.
Пока что fetchall
игнорирует ответы серверов, но сообщает об их размерах и затраченном на их получение времени:
// Выполняет параллельную выборку URL и сообщает // о затраченном времени и размере ответа для каждого из них package main import ( "fmt" "io" "io/ioutil" "net/http" "os" "time" ) func main() { start := time.Now() ch := make(chan string) for _, url := range os.Args[1:] { go fetch(url, ch) // start a goroutine } for range os.Args[1:] { fmt.Println(<-ch) // receive from channel ch } fmt.Printf("%.2fs elapsed\n", time.Since(start).Seconds()) } func fetch(url string, ch chan<- string) { start := time.Now() resp, err := http.Get(url) if err != nil { ch <- fmt.Sprint(err) // send to channel ch return } nbytes, err := io.Copy(ioutil.Discard, resp.Body) resp.Body.Close() // don't leak resources if err != nil { ch <- fmt.Sprintf("while reading %s: %v", url, err) return } secs := time.Since(start).Seconds() ch <- fmt.Sprintf("%.2fs %7d %s", secs, nbytes, url) }
Вот пример работы программы:
$ go build fetchall $ ./fetchall https://golang.org http://gopl.io https://godoc.org 0.14s 6852 https://godoc.org 0.16s 7261 https://golang.org 0.48s 2475 http://gopl.io 0.48s elapsed
go-подпрограмма представляет собой параллельное выполнение функции и имеет иное,
более запоминающееся, название - горутин
.
Канал является механизмом связи, который позволяет одной go-подпрограмме(горутину)
передавать значения определенного типа другой go-подпрограмме(горутину).
Функция main выполняется в горутине, а инструкция go
создает дополнительные go-подпрограммы.
Как это работает
Функция main создает канал строк с помощью make.
Для каждого аргумента командной строки
инструкция go в первом цикле по диапазону запускает новую go-подпрограмму,
которую fetch
вызывает асинхронно для выборки URL с помощью http.Get.
Функция io.Copy считывает тело ответа и игнорирует его, записывая в выходной поток ioutil.Discard.
Сору возвращает количество байтов и информацию о происшедших ошибках.
При получении каждого результата fetch
отправляет итоговую строку в канал ch
.
Второй цикл по диапазону в функции main получает и выводит эти строки.
Пример
Отправка значения в канал: ch <- expressionКогда одна go-подпрограмма пытается отправить или получить информацию по каналу, она блокируется, пока другая go-подпрограмма пытается выполнить соответствующие операции получения или отправки, и после передачи информации обе go-подпрограммы продолжают работу. В данном примере каждая функция fetch отправляет значение (ch <- expression) в канал ch, и main получает их все (<- ch). То, что весь вывод осуществляется функцией main, гарантирует, что вывод каждой go-подпрограммы(горутина) будет обработан как единое целое, без опасности получить на экране чередование вывода при завершении двух go-подпрограмм(горутин) в один и тот же момент времени.