>рабочие заметки: Задача с собеседования

31 января 2013 г.

Задача с собеседования

...Пусть у нас есть некоторая процедура обработки сообщений. Процедура состоит из двух фаз: P1 и P2. Фазы строго последовательны — P2 не может начаться, пока не закончилась P1. У нас есть датацентр, в датацентре — стойка, в стойке — сервер, в сервере — 2 процессора.

Есть два варианта организации процесса обработки:

Дизайн 1 (тривиальный): Мы просто задействуем одно-единственное ядро, которое последовательно для каждого сообщения выполняет P1 и P2. Второе ядро курит бамбук.
Дизайн 2: P1 вешаем на ядро 1, P2 на ядро 2, между ними организуем какой-то протокол передачи сообщений.

Вопрос — какой вариант будет быстрее? (== меньше времени на обработку одного сообщения, от начала P1 до конца P2)

...те же грабли, но вид сбоку: теперь нас интересует не скорость, а пропускная способность. У нас есть входящий поток сообщений, которые надо разгребать. Опять же, два варианта:

Дизайн 1 (тривиальный): Каждое ядро обрабатывает половину входящих сообщений, при этом каждое ядро для доставшихся ему сообщений выполняет обе фазы обработки последовательно.
Дизайн 2: Все сообщения идут сначала на ядро 1, которое выполняет фазу P1, потом пересылаются на ядро 2, которое выполняет для них фазу P2

Вопрос — в каком варианте можно достичь бОльшей пропускной способности? (== количество сообщений, обрабатываемых за единицу времени)

Подсказка: правильно заданный вопрос, как обычно, содержит половину ответа. Правильно заданный вопрос, в данном случае, будет "какой дизайн и при каких условиях даст лучший результат?"

UPD: Я упустил отметить, что по замыслу объемы (сложности) фаз примерно равны. Т.е. среднее время выполнения P1 равно среднему времени выполнения P2.

UPD2: В комментариях уже есть хороший ответ, так что не подглядывайте!

17 комментариев:

Zalim Bashorov31 января 2013 г. в 13:48
В случае 1.2 пока второе ядро делает P2 первое может делать другое P1?

Или может вопрос только про обработку одного сообщения, а не очереди?

P.S. В 2.2 предложение не закончено.
ОтветитьУдалить
Ответы
Zalim Bashorov31 января 2013 г. в 13:56
В 2.1 сообщения делятся ровно по полам(например, в начале) или каждое ядро берет новое сообщение по мере необходимости(например, после завершения оброботки текущего)?
ОтветитьУдалить
Ответы
Игорь Санников31 января 2013 г. в 14:44
Меньше время обработки сообщения разве не даст большую пропускную способност?
ОтветитьУдалить
Ответы
Andrey Pischikov31 января 2013 г. в 15:15
В первом варианте пожалуй лучше крутиться на одном ядре. Не надо организовывать дополнительные протоколы/синхронизации, на которые тоже уйдет какое-то время.

Во втором должно сильно зависеть от объема задач P1 и P2. Если они сильно разные (например, P1 сильно меньше P2), то одно из ядер (в нашем случае выполняющее P1) будет большую часть времени тупо простаивать.
ОтветитьУдалить
Ответы
Andrey Pischikov31 января 2013 г. в 15:18
Этот комментарий был удален автором.
ОтветитьУдалить
Ответы

Добавить комментарий

31 января 2013 г.

Задача с собеседования

17 комментариев:

31 января 2013 г.