>рабочие заметки: IO performance

24 марта 2011 г.

IO performance

Гонял тесты производительности ввода-вывода. Обнаружил интересную деталь -- чтение файлов с использованием обычного streaming-io (Input/OutputStream) замедляется, по мере увеличения буфера чтения. У меня на сервере (linux, RAID5) чтение замедляется почти вдвое при увеличении буфера с 128Кб до 10Мб. Причем это достаточно достоверно заметно во всей серии экспериментов с разными размерами файлов.

А вот чтение с использованием NIO (channels) так же вполне достоверно ускоряется, с увеличением размера буфера (под размером буфера здесь я подразумеваю аргумент count в вызове

FileChannel.transferTo( position, count, target )

. В целом, для чтения NIO быстрее old-school IO примерно на 10-20%

C записью положение более "универсальное" -- максимум скорости в районе размера буфера 128-512Кб, независимо от способа. Разница в скорости IO streams/NIO channels практически отсутствует.

В итоге (для нашего сервера) можно считать, что оптимальное значение "для всех миров" лежит где-то в районе 64-512Кб.

P.S. Да, эти значения актуальны для больших файлов -- > 10Гб. Для мелких файлов планка оптимального размера буфера смещается вниз -- 8-32Кб

6 комментариев:

Анонимный28 октября 2012 г. в 20:02
Кстати в сетевом взаимодействии в OpenJDK в зависимости от размера буффера выбирается где его аллоцировать - на стеке или динамически

SocketOutputStream.с

#define MAX_BUFFER_LEN 2048
#define MAX_HEAP_BUFFER_LEN 65536

char *bufP;
char BUF[MAX_BUFFER_LEN];
int buflen;
int fd;

if (len <= MAX_BUFFER_LEN) {
// use stack allocations for small buffers
bufP = BUF;
buflen = MAX_BUFFER_LEN;
} else {
// use heap allocations for small buffers
buflen = min(MAX_HEAP_BUFFER_LEN, len);
bufP = (char *)malloc((size_t)buflen);
}

Это виндовый код - в линуксе MAX_BUFFER_LEN побольше и зависит от 32/64 jdk
ОтветитьУдалить
Ответы
Ruslan Cheremin29 октября 2012 г. в 18:14
Любопытно. То есть вы хотите сказать, что если посылать в сокет большие массивы, то будет добавляться стоимость аллокации/деаллокации?
ОтветитьУдалить
Ответы
Анонимный30 октября 2012 г. в 17:00
По крайней мере в OpenJDK это так - я правда совершенно не понимаю зачем они так сделали
ОтветитьУдалить
Ответы
Анонимный30 октября 2012 г. в 17:07
Пруфлинк:

http://hg.openjdk.java.net/jdk7/jdk7/jdk/file/00cd9dc3c2b5/src/windows/native/java/net/SocketOutputStream.c
ОтветитьУдалить
Ответы
Ruslan Cheremin2 ноября 2012 г. в 11:22
Действительно. Странная реализация, я не понимаю смысла. Почему бы просто не отправлять кусками по 32К? Аллоцировать буфер в куче только для того, чтобы скопировать в него данные, и отдать в сискол?..
ОтветитьУдалить
Ответы
Анонимный2 ноября 2012 г. в 16:19
FileChannel.transferTo работает через sendFile - то есть это в теории zero-copy операция (http://en.wikipedia.org/wiki/Zero-copy)

У меня в тестах также вышло +20% производительности на NIO при отправке данных из памяти, что достаточно странно.
http://bedrin.livejournal.com/204307.html

Буду продолжать разбираться
ОтветитьУдалить
Ответы

Добавить комментарий

24 марта 2011 г.

IO performance

6 комментариев:

24 марта 2011 г.