>рабочие заметки: Stack allocation vs scalar replacement

17 февраля 2016 г.

Stack allocation vs scalar replacement

Самурай без меча подобен самураю с мечом, только без меча

Когда мы говорим об аллокации в java, регулярно всплывает тема аллокации объектов в куче против аллокации объектов на стеке. Начиная с jdk 1.6 Sun (а потом уже и Oracle) заявляет, что JIT умеет анализировать область жизни создаваемых объектов (escape analysis — "анализ убегания" как-то не очень звучит по-русски) и не выделять память в куче под те объекты, которые не покидают границ метода. Неформально об этом часто упоминают как "JIT умеет аллоцировать объекты на стеке". Официально же документация не говорит об аллокации на стеке, она говорит о скаляризации (scalar replacement). В чем разница?

Разница существенная. Объект, аллоцированный на стеке — это ровно такой же объект, как и объект, аллоцированный в куче, только на стеке. Порядок полей, выравнивание, системные поля, типа _vtable в C++ или object header в яве — все это должно быть одинаковым в обоих вариантах аллокации, иметь один и тот же размер и смещения. Почему? Потому что если мы возьмем ссылку/указатель на объект на стеке, и такой же объект в куче, то доступ к полям объекта через эти ссылки не должен зависеть от того, где объект аллоцирован. Или необходимо будет вводить признак "где объект расположен", и каждый доступ к каждому полю объекта будет тогда идти через дополнительные проверки типа расположения, и выбор соответствующего смещения.

Это аллокация на стеке. Которой в джаве нет — ни явной, ни автоматической. А есть (автоматическая) скаляризация. Скаляризация (scalar replacement) — это превращение объекта в набор полей (т.е. скалярных значений), которые раскладываются в локальные переменные текущего метода. Вместо того, чтобы выделять на стеке память под v = Vector2D(double x, double y) — мы просто добавляем в список локальных переменных метода double v$x, double v$y, и все обращения к v.x/v.y перенаправляем к ним. Объект как целое исчезает, появляется россыпь независимых полей, спроецированных на локальные переменные.

Чем это круче? Тем, что компилятору не нужно соблюдать порядок полей. Скаляризованные поля объекта уже не обязаны идти подряд, в фиксированном порядке — компилятор может разложить их в свободные слоты на стеке как ему удобно. Может использовать один слот под несколько переменных, если их области использования не пересекаются. Если у компилятора достаточно свободных регистров — он может вообще не выделять под эти поля слоты на стеке. Более того, компилятор может вообще выкинуть какие-то поля, если обнаружит, что в данном методе они не используются. (Если у Vector2D есть поле для хранения hashCode, на манер String, но в данном методе никто у вектора хэшкод не спрашивает, то и поле создавать не нужно). Короче говоря, весь спектр оптимизаций, применимых к компоновке локальных переменных, теперь применим и к скаляризованным полям.

Недостаток же у скаляризации один: раз объекта больше нет, то и ссылку на него тоже не получишь, а значит никуда за пределы текущего метода объект по ссылке передать не получится. То есть скаляризация работает если объект достижим исключительно в пределах одного метода. Поэтому в джаве напрашивается именно скаляризация: ведь мы начинаем с того, что доказываем, что ссылка на объект никуда за пределы метода не уходит (escape analysis), и только тогда пытаемся устранить аллокацию в куче. Раз уж мы все равно знаем, что ссылка на объект нам не понадобится — то почему бы не получить заодно бонусы скаляризации?

36 комментариев:

Vladimir Dolzhenko17 февраля 2016 г. в 20:33
Что происходит с массивом, который распихать по регистрам не получится, но никуда за пределы метода он явно не утекает ?
ОтветитьУдалить
Ответы
Anton17 февраля 2016 г. в 21:55
И с векторными операциями над этим массивом
ОтветитьУдалить
Ответы
Artem Bakulin17 февраля 2016 г. в 22:49
И еще интересно, считается ли escape'ом вызов какого-нибудь String.valueOf(myLocalObject). Есть подозрение, что если JIT заинлайнил String.valueOf(), то никто не помешает ему потом вычислить, что myLocalObject не покидает границ метода.
ОтветитьУдалить
Ответы
Alexander Toktarev22 февраля 2016 г. в 22:27
Я тут недавно слышал про новый язык "D".
Говорят там можно отдельно управлять кусками хипа как своего рода зонами.

Даешь разделение хипа в Java по зонам.

boolean turn_off_gc=true
HeapSegment segment = new HeapSegment(turn_off_gc);
ОтветитьУдалить
Ответы
Alexander Toktarev22 февраля 2016 г. в 23:53
Этот комментарий был удален автором.
ОтветитьУдалить
Ответы
Unknown23 февраля 2016 г. в 00:12
Про агрегацию 100тб в хипе. Можно чуть подробней - на каком железе эта задача решается? Chronicle и подобные..?
ОтветитьУдалить
Ответы
Alexander Toktarev23 февраля 2016 г. в 00:14
Этот комментарий был удален автором.
ОтветитьУдалить
Ответы
Vitaly Maryin23 марта 2016 г. в 01:10
"то массив скаляризуется до length=64"
на самом деле предел 64 очень условный - для byte[64] - да, но вот с double[64] всё интереснее.
В общем случае, память под массив не должна быть больше (TrackedInitializationLimit * HeapWordSize)
ОтветитьУдалить
Ответы
Vitaly Maryin30 марта 2016 г. в 15:05
путь - PhaseMacroExpand::scalar_replacement-> PhaseMacroExpand::value_from_mem-> InitializeNode::find_captured_store-> InitializeNode::captured_store_insertion_point
ОтветитьУдалить
Ответы

Добавить комментарий

17 февраля 2016 г.

Stack allocation vs scalar replacement

36 комментариев:

17 февраля 2016 г.