>рабочие заметки: Массовые расстрелы и духовная практика смирения

2 февраля 2016 г.

Массовые расстрелы и духовная практика смирения

— Микола, ты слыхал как профессиональные программисты ^тм наш newValue кличут?
— Не, а как?
— "о"!
— Да ну! Вот же ж нелюди, поубивал бы гадов!

Разбирался сегодня в одном из наших сервисов, который использует довольно старую версию trove (2.1.0)

Цитата из THashMap.Entry.setValue():

public V setValue(V o) {
    if (_values[index] != val) {
        throw new ConcurrentModificationException();
    }
    _values[index] = o;
    o = val; // need to return previous value
    val = o; // update this entry's value, in case setValue is called again
 
    return o;
}

Возьмите себе минуту времени на то, чтобы найти в нем ошибку.

Нашли?

Теперь так (o -> newValue):

public V setValue(V newValue) {
    if (_values[index] != val) {
        throw new ConcurrentModificationException();
    }
    _values[index] = newValue;
    newValue = val; // need to return previous value
    val = newValue; // update this entry's value, in case setValue is called again
 
    return newValue;
}

Стало очевиднее?

Возможно, что нет.

Тогда еще одна попытка (+final):

public V setValue(final V newValue) {
    if (_values[index] != val) {
        throw new ConcurrentModificationException();
    }
    _values[index] = newValue;
    newValue = val; // need to return previous value
    val = newValue; // update this entry's value, in case setValue is called again
 
    return newValue;
}

... упс, так написать нельзя – будет ошибка компиляции при присвоении значения
final переменной. Придется завести еще одну переменную (внимательный читатель
заметил, что заодно мы уже вынуждены исправить одну из ошибок – в .val
записывалось ее же старое значение, вместо нового):

public V setValue(final V newValue) {
    if (_values[index] != val) {
        throw new ConcurrentModificationException();
    }
    _values[index] = newValue;
    final V oldValue = val; // need to return previous value
    val = newValue; // update this entry's value, in case setValue is called again
 
    return newValue;
}

...Странно: мы хотим вернуть из метода старое значение, а возвращаем – новое.
Что-то здесь не так. Исправим:

public V setValue(final V newValue) {
    if (_values[index] != val) {
        throw new ConcurrentModificationException();
    }
    _values[index] = newValue;
    final V oldValue = val; // need to return previous value
    val = newValue; // update this entry's value, in case setValue is called again
 
    return oldValue;
}

Итого: 2 ошибки (!) в коде из 7 строчек. Совсем не очевидные в исходном варианте (я лично потратил несколько минут).

А чтобы эти ошибки стали очевидны (и, скорее всего, даже и не попали бы в репозиторий) достаточно было бы:

объявить все локальные переменные и аргументы методов final
назвать переменные своими именами
не переиспользовать локальные переменные, а заводить новые (смотри так же пункт 2)

тогда на одну из этих ошибок укажет компилятор, а вторая становится достаточно очевидной глазу (Куда уж очевиднее: " – Что мы хотим сделать? – Вернуть старое значение. – А что написано? – return newValue")

Конечно, после драки завсегда легко кулаками помахать. Мне-то на исходную ошибку вообще указал findbugs (справедливости ради, я и не собирался ревьювить код trove). Однако в моей практике я регулярно сталкиваюсь с тем, что достаточно выполнить эти 3 пункта, и запутанные методы становятся понятными, а глупые ошибки начинают бросаться в глаза. Почему люди так не делают? Это третий величайший вопрос на свете после "откуда пыль берется" и "куда деньги деваются".

Когда я сталкиваюсь с подобными сценариями, у меня создается твердое ощущение, что многие программисты всерьез считают свой мозг самым крутым компьютером на свете. Типа – раз я управляю этим примитивным кремниевым i7, значит я умнее его. И поэтому я даже не буду предполагать, что мой мозг может запутаться в 7 строчках кода с 3 переменными – да ну, это невозможно, я же профессионал, я в такой ерунде не ошибаюсь. И зачем я буду помогать себе, выбирая осмысленные имена для переменных? Это для слабаков, настоящие профессионалы не нуждаются в таких костылях.

...Человеческий мозг может быть и превосходит по мощности – формально – любой существующий суперкомпьютер. Вот только у любого вычислителя есть сильные и слабые стороны, и слабенький DSP умножает матрицы в сотню раз быстрее, чем человеческий мозг. Математика, логика, синтаксический разбор, анализ потоков данных и синтаксических деревьев, программирование (в том виде, в котором мы его сейчас знаем) – не относятся к сильным сторонам человеческого мозга. Даже близко не относятся. То, что мы можем (лет за 5-10-20 ежедневного опыта) научить свой мозг как-то все это делать – вовсе не означает, что мозг делает это хорошо. Мозг не делает это хорошо, и никогда не будет, просто (пока) никто не делает это лучше, поэтому мы вынуждены решать эти задачи используя такой неподходящий биологический компьютер. Я, может, неожиданную мысль скажу, но никто в мире не программирует хорошо. Хорошо работает компилятор: javac на моем компьютере распарсит и скомпилирует несколько тысяч файлов за пару десятков секунд без единой ошибки – вот это хорошая работа. Кто может похвастаться, что превратил несколько тысяч страниц бизнес-спецификации в код без единой ошибки хотя бы за неделю? Хоть раз в жизни? Никто таким не может похвастаться, нет таких людей. Никто из нас не программирует хорошо, по 5-бальной шкале мы все в пределах тысячных долей от нуля. Мы занимаемся этим только и исключительно потому, что компилятора не формализованных бизнес-спецификаций пока не придумали.

К чему это я? К тому, что, раз уж эта работа для мозга сложная, то необходимо использовать любые способы помочь мозгу делать эту сложную работу, к которой он совершенно не подготовлен эволюционно. Любые способы как-то подключить сильные стороны мозга к решению столь непрофильных задач. Давая же бессмысленные имена переменным, переиспользуя их где ни попадя – я усложняю мозгу и без того сложную задачу.

...Только ~~массовые расстрелы~~ регулярная практика смирения спасет IT-отрасль. Ежеутренняя получасовая медитация, прямо перед стэндапом: "Я обычный человек, мой мозг слаб, грешен, и подвержен ошибкам. Мой мозг не способен надежно оперировать более чем 3-4 единицами информации одновременно. Мой мозг нуждается в подсказках. Никто не способен писать код без ошибок, и я тоже не способен. Даже если очень стараюсь – в моем коде есть ошибки. Моя задача – сделать мои ошибки очевидными любому, кто читает мой код..."

P.S. На всякий случай: в какой-то версии trove старше 2.1.0 эта ошибка была исправлена. Я не смог отследить, в какой именно: в старом CVS репозитории ошибка присутствует везде, в "новом" SVN репозитории ее нет.

26 комментариев:

Roman Leventov2 февраля 2016 г. в 20:56
> trove

Зачем, когда есть fastutil/GS/koloboke/hppc/hppc-rt?
ОтветитьУдалить
Ответы
Vladimir Dolzhenko3 февраля 2016 г. в 01:33
это чтобы не обфускачить - сразу двух зайцев убить.

у нас народ прочно сидит на трове, хотя вот пинаю их на fastutil или колобок перевести, но в начале code style типа тех же checkArgument и @NotNull по-умолчанию - от трова еще дурацкая привычка возвращать 0... хотя это может быть и валидное значение

словом - стираем пыль
ОтветитьУдалить
Ответы
Alexander Toktarev4 февраля 2016 г. в 14:08
Я тут как то измерял troove vs kolobok
troove как то заметно производительнее оказался
Не знаю может я что то неправильно готовил
ОтветитьУдалить
Ответы
Alexander Toktarev4 февраля 2016 г. в 14:12
Руслан проблема человеческого мозга не в том что он не умеет считать или писать код - а в том что ему постоянно мешают.

Мозг успешно в состоянии используя воображение конструировать
великолепные вычислительные модели.

Если эти модели правильные - то код будет писать просто и правильно.

ОтветитьУдалить
Ответы
Vladimir Dolzhenko4 февраля 2016 г. в 21:04
вау! таки да - мы таки затриггерили trove'ом баг в компиляторе в jvm - правда проблема уже известна - https://bugs.openjdk.java.net/browse/JDK-8081379
но всё же!
ОтветитьУдалить
Ответы
Maccimo6 февраля 2016 г. в 06:15
> final T oldValue = val;

Точно T?
ОтветитьУдалить
Ответы
asolntsev2 марта 2017 г. в 01:07
Отличный статьюн!

Я примерно такими же аргументами защищаю необходимость писать юнит-тесты.
ОтветитьУдалить
Ответы
Yeahitsme5 августа 2017 г. в 01:08
На самом деле ошибка там только одна - val не меняется (иначе ошибку обнаружили бы раньше) поскольку сначала о становится равным ему, после чего val фактически присваивается сам себе:

o = val; // need to return previous value
val = o; // update this entry's value, in case setValue is called again

Так что возвращается старое значение, ошибка внесена при исправлении (при добавлении переменной oldValue её следовало бы использовать и ниже).
ОтветитьУдалить
Ответы

Добавить комментарий

2 февраля 2016 г.

Массовые расстрелы и духовная практика смирения

26 комментариев:

2 февраля 2016 г.