ComradeAndrew
Ну в 2013 ты же как-то отключил?
В 2010 в настройках можно выбрать тулсет. На v100 используется FPU, если явно не включить SSE настройкой /arch. То же самое поведение у GCC/MinGW.
XaeroX
Не. На тулсете v120, как и на v100 я ничего не менял, а по дефолту там настройка /arch (not set).
Нашел где эта настройка. Итак, давай теперь по порядку.
Везде оптимизация /O2:
Ну странно, почему он не хочет использовать fcomi/fcmovb? Полагает, что распределяет нагрузку между целочисленным и floating-point модулями?
А какой вариант быстрее у тебя оказывается? Можешь по-быстрому спрофилировать, плз?
~ X ~ писал: Кстати, ЕМНИП, кто-то (оп) очень любил десяточку и мне её жаоко рекомендовал
Я рекомендовал микрософтовский компилятор как таковой. В целом-то он более быстрый код генерит. Я собирал старую волатилу мингвом и десяткой, в десятке, по ощущениям, было немного быстрее. То есть там, вероятно, есть другие моменты, которые реализованы лучше, чем в мингве.