![]() |
Показать все 31 сообщений этой темы на одной странице |
HLFX.Ru Forum (https://hlfx.ru/forum/index.php)
- OpenGL (https://hlfx.ru/forum/forumdisplay.php?forumid=7)
-- OpenGL vs Direct3D (https://hlfx.ru/forum/showthread.php?threadid=4400)
OpenGL vs Direct3D
Т.к. ни для кого уже не секрет, что я занимаюсь мультирендером в волатиле, решил создать тему, где буду делиться впечатлениями от обоих API (OpenGL, D3D9) при решении одних и тех же задач.
Если у вас есть собственные наблюдения - пожалуйста, давайте делиться ими в этой теме.
Пока могу сказать, что D3D нравится всё больше и больше.
Назову два интересных момента.
1) Сглаживание (multisample)
Для включения MSAA в OpenGL под виндой требуется пересоздавать окно программы! Почему? Оч. просто. Сначала нужно создать контекст и получить кои-какие функции WGL, т.к. в винде имеются только функции GL 1.1, и остальные надо получать через расширения. Без контекста их получить нельзя. А заодно надо проверить, поддерживается ли MSAA драйвером. Но чтобы создать контекст, надо установить пиксельформат. А изменить его для одного и того же окна уже никак нельзя.
В D3D есть функция CheckDeviceMultisampleType, её можно вызвать до создания девайса. Ничего пересоздавать не требуется.
Справедливости ради отметим, что в Linux окно тоже пересоздавать не нужно, GLX реализован грамотнее, чем WGL.
2) Многопоточный рендеринг
Контекст OpenGL может быть current только для одного потока в каждый момент времени. Поэтому, если мы желаем рисовать в отдельном потоке, надо вызывать в нём wglMakeCurrent. Но что если нам надо, вернувшись в основной поток, тоже выполнить какую-нибудь GL-команду, да хотя бы glReadPixels для скриншута? Мы должны вызвать wglMakeCurrent в основном потоке. Но он уже вызван в потоке рисования! Значит, после рендеринга надо освободить контекст в потоке рисования. Т.е. мы вызываем wglMakeCurrent( hdc, hglrc ) два раза за кадр - в потоке рисования и в основном, а также wglMakeCurrent( hdc, NULL ) тоже два раза. Можно, конечно, слегка оптимизировать, вызывая wglMakeCurrent в основном потоке только тогда, когда мы собираемся выполнять команды OpenGL. Но это сильно усложняет логику - ведь команда снятия скриншута может поступить, вообще говоря, на любом кадре, или, скажем, игрок захочет подгрузить доп. текстурку (скин модели игрока). Но в любом случае как минимум один раз пара вызовов wglMakeCurrent будет вызвана. А эта команда, вообще говоря, довольно затратная - это мы знаем ещё по использованию pbuffer (одна из причин его замены на FBO - именно этот wglMakeCurrent).
В D3D, согласно документации, есть "внутренние механизмы синхронизации", поэтому никакие функции вызывать не надо, можно смело дёргать команды отрисовки из любого потока. В итоге выигрыш от многопоточности становится ощутимее.
__________________
Первый пункт... Ну, в общем-то мне плевать на сглаживание. А если учесть разрешения современных дисплеев, то без него вполне можно обойтись при 1920х1080 и даже при более низком кол-ве пикселей. А вот второй... Если D3D менее затратен, это даёт ему хорошее преимущество. Как человек, ничего толком не смыслящий в кодинге графики, в очередной раз напишу: D3D рано или поздно изломается с новой версией винды. А OpenGL будет соместим. Ну или по-любому будет враппер OpenGL-D3D, исправляющий несовместимость. А вот обратно навряд ли. Уж больно они говённые, врапперы из D3D в OpenGL.
Добавлено 17-05-2014 в 03:33:
У проектов на d3d есть одно маленькое но довольно интересное преимущество (по моим наблюдениям) - они не так капризны к драйверам. Ну т.е. таже халфа спойкойно работает на любом офисном древнющем компутере в д3д, а огл не робит и всё тут - иди ищи дрова .
__________________
У котёнка мокрый нос и гладенькая шерсть, у него забавный хвост и быстрых лапок шесть. Две задних, две средних и две передних лапы, такая многоножка получилася у папы.
Он ученый — папа мой — зверушек изучает, гуляет по помойкам, ловит крыс и чаек. Две крысы белокрылые и чайки две унылые покрытые пупырчатою кожей лягушат без пёрышек тоскуют и ускакать спешат.
А ещё есть муравей большой размером с гуся он пугает всех зверей, и я его боюся, когда он ковыляет на лапках на своих.
И в двери ударяет, и начинает стих: Я — муравей, воды налей! Не меньше ведра, напиться мне пора!
__________________
Тема интересная, жаль что её опять свели к драйверам и осям.
__________________
ㅤ
XaeroX про мантл расскажи что-нибудь. Мне интересно, за ним ли будущее?
Вообще преимущества Д3Д очень сомнительные. Т.е. скорее для программера, чем для юзера (т.к. последнему важнее что его игра запускается везде где надо).
__________________
Минутка полезного:
Бесплатный UT-подобный Half-Life mod.
Бесплатный редактор для 32-битных текстур. Без дотнета.
Бесплатный IDE для любых компиляторов и ЯП.
Бесплатная Windows-подобная ОС.
Проверка грамматики русского языка.
Чат по hl[fx]: [email protected]
__________________
My Projects: download page
F.A.Q по XashNT
Блог разработчика в телеграме
C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'
__________________
Дядя Миша
Ещё раз повторю. Если ты не понимаешь, как что-то можно сделать, это не означает, что это сделать нельзя. И незачем пытаться сводить всё к абсурду, все давно в курсе про твоё искромъотное чувство юмора.
__________________
Я не про то, что нельзя. Я про то, что смысла не имеет.
Даже с мультипоточным рендерером маленькая комнатка с мягкими партиклами выдаёт 30 фпс на 9800GT. Я полагаю в однопоточном рендере будет даже быстрее, из-за отсутствия потерь времени на синхронизацию потоков.
__________________
My Projects: download page
F.A.Q по XashNT
Блог разработчика в телеграме
C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'
Забавно
Тестирую волатилу, карта с кучей полигонов (арканос), оптимизации нет, все сурфасы рисуются скопом, даже без сортировки. Вертексный буфер, но в системной памяти.
OpenGL: 400 fps
Direct3D9: 800 fps
SMP, 4xFSAA, 16xAA.
Крутил и так, и эдак - D3D9 упорно выдаёт более высокий фпс.
Такие дела...
__________________
XaeroX Это GTX275? Если что-то слабее взять, то как с FPS дела?
__________________
Base Defense on Steam, ModDB
На других пока не тестировал. Это, так сказать, первичные замеры.
Буду делиться наблюдениями и дальше.
__________________
OpenGL помогает сажать баги, Direct3D - находить их
Нет, речь пойдёт не о замечательной штуке под названием Direct3D Debug Runtime, и даже не о инструменте PIX. Речь пойдёт о многопоточности и банальных race conditions.
Столкнулся я вчера с удивительной, неописуемой проблемой. Периодически перестаёт применяться вертексный шейдер к отдельным полигонам, и они начинают мерцать. В OpenGL - всё идеально, а в D3D - мерцание. И только при включенной многопоточности. Выключаю статическое кэширование - мерцания нет. Выключаю шейдеры - мерцания нет. Отключаю вызов SetVertexShader( NULL ) (т.е. отключение однажды забинденного шейдера) - мерцания нет. Включаю Debug Runtime - мерцания нет. А так - есть. Гугл, разумеется, был перерыт, и я быстро убедился, что такая проблема возникает только у меня. Я и на драйвер грешил (обновил), и на версию дхсдк (обновил). Ничего не помогало. Мерцает, зараза, и всё тут, словно вертекс-шейдер с перепою и раз в пару сотен кадров просто не хочет биндиться.
Раз дело связано с многопоточностью - остаётся только вариант с race condition, но вот где? Первая мысль, традиционно - не у меня, а у "говнокодеров", написавших директх/драйверы/венду (говнокодерам эта мысль всегда приходит первой ), но я её быстро отогнал. И вот методом многочасового ковыряния в отладчике проблема таки была найдена. Выглядела она в общем случае так:
effect->shader = NULL; |
if ( true ) effect->shader = pshader; |
__________________
__________________
__________________
Минутка полезного:
Бесплатный UT-подобный Half-Life mod.
Бесплатный редактор для 32-битных текстур. Без дотнета.
Бесплатный IDE для любых компиляторов и ЯП.
Бесплатная Windows-подобная ОС.
Проверка грамматики русского языка.
Чат по hl[fx]: [email protected]
Ещё немного о том, за что я ненавижу OpenGL.
В нём трёхкомпонентный secondary color!
Тут надо пояснить. Когда шейдеров не было, вторичный цвет задавал цвет спекуляра, а его альфа-компонент не использовался и считался равным 0. В D3D он игнорировался на этапе обработки данных пользователя (там цвета засылаются как DWORD), а мерзкий OpenGL в функции glSecondaryColorPointer дал чёткую установку: кол-во компонентов, переданное пользователем, всегда 3, иначе ошибка! Типа, смотрите на меня, я OpenGL, я самый умный, а вы тупые юзеры.
Появились шейдеры. Появился резон использовать альфа-компоненту вторичного цвета. Что изменилось в D3D? Он перестал игнорировать альфа-байт, переданный пользователем, и передаёт его в шейдер. Что изменилось в OpenGL? НИЧЕГО! Задать 4-компонентный вторичный цвет нельзя. Ну то есть как? Некоторые драйверы (например, NVIDIA) принимают size = 4 у glSecondaryColorPointer. Но формально это нарушение спеки, а значит, на каком-нибудь интеле может быть ошибка и цвет не будет передан вообще. А самое, блин, интересное - нет никакой возможности проверить, поддерживает ли драйвер size = 4 (ну кроме как вызвать функцию и посмотреть glGetError).
Конечно, некоторые скажут - зачем тебе glSecondaryColorPointer, если есть glVertexAttribArray? Ответ: для ARB_vertex_program те же самые ограничения, а использование GLSL у меня опционально, т.к. он ухитряется глючить на некоторых видеокартах (особенно интелах).
И ещё. Железо, разумеется, использовало все 4 байта вторичного цвета. Альфа-компонент часто хранил Fog coordinate. Однако от пользователя это скрывалось. Следовательно, никаких препятствий задавать 4-компонентный вторичный цвет технически нет и быть не могло.
__________________
Однако, здравствуйте.
Сегодня речь пойдёт о Радеонах - да, мы словно снова в 2005 году. Но не о Direct3D (хотя наверняка под ним всё было бы отлично!), а о кривых OpenGL-драйверах (или какой-то ещё НЁХ??) в 2018 году, Карл.
Имеется макбук с ОС High Sierra, Radeon Pro 555.
Запускаю движок и с изумлением замечаю, что отвалились многие эффекты, как-то вода, софт-партикли, некоторые постфильтры. Начинаю смотреть внимательно и быстро прихожу к выводу, что проблема в том, что в шейдеры попадает неправильная текстура глубины экрана.
А конкретно - вызов glCopyTexSubImage2D не отрабатывает и ничего не копирует. При этом не возникает никаких ошибок! Та же ситуация - с glCopyTexImage2D. Безуспешно перепробовал все мыслимые форматы depth-текстуры - включая depth-stencil - обнаружил, что единственное, что работает - это связка glReadPixels + glTexImage2D. А копирование текстуры - ни в какую! Как тебе такое, Стив Джобс?
Понятное дело, что на другом макбуке с GeForce GT 750M всё работает без каких-либо багов, и полностью соответствует картинке десктопа (где у меня тоже GeForce)...
__________________
Обычные текстуры тоже не копируются?
ncuxonaT
Обычные превосходно копируются. Проблема только с копированием глубины и только через glCopyTex(Sub)Image.
Попробую подкостылить для мобильных радеонов копирование через glReadPixels-> PBO ->glTexSubImage, по скорости должно быть сопоставимо, но не удивлюсь, если и оно не работает.
Самое мерзкое тут то, что glGetError не возвращает никаких ошибок.
__________________
__________________
My Projects: download page
F.A.Q по XashNT
Блог разработчика в телеграме
C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'
Это не может быть связано с тем, что на радеонах с GCN-архитектурой текстуры глубины хранятся сжатыми, пока из них не начнешь читать?
ncuxonaT теперь увяжи в эту теорию GL_POLYGON_OFFSET.
__________________
My Projects: download page
F.A.Q по XashNT
Блог разработчика в телеграме
C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'
Дядя Миша на форумах пишут, что старые радеоны не поддерживают gl_FragCoord хардварно, оно как-то эмулируется через varying. Видимо, с оффсетом сэмулировать не получается, и всё идёт по одному месту.
ncuxonaT это я тоже читал, но связи как-то не уловил. Полигоноффсет это просто оффсет такой.
__________________
My Projects: download page
F.A.Q по XashNT
Блог разработчика в телеграме
C:\DOCUME~1\C4C5~1\LOCALS~1\Temp\a33328if(72) : see declaration of 'size_t'
__________________
Временная зона GMT. Текущее время 13:54. | Показать все 31 сообщений этой темы на одной странице |
На основе vBulletin версии 2.3.0
Авторское право © Jelsoft Enterprises Limited 2000 - 2002.
Дизайн и программирование: Crystice Softworks © 2005 - 2024