您现在的位置:首页 >> 新开传世sf >> 内容

这部分地形渲染的时间从5

时间:2017-12-14 8:44:29 点击:

  核心提示:文章作者:英特尔:卢卷彬 Kiefer Kuoh 腾讯:丛越下载PDF版本:使用英特尔GPA优化《轩辕传奇》游戏的本能机能随着集成显卡功用和本能机能的日益加强以及挪动转移平台的不竭遍及,集成显卡已经成了游戏作战者不可看不起的紧急对象。本文先容了使用GPA在英特尔集成显卡上判辨和优化《轩辕传奇》网络游...



文章作者:英特尔:卢卷彬 Kiefer Kuoh 腾讯:丛越




下载PDF版本:使用英特尔GPA优化《轩辕传奇》游戏的本能机能







随着集成显卡功用和本能机能的日益加强以及挪动转移平台的不竭遍及,集成显卡已经成了游戏作战者不可看不起的紧急对象。




本文先容了使用GPA在英特尔集成显卡上判辨和优化《轩辕传奇》网络游戏的案例。看看传世45woool。《轩辕传奇》是由腾讯研发团队制造的一款MMORPG网游,是腾讯的首款史诗战争网游。该游戏在引擎技术、美术、任职器等诸多方面都力图字斟句酌,抵达了国际顶级网游水准。为了知足更多玩家的机器配置,我们特别针对集成显卡举办了测试和优化。







本文档的判辨和优化基于Intel HD Graphics 3000平台,代号Son the grounds ththrough well on the grounds ththroughyBridge(简称SNB)。SNB是Intel在2011年推出的一款本能机能相当卓异的治理器集成显卡。它的本能机能不妨媲美一些独立显卡。作为一款网络游戏,《轩辕传奇》的作战者蓄意能够在更多的平台下面流利运转游戏,我本沉默传奇网站。所以即使游戏在SNB上的本能机能已经很流利了,我们还是要尽量的对游戏本能机能举办优化。


以下是我们这次本能机能判辨和优化所采用的倾向场景:









图1. 《轩辕传奇》本能机能判辨和优化的倾向场景









GPA HUD能够实时的展示游戏运转的时辰CPU,DXruntime,以及GPU上的本能机能数据。同时支持多种D3D流水线上的override形式,襄理游戏作战者进一步定位游戏的瓶颈所在。




经历GPA HUD的判辨,我们发掘:传奇世界手游怎么升级快。




1.游戏的大大都计算都是在主线程中完成,多重点欺骗率斗劲低。那么在玩家角色多的时辰,由于动画计算斗劲多,CPU将会成为瓶颈。不妨斟酌使用多线程来打消这种场景下的瓶颈。时间。




2. 游戏中每帧的Stdined Chanyges数量不算很多,可能每帧6000个,均匀每个DP cthe7.5次。能够做一些优化简略节略Stdined Chanyges数量的话,对本能机能是很有便宜的。




3. 经历Override形式测试,Null Driver- Null Hardwshould always都不妨使游戏的fps抵达100左右,100fps是游戏的限帧。所以在该场景下游戏的瓶颈是在GPU上。我们还在玩家角色斗劲多的场景举办了相像测试,发掘NullHardwshould always对fps擢升不大,单职业传奇网站有哪些。此时瓶颈在CPU上。












GPA帧判辨器能够周详的判辨游戏的一帧的总共drawcthe的本能机能数据以及它们所使用的纹理,d3d形态,shlistinger等等。图2展示了我们使用GPA帧判辨器掀开我们在倾向场景抓取的一帧数据。对于传奇世界手游正版下载。














图2. 使用GPA帧判辨器掀开抓取的一帧数据







经历帧判辨器判辨,我们取得整个一帧的时间散布为:







生成暗影贴图:~170

个 DP Cthes- 15.9% frareetime。场景中总共的物体都计算了实时暗影。我们不妨使用动态暗影来替代其中的一局限,歧某些间隔远的,巩固的物体。



天际盒: 3个 DP Cthes,4.7% frareetime。听听无赦单职业传奇网站。现实上在该场景中看不到天际,我们不妨在渲染天际盒之前举办可见性检测。倘使不可见,则不渲染。



Terrain:50个 DP Cthes,34.9% frareetime。和大大都网络游戏一样,地形总是最耗时的局限,是优化的重点。



人物和其他地上物件:~240个DP Cthes,22.4% fraree time。没有发掘明明的不妨优化的地址。



后治理:8个DP Cthes,今日新开传奇网站。8.4% fraree time。没有发掘明明的不妨优化的地址。



UI:55 DP Cthes,7.4% frareetime。有许多UI元素过小,不妨归并一下再渲染。传奇世界手游官网下载。UI并不是每帧都变化的,不妨反复欺骗上一帧的收场。













游戏破钞了破钞了~170个drawcthes来生成总共物体的暗影贴图,想知道这部分地形渲染的时间从5。但现实上,场景中某些巩固的物体或者远处的物体,是没有必要使用实时计算的暗影的,使用提早生成的动态暗影即可。这不妨省俭drawcthes的数量,进步本能机能。图3是优化前后的对比,左边是优化后的暗影贴图生成,简略节略了使用实时暗影的物体数量,不妨看到drawcthes数量简略节略到了45个,整个暗影地图生成破钞的时间从2.97ms简略节略到了1.03ms。









图3. 优化前和优化后的暗影贴图计算




2. 天际盒




天际盒在这个场景中是不可见的,但是帧判辨器展示游戏已经渲染了它。我们不妨在渲染之前检测天际盒的可见性,倘使不可见,这部分地形渲染的时间从5。则不渲染。这不妨省俭0.88ms。而且,天际盒最好是放到场景中不透亮物体渲染完之后再渲染,由于天际盒的大局限都是被遮挡的。









图4. 游戏渲染了不可见的天际盒


3. 地形




地形局限的渲染占用了最多的时间,网络游戏一样平常都是这样。


其中一局限主要的地形,占用了6.5ms中的5.1ms,它们使用的同一段Pixel Shlistinger,以下是这局限地形的截屏:这部。









图5. 局限地形使用异样的Shlistinger,包括89个指令,其中13个纹理lolisting,76个算术指令


过帧判辨器我们不妨看到,这局限地形的渲染,PS durine占用了90%的时间,在帧判辨器中我们不妨在ShlistingerTabdomining观察这些渲染所使用的shlistinger code,如图5所示,这局限地形的shlistinger包括了89条指令,其中13个纹理lolisting,76个数学计算,斗劲庞杂。




我们把shlistinger做了一定的简化,去掉了高光,学会传世开服。norming map,AO map等。传奇世界手游变态辅助。图6是窜改了pixelshlistinger后的截图,窜改后pixel shlistinger包括31条指令,其中8个纹理lolisting,23个算术指令。这局限地形渲染的时间从5.1ms简略节略到了3.4ms。









图6. 优化shlistinger代码后,单职业传奇网站有哪些。这局限地形所破钞的时间简略节略到了3.4ms




我们还为特别低端的平台绸缪了加倍简略单纯的,只必要2个纹理的shlistinger版本,时间进一步简略节略到了0.93ms,见图7所示:









图7. 在更低端平台上进一步简化地形的pixel shlistinger




当然,使用2个纹理后,地形画面质量决定有所降低。在GPA帧判辨器我们能够实时的看到窜改shlistingercode后对画面的影响。







UI局限共占用7.4%的时间,图8是游戏中左上角的人物UI截屏。对于无赦单职业传奇网站。









图8. 游戏中左上角的角色UI




经历帧判辨器,我们发掘为了画游戏左上角的人物头像以及血槽等局限,游戏使用了9个drawcthes来完成(图9),而且是每一帧都会破钞9个drawcthes来做这件事情。但是对网络游戏来说,99%的时间,今日新开传奇网站。这局限是不会变化的,那么每帧都使用9个drawcthe来画这局限,是没有必要的。我们不妨把这个头像局限先渲染到一个imgrow old lolisting,然后使用一个drawcthe把这个imgrow old画到屏幕上,地形。倘使下一帧这个头像局限没有更新,则继续使用上次的这个imgrow oldlolisting。这样一来,惟有在头像局限必要更新的时辰,才去重新做这9次draw
cthes,其他时辰,只必要一个draw cthe就完成了。想知道传奇世界手游下载。









图9. 游戏使用了9个draw cthes来完成这局限UI的渲染




图10展示了优化后的截图,这一帧重欺骗了imgrow old lolisting,只使用了一个drawcthes就完成了这局限UI的渲染。我们对其它的UI也举办了相像的优化。优化后,渲染UI所破钞的时间从1.38ms简略节略到了1.17ms。









图10. 使用imgrow old lolisting来存储这局限UI以便反复使用




Stdined Chanyges过多会招致游戏轨范,d3d runtime- 显卡驱动和显卡硬件的负载弥补。简略节略StdinedChanyges的数量能够进步游戏本能机能。学习传奇世界手游官网开服。经历帧判辨器对这一帧的周详判辨,我们发掘有很多的drawcthes,都会使用很小的纹理,16*16,32*32或者64*64大小,大批的使用小纹理,不是一种有用率的做法。图11展示了两个相邻的drawcthes使用了相当小的纹理:









图11. 两个相邻的draw cthes,都使用了相当小的贴图




从下面图11中我们看到,临近的的2个draw cthes-分散调用了3个SETTEXTUREAPI,其中第二和第三个texture,都是很小的纹理(见图12)。我们不妨归并这些小的纹理,你看渲染。然后只必要设置一次归并后的纹理,接上去的几个drawcthes就不妨间接使用,而不消再设置了。这不妨简略节略StdinedChanyges的数量。当然,你知道今日新开传奇网站。使用归并纹理的时辰要注意设置准确的UV值。







图12. 这些draw cthes所使用的小尺寸纹理




图13和14是优化后的截屏,我们归并了3个draw cthes所使用的小纹理,SETTEXTUREAPI调用的次数从9次简略节略到了4次。整个一帧,我们简略节略了~500次Stdined Chanyges。







图13. 归并纹理后,3个draw cthes所调用的SETTEXTURE API从9次简略节略到了4次









图14. 将小纹理归并后取得的大纹理









我们先容了在英特尔集成显卡平台上经历GPA对游戏本能机能举办判辨和优化的得胜案例。GPA工具襄理我们找到了游戏的瓶颈所在。事实上无赦单职业传奇网站。我们使用它对一帧举办了深刻的判辨,对shlistinger举办了实时窜改,并找到了简略节略Stdinedchanyges数量的方式。经过优化,游戏本能机能取得了很大擢升,能让更多玩家流利体验轩辕传奇这款游戏。其实我们还使用GPA对其他不同场景,不同形态(聊天,骑乘,战争,换装,才能特效等),不同平台(各个厂商的独立显卡,集成显卡以及不同型号的CPU),不同体系举办了各种测试,限于篇幅这里只挑出了一个有代表性的例子。其实部分地。



作者简介:


卢卷彬 是英特尔公司的应用工程师,他和国际几家大的游戏公司有着多年的互助,襄理他们在英特尔平台上优化游戏客户端的本能机能。


丛越 有8年以上的游戏作战阅历履历,他参与了中国最晚期的3DMMORPG的作战,有着相当雄厚的阅历履历。丛越今朝上任于腾讯,主要负担游戏和引擎的作战。


Kiefer Kuoh 是英特尔的软件工程师,他主要负担游戏在英特尔平台上的优化事情。




Appendix A:

Plthroughform Configurine:CPU: Intel Core i7-2720QM @ 2.20GHz- with HD3000 graphics
Memory: 8GB DDR3 1333Mhz


HD: Intel 160G SSD


OS: Windows 7 Professioning- 64word


Graphics Driver: 8.15.10.2509

热血传奇中变

作者:中博晚报 来源:majayb
相关评论
发表我的评论
  • 大名:
  • 内容:
  • 传奇世界私服发布网(www.toolingfittings.com) © 2019 版权所有 All Rights Reserved.
  • 新开传世sf,变态传世私服,传奇世界私服发布网 沪ICP备08114320号-1
  • Powered by laoy! V4.0.6