回击MLAA:NVIDIA FXAA抗锯齿性能实測、画质对照

摘要:
PC游戏玩家肯定会熟悉各种AA抗锯齿技术。今天,本文的主角是NVIDIA今年推出的新抗锯齿技术“FXAA”。与MLAA进行比较。此截图来自NVIDIA。最左边是FXAA收盘。FXAA在Radeon HD6870上再次获胜。MLAA平均比FXAA慢37.1%。
PC游戏玩家肯定会对各式各样的AA抗锯齿技术很熟悉,而今天本文的主角就是NVIDIA今年才推出的新型抗锯齿技术“FXAA”。

FXAA在某种程度上有些类似于AMD之前宣传的MLAA(形态抗锯齿)。但远比后者低调。所以非常多玩家可能还从来没听说过。可是假设你玩过《永远的毁灭公爵》或者《F.3.A.R》。应该会有所耳闻。

今天我们就来实际測測多款显卡上的FXAA性能和画质表现。并将其与MLAA进行简单对照。

什么是FXAA?

FXAA全称为“Fast Approximate Anti-Aliasing”。翻译成中文就是“高速近似抗锯齿”。它是传统MSAA(多重採样抗锯齿)效果的一种高性能近似值。

它是一种单程像素着色器,和MLAA一样执行于目标游戏渲染管线的后期处理阶段,但不像后者那样使用DirectCompute,而仅仅是单纯的后期处理着色器,不依赖于不论什么GPU计算API。正由于如此,FXAA技术对显卡没有特殊要求,全然兼容NVIDIA、AMD的不同显卡(MLAA仅支持A卡)和DX9、DX10、DX11。

相比于MSAA,FXAA的目标是速度更快、显存占用更低,还有着不会造成镜面模糊和亚像素模糊(表面渲染不足一个像素时的闪烁现象)的优势。而代价就是精度和质量上的损失。

依照FXAA技术开发人员Timothy Lottes的说法,GeForce GTX 480利用FXAA Preset 2(另外一种预设)处理一帧1920×1200分辨率画面时所需时间不到1毫秒。

FXAA如今有三种版本号:“FXAA 1”是最早最基础的版本号。也是在PC游戏中使用最广泛的。已用于《F.3.A.R》、《永远的毁灭公爵》、《柯南时代》、《Crysis 2》、《无主之地》等等;“FXAA 2”是针对Xbox 360游戏机专门设计的;“FXAA 3”又有两种算法,Quality质量版本号面向PC,Console主机版本号则面向Xbox 360、PS3。

FXAA 3相比于FXAA 1有非常明显的性能优势,GeForce GTX 480 DX11默认设置下使用FXAA 3 Quality处理典型的720p分辨率画面仅仅须要大约0.21毫秒。

另外DX9、DX11模式下性能差异会非常大,当中DX11更快一些

FXAA官方技术白皮书:
http://developer.download.nvidia.com/assets/gamedev/files/sdk/11/FXAA_WhitePaper.pdf

NVIDIA FXAA抗锯齿性能实測、画质对照
从左到右:无AA、4xMSAA、FXAA

NVIDIA FXAA抗锯齿性能实測、画质对照
FXAA算法过程

NVIDIA FXAA抗锯齿性能实測、画质对照
FXAA演示

本次測试的平台配置例如以下:

处理器:Core i7-920 OC 3.6GHz
主板:华硕P6T6 WS Revolution
内存:海盗船DDR3-1600 6GB
硬盘:西部数据500GB SATA
电源:酷冷至尊Real Power Pro 1250W
显示器:戴尔3007WFP (DVI)
操作系统:Windows 7 Ultimate SP1 x64

显卡:

GeForce GTX 580 772/1544/4008MHz
GeForce GTX 570 732/1464/3800MHz
GeForce GTX 560 Ti 822/1645/4000MHz
Radeon HD 6970 880/5500MHz
Radeon HD 6950 800/5000MHz
Radeon HD 6870 900/4200MHz

驱动程序:

GeForce 275.50 Beta
Catalyst 11.6 WHQL

FXAA、MSAA性能对照

測试场景选择《F.3.A.R》(版本号16.0.20.1060)游戏中画质要求更高的Intervals 07。从開始录制帧率。直到Alma尖叫导致Armacham直升机坠毁为止。时长15-18分钟。为了便于保证測试过程的一致性,期间使用了上帝模式。开启DX11、16xAF,分辨率依照显卡不同有高中低三个档次。

经过衡量。平均帧率至少应该达到37FPS才干保证游戏的全然流畅。

NVIDIA FXAA抗锯齿性能实測、画质对照

GeForce GTX 580开启FXAA之后相比于不开启不论什么AA性能平均损失11.7%。平均帧率依旧有56.7FPS。 

NVIDIA FXAA抗锯齿性能实測、画质对照

GeForce GTX 580上开启2xAA速度降为43.1FPS,相比于FXAA慢了13.6%,进一步开启4xAA又比2xAA慢了38%(此时已经无法保证流畅),因此从FXAA到4xAA的降幅为52.8%。就看FXAA、2xAA、4xAA谁的画质效果好了。 

NVIDIA FXAA抗锯齿性能实測、画质对照

Radeon HD 6970开启FXAA后平均速度为55.6FPS,比不开启AA损失了14.7%,稍微输于GeForce GTX 580。 

NVIDIA FXAA抗锯齿性能实測、画质对照

Radeon HD 6970开启2xAA、4xAA分别比FXAA慢了17.4%、50.9%。 

NVIDIA FXAA抗锯齿性能实測、画质对照

GeForce GTX 570 FXAA分别比2xAA、4xAA快了24.8%、35%。只是由于分辨率减少,4xAA下平均帧率依旧接近40FPS。

NVIDIA FXAA抗锯齿性能实測、画质对照

Radeon HD 6950相同条件下的差距是16.1%、30.9%,最慢也有44FPS。

NVIDIA FXAA抗锯齿性能实測、画质对照

GeForce GTX 560 Ti上2xAA、4xAA分别慢了23.1%、50%。 

NVIDIA FXAA抗锯齿性能实測、画质对照

Radeon HD 6870上则是15.8%、37.8%。

FXAA、MSAA画质对照

下面截图的原始分辨率均为2560×1600。细节设为最高。

NVIDIA FXAA抗锯齿性能实測、画质对照

NVIDIA FXAA抗锯齿性能实測、画质对照

NVIDIA FXAA抗锯齿性能实測、画质对照

NVIDIA FXAA抗锯齿性能实測、画质对照

我们之前就说过,FXAA不管对N卡还是A卡都适用,并且没有区别对待。来自GeForce GTX 580、Radeon HD 6970的截图都显示了差点儿相同的效果

FXAA的抗锯齿效果明显优于2xAA,甚至比4xAA也不弱。结合前边的性能測试能够看出。FXAA用比2xAA快非常多的速度。取得了4xAA级别甚至更好的效果。

 

NVIDIA FXAA抗锯齿性能实測、画质对照

这几张GeForce GTX 580上的截图显示了FXAA对透明Alpha纹理的影响。

不开启AA的话。纹理外側的硬边缘被平滑。可是树叶和树枝上还有大量颗粒,2xAA、4xAA下甚至更糟,仅仅有FXAA才消除了树叶上的颗粒

NVIDIA FXAA抗锯齿性能实測、画质对照

这几张Radeon HD 6970的截图也非常easy看出不同效果。关闭AA的时候边缘锯齿非常明显,2xAA略有改善,4xAA又稍好一些。但显然都不如FXAA来得平滑。 

NVIDIA FXAA抗锯齿性能实測、画质对照

这张截图来自NVIDIA。所用游戏不明。最左側是关闭FXAA。中间是开启FXAA 3.9但没有亚像素对照度减少,右側就是同一时候开启FXAA 3.9和亚像素对照度减少了,即使不到一个像素的树叶也都被平滑了。

FXAA、MLAA性能对照

NVIDIA FXAA抗锯齿性能实測、画质对照

Radeon HD 6970上,FXAA开启后平均速度56FPS,MLAA则会减少至32.6FPS,慢了42%之多,仅仅是后者的帧率更加稳定一些。 

NVIDIA FXAA抗锯齿性能实測、画质对照

Radeon HD 6950上FXAA也取得了60%的优势。 

NVIDIA FXAA抗锯齿性能实測、画质对照

Radeon HD 6870上FXAA再次获胜。率先幅度47.5%。

FXAA、MLAA画质对照

NVIDIA FXAA抗锯齿性能实測、画质对照

湿润的底面上,FXAA、MLAA的效果差点儿相同。肉眼基本看不出差别。 

NVIDIA FXAA抗锯齿性能实測、画质对照

较真的话能够说MLAA的色彩过渡更平滑一些,但总体基本同样。 

NVIDIA FXAA抗锯齿性能实測、画质对照

放大区域的对照度略有不同,FXAA更强一些。 

NVIDIA FXAA抗锯齿性能实測、画质对照

以树叶为代表的透明纹理上,FXAA的颗粒明显比MLAA少得多。MLAA也取得了一定的效果,可是FXAA更好一些。

小结:

FXAA是NVIDIA针对AMD MLAA提出的技术回应,在基本差点儿相同的画质水平上取得了更快的速度,并且对透明树叶纹理的处理更平滑。在同等画质下。MLAA要比FXAA平均慢37.1%之多。

NVIDIA FXAA长处:

- 兼容NVIDIA、AMD显卡

- 性能影响更小(相比于MSAA、MLAA)

- 画质与4xMSAA、MLAA基本相当

- 定制度高,可在性能和画质之间取得平衡

- 可以降低边缘、纹理和Shader上的锯齿

缺点:

- 须要游戏开发者提供支持

AMD MLAA长处:

- 无需游戏特别支持,可通过驱动用于不论什么游戏

- 兼容全部游戏和引擎,无论是DirectX还是OpenGL

- 可以降低边缘、纹理和Shader上的锯齿

缺点:

- 仅支持AMD显卡

- 性能影响比較大

- 对于单像素和亚像素物体效果一般

免责声明:文章转载自《回击MLAA:NVIDIA FXAA抗锯齿性能实測、画质对照》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇用友UAP设置Tomcat管理员用户名和密码下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Ubuntu18.04+GTX1080Ti+CUDA9.0+cuDNN7.0+TensorFlow-GPU1.9环境搭建

注:下面的的驱动版本不要安装最新(默认)的版本,因为会遇到各种问题,将会浪费你的大量时间。(当然大神无视) 环境 系统:Ubuntu 18.04 LTS 显卡:GTX1080Ti CUDA:9.0 cuDNN:7.0 TensorFlow:teansorflow-gpu 1.9 Python版本:3.6 一、安装NVIDIA显卡驱动 1.删除旧的驱动。 原...

cuda8和cuda10切换 以及正确按照配置cuDNN

切换至 cuda-8.0 sudo rm -rf /usr/local/cuda sudo ln -s /usr/local/cuda-8.0 /usr/local/cuda nvcc --version which nvcc 切换至 cuda-10.0 sudo rm -rf /usr/local/cuda sudo ln -s /usr/local/c...

NVIDIA深度架构

NVIDIA深度架构 本文介绍A100 GPU,NVIDIA Ampere架构GPU的重要新功能。  现代云数据中心中运行的计算密集型应用程序的多样性推动了NVIDIA GPU加速的云计算的爆炸式增长。此类密集型应用程序包括AI深度学习(DL)训练和推理,数据分析,科学计算,基因组学,边缘视频分析和5G服务,图形渲染,云游戏等。从扩展的AI训练和科学计算,...

win10下检查nvidia显卡支持的cuda版本

1、首先将【C:Program FilesNVIDIA CorporationNVSMI】添加至系统环境变量【path】中; 2、在powershell中使用命令【nvidia-smi】,即可看到结果 nvidia与cuda需要满足关系:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/ind...

计算机组成原理 — GPU 图形处理器

目录 文章目录 目录 显卡 GPU GPU 与深度学习 GPU 与 CPU 体系结构的区别 GPU 显存与 CPU 主存的区别 GPU 与 CPU 之间的数据交互方式 GPU 的体系结构 GPU 的工作原理 GPU 的关键参数 CUDA 编程模型 CUDA 的架构 CUDA 的核心概念 CUDA 的工作原理 云主机显卡的实现方式 虚拟显卡...

关于CUDA,cuDNN,TF,CUDA驱动版本兼容问题

实际工作当中,经常维护好几个项目的代码,不同项目依赖的TF版本不一致问题。网上找了好多资料,但是每次遇到的问题都不一样,每次都要去查(就是是一样的问题,解决办法也可能会不一样)每次踩坑无数,今天痛定思痛,下决心总结一下。 基本概念 CUDA:用于GPU编程的语言,跑TF的时候用了GPU,TF里面很多函数(或者依赖库)是CUDA语言编写的。不同TF版本需要...