Articles

AMD Zen2+Intel Cascade Lake

でのGCC10とClang10コンパイラのパフォーマンス今年初めに更新されたLLVMコンパイラスタックリリースに続いて、さまざまなCpuでClang10.0の多くのベンチマークを提供しました。 今月初めにリリースされたGCC10では、GNUコンパイラコレクションに対するこの年次機能リリースのベンチマークを開始しました。 まず、AMD Zen2およびIntel Cascade LakeシステムでのGCC9とGCC10とLLVM Clang10コンパイラのパフォーマンスを見てみましょう。

GCC10とClang10のベンチマークのこの最初のラウンドは、各プラスGCC9のリリースビルドを見ています。3AMD Ryzen Threadripper3990XおよびIntel Core i9 10980XEワークステーションでテストする場合。 Threadripper3990Xは、システムが不足しています。 両方のシステムはUbuntu20.04LTSをLinux5.4カーネルで実行しており、すべてのコンパイラは同じリリースモードで構築されていました。 システム間にはRAM/SSDの違いがあり、AMDとIntelのパフォーマンスを比較するのではなく、これらのLLVM ClangとGCCコンパイラが複数のCPUファミリ間でどのように これらのコンパイラでは、追加のCPUベンチマークが今後予定されています。すべてのベンチマーク中に、CFLAGS/CXXFLAGSはAMD Zen2とIntel Cascade Lakeシステムの両方で”-O3-march=native”に設定されました。 Phoronixテストスイートを介して、テストされている異なるコンパイラのそれぞれの下でオープンソースのベンチマークを再構築しながら、C/C++ベンチマークの広い範Blosc compressorでは、Clang10.0のパフォーマンスは基本的にGCC10と結びついていましたが、Core i9 10980XEのパフォーマンスはGCCがこの最新のClangリリースよりも優れたパフォーマCrypto++ベンチマークでは、Gcc9.3とGCC10.1の間に大きな違いはありませんでしたが、Clang10.0のパフォーマンスはCascade Lake HEDTシステムでGCCを追跡し続けました。 Threadripper Thelio Majorシステムでは、GCCが測定可能に強くなった整数と楕円曲線の公開鍵アルゴリズムテストを除いて、CLANGのパフォーマンスはGCCに対してよく実行される傾向がありました。

LczeroのEigenバックエンドでは、GCC10からわずかな利益が得られ、Clang10ではさらにパフォーマンスが向上しましたが、I9-10980XEシステムはGCC9.3ではわずかにパフォーマンスが向上しました。

ClangのLAMMPSバイナリパフォーマンスは、両方のシステムでGCCと一致していました。