Applied BTO

大学・官公庁・研究機関様向け

CERVO Deep Type-DPXS

ディープ・ラーニング用途に最適化されたシステム構成

ディープ・ラーニングとは、CUDA を使った深層学習研究、多層構造のニューラルネットワークを用いた機械学習の手法の 1 つです。インプットした情報が第 1 層からより深い層に次々と伝達される間に各層で学習が繰り返されて、その過程で特徴量が自動で計算されていくことで、パターンの認識精度が向上するなど、様々な問題の解決に繋がると期待されています。

「CERVO Deep シリーズ」は、ディープ・ラーニング(深層学習)向けに最適化された OS (Ubuntu 18.04 LTS)、フレームワーク、ライブラリをあらかじめインストールしており、深層学習を意識した専用モデルとなります。

インストール済み開発環境とフレームワーク、ライブラリ

NVIDIA® CUDA 8.0/9.1
NVIDIA®DIGITS
Caffe
Chainer
TensorFlow
torch
Keras
OpenCV
Theano
NVIDIA® cuDNN
NVIDIA® NCCL

その他の開発環境やフレームワーク、ライブラリについてはお問い合わせください。

「CERVO Deep Type-DPXS」のハードウェア特徴

NVIDIA® GeForce® GTX1080Ti 2 基を標準採用

NVIDIA® GeFroce® GTX1080Ti

標準仕様では、NVIDIA® GeForce® GTX1080Ti を 2 基搭載しています。最新の NVIDIA Pascal™ アーキテクチャを採用した GeForce® GTX1080Ti GPU は、1GPU あたり 3584 基の CUDA コアと 11GB の高速メモリを搭載し、単精度浮動小数点性能は、最大 11.3TFLOPS という驚愕のパフォーマンスを発揮します。

GeForce® GTX1080Ti GPU は、プロフェッショナル向けの NVIDIA® Tesla® リリーズのような ECC 機能や 24 時間連続稼働の耐久性はありませんが、コストパフォーマンスに優れた製品となっています。

「CERVO Deep Type-DPXS」は、NVIDIA® Quadro® GP100 を搭載することもできます。32bit 単精度浮動小数点演算 CUDA コア 3,584 基、64bit 倍精度浮動小数点演算 CUDA コア 1,792 基を搭載し、倍精度で 5.2TFLOPS、単精度で 10.3TFLOPS、半精度は 20.7TFLOPS と高い性能を実現します。


高性能な GPU を最大 3 枚「マルチ GPU 」に対応

WS C422 PRO/SE

「CERVO Deep Type-DPXS」に採用しているマザーボードには、3 基の PCIe Gen3 x 16 スロットを搭載しています。

「インテル® Xeon® W-2133 プロセッサー」の PCI-Express レーン数 48 と同じ、最大 3 枚を高レーンで同時に動作させ、最大のパフォーマンスが得られる設計となっています。

まさに、ディープラーニング専用に開発されたと言っても過言ではない製品です。「CERVO Deep Type-DPXS」は最大で、3 基の GeForce®、2 基の Quadro® を搭載することができます。


逐次計算向け高クロック周波数
インテル® Xeon® W プロセッサー を標準採用

インテル® Xeon® W プロセッサー

開発コードネーム Skylake と呼ばれるメインストリーム・ワークステーション向けプロセッサー「インテル® Xeon® W-2133 プロセッサー」は、6 コア/ 12 スレッド、3.6GHz/Max3.9GHz で、最大 512 GB の DDR4 ECC 2666 MHz メモリーに対応して、ワークロードの迅速なロードおよび処理を実現します。

「インテル® Xeon® W-2133 プロセッサー」は、デュアル・チャネル DDR4-2666 メモリ、最大 48 レーンの PCI Express に対応しています。

「インテル® Xeon® W シリーズ・プロセッサー」 は、既存の Skylake と比べ,1 コアあたり L2 キャッシュ容量が従来の 256KB から 1MB へと 4 倍増加しています。レイテンシの少ない L2 キャッシュが増加することで、並列処理の性能が大きく向上します。


Registered-ECC 対応 DDR4-2666 メモリ
32GB を標準採用。最大 512GB まで搭載可能。

DDR4-2666 Registered-ECC メモリ

最新の DDR4 メモリで、最大 2,666MT/s の高速化を実現しています。また、8 スロットで最大で 512GB を実装できます。

4 スロット以上を利用することで、最大 4 チャンネルのメモリ帯域が利用でき、通信速度が向上します。

また、Registered-ECC 機能により、電気信号の清流・増幅で安定したメモリ・アクセス、専用チップでのエラー訂正による信頼性の向上を図っています。