Applied BTO

大学・官公庁・研究機関様向け

CERVO Deep Type-DPXX2

ディープ・ラーニング用途に最適化されたシステム構成

ディープ・ラーニングとは、CUDA を使った深層学習研究、多層構造のニューラルネットワークを用いた機械学習の手法の 1 つです。インプットした情報が第 1 層からより深い層に次々と伝達される間に各層で学習が繰り返されて、その過程で特徴量が自動で計算されていくことで、パターンの認識精度が向上するなど、様々な問題の解決に繋がると期待されています。

「CERVO Deep シリーズ」は、ディープ・ラーニング(深層学習)向けに最適化された OS (Ubuntu 16.04 LTS)、フレームワーク、ライブラリをあらかじめインストールしており、深層学習を意識した専用モデルとなります。

インストール済み開発環境とフレームワーク、ライブラリ

NVIDIA® CUDA 8.0/9.1
NVIDIA®DIGITS
Caffe
Chainer
TensorFlow
torch
Keras
OpenCV
Theano
NVIDIA® cuDNN
NVIDIA® NCCL

その他の開発環境やフレームワーク、ライブラリについてはお問い合わせください。

「CERVO Deep Type-DPXX2」のハードウェア特徴

NVIDIA® Tesla® V100 16GB 1 基を標準採用

NVIDIA® Tesla® V100 16GB

標準仕様では、NVIDIA® Tesla® V100 16GB を 1 基搭載しています。NVIDIA® Tesla® V100 は世界一高性能なデータセンターGPUで人工知能、HPC、グラフィックスの処理を加速させます。

最新の GPU アーキテクチャである NVIDIA Volta™ の力により Tesla V100 は最大で CPU 100 個分の性能を 1 個の GPU で提供します。これによりデータサイエンティスト、リサーチャー、そして技術者はかつて不可能と思われてきた挑戦に取り組むことができます。

640個のTensorコアを搭載したNVIDIA® Tesla® V100はディープラーニングのパフォーマンスにおいて、120 TeraFLOPSを提供します。これはPascal世代のGPUと比較すると、ディープラーニングのトレーニング時に12倍のTensor FLOPS で、またディープラーニングの推論時に6倍のTensor FLOPSです。

また、改良された 900GB/秒の RAW 帯域と利用効率を 95% 向上させた DRAM の組み合わせにより、Telsa V100 は STREAM での測定において、Pascal 世代の GPU と比較してメモリ帯域が 1.5 倍増加しています。


高性能な GPU を最大 4 枚「マルチ GPU 」に対応

MBD-X11DPG-QT

「CERVO Deep Type-DPXX2」に採用しているマザーボードには、6 基の PCIe Gen3 x 16 スロットを搭載しています。

PCI-Express 3.0 (x16 モード) の NVIDIA® Tesla® V100 GPU を、最大 4 枚で同時に動作させ、最大のパフォーマンスが得られる設計となっています。

また、表示用グラフィックとして、NVIDIA® Quadro® P620 も同時に動作できます。まさに、ディープラーニング専用に開発されたと言っても過言ではない製品です。


並列計算向け向け多コア インテル® Xeon® スケーラブル
Gold プロセッサー 2 基を標準採用

インテル® Xeon® Gold プロセッサー

開発コードネーム Skylake と呼ばれるエントリーレベルのプロセッサー「インテル® Xeon® Gold 5120 プロセッサー」は、14 コア/ 28 スレッド、2.2GHz/tb3.2GHz で、データセンター・コンピューティング、ネットワーク、ストレージに求められるハードウェア支援型のパフォーマンスが得られます。

「インテル® Xeon® Gold 5120 プロセッサー」は、デュアル・チャネル DDR4-2400 メモリ、1 プロセッサーあたり最大 48 レーン (合計:96 レーン) の PCI Express に対応しています。

「インテル® Xeon® Gold 5120 プロセッサー」 は、既存の Skylake と比べ,1 コアあたり L2 キャッシュ容量が従来の 256KB から 1MB へと 4 倍増加しています。レイテンシの少ない L2 キャッシュが増加することで、並列処理の性能が大きく向上します。


Registered-ECC & 12 チャンネル対応。
96GB を標準採用。最大 768GB まで搭載可能。

DDR4-2400 Registered-ECC メモリ

最新の DDR4 メモリで、最大 2,400MT/s の高速化を実現しています。また、16 スロットで最大で 768GB を実装できます。

12 スロット以上を利用することで、最大 12 チャンネルのメモリ帯域が利用でき、通信速度が向上します。

また、Registered-ECC 機能により、電気信号の清流・増幅で安定したメモリ・アクセス、専用チップでのエラー訂正による信頼性の向上を図っています。


IPMI 2.0 対応 LAN

IPMI 2.0 対応 LAN を 1 基装備

OS に依存せずに動作する IPMI 2.0 に対応した専用 LAN ポートを搭載しています。プロセッサー温度やファン回転数の監視、リモートでサーバの電源制御などができ、遠隔地やサーバールームに設置したワークステーションのメンテナンスが可能です。

10 ギガビット 対応 LAN を 2 基装備

10GBase-Tは、カテゴリ 7 以上のツイストペアケーブルを利用することで、物理層で最大 10Gbps の転送速度を持ちます。ケーブル長は最大で 100 メートルまで対応しています。


8 基の 3.5 インチ・ホットスワップ対応ベイ

8 基の 3.5 インチ・ベイを装備

最大 8 基の 3.5 インチ・ストレージを搭載でき、マウンターを利用することで 2.5 インチ・ストレージも搭載可能です。また、全てのベイで、ホットスワップに対応しています。

また、最大 3 基の 5.25 インチ・ストレージを搭載できます。