ニューラルネットワーク向けTensilica Vision C5 DSPとCNNソリューション
Tensilica® Vision C5 DSPは、テンシリカVision DSPファミリの最新のDSPで2017年9月に一般リリースされたました。Vision C5 DSPは従来のVision P5/6 DSPとは異なり、CNN(畳み込みニューラルネットワーク)に特化し最適化されたアーキテクチャを採用しているので、畳み込み関数だけでなく、あらゆるニューラルネットワークの演算層(畳み込み、全結合、プーリング、正規化)を高速化します。Vision C5 DSPは、自動車、監視カメラ、ドローン、モバイルやウェアラブル市場などをターゲットとしており、あらゆるニューラルネットワークの演算タスクを実行できる、毎秒1テラMACの演算能力を提供します。
ニューラルネットワークはより深く、より複雑になってきているため、演算能力に対する要求が急速に高まっています。一方で、絶えず新しいネットワークが現れ、次々に新しいアプリケーションや市場が現れるため、ニューラルネットワークのアーキテクチャは常に変化しています。
このようなトレンドにより、将来にわたって運用が保証される柔軟性と低リスクを実現し、低消費電力なだけでなく高度にプログラマブルな組み込みシステムを可能とする、高性能で汎用性の高いニューラルネットワーク処理のソリューションに対するニーズが高まっています。
既存のニューラルネットワークアクセラレータのソリューションは、イメージングDSPに付加されたハードウェアアクセラレータであり、ニューラルネットワーク処理のコードをDSP上で実行させるネットワーク層と、アクセラレータにオフロードさせる畳み込み層に分離して処理します。この組み合わせは非効率で余計な電力を消費してしまいます。
Vision C5 DSPは、ニューラルネットワークに特化し最適化されたアーキテクチャを採用しているので、畳み込み関数だけでなく、あらゆるニューラルネットワークの演算層(畳み込み、全結合、プーリング、正規化)を高速化します。これにより、Vision C5 DSPが推論タスクを実行する間に、独立して画像補正アプリケーションを実行できるようメインのビジョン/イメージングDSPを解放します。ニューラルネットワークDSPとメインのビジョン/イメージングDSP間における余計なデータ転送をなくすことにより、Vision C5 DSPは競合するニューラルネットワークアクセラレータよりも低電力なソリューションを提供し、さらにニューラルネットワーク向けの単純な、シングルプロセッサーのプログラミングモデルを提供します。
ニューラルネットワークDSPへの要件をいくつか見てみますと、まず一つ目の要件としてMACアーキテクチャが優れていることが挙げられます。Vision C5は最内ループのMAC使用率が100%に限りなく近づくよう、専用設計されたMACユニットを搭載しています。複数の並列化スキーム(ネットワーク係数の並列化と入力データの並列化)を行う命令セットを実装しており、また非常に小さなサイズの畳み込み演算の最適化を行うことが可能です。さらに、低電力化のためのゼロ乗算スキップもサポートしています。
2つ目の要件として、畳み込み以外のレイヤーの処理性能が挙げられます。Vision C5は、畳み込み関数だけでなく、あらゆるニューラルネットワークの演算層(プーリング、正規化など)を高速化する算術命令を実装しており、畳み込み以外のレイヤーも高速に処理することが可能であり、8bitと16bitの精度を複合することも可能です。
3つ目の要件としては量子化(固定小数点化)が挙げられます。Vision C5は8bitと16bitの両モードをサポートする固定小数点MACユニットを搭載しており、また、畳み込みは8bit、正規化は16bitといったOn the flyの複合精度処理を行うことが可能です。また専用の命令セットを実装しており、量子化・正規化を効率よく処理することが可能です。
4つ目の要件としてメモリの使用効率が挙げられます。Vision C5はDMAコントローラを内蔵しておりデータの転送を自身で管理するとともにPing-pongバッファリングによりDSPのパイプラインをストールさせることなくメインメモリへのアクセスレイテンシを隠蔽します。またデータの並び替え等の操作を行う命令セットを豊富に実装しており、CNNの処理を加速します。さらにOn the flyのウエイト・デコンプレッション機構を備えており、ネットワークの重み係数のメモリ使用量を大幅に削減することが可能です。
以上のように、Vision C5 DSPは、ニューラルネットワークに特化し最適化されたアーキテクチャを採用しているおり、あらゆるニューラルネットワークの演算層(畳み込み、全結合、プーリング、正規化)を高速化します。これにより、ニューラルネットワークDSPとメインのビジョン/イメージングDSP間における余計なデータ転送をなくすことにより、Vision C5 DSPは競合するニューラルネットワークアクセラレータよりも低電力なソリューションを提供します。
さらに、ニューラルネットワーク向けの単純な、シングルプロセッサーのプログラミングモデルを提供すると共に、Vision C5 DSPが推論タスクを実行する間に、独立して画像補正アプリケーションを実行できるよう、メインのビジョン/イメージングDSPを解放します。
Vision C5 DSPには、CaffeおよびTensorFlowなどのツールを利用して学習されたあらゆるニューラルネットワークを、実行ファイルおよびVision C5 DSP向けに高度に最適化されたコードにマッピングするケイデンスのXtensa Neural Network Compiler(XNNC)ツールセットが付属しており、ハンド・オプティマイズされた包括的なニューラルネットワークライブラリ関数を有効活用することができます。
一部の先行カスタマーとの顧客プロジェクトは現在進行中です。Vision C5 DSPに興味をお持ちのお客様は、ケイデンスの担当営業までご連絡ください。
テンシリカ シニアAEマネージャ
松岡 祐介
この記事に関する問い合せ先:
コーポレート・マーケティング部
E-mail:cdsj_info@cadence.com
Archive
2023 Issues
2022 Issues
2021 Issues
2020 Issues