これは、8ビット整数分解能を使用したGoogLeNet Inception-v1 CNNとして実証されました。これは、1秒間に16.8テラ操作(TOPS)を達成し、1秒間に5,300画像を超える ザイリンクス Virtex UltraScale + XCVU9P-3 fpga。モジュラーでスケーラブルなアプローチは、エッジやクラウドでのオブジェクト検出やビデオ処理アプリケーションに適しているとFawcett氏は説明し、データセンターやインテリジェントカメラの推論も説明しています。
DPUは、並列DSPアーキテクチャ、分散メモリ、および異なるアルゴリズムのロジックおよび接続の再構成可能性を使用して、機械学習アプリケーションのニューラルネットワークトポロジに最適なコンピューティングパフォーマンスを提供するように構成できます。
DPUは競合するCNNより50%以上高いパフォーマンスを達成し、所定の電力またはコスト予算でGPUを上回ると同社は主張しています。 「FPGAは、将来の校正のために非常に柔軟性があり、レイテンシを短くしてAIのGPUを上回ることができる、世界を舞うプラットフォームとアーキテクチャです」とFawcett氏は付け加えました。
同社はまた、DPhil(オックスフォード大学PhD0)のスポンサーであることを発表しました。これはOmnitek自身のAI計算エンジンやアルゴリズムに関する研究と連携して行われます。