Akcelerátor neuronové sítě založený na FPGA převyšuje GPU
Bylo prokázáno, že je CNN CNR využíváno jako první, a používá osmibitové celočíselné rozlišení. Dosáhl 16,8 terra operací za sekundu (TOPS) a mohl vyvodit více než 5 300 snímků za sekundu na a Xilinx Virtex UltraScale + XCVU9P-3 fpga. Modulární, škálovatelný přístup je vhodný pro detekci objektů a aplikace pro zpracování videa na okraji a v oblaku, vysvětluje Fawcett, stejně jako pro inference v datových centrech a inteligentních kamerách.
DPU může být konfigurován tak, aby poskytoval optimální výpočetní výkon pro topologie neuronových sítí v aplikacích strojového učení, pomocí paralelní architektury DSP, distribuované paměti a rekonfigurace logiky a konektivitě pro různé algoritmy.
Společnost DPU dosahuje více než 50% vyšší výkon než konkurenční CNN a vyčerpává GPU pro daný rozpočet na energii nebo náklady, tvrdí společnost. "FPGA je světová platforma a architektura, která je velmi flexibilní pro budoucnost a může překonat GPU v AI s nižší latencí," dodal Fawcett.
Společnost také oznámila, že sponzoruje DPhil (PhD0 na Oxfordské univerzitě ke studiu technik pro implementaci hlubokého učení zrychlení na fpgas). Práce bude ve spolupráci s vlastním výzkumem společnosti Omnitek v oblasti počítačových motorů a algoritmů.
