Akcelerátor neuronové sítě založený na FPGA převyšuje GPU

Bylo prokázáno, že je CNN CNR využíváno jako první, a používá osmibitové celočíselné rozlišení. Dosáhl 16,8 terra operací za sekundu (TOPS) a mohl vyvodit více než 5 300 snímků za sekundu na a Xilinx Virtex UltraScale + XCVU9P-3 fpga. Modulární, škálovatelný přístup je vhodný pro detekci objektů a aplikace pro zpracování videa na okraji a v oblaku, vysvětluje Fawcett, stejně jako pro inference v datových centrech a inteligentních kamerách.

DPU může být konfigurován tak, aby poskytoval optimální výpočetní výkon pro topologie neuronových sítí v aplikacích strojového učení, pomocí paralelní architektury DSP, distribuované paměti a rekonfigurace logiky a konektivitě pro různé algoritmy.

Společnost DPU dosahuje více než 50% vyšší výkon než konkurenční CNN a vyčerpává GPU pro daný rozpočet na energii nebo náklady, tvrdí společnost. "FPGA je světová platforma a architektura, která je velmi flexibilní pro budoucnost a může překonat GPU v AI s nižší latencí," dodal Fawcett.

Společnost také oznámila, že sponzoruje DPhil (PhD0 na Oxfordské univerzitě ke studiu technik pro implementaci hlubokého učení zrychlení na fpgas). Práce bude ve spolupráci s vlastním výzkumem společnosti Omnitek v oblasti počítačových motorů a algoritmů.

Vyberte zemi nebo oblast.

Akcelerátor neuronové sítě založený na FPGA převyšuje GPU