DSPs Power Learning SoCs

Difference between CPU, MPU, MCU, SOC, and MCM? (Jun 2019).

$config[ads_text] not found
Anonim

DSPs Power Learning SoCs


DSP menandakan pilihan silikon yang boleh dipercayai ketiga untuk produk pembelajaran mendalam, terutamanya sistem terbenam yang memerlukan penyelesaian yang berpatutan dan rendah.

Unit pemprosesan grafik (atau GPU), dan sedikit sebanyak FPGAs, secara umumnya telah digunakan untuk model latihan dalam jaring neuron pembelajaran dalam. Dan evaluasi dan proses latihan secara intensif sering dilakukan di luar talian di ladang pelayan besar.

Seterusnya, model terlatih diterjemahkan ke dalam persekitaran pengeluaran sebenar menggunakan hibrid CPU dan GPU, atau hibrid CPU dan FPGA. Tetapi bagaimana dengan sistem terbenam dalam persekitaran automotif, pengguna, dan perindustrian yang sangat sensitif terhadap penggunaan kos dan kuasa "" src = "// www.allaboutcircuits.com/uploads/articles/CEVA_CDNN_Brain_illustration_1000px_041015.jpg" />

DSP membolehkan capaian pembelajaran yang mendalam kepada aplikasi tertanam. Gambar ihsan CEVA.

Dua Kajian Kes

Ambil CEVA, pembekal teras DSP untuk sistem terbenam berkuasa rendah, yang baru-baru ini menggambarkan rangkaian neural konvensional 24 lapisan (CNN) yang dikuasai oleh pemproses XM4 wawasannya. Menurut CEVA, enjin CNN yang berasaskan DSP mampu menyampaikan hampir tiga kali prestasi berbanding dengan penyelesaian pemprosesan CPU / GPU hibrid biasa.

Tambahan pula, dengan menggunakan kuasa 30 kali kurang daripada GPU, CEVA mendakwa bahawa enjin DSP memulihara hampir seperlima dari lebar jalur memori. Di samping pengimejan CEVA-XM4 dan pemproses penglihatan, syarikat itu menawarkan penjana rangkaian yang menerjemahkan rangkaian terlatih ke dalam pelaksanaan CNN yang berkos efektif.

CEVA membawa pembelajaran mendalam ke ruang tertanam dengan mengambil rangkaian saraf yang telah ditala dan dilatih di stesen kerja dan menukarnya untuk dijalankan pada pemproses XM4 yang berasaskan DSP. Pembekal teras DSP menukar operasi titik terapung dari stesen kerja ke arahan tetap-titik supaya mereka boleh menjalankan lebih cekap pada teras DSP.

Penyelesaian Algoritma Phi yang berpusat di Toronto menggunakan rangka kerja rangkaian neural dalam CEVA untuk sistem tertanam dan pemproses XM4 untuk melaksanakan pembelajaran mendalam dalam algoritma Pengesan Objek Universal. Algoritma kini tersedia untuk aplikasi seperti ADAS, pengesanan pejalan kaki, dan pengiktirafan muka.

Cadence mensasarkan Tensilica Vision P6 DSP di aplikasi CNN. Gambar ihsan dari irama.

Cadence adalah pemain lain yang terkenal di kamp DSP yang melabur dalam pembelajaran mendalam dan aplikasi CNN. Firma itu mendakwa bahawa pemproses pembelajaran yang mendalam berdasarkan teras DSP Tensilica Vision P6 dapat mencapai dua kali bingkai imej pada penggunaan tenaga yang lebih rendah berbanding dengan GPU yang tersedia secara komersial.

Ciri-ciri dalam pemprosesan SIMD vektor P6 DSP, arahan VLIW, dan histogram cepat dan penyebaran / pengumpulan intrinsik-menjadikan ia lebih sesuai untuk persekitaran pembelajaran yang mendalam. Pemproses ini menggabungkan pelaksanaan kecekapan kuasa algoritma CNN dengan mampatan data dalam penerbangan yang secara besarnya mengurangkan keperluan jejak memori dan jalur lebar untuk lapisan rangkaian saraf.

Inti DSP Visi P6 berdasarkan seni bina Xensa Tensilica menyokong perpustakaan OpenCV dan OpenVX.

Berikut adalah pautan kepada dua artikel sebelumnya tentang bagaimana teknologi silikon membentuk dunia pembelajaran mendalam.

Pembelajaran Deep GPU Way

Pembelajaran Deep dengan FPGAs