Kíváncsi lenni az életre 54/ Új többnyelvű mesterséges intelligencia: a SeamlessM4T
A közösségi médiaóriás Meta bemutatta a SeamlessM4T-t, egy többnyelvű mesterséges intelligencia modellt a beszéd- és szövegfordításhoz.
A SeamlessM4T olyan neurális hálózatként, amely egyaránt képes szöveg és hang feldolgozására, képes szövegfelolvasásra, beszéd-szöveg és szöveg-szöveg fordításra "akár 100 nyelven".
A Meta bejelentette, hogy a mesterséges intelligencia előállításával az a célja, hogy segítse a különböző nyelveket beszélő embereket hatékonyabban kommunikálni egymással.
A SeamlessM4T bemutatása során a Meta utalt a Babel-halra, Douglas Adams klasszikus sci-fi sorozatának, A Stoppos Útikalauz A Galaxisba című könyvének kitalált halára, amely a fülbe helyezése esetén azonnal le tud fordítani bármilyen beszélt nyelvet.
Csakúgy, mint a Babel Hal, a SeamlessM4T célja az emberek közötti nyelvi probléma kiküszöbölése.
A Babel halhoz hasonló univerzális nyelvi fordító létrehozása azért nehéz, mert a jelenlegi beszéd-beszéd és beszéd-szöveg rendszerek a világ nyelveinek csak egy kis részét fedik le.
A Meta nem az első mesterséges intelligenciával foglalkozó vállalat, amely gépi tanulási fordítási eszközöket kínál.
A Google Fordító 2006 óta használ gépi tanulási technikákat, és az olyan nagy nyelvi modellek, mint a GPT-4, ismertek a nyelvek közötti fordítási képességükről.
Az utóbbi időben azonban a technológia felgyorsult a hangfeldolgozás terén.
Szeptemberben az OpenAI kiadta saját, nyílt forráskódú beszéd-szöveg modelljét, a Whisper-t, amely képes felismerni a beszédet a hangban, és nagy pontossággal lefordítani azt szövegre.
A SeamlessM4T erre a tendenciára épül a többnyelvű fordítás további nyelvekre történő kiterjesztésével.
Még több hír
Május 19., az Atatürk Emléknap és az Ifjúság és Sport Ünnepe fontossága és története
Röviden összefoglaltuk önöknek május 19. fontosságát és történetét.