Технически Новинарски Технологии

Google добавя „Невронен машинен превод“ за индийски езици: Ето какво означава това

Google обяви Neural Machine Translations за индийски езици и ето какво ще означава това за потребителите

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Какво е Neural Machine Translation, Невронни мрежи, Машинно обучениеМелвин Джонсън, който е инженер и изследовател в Google Translate.

Google току-що обяви голяма стъпка за това как преводите вече ще работят за индийски езици. Неговият невронен машинен превод (NMT) се въвежда за девет езика в Индия; Хинди, бенгалски, маратхи, тамил, телугу, гуджарати, пенджаби, малаялам и каннада. Тази нова система за преводи също ще захранва как работи автоматичният превод в Google Chrome и функцията за прегледи в Google Maps.



Когато става въпрос за машинно обучение и изкуствен интелект, Google е признат за безспорен лидер, а езиците са част от това по-голямо усилие. И така, какво точно означава NMT за индийските езици в мрежата и защо тази нова система за превод има значение? Ние обясняваме по-долу.

Какво точно е невронен машинен превод?



Казано по-просто, невронният машинен превод на Google разчита на невронни мрежи за дълбоко обучение за извършване на преводи. Това е многоезичен модел, при който системата се обучава да превежда между повече от една двойка езика.



Google стартира проекта през 2015 г., използвайки собствената си библиотека за машинно обучение TensorFlow, за да види как може да подобри преводите, извършвани от компютри. TensorFlow е библиотеката с отворен код на Google за машинно обучение.

Както изследователският инженер на Google Мелвин Джонсън обясни пред медиите, невронна мрежа е моделирана върху човешкия мозък. Точно както човешкият мозък реагира на външни стимули, тези невронни мрежи с дълбоко обучение са научени да реагират на определени входове.

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Какво е Neural Machine Translation, Невронни мрежи, Машинно обучениеGoogle обяви преводи на Neural Machine за девет индийски езика.

В случай на мрежи за невронен машинен превод (NMT), тези системи се преподават на езиците и представляват „система от край до край“. Системата се захранва с изречения от езици, които трябва да бъдат преведени. Например, за превод от хинди на английски, системата се преподава на същите изречения на хинди и неговия аналог на английски, за да разбере превода.

Системата е подобна на начина, по който Google учи компютрите да разпознават изображения. В този случай мрежата се захранва с милиони и милиони изображения на конкретен обект, като например котка, докато не може да разпознае сама какво се идентифицира като котка.

И така, с какво новата базирана на NMT система е по-добра от това, което Google правеше по-рано?

Google казва, че по-новата система за превод е много по-качествена и по-бърза. По-старата система за превод за компютри изискваше те да се извършват фраза по фраза и като се има предвид, че Google поддържа 103 езика, това направи процеса по-бавен и досаден.

Въпреки това, новата многоезична NMT система е много по-бърза, като се има предвид, че същият модел може да се преподава на няколко езика и позволява на Google да се увеличава много по-бързо. Освен това научава преводи въз основа на изречение към изречение, а не само на фраза към фраза. Google казва, че е много по-точен и по-близък до човешките преводи от предишната система и подобрява преводите от 10 секунди на изречение до 0,2 секунди на изречения.

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Какво е Neural Machine Translation, Невронни мрежи, Машинно обучениеНякои от предизвикателствата за мащабиране за преводите, базирани на NMT на Google.

Новите TPU (TensorFlow Processing Units), които Google използва за тези невронни преводи, също значително подобриха скоростта, казва компанията, тъй като те са специално проектирани да поддържат такива операции. Идеята с NMT е да се преодолее пропастта между човешки и компютърни преводи.

Така че системата перфектна ли е? Или все още има някои предизвикателства?

Трябва да се помни, че машинното обучение, независимо дали става въпрос за превод или разпознаване на изображения, е все още в начален стадий. Както Джонсън обяснява, системата NMT за превод наистина е изправена пред някои предизвикателства, особено когато става въпрос за Индия, която има толкова много регионални езици.

Не забравяйте, че системата трябва да се захранва с изречения, за да разбере и разпознае езика. Нуждае се от успоредно изречение както на английски, така и на хинди, ако това е двойката, която трябва да бъде преведена от машината.

Google, Google Neural Machine Translation, Google Translate, Google Machine Learning, Какво е Neural Machine Translation, Невронни мрежи, Машинно обучениеНовата система позволява много по-бърз превод на изречения.

Както Джонсън посочва понякога намирането на паралелно съдържание в мрежата е предизвикателство (това е съдържание на регионален език). Той го нарича малка череша отгоре, като се има предвид, че английското съдържание доминира в мрежата. Това прави задачата за обучение на машините да извършват превода много по-трудна. Google ще се нуждае от повече данни, повече съдържание на регионални езици, за да подобри работата на тази система.

След това има проблем с нюансите и тона в преводите, които хората могат да интерпретират и разбират, но преподаването на това на машината ще бъде много по-трудно.

Какво ще означава това в бъдеще за потребителите?

Идеята с модела не е просто да се превеждат две двойки език, като например хинди на английски. В крайна сметка това може да означава, че Google Translate е в състояние да превежда хинди на тамилски директно, без всъщност да бъде преподавано това специално.

Всъщност през ноември миналата година Google разкри, че нейната система е в състояние да прави „превод от нула“ или по-скоро да превежда двойки език, където не е специално научен да прави това. Google разкри, че системата е измислила преводи между корейски и японски. В тази област на машинното обучение това означава значителен скок, защото системата сама е измислила как да превежда. Това може да направи всичко различно в бъдеще.