Google Translate все още превежда „пържено сирене и небе“, но „подобрява“.
Ако сте превели нещо през Google Translate през последните седмици, може би сте забелязали, че преводът от словашки на английски и обратно е по-добър. Компилаторът използва нова и подобрена технология.
До 19 април Google използваше така наречената статистическа система, която превеждаше текст по предварително дефинирани граматически модели. Наскоро използва невронни мрежи, които позволяват на системата да се научи как да превежда текстове, така че резултатът да е по-близо до естествената човешка реч. По-добре казано, за да направи резултата по-близък до текстовете, които са му дали за учене.
Тествахме новата технология върху различни текстове в редакцията и консултирахме резултатите с професионални преводачи.
Въпреки че Google Translate все още превежда фразата „пържено сирене и небе“ като „пържено сирене и небе“, в противен случай тя се е подобрила в няколко отношения. Новият неврален превод ви позволява да превеждате цели изречения наведнъж, а не малко по малко. Той използва по-широк контекст около думите и по този начин предлага по-подходящ превод. Подобрението в качеството трябва да бъде забележимо, особено при по-дълги изречения. Google казва, че новата технология може да премахне грешките в превода с 55 до 85 процента.
„На нивото на самото изречение той вече може да инфлексира на словашки, той знае какъв предлог е свързан с глагола, има голяма промяна в това. Но все още му липсва съзнанието на читателя, което има само човек ", казва преводачът и основател на Inaque Аня Острихонова.
В интернет има много примери за това какви глупави грешки е направил Google Translate досега. Например, той е превел фразата „не лебед“ като „не събуждай лебед“. Днес той предлага две възможности - буквалният превод „не бъди лебед“, а също и като фразеология „не бъди глупав“ (не бъди глупав). Когато превежда от чешки, той знае третото значение на „хайде“ (можете да го направите, напредвате, не се колебайте).
Графиката показва потребителския рейтинг на преводи от английски на испански, френски, китайски и обратно. Преводът от френски на английски показва, че невронният превод (зелен) се възприема почти както и преводът на средния човешки двуезичен преводач (оранжев). Досега преводите на и от китайски са по-лоши, но невронният превод значително подобри оригиналния статистически превод (син). Източник: research.googleblog.com
Системата се учи сама
Google записва около един милиард превода всеки ден. Той превежда 140 милиарда думи всеки ден, написани от повече от 500 милиона души.
Компанията представи новата технология миналия ноември, когато стартира невронни преводи за първите осем световни езика - немски, френски, испански, португалски, китайски, японски, корейски и турски. Днес новите преводи работят между английски и повече от две дузини езици. От април сред тях е и словашкият.
Невронният превод не се учи от хората, а сам анализира преведените текстове и се учи от тях. В същото време отделните езици не се преподават отделно, а се обработват от няколко наведнъж. Подобно е на човек, който, ако знае романски език (френски или испански), му е по-лесно да научи чужд език на друг роднина (португалски или италиански).
„Невронните мрежи превеждат цели изречения и се нуждаят от огромна изчислителна мощ. Google превежда между 103 езика и ако трябваше да създадем отделен модел за всяка комбинация, хардуерът нямаше да я затегне “, каза Барак Туровски, продуктов мениджър на Преводач, пред МСП. „Ето защо комбинираме езиците в групи. В идеалния случай това са езиково подобни езици, като славянски или индийски. "
Преводач Острихонова казва, че днес Преводачът е много по-умен, отколкото в продължение на три или четири години. В същото време той добавя, че преводът е много буквален и не регулира стилистиката. Самият превод на думи от един език на друг е минимален. „Но след това има регистър, стил, различните езикови слоеве, които разказвачите използват в диалоговите прозорци - Google Преводач не знае това.“
Думите й се потвърждават от Мартин Кубуш, който изнася лекции в университета „Матей Бел“ по английска литература и превод на художествени текстове: „Google няма стратегическа компетентност, нито социално-лингвистична компетентност. Той има само езикова база - обменя езиков материал. "
Според него компилаторът не може да декодира стила, няма добър синтаксис. „Полезно е за човек, който трябва да направи грозен груб превод, но не е достатъчен за художествен превод. Това изисква човек, който може да измисли подходяща стратегия, която да плати в определен пасаж от текста. "
„Вероятно нито един език не може да бъде сведен до правила, които софтуерът може да използва“, добавя Острихонова. "Освен това езикът се променя и еволюира всеки ден, думите придобиват различни конотации."
Какви грешки допуска новият Google Translate в преводите?
Понякога дори не превежда прост текст
Очевидно все още има грешки в системата, които правят невъзможно превеждането дори на обикновен текст.
Гугъл преводач: Не можете да получите от него в Мексико. Смърт. Кръв. Болка. Изтезанията са навсякъде.
Правилен превод: Няма да му избягаш в Мексико. Смърт. Кръв. Болка. Изтезания на всяка крачка.
Някои изречения не се превеждат правилно, защото не ги виждат в контекста
Някои изречения са погрешни, защото не са преведени в контекста на цял абзац или страница. В резултат на това те нямат смисъл.
Гугъл преводач: "Няма смисъл."
- Е, така е.
Правилен превод: "Няма смисъл"
"Да той прави."
Присвоява ненужно
„Английски, немски, френски често се присвояват - например„ тя си взела нещата “,„ той отишъл в стаята си “. Превеждаме го на словашки, когато той отиде в стаята си или „отиде в стаята си“, обяснява Острихонова. „Тя няма чувство за език. Той не знае, че това, което е от съществено значение за един език, може да не е от съществено значение за друг, или дали това е просто граматическа функция, която не се прехвърля на друг език или се превежда лексикално или стилистично. "
Гугъл преводач: Когато операторът най-накрая позвъни в стаята, тя седеше на седалка на прозореца и почти завършваше лака на лявата си ръка.
Правилен превод: Когато най-накрая звънецът иззвъня в стаята й, тя седеше до прозореца и боядисваше почти всички нокти на лявата си ръка.
Той повтаря ненужно някои от думите в превода
Google повтаря някои думи, въпреки че това не е необходимо в превода. „Той просто обменя езикови материали и изобщо не взема предвид някои специфики на словашкия“, казва Кубуш.
Гугъл преводач: "Кой казва това?"
- Комодор казва така.
Правилен превод: "Кой каза?"
- Комодор.
Проблеми с героите и техните имена
Google често не може да разбере какъв характер има характерът в историята. Дори да е въведен персонажът, системата може вече да не знае в следващото изречение дали е момиче или момче. Също така понякога не може да се справи с имена на символи - понякога ги оставя в оригиналната версия и ги превежда на няколко реда по-долу. Положителната страна е, че се накланя, така че знае, че трябва да използва суфикса -ová за женски фамилии.
Ако не може да преведе нещо, ще използва чешки
В ситуации, когато Google не може да се справи с превода на дума, тя ще достигне чешки.
Гугъл преводач: „Здравей“, каза тя, държейки пръстите на лявата си ръка протегнати и отдръпнати от белите копринени одежди.
Правилен превод: - Моля те - каза тя и протегна лявата си ръка възможно най-далеч от бялата копринена роба.
Преводът е изкуствен и неподходящо буквален
Някои преводи са буквални, въпреки че на словашки някои неща ще бъдат казани по различен начин. По този начин, дори ако Преводачът не направи граматическа грешка, преводът е неподходящ. „Това е изкуствено. Няма тълкуване на преводача “, казва Кубуш.
Гугъл преводач: Не е неговата природа
Правилен превод: Той го няма в природата си.
Той не знае кой е актьорът
В ситуации, в които литературата не посочва изрично кой какво е направил, Преводачът се губи.
Гугъл преводач: Чух Чарли да се изкачва по стълбите и да скача в леглото, преструвайки се, че спи. Той затвори глава в стаята и каза името ми, но аз не отговорих.
Правилен превод: Чух Чарли да се изкачва по стълбите и се хвърлих в леглото, докато спях спокойно. Той надникна в стаята и се обърна към мен, но аз не отговорих.
Пунктуационни проблеми
Компилаторът понякога прави безсмислени пунктуационни грешки. Понякога неправилно вмъквате интервал между дума и затварящия кавичка. Той също така неправилно вмъква интервал между думата и следващите три точки, въпреки че тази грешка не е възникнала в изходния текст. Случвало се е и той да замени периода със запетая, въпреки че е оставил следващата дума с главна начална буква, сякаш е началото на изречение.
Той има проблем с остарелите думи
Някои по-стари думи са се развили и тяхното значение постепенно се е променило. Google Translate обаче не може да датира текста, така че не знае кой превод да използва. Той имаше проблеми, например, когато му помолихме да преведе текст от книгата „Девет кратки истории“, написана от Дж. Д. Селинджър през 1953 г.
Гугъл преводач: Тя свали две прясно появяващи се коси на врата си.
Правилен превод: Тя издърпа две малки косми от знака.
Той не знае, че словашкият вече няма вокатив
Google често не може да използва правилния стил. По време на тестването ни се случи, че той използва 5-ия случай, въпреки че почти не съществува на словашки.
Гугъл преводач: „Майко, скъпа, не ми крещи, чувам те прекрасно“, каза момичето.
Правилен превод: „Мамо, скъпа, не ми крещи. Чувам ви много добре ", каза момичето.
Все още няма да замени преводачите
Тестването на новия Преводач показва, че технологиите няма да заменят професионалните преводачи в близко бъдеще. Системата все още допуска грешки, които обикновеният преводач или преводач не би направил.
„Ние, преводачите, все още можем да сме в мир. Тази злощастна машина още няма да ни замести “, казва преводачът Мартин Кубуш. Той смята, че Google Translate трябва лесно да превежда информативни текстове, когато не се изисква тълкуване на преводач, като ръководства и инструкции за употреба.
„Има разлика между експериментално-експресивен текст и информативен текст. Google може да е в състояние да преведе някои шаблонни договори, може би ще се справи с т. Нар. Сива литература на Европейския съюз, но дори там вероятно все още ще се нуждае от корекция “, казва той. „Но що се отнася до тълкуване на текста, добавяне на нещо, което не е разбираемо, съкращаване на нещо, системата не знае.“
Google Translate не само не замества преводачите на красива литература, но досега на него не може да се разчита дори в области, където използваният език е по-опростен. В професионалните, техническите, финансовите или юридическите текстове граматиката често е по-проста, но дори малки грешки са неприемливи.
Освен това авторите на новия Преводач признават, че новата технология за превод може в някои моменти да бъде по-малко точна от стария начин на действително превеждане от дума на дума. Системата се опитва да намери най-добре звучащия превод и може да има проблем, например с превода на рядко използвани думи. Понякога може да не успеете да преведете всички думи.
Бъдещето на Преводача зависи и от това от какви висококачествени двуезични текстове ще се учи системата. Използването на невронни мрежи за превод наистина е голяма и значителна технологична промяна, но ако софтуерът се учи от лошо преведени текстове, той може да научи и лоши начини.