fot. © lassedesignen - Fotolia.com
Reklama

fot. © lassedesignen – Fotolia.com
Jakie są szanse na to, że w niedalekiej przyszłości będzie można usłyszeć swój głos zamawiający kanapki w dowolnym języku? Co jeszcze musi się stać i jak długo będziemy musieli czekać na tak wielki przełom w technice użytkowej?
Microsoft Research od lat pracuje nad innowacyjnymi rozwiązaniami dla mobilnych tłumaczy.
Reklama
Idea badań Microsoftu polega na połączeniu syntezatora mowy, tłumacza oraz funkcji rozpoznawania mowy. Program będzie rozpoznawał frazy w ojczystym języku i płynnie imitował głos tłumacząc go na wybrany język obcy. Ale to nie koniec możliwości rozwoju.
Rozpoznawanie
Rozpoznawanie mowy funkcjonuje od wielu lat. Pierwsze programy były bardzo nieskuteczne, jednak obecne rozwiązania sprawdzają się bardzo dobrze. Rozpoznawanie działające w Voice search jest bardzo popularne. W 2010 roku, kiedy wprowadzano aplikacje wraz z nowym system android, 25% zapytań wysłanych ze smartfonów, wykonano za pomocą poleceń głosowych. Częstotliwość korzystania z aplikacji wskazuje na skuteczność tego rozwiązania.
Naśladowanie i tłumaczenie
Czy telefon może mówić głosem użytkownika? Oczywiście może nagrać wypowiedź i ją odtworzyć. Ale jak to zrobić z nieznanym językiem? Naukowcom z Microsoftu udało się stworzyć program, który naśladował głos jednego z nich w obcym mu języku. Pierwsze prezentacje odbyły się w 2012 roku. Zbudowanie wersji demo opartej na jednym głosie zajęło wiele tygodni badań i prac. Na podstawie mowy native speakera języka Chińskiego, program odpowiednio zmodyfikował głos, stosując właściwą intonacje. Pozostaje kwestią czasu przyśpieszenie tego procesu, aby stał się powszechny.
Tłumaczenie
Ostatnim problem jest tłumaczenie. Microsoft chwali się, iż udało się się stworzyć program, który z angielskiego na mandaryński jest wstanie tłumaczyć poprawnie z wysoką skutecznością. Teksty jednak muszą być właściwie gramatycznie i najlepiej stosować język akademicki. Prototyp działa tylko w jednym języku. Dalej trwają pracę nad lepszą skutecznością tłumaczeń języka powszechnego. Na razie skuteczność tego typu rozwiązań można sprawdzić w tłumaczu Google na Androidzie lub iOS.
Przyszłość
Rozwój wszystkich trzech niezbędnych składników sprawnego tłumacza napawa optymizmem. Dołączając do tego fakt, iż od kilka lat na rynku pojawiają się pierwsze urządzenia sterowane myślami, można spodziewać się wielkiego przełomu. Dzień, w którym myśli przekształcimy w obcą mowę, może nie być tak odległy. Spełni się wtedy kolejny cud technologiczny, najpierw wymyślony w filmach si-fi, dopiero później zaprojektowany przez naukowców.

