Pierwsze urządzenie do rozpoznawania mowy pojawiło się w 1952 roku, mogło rozumieć wypowiadane przez człowieka cyfry. 40 lat później zostały zaprezentowane pierwsze komercyjne programy, które rozpoznają mowę człowieka. Były one przeznaczone dla osób, które ze względu na fizjologiczne, nie można pisać ręcznie. Teraz funkcja rozpoznawania mowy jest praktycznie w każdym smartfonie, ona pozwala nam komunikować się głosem z aplikacjami, co ułatwia i upraszcza nasze życie. Jak działa rozpoznawanie mowy, — o tym w dzisiejszym wydaniu.
Http://www.youtube.com/watch?v=PF6q8hUdKz8
Jeśli mowa głosowe zapytanie, na przykład, adres miejsca przeznaczenia, smartfon usłyszy, nie na ulicę i numer domu, a sygnał dźwiękowy, w którym dźwięki płynnie przepływają do siebie, nie mając wyraźnych granic. Zadaniem systemu rozpoznawania mowy — przywrócić na ten sygnał to, co zostało powiedziane. Warto zauważyć, że jedna i ta sama fraza, wymówione przez różnych ludzi w różnym otoczeniu, będzie dawać zupełnie różne na siebie sygnały. Poprawnie je interpretować pomaga system modelowania akustycznego.
Po wymówieniu komunikatu głosowego jest on nagrywany telefonem i wysyłane na serwery, w którym określa się poziom zakłóceń i dzieje się шумоотчистка i oddzielenie sygnału użytkowego. Następnie nagrywanie jest podzielony na małe fragmenty (ramki), na przykład, o długości 25 ms w krokach co 10 milisekund, czyli na zakładkę. W ten sposób z jednej sekundy mowy okazuje sto ramek.
Najpierw każda ramka jest pomijany przez głośnik model. System z uczeniem maszynowym, określa opcje wypowiedzianych słów i kontekstu. Dokładność wyników zależy od kompletności alfabetu fonetycznego systemu. Dla każdego dźwięku pierwotnie zbudowany jest skomplikowana statystyczny model, który opisuje wypowiedzi tego dźwięku w mowie. System rozpoznawania koreluje przychodzący sygnał mowy z фонемами, a już z nich zbiera słowa. Na przykład, alfabet fonetyczny Yandex składa się z 4000 elementarnych jednostek, które zawierają fonemów, ich części i kombinacji. Każda ramka jest mapowany nie z jednym fonemem, a z kilkoma, odpowiednie o różnym stopniu prawdopodobieństwa. Ponadto, system bierze pod uwagę prawdopodobieństwa przejścia, czyli określa, jakie ramki mogą iść w ślad za konkretnego fonemem. W tym celu stosuje się dane o wymowie, morfologii i semantyki. W ten sposób system dobiera wyrazy, które następnie analizuje na formy, części mowy i ewentualne statystyczne powiązania między nimi.
Następnie w proces wchodzi językowa model, za pomocą którego system określa prawdopodobną kolejność słów i w razie potrzeby przywraca nierozpoznane słowa znaczenia na podstawie kontekstu i dostępnych danych statystycznych.
W rezultacie uzyskane informacje wchodzi jednostka główna systemu rozpoznawania — dekoder. Ten składnik łączy dane od akustycznych i modeli językowych i na podstawie ich połączenie daje efekt końcowy w postaci najbardziej prawdopodobnej sekwencji słów.
Dzięki maszynowej uczenia się systemy odporne na hałas i potrafią rozpoznawać mowę z naciskiem. Dokładność nowoczesnych systemów rozpoznawania mowy przekracza 90 procent.
Bardziej:
Ile zwierząt zostało uratowanych przed całkowitym wyginięciem?
Pomimo najlepszych wysiłków ludzi, wielu zwierząt nie można już uratować. Ale niektórzy nadal przetrwać Dziesiątki gatunków są zagrożone wyginięciem każdego roku z powodu działalności człowieka. Na szczęście naukowcy z całego świata monitorują swoje ...
Najbardziej niebezpieczne mrówki: gdzie żyją i jak boli gryzą?
W świecie istnieje 90 gatunków mrówek-buldogi, ale najbardziej niebezpiecznych z nich to Myrmecia pilosula Przyroda Australii jest bardzo zróżnicowana i będzie dla ludzi bardzo niebezpieczne. To właśnie w tym punkcie naszej planety zamieszkują jedne ...
Jak budowano egipskie piramidy?
Najbardziej znany z egipskich piramid jest piramida Cheopsa Egipskie piramidy uważane są za jedne z najbardziej tajemniczych budowli na świecie. W tej chwili akademicy wiadomo o 140 konstrukcjach, z których większość przeznaczona była dla pochówku fa...
Nowości
Jak to działa? | Skaner tęczówki
Technologia skanowania tęczówki została po raz pierwszy zaproponowana w 1936 roku okulista Frankiem Буршем. Oświadczył on, że irys oczy każdego człowieka jest wyjątkowy. Prawdopodobieństwo jej trafienia wynosi około 10 do minus 78...
Jak to działa? | Skaner linii papilarnych
Identyfikacja na podstawie odcisku palca — jeden z najbardziej niezawodnych sposobów w celu potwierdzenia tożsamości osoby. Dokładność taka metoda ustępuje tylko skanowania siatkówki oka i analizy DNA. Odcisk palca — t...
Historia myszy komputerowej bierze swój początek 9 grudnia 1968 roku, kiedy to został zaprezentowany na targach interaktywnych urządzeń w Kalifornii. Patent na ten gadżet otrzymał Douglas Энгельбарт 2 lata później. Pierwszym kompu...
Historia komputerowej klawiatury liczy już ponad 150 lat. Pierwowzorem współczesnej klawiatury były maszyny do pisania, które pojawiły się w połowie XIX wieku. Najpierw klawisze z literami umieszczone alfabetycznie. Jednak z czase...
panel Dotykowy, lub inaczej touchpad, został wynaleziony w 1988 roku George Герфайде. Następnie firma Apple koncesjonowali jego projekt i, począwszy od 1994 roku, stała się używać w komputerach PowerBook. Od tego czasu touchpad je...
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działa dysk SSD. Miłego oglądania! http://www.youtube.com/watch?v=tg9qRyCKbN4...
"Internet rzeczy" — kolejna modna fraza, którą w ostatnim czasie można usłyszeć coraz częściej. W rzeczywistości, powstała ona dużo wcześniej, niż myślisz, ale dopiero teraz potencjał tego zjawiska każe poważnie zastanowić s...
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działają sieci 5G. Miłego oglądania! ...
Jak to działa? | Wi-Fi w samolocie
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działa Wi-Fi w samolocie. Miłego oglądania! http://www.youtube.com/watch?v=ytmb6jmjOXI...
Co nam pokażą na paradzie Zwycięstwa — 2017?
Tradycyjna parada Zwycięstwa, który odbywa się 9 maja w samym sercu naszej ojczyzny na placu Czerwonym miasta Moskwy, pozwala osobiście zobaczyć najnowsze выскотехнологичной sprzętu wojskowego produkcji krajowej. Nie będzie wyjątk...
Jak to działa? | Wi-Fi w metrze
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działa Wi-Fi w hotelu. Miłego oglądania! http://www.youtube.com/watch?v=xSmsQolrPWs...
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działają telefony nawigacje, w jaki sposób system o budowie trasy mierzą i biorą pod uwagę korki. Miłego oglądania! http://www.you...
Jak to działa? | Kamery zatwierdzenia naruszeń przepisów ruchu drogowego
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o fotoradarach zatwierdzenia naruszeń przepisów ruchu drogowego, zasady ich pracy, błędy pomiarowe i wiele innych. Miłego oglądania! http://w...
Jak to działa? | Intelligent video surveillance
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o inteligentnym nadzoru: zasady pracy inteligentnych systemów analizy i identyfikacji obiektów i wiele innych. Miłego oglądania! http://www.y...
Jak to działa? | Elektrownia wodna
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o elektrownie wodne: w zasadzie jej pracy, rekordowej SPRAWNOŚCI najważniejszych zalet i wad. Miłego oglądania! ...
Na aukcji za 15 tysięcy dolarów został sprzedany 90-letni okaz formy
Wiadomość o tym, że ktoś postanowił wydać 14 617 dolarów amerykańskich na wstrętny wzór formy, może wydawać się szalony. Ale tylko do momentu, gdy nie wiesz, co to może być najważniejsza w historii ludzkości kiedykolwiek spłodził ...
Jak to działa? | Farma wiatrowa
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o wiatrowej: zasady jej pracy, zalet i wad. Miłego oglądania! ...
Nad wieloma krajami europejskimi oznaczony podwyższony poziom promieniowania
W ubiegłym miesiącu, raz nad wieloma krajami europejskimi odnotowano niewielki wzrost poziomu promieniowania tła. Przy tym źródło tego promieniowania tła tak jak do tej pory i nie zidentyfikowane. Najpierw lekki wzrost promieniowa...
#этоинтересно | Najbardziej niezwykłe parkingi
Dzisiaj prezentujemy 184-szy i ostatni problem transmisji #этоинтересно, w którym porozmawiamy o najbardziej niezwykłych sportów zimowych. A mianowicie chodzi o Wolfsburg's przemysłowe Volkswagen Autostadt, Michigan Theatre, 1111 ...
#этоинтересно | Najbardziej nietypowe sporty zimowe
Dzisiaj prezentujemy 183 odcinek transmisji #этоинтересно, w którym porozmawiamy o najbardziej niezwykłych sportów zimowych. A mianowicie chodzi o сноукайтинге, zimowym przejażdżki polo, брумболе i wiele innych. Miłego oglądania! ...
Uwaga (0)
Ten artykuł nie ma komentarzy, bądź pierwszy!