Rozmawialiśmy na temat rozpoznawania mowy, dzisiaj omówimy drugą zadanie. Tak, jak dzieje się synteza mowy, lub, innymi słowy, konwersja dowolnego tekstu na głos — o tym w dzisiejszym wydaniu!
Http://www.youtube.com/watch?v=a_OeS-ORWQQ
Zadanie syntezy mowy decyduje się w kilku etapach. Przede wszystkim specjalnemu algorytmowi należy przygotować tekst, aby robot było wygodnie go czytać: zapisuje wszystkie liczby słowami i odszyfrowuje redukcji. Następnie tekst jest dzielony na poszczególne frazy, które trzeba czytać z ciągłym intonację — system koncentruje się na znaki interpunkcyjne i trwałe konstrukcje.
Dalej do wszystkich słów składa się transkrypcja fonetyczna. Aby zrozumieć, jak czytać słowo i gdzie umieścić w nim akcent, system uzyskuje dostęp do wbudowanych, sporządzony ludźmi słowników. Jeśli żądane słowo w nich brakuje, komputer buduje transkrypcji samodzielnie, opierając się na akademickie zasady. Jeśli ich nie wystarcza, chodzi wchodzą statystyczne zasady: system sortuje wpisy mówców i określa, na jaką sylabę robili akcent.
Gdy transkrypcja skomponowana, komputer oblicza, ile jest w niej ramek, lub, innymi słowy, fragmentów o długości 25 milisekund. Dalej każda ramka opisano wiele parametrów: częścią jaki fonemy on jest, jakie miejsce w niej zajmuje, w jaki sylabę wchodzi ten fonem. Opisano również ударность lub безударность fonemy, w przypadku jeśli jest to samogłoska. Ponadto, system tworzy właściwą intonację, wykorzystując dane wyrażenia i zdania.
Następnie system automatycznie włącza akustyczną model, aby przeczytać przygotowany tekst. Ona ustawia zgodności między фонемами z pewnymi cechami i dźwiękami. Akustyczna model wie, jak poprawnie wymówić фонему i nadać właściwą intonację zdania dzięki maszynowej uczenia się. Im więcej danych, na których uczy się model, tym lepiej zapomoga jej wynik.
Co do głosów, to rozpoznawalne je robi, w pierwszej kolejności, głos, który zależy od cech budowy narządów mowy urządzenia. Brzmienie każdego głosu można modelować, czyli opisać jego cechy — to wystarczy, aby wyrecytować w studio niewielką ilość tekstów. Po tym dane o brzmieniu można używać w syntezie mowy w dowolnym języku. Gdy system potrzebuje coś powiedzieć, ona wykorzystuje generator fal dźwiękowych — vocoder. Pokazuje informacje o częstotliwości cechach zdanie, pochodzące od akustycznej modelu, a także dane o brzmieniu, który nadaje głosu rozpoznawalną barwę.
Warto zauważyć, że nowoczesne technologie syntezy mowy mają pewne problemy. Pierwsza z nich polega na искусственности. Każda syntetyzującym rozchodzenie się człowiekiem z trudem, i jest on zmuszony wykorzystać dodatkowe zasoby dla jej zrozumienia. W ten sposób ludzie mogą normalnie postrzegać syntezatorowy chodzi tylko około 20 minut. Również u syntezatora mowy, jak zwykle, brakuje emocjonalne zabarwienie, a ona ma niską odporność na zakłócenia. Innymi słowy, postrzegania syntezatora mowy człowiekowi przeszkadzają wszelkie, nawet najmniejsze szumy.
Bardziej:
Ile zwierząt zostało uratowanych przed całkowitym wyginięciem?
Pomimo najlepszych wysiłków ludzi, wielu zwierząt nie można już uratować. Ale niektórzy nadal przetrwać Dziesiątki gatunków są zagrożone wyginięciem każdego roku z powodu działalności człowieka. Na szczęście naukowcy z całego świata monitorują swoje ...
Najbardziej niebezpieczne mrówki: gdzie żyją i jak boli gryzą?
W świecie istnieje 90 gatunków mrówek-buldogi, ale najbardziej niebezpiecznych z nich to Myrmecia pilosula Przyroda Australii jest bardzo zróżnicowana i będzie dla ludzi bardzo niebezpieczne. To właśnie w tym punkcie naszej planety zamieszkują jedne ...
Jak budowano egipskie piramidy?
Najbardziej znany z egipskich piramid jest piramida Cheopsa Egipskie piramidy uważane są za jedne z najbardziej tajemniczych budowli na świecie. W tej chwili akademicy wiadomo o 140 konstrukcjach, z których większość przeznaczona była dla pochówku fa...
Nowości
Jak to działa? | Rozpoznawanie mowy
Pierwsze urządzenie do rozpoznawania mowy pojawiło się w 1952 roku, mogło rozumieć wypowiadane przez człowieka cyfry. 40 lat później zostały zaprezentowane pierwsze komercyjne programy, które rozpoznają mowę człowieka. Były one pr...
Jak to działa? | Skaner tęczówki
Technologia skanowania tęczówki została po raz pierwszy zaproponowana w 1936 roku okulista Frankiem Буршем. Oświadczył on, że irys oczy każdego człowieka jest wyjątkowy. Prawdopodobieństwo jej trafienia wynosi około 10 do minus 78...
Jak to działa? | Skaner linii papilarnych
Identyfikacja na podstawie odcisku palca — jeden z najbardziej niezawodnych sposobów w celu potwierdzenia tożsamości osoby. Dokładność taka metoda ustępuje tylko skanowania siatkówki oka i analizy DNA. Odcisk palca — t...
Historia myszy komputerowej bierze swój początek 9 grudnia 1968 roku, kiedy to został zaprezentowany na targach interaktywnych urządzeń w Kalifornii. Patent na ten gadżet otrzymał Douglas Энгельбарт 2 lata później. Pierwszym kompu...
Historia komputerowej klawiatury liczy już ponad 150 lat. Pierwowzorem współczesnej klawiatury były maszyny do pisania, które pojawiły się w połowie XIX wieku. Najpierw klawisze z literami umieszczone alfabetycznie. Jednak z czase...
panel Dotykowy, lub inaczej touchpad, został wynaleziony w 1988 roku George Герфайде. Następnie firma Apple koncesjonowali jego projekt i, począwszy od 1994 roku, stała się używać w komputerach PowerBook. Od tego czasu touchpad je...
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działa dysk SSD. Miłego oglądania! http://www.youtube.com/watch?v=tg9qRyCKbN4...
"Internet rzeczy" — kolejna modna fraza, którą w ostatnim czasie można usłyszeć coraz częściej. W rzeczywistości, powstała ona dużo wcześniej, niż myślisz, ale dopiero teraz potencjał tego zjawiska każe poważnie zastanowić s...
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działają sieci 5G. Miłego oglądania! ...
Jak to działa? | Wi-Fi w samolocie
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działa Wi-Fi w samolocie. Miłego oglądania! http://www.youtube.com/watch?v=ytmb6jmjOXI...
Co nam pokażą na paradzie Zwycięstwa — 2017?
Tradycyjna parada Zwycięstwa, który odbywa się 9 maja w samym sercu naszej ojczyzny na placu Czerwonym miasta Moskwy, pozwala osobiście zobaczyć najnowsze выскотехнологичной sprzętu wojskowego produkcji krajowej. Nie będzie wyjątk...
Jak to działa? | Wi-Fi w metrze
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działa Wi-Fi w hotelu. Miłego oglądania! http://www.youtube.com/watch?v=xSmsQolrPWs...
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o tym, jak działają telefony nawigacje, w jaki sposób system o budowie trasy mierzą i biorą pod uwagę korki. Miłego oglądania! http://www.you...
Jak to działa? | Kamery zatwierdzenia naruszeń przepisów ruchu drogowego
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o fotoradarach zatwierdzenia naruszeń przepisów ruchu drogowego, zasady ich pracy, błędy pomiarowe i wiele innych. Miłego oglądania! http://w...
Jak to działa? | Intelligent video surveillance
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o inteligentnym nadzoru: zasady pracy inteligentnych systemów analizy i identyfikacji obiektów i wiele innych. Miłego oglądania! http://www.y...
Jak to działa? | Elektrownia wodna
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o elektrownie wodne: w zasadzie jej pracy, rekordowej SPRAWNOŚCI najważniejszych zalet i wad. Miłego oglądania! ...
Na aukcji za 15 tysięcy dolarów został sprzedany 90-letni okaz formy
Wiadomość o tym, że ktoś postanowił wydać 14 617 dolarów amerykańskich na wstrętny wzór formy, może wydawać się szalony. Ale tylko do momentu, gdy nie wiesz, co to może być najważniejsza w historii ludzkości kiedykolwiek spłodził ...
Jak to działa? | Farma wiatrowa
W dzisiejszym wydaniu naukowo-poznawczy program «Jak to działa?» porozmawiamy o wiatrowej: zasady jej pracy, zalet i wad. Miłego oglądania! ...
Nad wieloma krajami europejskimi oznaczony podwyższony poziom promieniowania
W ubiegłym miesiącu, raz nad wieloma krajami europejskimi odnotowano niewielki wzrost poziomu promieniowania tła. Przy tym źródło tego promieniowania tła tak jak do tej pory i nie zidentyfikowane. Najpierw lekki wzrost promieniowa...
#этоинтересно | Najbardziej niezwykłe parkingi
Dzisiaj prezentujemy 184-szy i ostatni problem transmisji #этоинтересно, w którym porozmawiamy o najbardziej niezwykłych sportów zimowych. A mianowicie chodzi o Wolfsburg's przemysłowe Volkswagen Autostadt, Michigan Theatre, 1111 ...
Uwaga (0)
Ten artykuł nie ma komentarzy, bądź pierwszy!