Moduly rozpoznávání hlasu: pracovní postup a aplikace

Vyzkoušejte Náš Nástroj Pro Odstranění Problémů





Pokrok v technologii vyvinul inteligentní techniku ​​rozhraní člověk-stroj, která umožňuje ovládání počítačů nebo strojů nebo robotů pomocí hlasových příkazů člověka bez použití jakýchkoli vstupních systémů, jako jsou klávesnice nebo myš. Toto rozhraní člověk-stroj (HMI) lze dosáhnout pomocí hlasové rozpoznávání moduly. V tomto článku se budeme zabývat moduly rozpoznávání hlasu spolu s jejich pracovními postupy a aplikacemi.

Hlasový modul

Hlasový modul



Modul rozpoznávání hlasu

Rozpoznávání hlasu je technika, která umožňuje přirozenou a pohodlnou práci rozhraní člověk-stroj pomocí modulu rozpoznávání hlasu. Extrahuje a analyzuje hlasové funkce člověka dodávané do stroje nebo počítače přes mikrofon. Technika rozpoznávání hlasu je rozdělena do mnoha typů na základě různých kritérií, jako je rozsah uživatelů, množství slov použitých k rozpoznání, přirozenost mluvení. Pokud je úroveň rozpoznávání hlasu více než 95%, pak se prakticky použije pouze rozpoznávání hlasu.


Pracovní princip modulu rozpoznávání hlasu

HM2007 je jednočipový CMOS modul rozpoznávání hlasu. Jedná se o analogový front-end analogový rozsáhlý integrovaný obvod s procesem hlasové analýzy, rozpoznávání řeči a rozpoznávání hlasu. HM2007 lze provozovat ve dvou režimech: manuální režim a režim řízení CPU.



HM2007

Kolíkové schéma HM2007

V manuálním provozním režimu se modul rozpoznávání hlasu HM2007 používá k vytvoření jednoduchého systému rozpoznávání připojením komponent, jako je klávesnice, SRAM s pamětí 8 kB a další komponenty. Pokud je napájení zapnuto, pak HM2007 zahájí proces inicializace a pokud je pin WAIT L, pak HM2007 zkontroluje externí paměť: 8Kbyte SRAM - ať už je to perfektní nebo ne. Pokud je však WAIT H, pak HM2007 proces kontroly paměti přeskočí. Po tomto inicializačním procesu se HM2007 přesune do režimu rozpoznávání. Pokud je v režimu rozpoznávání pin WAIT H, je HM2007 připraven přijmout hlas a zahájí proces rozpoznávání. Pokud je WAIT pin L, pak HM2007 nepřijímá hlas, který má být rozpoznán. Poté tréninkem nových vzorů vymazáním trénovaných vzorů jsou dvě operace prováděné pomocí funkčních kláves: TRN a CLR. Všechny vzory v HM2007 lze vymazat zadáním číselné klávesy 99 a stisknutím CLR.

V provozním režimu řízení CPU je v tomto režimu poskytováno několik funkcí, jako jsou RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET funkcí modulu rozpoznávání hlasu HM2007. Podobně jako v ručním režimu provozu se v tomto režimu také na základě různých kritérií provádějí operace zapnutí, rozpoznávání, trénování, výsledné, nahrávání, stahování a resetování.

Aplikace modulu rozpoznávání hlasu

Hlasově ovládané robotické vozidlo

Hlasově ovládaná sada pro projektování robotických vozidel

Hlasově ovládaná sada pro projektování robotických vozidel

Hlasově řízené robotické vozidlo se systémem rozpoznávání řeči na dlouhé vzdálenosti je navrženo tak, aby bylo možné jej ovládat pomocí rozhraní člověk-stroj a hlasovými příkazy pro dálkové ovládání robotického vozidla. An 8051 mikrokontrolér se používá společně s modulem rozpoznávání hlasu nebo modulem rozpoznávání řeči pro dosažení požadované operace. Směr pohybu robotického vozidla lze ovládat pomocí hlasových příkazů nebo tlačítek. Hlasové příkazy jsou vysílány RF z vysílacího konce směrem k přijímacímu konci. Robotické vozidlo se tedy pohybuje vpřed, vzad, doleva nebo doprava na základě příkazů přijatých přijímačem.


Blokové schéma vysílače roboticky ovládaného hlasu

Blokové schéma vysílače roboticky ovládaného hlasu

Tento pohyb robotické vozidlo v určitém směru lze ovládat pomocí dvou motorů, které jsou propojeny s mikrokontrolérem řady 8051. RF vysílač převádí příkazy stiskem spínače nebo hlasovými příkazy, které se převádějí na zakódovaná digitální data ve prospěch přijatelného dosahu (až 200 metrů) od robotického vozidla. Zakódovaná data přijatá v obvodu přijímače jsou dekódována k odeslání do jiného mikrokontroléru pro řízení stejnosměrných motorů pomocí ovladače motoru IC pro řízení směru a pohybu motorů pomocí dekódovaných dat hlasových příkazů.

Blokové schéma přijímače hlasem ovládaného robotického vozidla

Blokové schéma přijímače hlasem ovládaného robotického vozidla

Toto hlasem ovládané robotické vozidlo s projekty rozpoznávání řeči na dlouhé vzdálenosti lze integrovat s Technologie DTMF který usnadňuje ovládání robotického vozidla pomocí mobilního telefonu. Tato technologie DTMF poskytuje ve srovnání s technologií RF komunikaci na velmi dlouhou vzdálenost - robotická vozidla tak mohou být ovládána na dálku z velmi velké vzdálenosti.

Obvod hlasového záznamu a přehrávání

APR 9301 IC

APR 9301 IC

APR 9301 IC

APR 9301 IC se skládá z 28 pinů a energeticky nezávislé paměti flash. Usnadňuje záznam 100 000 cyklů a ukládání paměti po dobu přibližně 100 let. Pro normální provoz integrovaného obvodu APR 9301 je zapotřebí pouze nízké napětí 5 V a 25 mA.

Práce s obvodem hlasového záznamu a přehrávání

APR 9301 IC funguje nahrávání a přehrávání hlasu operace. Záznam lze provádět přijímáním hlasových signálů pomocí kvalitního (jakéhokoli) kondenzátorového mikrofonu připojeného k 17 a 18 pinům integrovaného obvodu. Pokud zavřeme přepínač S1, lze spustit režim nahrávání pro snadné nahrávání hlasové zprávy po dobu 20 - 30 sekund. Jako indikace záznamu bude LED připojená ke kolíku 25 APR 9301 IC blikat, dokud bude L kolík 27 uzemněn.

Obvod hlasového záznamu a přehrávání

Obvod hlasového záznamu a přehrávání

Po dokončení 20 cyklů s poslední pamětí se proces záznamu automaticky ukončí změnou hodnoty odporu R1 připojeného k pinům 6 a 7 IC APR 9301. Maximální doby trvání záznamu 20 sekund, 24 sekund a 30 sekund lze získat změnou hodnot rezistoru R1 na 52K, 67K a 89K.

Během přehrávání se vstupní část automaticky ztlumí. Pokud je spínač S2 sepnutý, pak zpráva přijde z reproduktoru od začátku zaznamenaných zpráv. Pokud jsou funkce nahrávání nebo přehrávání dokončeny, přejde APR 9301 IC do pohotovostního režimu.

Tento obvod lze akumulovat na společné desce plošných spojů. Základnu IC APR 9301 připájejte opatrně, aby nedošlo ke zkratu mezi kolíky integrovaného obvodu. Po namontování na desku plošných spojů zkontrolujte obvod a poté připojte IC k základně IC. Před napájením obvodu pečlivě zkontrolujte připojení kolíků. 5V regulátor s napájením na bázi IC se používá k napájení obvodu. K získání čistého zvuku se používá kvalitní 2palcový reproduktor s 8 ohmy. Záznam lze provést stisknutím přepínače S1. Zvukové signály (řeč nebo hudba) jsou snímány mikrofonem a jsou předávány IC, kde jsou hlasové signály ukládány do paměťových buněk. Pokud sepneme spínač S2, spustí se přehrávání a přes reproduktor uslyšíme zaznamenanou zprávu.

Modul pro rozpoznávání hlasu lze použít v mnoha aplikacích, například pro ovládání leteckých systémů pomocí hlasových povelů pilotů, pro ovládání motorového vozu pomocí hlasu aktivovaného multiprocesoru atd. Pokud máte zájem vědět o elektrické a elektronické projekty na základě modulu rozpoznávání hlasu nás pak můžete kontaktovat zveřejněním komentářů v sekci komentářů níže.

Fotografické kredity: