Sistem De Conversație Bazat Pe Inteligență Umjetno: 6 koraka
Sistem De Conversație Bazat Pe Inteligență Umjetno: 6 koraka
Anonim
Sistem De Conversație Bazat Pe Inteligență Umjetno
Sistem De Conversație Bazat Pe Inteligență Umjetno

Autor: Stanut Nicolae-Radu

Grupa: 333AB

Napomena: 8

Korak 1: Opišite funkcionalnost

Opišite funkcionalnost
Opišite funkcionalnost

Princin principiu sustav va fi asemănător

asistenților inteligenți pentru casă de tipul Google Assistant i Amazon Alexa, iskorištavanje pot da comenzi vocale aparatului, iar acesta va răspunde sau va face o anumită acțiune, în funcție de cerințele utilizatorului. Creierul acestui dispozitiv va fi un Raspberry pi 3, datorită faptului că sporne de Wi-Fi, acest lucru permițâ and conectarea la serviciul cloud Amazon, care for da „inteligență“systemlui.

Folosind poslužitelj u oblaku i na inteligenciji umjetne de Amazon, procjenjuje dispozitiv avea o funkcionalnom praktičnom identitetu u Amazon Alexa. De exemplu acest asistent virtual poate prezenta starea meteo, poate ține minte notițe, poate pune alarme, dar din păcate (sau fericire?), Aceste lucruri depind în totalitate de Amazon, iar comenzile dispozitivului se dau în limba engleză.

Ca și obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată înțelege coi comenzi și de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul să ajute la automatizarea unor procese, de exemplu aprinderea și stingerea unor lumini, oprirea unei award. Da biste to učinili, do API-ja na Amazonu možete dopustiti pristup lucruri.

Sursa poză:

Korak 2: Komponenta

Pentru realizarea proiectului am avut nevoie de următoarele komponente:

  1. Malina PI 3 B+

    Acest mini računalo za kreiranje novih programa, pravilo o verziji ili promjeni Linux Debiana za procesor ARM. De asemenea, acest model sporne wii de wi-fi, conexiunea la internet fiind absolut necesară pentru motoarele de text-în-vorbire vi vorbire-în-text

  2. PS kamera za oči

    Nakon postavljanja mikrofona ("urechea proiectului") am ales o cameră destinată consolei Play Station 3 deoarece sporne de un microfon puternic cu 4 canale, pronađite moj isftină decât o kameri web obișnuită

  3. Boxă portabilă

    Pentru prenesite informaciju o korisniku korištenja i o nevolji de un difuzor, am folosit o boxă cu fir primită de la un prieten

  4. 2 vatre + LED
  5. Caserolă

    Carcasa proiectului, o caserolă de sarmale: D

Korak 3: Hardver

Hardver
Hardver

După ce am adunat componentsntele, am trecut la Implere, schema este una foarte simplă. Boxa portabilă se povezuje na portul USB priključak za prehranu i portul jack pentru reprodukcija, kamera/mikrofon se povezuju na portalu USB prin care comunică na računalu. Am mai adăugat în schemă și led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Nimić komplicirati.

Korak 4: Softver

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator (voce), să transforme datele într-un format accesibil lui (text) și să le redea răspunsul sau confirmationmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii odvojeno:

  1. Un motor Speech-to-Text (STT), prije i unatrag datele de intrare (informacii transmise de utilizator prin vorbire)
  2. Un sustav de inteligență umjetan, pentru a lua decizii ai riješen problem
  3. Bez motornog pretvaranja teksta u govor (TTS), upotrijebite prijenosni prijenosnik pomoću kojega je potrebno potvrditi ili potvrditi

Pentru STT am folosit API-ul de la Google, denumit Google Speech API, care este gratuit, oferă o calitate mare a talkiei rati o rată mică de erori, dar oferă și un număr limitat de apeluri. Am ales acest API datorită faptului că această parte a systemlui este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardverski impuse računala (putere de processre, spațiu de stocare, memorija), folosirea unui servisi offline isključuje, așa că am optat pentru un serviciu Cloud, oferind oi o precizie mai mare, dar și un timp de răspuns mai, Google može objaviti sve što vam je potrebno za moto STT.

Pentru feedback-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este foarte mare consumator de resse și nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Speech Synthesis System, care of oferit gratuit sub o liceță de tipul MIT. Vocea este una ușor robotică, dar mult mi inteligibilă față de eSpeak, alt motor TTS offline. Avantajul său față de servicesile online este că nu are niciun fel de limitare la numărul de coversii.

Liantul dintre STT i TTS, precum i partea "iteligentă" este platforma denumită Jasper. O platformi otvorenog koda, dostupnoj na GitHub-u na linku: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus și ia decizii în funcție de input-ul utilizatorului. Kompatibilni ste s Raspberry PI, pronađite ga na Pythonu. Am ales această solution în detrimentul celor Cloud datorită modularităii, platforma permite folosirea oricărui serviciu STT și TTS, dar definii definirea oricărei acțiuni folosind limbajul de programme Python.

Sustav inteligencije umjetne prirode koji nije proceduralan, optimalan je za razliku od varijante u kojoj se nalazi sustav za učenje strojnog učenja (chatbot) ako je nedostupan administratorom. Natura platformei Jasper, pronađite bazată pe comenzi și acțiuni predefinite, limitează kapacitatea de convorbire, dar oferă un cadru potrivit pentru un asistent digital, acesta fiind și scopul proiectului.

Korak 5: Implementirajte

  1. Jesam li instalirao operativni sustav Raspbian za karticu microSD
  2. Am conectat camera dii difuzorul la Raspberry
  3. Ako sam konfigurirao operativni sustav, potrebno mi je briga da li sam instalirao tote bibliotecile i servise necesare, urmând toți pașii din acest ghid:
  4. Je li kreiran instalacijski modul, dodatna upravljačka jedinica s dodatnom funkcionalnom sustavom

Korak 6: Iskoristite

Image
Image
Utilizare
Utilizare
Utilizare
Utilizare

Ako ne instalirate monitor, konfigurirajte ga tako da se poveže s unaprijed definiranom bežičnom mrežom, kontrolira dispozitivnu konfiguraciju ispisanog SSH-a. Jasper permite două tipuri de interacțiune:

  1. Prin terminal (tekst) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jaspis

Din simplitate voi începe demonstrarea funcționalității prin intermediul terminalului. La rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Printre comenzile cunoscute se numără:

  • DEFINE + cuvânt - întoarce definiția din dicționar a cuvântului respectiv
  • TKO, ŠTO, KOLIKO, KOLIKO, KOLIKO + KOVIN - folosește API -ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - Folosește API -ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • ŠALA - spune o glumă
  • LUMOS/NOX - trajna/osvijetljena LED žaruljica
  • TRIVIJALNOST
  • MOVIES - informații despre film (imdb)
  • VIJESTI - citește știri

Modn modul voce, deschis la Introdure comenzii "jaspis" în linia de comandă, dispozitivul se pune în modul de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. N cazul de față cuvâtul cheie este "Jasper". După ce dispozitivul a auzit cuvântul cheie, acesta intră în modul de ascultare, putând să primească comenzi točan ca și în modulni tekst. După executarea comenzii, dispozitivul intră din nou în așteptare până la o nouă trezire a sa.

Preporučeni: