Alexa, Siri és a Google nem érti azt a szót, amit mondasz

amazon

Az utóbbi években hosszú távon jöttek az olyan hangsegítők, mint az Alexa, a Google asszisztens és a Siri. De minden javulásukhoz egy dolog visszatartja őket: nem értik meg. Túlságosan támaszkodnak bizonyos hangutasításokra.

A beszédfelismerés csak egy varázslat

amazon

A hangsegédek nem értik meg. Nem igazán. Amikor egy Google kezdőlapra vagy az Amazon Echo-ra beszél, lényegében szöveges szöveggé alakítja a szavait, majd összehasonlítja azt a várt parancsokkal. Ha pontos találatot talál, akkor az utasítások halmazát követi. Ha nem, alternatívát keres, hogy mit kell tennie annak alapján, hogy milyen információ van, és ha ez nem működik, akkor hibaüzenetet kap, mint például: „Sajnálom, de nem tudom, hogy . ”Kicsit több, mint a varázslatos nyugalom, hogy megragadjon a gondolkodásában.

Nem használhatja a kontextusos nyomokat a legjobb találgatáshoz, vagy akár hasonló témák megértéséhez is, hogy tájékoztassa döntéseit. A nehéz segédeszközöket sem nehéz kirakni. Miközben megkérdezheted Alexa-tól: „Te dolgozol az NSA-nál?”, És kapsz választ, ha megkérdezed, hogy „Titokban vagy-e az NSA-nak?”, Kapsz egy „Nem tudom, hogy ez az egyik” választ (legalábbis az az írás időpontja).

Az emberek, akik valóban megértik a beszédet, nem működnek így. Tegyük fel, hogy kérdezsz egy embert: „Mi az a klarvain az égen? Az, amelyik ívelt, és tele van csíkos színekkel, mint a piros, narancssárga, sárga és kék. ”Annak ellenére, hogy a klarvain elkészült szó, a megkérdezett személy valószínűleg kiderül, hogy egy szivárványt ír le.

Bár azt állíthatod, hogy az ember eszmékké alakítja a beszédet, az ember ezt követően tudást és megértést alkalmazhat, hogy válaszoljon. Ha kérdez egy embert, ha titokban dolgoznak az NSA-nak, akkor igen vagy nem válaszolnak, még akkor is, ha ez a válasz hazugság. Egy ember nem mondaná, hogy „nem tudom, hogy ezt” egy ilyen kérdésre. Az, hogy az emberek hazudhatnak, valódi megértéssel jár.

A hang-asszisztensek nem léphetnek túl a programozásukon

A hang-asszisztensek végső soron a programozott várt paraméterekre korlátozódnak, és a kívülről történő vándorlás megszakítja a folyamatot. Ez azt a tényt mutatja, amikor harmadik féltől származó eszközök jönnek be. Általában a parancsok, hogy kölcsönhatásba lépjenek velük, nagyon nehézkes, ami azt jelenti, hogy „megmondja az eszközgyártónak, hogy parancsoljon opcionális argumentumra.” Példa erre: „Mondd Whirlpool-nak, hogy szüneteltesse a szárítót.” Ha még nehezebb emlékezni, például a Genfi Alexa készség irányítja néhány GE sütőt. A készség felhasználójának emlékeznie kell arra, hogy „mondja el Genfnek”, nem „mondja el a GE-nek”, akkor a többi részt. És bár megkérdezheti, hogy a sütőt előmelegítse 350 fokra, nem követheti azt a kérést, hogy a hőmérsékletet további 50 fokkal növelje. Egy ember azonban követheti ezeket a kéréseket.

Az Amazon és a Google nagyon keményen dolgozott ezen akadályok leküzdésében, és megmutatja. Ahol egyszer kellett követni a fenti sorrendet, hogy vezérelje az intelligens zárat, most azt mondhatja, hogy „zárja be az elülső ajtót”. Az Alexa-t megzavarta, hogy „mondja el nekem egy kutya viccet”, de kérjen egyet ma, és működni fog. Változásokat adtak hozzá a használt parancsokhoz, de végül még mindig tudnia kell a megfelelő parancsot. A helyes szintaxist kell használnia a megfelelő sorrendben.

És ha úgy gondolja, hogy úgy hangzik, mint egy parancssor, nem tévedsz.

A hang-asszisztensek egy képzeletbeli parancssor

A Parancssor szűken definiált, hogy egyszerű feladatokat végezzen, de csak akkor, ha ismeri a megfelelő szintaxist. Ha elhagyja a helyes szintaxist, és a dir parancs helyett írja be a dyr parancsot, akkor a parancssor hibaüzenetet kap. A varázslatok használatával könnyebben emlékezhet a parancsokra, de el kell gondolkodnia arról, hogy az eredeti parancsok hogyan működnek, hogyan működnek, és hogyan használják az álneveket hatékonyan. Ha nem veszi el az időt, hogy megtanulja a parancssorból, akkor soha nem fog sokat kihozni belőle.

A hangsegédek nem különböznek egymástól. Meg kell ismernie a helyes módot, hogy mondjon egy parancsot, vagy kérdezzen. És tudnia kell, hogyan állíthat be csoportokat a Google és az Alexa számára, miért elengedhetetlen az eszközök csoportosítása és az intelligens eszközök megnevezése. Ha nem követi ezeket a szükséges lépéseket, úgy fogja érezni, hogy csalódást kelt a hangszolgálati asszisztensnek, hogy kapcsolja ki a tanulmányt, hogy csak azt kérje, hogy „melyik tanulmány” legyen kikapcsolva.

Még akkor is, ha a megfelelő szintaxist a megfelelő sorrendben használja, a folyamat sikertelen lehet. Vagy a helytelen válasz, vagy meglepő eredmény. Két ugyanabban a házban lévő Google Homes adhat időjárást kissé eltérő helyszínekre, még akkor is, ha hozzáférnek ugyanazon felhasználói fiók információihoz és internetkapcsolatához.

A fenti példában az „Időzítő beállítása fél órára” parancsot adjuk meg. A Google Home hub létrehozott egy „Óra” nevű időzítőt, és megkérdezte, hogy az időzítő mennyi ideig legyen. Mégis ugyanaz a parancs megismétlése háromszor ismét megfelelően működött, és létrehozott egy 30 perces időzítőt. Az „Időzítő beállítása 30 percre” parancs használata következetesen működik megfelelően.

Míg a Google Home-hoz vagy az Echo-hoz való beszélgetés folyékonyabb lehet, a kapucnis hangszórók és a parancssorok ugyanúgy működnek. Lehet, hogy nem kell új nyelvet tanulnia, de új nyelvjárást kell tanulnia.

A hangsegédek szűk megértése korlátozza a növekedést

Ez egyáltalán nem akadályozza meg, hogy a Google asszisztens és az Alexa hangos asszisztensei elég jól működjenek (bár Cortana más történet). Google Assistant és Alexa, és az interneten keresni a kérdéseket tisztességesen, bár nem meglepő, hogy a Google jobban keres, és válaszolhat az alapvető kérdésekre, mint a mérési konverziók és az egyszerű matematika. A helyesen beállított okos otthoni és jól képzett felhasználóval a legtöbb intelligens otthoni parancs a tervezett módon működik. Ez azonban munkán és erőfeszítésen, nem szellemi megértésen ment keresztül.

Az időzítők és a riasztások korábban egyszerűsítettek. Idővel hozzáadták az elnevezést, majd az időt egy időzítő hozzáadásához. Az egyszerűségről a bonyolultabbra költöztek. A hang-asszisztensek több kérdésre válaszolhatnak, és minden nap új készségekkel és funkciókkal jár. De ez nem a tanulásból és a megértésből származó önnövekedés eredménye.

És ezek egyike sem nyújtja a benne rejlő képességet arra, hogy az ismert, hogy elérje az ismeretlenet. Minden olyan parancs és kérdés esetében, amelyik működik, mindig három lesz, ami nem. Áttörés nélkül A.I. hogy az ember-szerű megértést képes megérteni, a hangsegédek egyáltalán nem asszisztensek. Csak a helyes forgatókönyvben hasznosak, de csak azok a forgatókönyvek, amelyeket megértettek.

Más szóval: a gépek a dolgokat tanulják, de nem értik őket.