[Re:] Hallgatózott az Alexa - LOGOUT.hu Hozzászólások

üzenetek

hozzászólások

-Skylake-
(addikt)

"Ha egyszer valóban kiderülne, hogy mindenféle visszajelzés nélkül, valóban titokban rögzítene bármelyik ilyen eszköz, akkor az hír érték lenne, minden más eset, csak egy felfújt lufi!"

Ahhhhhhhhhhhha, pont mint mikor nyilvanossagra kerultek a snowden aktak, aholis amugy pontosan ez tortent, kiderult, hogy ez egesz nyomorult vilagot ott es ugy kovetik ahogy tudjak es abbol is mi lett ? Tuntetesek , haboruk tortek ki, kormanyok buktak meg. Ja varj. Nem mert jott a paraszt , "hejjejjjejej hat nekem nincsen titkoooonivalom dikkma" es viszlat. Ostoba tarsadalomra ilyesmit nem lehet alapozni, ha holnap kiderulne hogy a zalexa hallgatozik meg naplozza hogy mikor szarsz, garantalom, hogy az alexat vasarlo emberek 99% szembe se talalkozna ezzel a hirrel.

[ Szerkesztve ]

(#82) Tommmysun -Skylake- (#81)

Tommmysun
(senior tag)

Én viszont rögtön kidobnám és szerintem azért még nagyon sokan szintén... nem biztos, hogy megérné ez az Amazonnak, mert szerintem meg nagyot bukna rajta, nem 1%ot! Ezt még annak tükrében is így gondolom, hogy a Snowden üggyel kapcsolatban teljesen igazat adok neked ... baromira nem történt semmi, mint ahogy pl. az egyértelműen kiderült választási csalásokkal sem.
De a korábbi mondani valóm szempontjából nem is ez lenne a lényeg, csak azt mondtam, hogy az valóban fontos hír lenne (a következményei megint más kérdés), viszont a mostani eset csupán egy bulvárosra sikeredett cikk (főleg a címe miatt), amiből sokan rögtön azt mondják, hogy itt a bizonyíték, hogy lehallgat, stb.

(#83) kymera

kymera
(senior tag)

WTF ????? Maga a felvételt küldte el egy a kontakt-listában szereplő egyénnek ? Ez komoly ? :DDD
És erre a mérnökök azt válaszolták hogy "bocsi , legközelebb jobban vigyázunk " ?

(#84) dezz Tommmysun (#80)

dezz
(nagyúr)

Blog

Az a baj, hogy itt még csak nem is olyan részletkérdésekről van szó, amikbe valóban kevésbé látni bele kívülről, hanem szarvashibákról. Nem tud különbséget tenni a "szerkezet", hogy a nevén szólították (1s szünet - Alexa! - 1s szünet) vagy egy random szósorban felfedezhető egy hasonló hangalak? Hosszabb kihagyás utáni megszólításnál nincs egy "Yes?" fázis? A parancsnál sem különbözteti meg, hogy különálló szó-e vagy szintén nem ide vonatkozó szavak sorában szerepelt egy hangalak? A megerősítési kérést csak úgy elengedi az éterbe, nem figyelve arra, hogy beleszól egy beszélgetésbe?

Jól látható, hogy itt egy nagyon egyszerű vezérlésről van szó, ami különféle hangalakokra figyel, de azon kívül másra nem. Tisztára mintha az említett beszélő-hangfelismerő barkóbázó tescos ~~kutyát~~ cicát kicsit átprogramozták volna...

Barkóba cica

Valószínűleg te is látnád ezt, ha nem folytonosan kifogásokat keresnél és helyettük is magyaráznád a bizonyítványt. A vezető programozónak és néhány értelmesebb managernek nagyon éghet most ott a feje...

Az Apple és a Google hasonló eszközei valószínűleg jóval kifinomultabbak, átgondoltabbak, profibbak.

(#85) Tommmysun dezz (#84)

Tommmysun
(senior tag)

"Valószínűleg te is látnád ezt, ha nem folytonosan kifogásokat keresnél és helyettük is magyaráznád a bizonyítványt." Eszem ágában nincs őket védeni, nem fizetnek engem ezért , de én továbbra sem gondolnám ilyen egyszerűnek a kérdést, mint ahogy te levezeted és én inkább csak arra próbálnék rávilágítani, hogy nem mindig egy gépet, vagy annak a fejlesztőit kell hibáztatni a felhasználói felelőtlenség vagy hülyeség miatt.

"Az Apple és a Google hasonló eszközei valószínűleg jóval kifinomultabbak, átgondoltabbak, profibbak." Nem igazán, a legtöbb teszten vagy rosszabbul, vagy hasonlóan működnek.

"Nem tud különbséget tenni a "szerkezet", hogy a nevén szólították" Továbbra is csak azt tudom mondani, hogy ezt még sokszor egy ember is képes "benézni", vannak korlátai a dolognak és én még mindig nem tartom megoldásnak a 1-2 másodperces kivárást, nem praktikus, és ha így is működne, még akkor is lehetnének az eszköz számára félreértelmezhető szituációk. Szerintem ez kb kiküszöbölhetetlen 100%-osan. Ahogy korábban is írtam én praktikusabbnak tartanám, ha azt érzékelné valamilyen módon az eszköz, hogy felé fordulunk, vagy sem... de ezt egyelőre egyik hasonló eszköz sem tudja, nem véletlenül és nem állítom azt sem, hogy ez tökéletes megoldás lenne... ennek is meg lennének a hátrányai.

A "Yes" fázis alatt nem pontosan értem mire gondolsz, de ha egy bizonyos visszareagálásra, akkor az jelenleg is megvan, minden kérésre van valamilyen reakció, csak nem kéne ezt figyelmen kívül hagynia a felhasználónak!

A szótagoltság érzékelése sem gondolnám, hogy egy tök egyszerű dolog, főleg angol nyelven, ahol azért nem igazán a tagoltság jellemző az "élő" beszédre.

(#86) stellaz Tommmysun (#85)

stellaz
(addikt)

"Szerintem ez kb kiküszöbölhetetlen 100%-osan."

Mondjuk addig nem volna muszáj piacra dobni az eszközt.... arról nem beszélve, hogy olyan embereket is lehallgathat, aki nem tulajdonosa, azaz nem tudja, hogy van ilyen eszköz a közelben és azt hogyan kell használni, pl. vendégek, hatósági emberek, stb.

(#87) Tommmysun stellaz (#86)

Tommmysun
(senior tag)

Akkor szerintem 50 év múlva sem dobhatnák piacra!

A eszköz alapvetően jól használható, csak a mai technológiával kb ezt lehet elérni. Ennyi erővel, a kerékpárt sem szabadott volna annak idején piacra dobni, hiszen a mai napig tökéletesítik és még fogják is jó pár évig.

Továbbra sem neveznék egy ilyen esetet lehallgatásnak, de ennyi erővel egy véletlenül (vagy szándékosan) bekapcsolva hagyott diktafon is kockázati tényező, az is képes vendéget, hatósági embert lehallgatni! És akkor lehet azt kérdezni, hogy miért nem ismeri fel intelligensen a diktafon, mikor hallgatózhat és mikor nem?

(#88) ddekany dezz (#84)

ddekany
(veterán)

"Nem tud különbséget tenni a "szerkezet", hogy a nevén szólították (1s szünet - Alexa! - 1s szünet) vagy egy random szósorban felfedezhető egy hasonló hangalak?"

Amúgy az ismert, hogy nem várja el, hogy egyértelmű szóhatár legyen az utasítások körül, vagy honnan jön ez? Látni/hallani kéne, hogy ez a "baleset" hogyan jött ez össze. És ha még olyan lazák is voltak, hogy nem várták el, hogy egyértelmű legyen a szóhatár... az addig OK, hogy ha úgy beszélünk, hogy összefolynak a szavak, akkor nagyon ritkán többféleképpen is értelmes szavakra lehet szeletelni a hallottakat. De még nyelvtanilag is és értelmében is stimmelnie kell, ami már nagyon esélytelen. Főleg hogy több egymás utáni mondat is kellett ehhez. Ráadásuk, még az is kell, hogy a félreértés kiderüljön a felhasználó számára, és az ügy eljusson a sajtóba is. Szóval eléggé gyanús, hogy egy pöttyet elkapkodták a kivitelezést...

Kicsit úgy hangzik ez az ügy, mintha betanítottak volna valami "neurális hálót", amiről fogalmuk sincs, hogy részleteiben hogyan működik, csak statisztikailag jónak tűnt... Kiemelném, fogalmam sincs mi volt a baj. (Itt eszembe jut az AI, ami meg tudta mondani, hogy egy képen kutya vagy farkas van. Néha viszont furcsa tévedései voltak. Kiderült, hogy ha havas volt a háttér, akkor erősen a farkas irányába húzott, hiszen a fotókon amiket látott, a havas vadonban voltak sokszor a farkasok...)

[ Szerkesztve ]

(#89) dezz Tommmysun (#85)

dezz
(nagyúr)

Blog

Ezért nem, de másért igen? Akkor végül is az Amazonnak dolgozol?

"mindig egy gépet, vagy annak a fejlesztőit kell hibáztatni a felhasználói felelőtlenség vagy hülyeség miatt."

Mindig nem is, de a jelen esetben, ha én lennék a pórul járt felhasználó, te a termékmanager és kimondanád az utóbbi szavakat, vagy célzást tennél rájuk, valószínűleg rád borítanám az asztalt...

"Nem igazán, a legtöbb teszten vagy rosszabbul, vagy hasonlóan működnek."

Lehet, hogy valamilyen teszteken akár rosszabbul teljesítenek, de kizártnak tartom, hogy az ilyen eseteket nem igyekeztek sokkal jobban elkerülni.

Az 1 másodperces szünet a megszólítása előtt és után nem praktikus, a felé fordulás viszont igen? Ne hülyéskedjünk már! Az sem praktikus, hogy ne szóljon közbe egy beszélgetésbe a reagálásával?

"A "Yes" fázis alatt nem pontosan értem mire gondolsz"

Volt róla szó: hosszabb szünet utáni megszólításnál kérdezzen vissza egy "Yes?"-szel, előtte-utána figyelve, hogy a felhasználó várja-e a visszajelzését, vagy folyamatosan beszél, mert akkor valószínű, hogy nem is hozzá szólt. (Emberek között is így megy ez...)

A megszólítás még angolban is tagolt. És valószínűleg eleve tagoltan kell elmondani a parancsokat ennek az eszköznek, hogy jobban értse, így eleve nem szabadna semmit belehallania egy nem tagolt beszédbe, ami a parancs részt illeti.

(#88) ddekany: "Amúgy az ismert, hogy nem várja el, hogy egyértelmű szóhatár legyen az utasítások körül, vagy honnan jön ez?"

[link] Nem ismerek az angolban "Alexa"-ra hasonlító különálló szót. Az sem valószínű, hogy utána rögtön a "send message" vagy hasonló hangzású (mi?) hangsor hangzott el, azaz ezt (is) más szavak közül halászta ki. A továbbiak ugyanígy.

Szerintem nincs itt semmilyen neuronális háló. Az egész úgy néz ki, mintha egy barkóba cica szintű cucc lenne, amit linkeltem, csak más szavakra figyel és mást csinál (egyszerű műveleteket). Röviden: nagyon kezdetleges, de eladható, mint "személyi asszisztens".

[ Szerkesztve ]

(#90) Realradical dezz (#89)

Realradical
(őstag)

Blog

Ha így lenne, akkor nem aratott volna a termék ekkora sikert.
Simán összerakja azt, ha a gyerek azt mondja "Bing mesét ( vagy akármilyen podcastot ) akarok nézni-hallgatni", hogy meg kell nyitni az iPlayert, mert a szereplő egy nyúl a BBC mesékben és adott epizódtól kell folytatni a lejátszást.
Nem tudom mennyire vagy otthon programozásban, de az, hogy ez alapján a kérés alapján ennyi üres változót kitölt és tovább ad az adott API-nak, az azért nem rossz.
Ha érdekel a témának a komplexitása, akkor regelj egy ingyenes AWS accountot és rakj össze egy egyszerű Lex botot a UI-n.

[ Szerkesztve ]

(#91) dezz Realradical (#90)

dezz
(nagyúr)

Blog

A "bing mese"-re rákeresve az első 5 találat + kapásból egy Youtube találat + egy sor képtalálat a szóban forgó mese és a nyuszi... Az "akarok nézni/hallgatni"-ből pedig elég egyértelmű, hogy el kell indítani a lejátszást, és akkor már a legutóbbi pozíciótól, ha még nem ért véget az adott rész.

Lehet, hogy van mögötte valamilyen egyszerű, neuronális hálónak nevezhető megoldás (ami rettentő messze van egy I Robot szintű MI-től), de a szövegfelismerést szerintem nem ez csinálja, hanem egy "barkóba cica" modul (amit egy viszonylag egyszerű script vezérel), ami aztán továbbadja a felismert szavakat.

Korábban más is jött már ezzel a 'te biztosan csak outsiderként kotyogsz bele, fogalmad sincs az egészről, a vérprofi Amazon programozók viszont... stb.' (nem szó szerint), ezért néhánnyal korábban már említem, hogy 30 éve programozok komolyabban.

[ Szerkesztve ]

(#92) Realradical dezz (#91)

Realradical
(őstag)

Blog

I Robot szintű MI-től
Lol! Szerintem a Johhny 5-től is távol van. Ezzel most vicceltél ugye? :DDD
Ha 30 éve programozol akkor nem kerülne sokba, hogy informált véleményed legyen (kb. 20 perc még Slack integrációval is). Gyárts egy Lex botot és csekkold le mi mindent el fog neked tárolni és értelmezni.

szerk: Ja feltételezem, hogy a könyvről beszélsz, hiszen az I robot film egy kalap kaka volt.

Így aktiváltad amit kellett?
http://iplayerhelp.external.bbc.co.uk/radio/amazon-alexa

[ Szerkesztve ]

(#93) Zsoxx

Zsoxx
(senior tag)

Kb. ennyire érti a beszédet az Alexa is?
https://youtu.be/2GgHaFvmY3s?t=42

[ Szerkesztve ]

(#94) dezz Realradical (#92)

dezz
(nagyúr)

Blog

Mintha nem tudnád, hogy sokakban milyen ködös elképzelések élnek az MI-ről. És jó lenne, ha nem oltogatnál, hanem arra reagálnál, amiket szarvashibaként felsoroltam.

(#95) atike Tommmysun (#87)

atike
(nagyúr)

A diktafon hangfelvételre készült. Az Alexa nem épp...

(#96) Tommmysun dezz (#89)

Tommmysun
(senior tag)

"Akkor végül is az Amazonnak dolgozol?"

Azt mondom, bár úgy lenne !

"...valószínűleg rád borítanám az asztalt... "

Lehet, de ez még nem jelenti azt, hogy igazad lenne .... nehéz a felhasználónak elismerni, hogy ő volt a hülye .

"de kizártnak tartom, hogy az ilyen eseteket nem igyekeztek sokkal jobban elkerülni."

Miért? A többi hasonló eszköz fejlesztését ismered? Vagy használod őket?

"Az 1 másodperces szünet a megszólítása előtt és után nem praktikus, a felé fordulás viszont igen?"

Ahogy írtam is, az én elgondolásom sem tartom tökéletesnek, csak jobbnak mint a szünetekre odafigyelést ... nem csak az eszköznek, nekem is figyelnem kéne rá, hogy pont elég időt hagyjak, stb. Én a legtöbbször ösztönösen jelenleg is oda fordulok az eszközhöz, hogy lássam is, a vizuális visszajelzést. Meg gondolom ez abból is jön, hogy amikor beszélget két ember, akkor is igyekeznek egymásra nézni.... de persze sötétben nehezebb ezt érzékelni, meg ha az ágyban fekszik valaki, akkor sem feltétlen néz rá, illetve fal vagy bármi más is belóghat ... tudom, de nekem még mindig jobban járható, mint a tagolgatás.

"hosszabb szünet utáni megszólításnál kérdezzen vissza egy "Yes?"-szel"

Minek kérdezzen vissza Yes-el, ha amúgy is van valami reakciója a kérésedre, kérdésedre, tehát van visszajelzésed, hogy aktív!?

"És valószínűleg eleve tagoltan kell elmondani a parancsokat ennek az eszköznek"

Tapasztalatom szerint nem .... sőt.

atike

A felvetett szituáció szempontjából ez viszont szerintem nem releváns! Az kívülálló személynek adott esetben ugyanúgy nem lesz tudomása arról, hogy rögzítik a hangját. De akkor legyen a példa egy zsebben véletlenül elinduló telefon hívás ... ugyanaz az eset. Lehet hogy rosszul tervezett a telefon, mert könnyen feloldható akár véletlenül is, de az is lehet (és inkább ez a jellemző), hogy a felhasználó kapcsol ki minden képernyőzár, stb funkciót ... ezért is a telefon fejlesztője a hibás? Szerintem nem!

[ Szerkesztve ]

(#97) atike Tommmysun (#96)

atike
(nagyúr)

Jelen esetben a rendszert használók sem tudták, hogy rögzítik a hangjukat. A te példádnál maradva ott szándékosság tényállása forog fent (úúúúú ez a kifejezés ) mivel valaki fel akarja venni a beszélgetést valamilyen céllal. Azaz van, aki tudja, hogy felvétel történik. Itt ilyenről szó sem volt. És ráadásnak a diktafon nem másolja le magát és küldi el akárhova amit felvett. Szóval sokszorosan nem jó a példa.

(#98) Zsoxx Tommmysun (#96)

Zsoxx
(senior tag)

A szüneteket hogy érzékelné, ha közben mondjuk szól a tévé, vagy másvalakik beszélgetnek a házban?

[ Szerkesztve ]

(#99) Realradical dezz (#94)

Realradical
(őstag)

Blog

Egy percig sem oltogattalak, fogalmam, sincs mit vettél magadra.
Ha az neked sértés, ha arra merek utalni, hogy nem tudsz mindent, akkor elnézést kérek. Én naponta tanulok új dolgokat.

(#100) dezz Tommmysun (#96)

dezz
(nagyúr)

Blog

"Lehet, de ez még nem jelenti azt, hogy igazad lenne"

Így kezdtem a mondatot: "Mindig nem is, de a jelen esetben, ha én lennék a pórul járt felhasználó". Sebaj.

"nehéz a felhasználónak elismerni, hogy ő volt a hülye"

Nem is tudom, én mintha ezt olvastam volna: "A mérnökök a logadatokból megállapították, hogy valóban úgy történt, ahogy a panaszos állította, ezért többszörösen is bocsánatot kértek, és megköszönték a figyelmeztetést. Ugyanakkor részleteket nem árultak el a meghibásodás okáról, csak annyit közöltek, hogy egy rendkívül ritka szituációról van szó, de mindent megtesznek, hogy ilyesmi többé ne fordulhasson elő."

"Miért?"

Azért, mert az Apple és a Google nem fogja lejáratni magát ilyen hibákkal.

Bocs, de nevetséges, hogy inkább forduljunk a készülék felé, ahelyett, hogy minimálisan odafigyelünk a tagolt megszólításra. Ha te terveznéd az Alexa 2-t, az sem ismerné fel szitut (minek az), inkább rá kell majd mutatni? (Azzal a felütéssel, hogy ilyen is van emberek között is.) Na ne.

"Minek kérdezzen vissza Yes-el, ha amúgy is van valami reakciója a kérésedre, kérdésedre, tehát van visszajelzésed, hogy aktív!?"

Pl. hogy elkerülhetők legyenek a hasonló helyzetek? Egy "Yes?" sokkal feltűnőbb egy más irányú beszélgetésben, adott esetben vitában, amikor egy hosszabb kérdést a készülék részéről az ember meg sem hall, mert nem oda figyel és nem is számít rá, hogy valamit parancsnak vett a pléhdoboz, amit nem kellett volna. Mellesleg a "Yes?"-nek el sem szabad hangzania, ha nem teljesülnek a vonatkozó feltételek, azaz emberek egy más irányú beszélgetése közben.

"ezért is a telefon fejlesztője a hibás?"

Nem régi eset: telefon duplabökkre ébredése zsebben is bekövetkezik. 1. Közelségérzékelőt nem veszi figyelembe. 2. környezeti fényérzékelőt nem veszi figyelembe. 3. egészen más ilyenkor a kapacitív mintázat, mint ha aszalon feküdne és pusztán egy ujjal megbökik, ezt sem veszi figyelembe. Szerinted ki a hibás? A felhasználó, mert használni akarna egy funkciót???

(#98) Zsoxx: Ha kellően jó, hogy egy ilyen hangzavarból kiszűrje a felhasználó hangját, akkor már különítse is el azt másokétól...

(#99) Realradical: Nézzük csak...

"Ha érdekel a témának a komplexitása" = 'fogalmad sincs a téma komplexitásáról'
"Lol! Szerintem a Johhny 5-től is távol van. Ezzel most vicceltél ugye?" = 'hülye vagy?'
"Ha 30 éve programozol" = 'már ha igaz' ("PH! nagyúr"-ként nyilván nekiállok valótlanságot közölni magamról.)
"akkor nem kerülne sokba, hogy informált véleményed legyen" = 'most csak úgy belepofázol"
"Ja feltételezem, hogy a könyvről beszélsz, hiszen az I robot film egy kalap kaka volt."

Ja, hogy ezeket nem is nekem írtad, csak úgy magamra vettem? Az mindjárt más! (Nem.)

Újabb hozzászólás tőled, újabb "sértés". Képzeld, én sem tudok mindent, nem is állítottam ilyet. Csak tudod, a semmi és a minden között van még egy pár fokozat.

Mindeközben érdemi reakciók = 0.

[Re:] Hallgatózott az Alexa - Mobiltechnológiák fórum

üzenetek

hozzászólások

üzenetek