WebQuatro

badam, zarządzam, projektuję, użytkuję

więcej o mnie

[up] Użyteczność — rozumiemy to?

Kategoria: Naukowe, Standardy, Subiektywne, Użyteczność

Tagi: , , , , ,


[update 27.04.2010] Czy­tałem dziś artykuł na inter­ak­ty­wnie i aż mnie zako­r­ciło, by wkleić słowa Andrea Resmini:

Użyteczność to cały zestaw tech­nik pomi­arów i zale­ceń, wynika­ją­cych z długiej trady­cji, której korze­nie tkwią jeszcze w cza­sach sprzed ery kom­put­erów: w ergonomii i wzor­nictwie przemysłowym.”

Kiedyś dawno temu nasza branża urodz­iła poję­cie “usabil­ity”, niefor­tun­nie tłu­mac­zone na pol­ski “funkcjon­al­ność” (w tłu­macze­niu książki Pearrow-a by Helion), następ­nie “użyteczność”. Wyko­rzys­tu­jąc tylko te poję­cie można przeprowadzić pełnowartoś­ciowy test na pro­fesjon­alną przy­dat­ność w branży.
Przeczy­ta­j­cie poniższe zdania:

  • Usabil­ity tej aplikacji należy poprawić.
  • Ten sajt ma niedostate­cznie dobre usability.
  • Inter­fejs jest zupełnie nie użyteczny.
  • Słaba użyteczność to jak zła ekolo­gia środowiska.

Jeżeli po przeczy­ta­niu tego:

  • nie macie ochoty pośmiać się lub popłakać,
  • wasza twarz nie została skrzy­wiona poprzez nies­maczny gry­mas lub wyraz żałoby,
  • wewnątrz nie roz­palił się ogień nienawiści,
  • żadne z powyższych nie pasuje, a wciąż uważa­cie się za specjalistę,
  • właśnie przy­pom­nieliś­cie sobie, że też nadużywa­cie powyższe zda­nia wyko­rzys­tu­jąc każdą (nie ważne czy właś­ciwą) do tego okazję,

to grat­u­luję. Wykryto dyle­tanta, gdyż tylko dyle­tant może bez poczu­cia winy i włas­nego sum­ienia, z prz­er­aża­jącą sta­bil­noś­cią wyko­rzysty­wać ter­min, którego nie rozu­mie i nie umie uży­wać właściwie.

Definicja zgod­nie z ISO 9241–11 mówi, że:

Usabil­ity — the extent to which a prod­uct can be used by spec­i­fied users to achieve spec­i­fied goals with effi­ciency, effec­tive­ness and sat­is­fac­tion in a spec­i­fied con­text of use.

Dodatkowo, trzeba pamię­tać o innych definic­jach (w poniższej tabelce zestaw­ie­nie porów­naw­cze “konceptów”):

ISO 9241–11 ISO 9126 Schakel 1991 Nielsen 1993 Shnei­der­man 1998
Effi­ciency Learn­abil­ity
Understandability
Learn­abil­ity Effi­ciency

Learn­abil­ity

Time to Learn
Speed Performance
Effec­tive­ness Oper­abil­ity Effec­tive­ness Mem­o­ra­bil­ity

Errors

Safety

Reten­tion over time

Rate of errors by users

Sat­is­fac­tion Sub­jec­tive attractiveness Sub­jec­tive attitude Sat­is­fac­tion Sub­jec­tive satisfaction
Porta­bil­ity Flex­i­bil­ity

Wystar­czy 2-minutowej anal­izy, aby zrozu­mieć, że:

  1. Użyteczność jest stop­niem kilku wskaźników. Nie może być ona zła czy dobra. Usabil­ity nie można polep­szyć lub pogorszyć, ale zwięk­szyć lub zmniejszyć.
  2. Nie ma żadnego ogól­nego stop­nia użyteczności. Poję­cie użyteczności zaw­iera w sobie metryki, które mogą być sko­relowane lub przeczyć sobie (np. szy­bkość uczenia się i szy­bkość “pracy” nie mogą być jed­nakowo wysokie).
  3. Usabil­ity nie jest syn­on­imem określeń tj. “wygoda”, “przy­jazność”, “intu­icyjność”, “zrozu­mi­ałość”, “łatwość” itp. Mówiąc o przy­jazności pamię­ta­jmy, że te słowo oznacza “przy­jaźnie nastaw­iony do kogoś/czegoś, życzący dobra”. Ani grama tu stop­nia efek­ty­wności, skuteczności czy satysfakcji.

Krótko mówiąc, użyteczność (ang. usabil­ity) nie ma syn­on­imów i nie będzie ich dopóki, dopóty szanowana społeczność spec­jal­istów nie umówi się wspól­nie dokładać kole­jne przymiotniki, rzec­zown­iki i inne części nie mające nic wspól­nego z użytecznoś­cią.
Użyteczność to poję­cie z ciężkim losem i najprost­szym sposobem na złagodze­nie jego cier­pi­enia jest wyłącze­nie tego słowa ze swo­jego słown­ika do momentu pełnego zrozu­mienia czym “ono” jest.
Przy okazji tego wylewu pragnę wyrazić uznanie Rober­towi Droz­dowi, bez którego pięknych wpisów świat pol­skiego usabil­ity nie byłby taki interesujący.

Spodobało się? Zapisz się na RSS.

12 wypowiedzi

  1. Szcz­erze mówiąc zaskoczył mnie ten artykuł, opis wskazuje na pomieszanie tem­atu testów inter­akcji HCI. Wydaje mi się, że autor nie jest ekspertem badań, a mimo to próbuje je tutaj opisy­wać – nieu­dol­nie niestety, co postaram się udowodnić.

    Mieszanie różnych pode­jść, potocznego i naukowego empirycznego nie wyjaś­nia sprawy. Panie Autorze! Pewnie Pan wie, że użyteczności to wyma­ganie niefunkcjon­alne, czyli nie da się go zmierzyć wprost. Wiedzą to wszyscy od “usability”.

    To od czego wychodz­imy w tym artykule, to potoczne określe­nia jakości inter­fe­jsu “niedostate­czne usabil­ity, nieużyteczny”. To co Pan później pisze o mod­elach pomi­aru empiryczego — to pro­ponowane miary w bada­ni­ach z użytkownikiem!

    Oczy­wiś­cie po raz kole­jny powtórzę, że takimi bada­ni­ami z użytkown­ikiem powinni zaj­mować się wyłącze­nie psy­cholodzy zna­jący pod­stawy badań, rozu­miejący poprawną metodologię badań!

    W artykule widać kom­pletny brak zna­jo­mości aktu­al­nego poziomu wiedzy na temat badań ekspery­men­tal­nych w psychologii.

    Mod­ele użyteczności takie jak ISO, Nielsena czy Shnei­der­mana zostały zwery­fikowane. Obec­nie służą nam do dziś (z pewnym praw­dopodobieńst­wem wyniku) do oceny jakości. Podob­nie jak testy IQ określają jedynie to co mierzą! Jak Pan wie mądrości też Pan nie zmierzy testem IQ, jed­nak jak się okazuje do dziś ten test jest stosowany dla dzieci w celu określe­nia pewnych predys­pozy­cji czy też dys­funkcji. Znamy kilka­dziesiąt testów inteligencji, ten najbardziej znany IQ też jest tylko mod­elem. Zna­jąc jego wady i zalety może się przy­dać do określonych czynności.

    Wskaźniki, służą do określa­nia speł­ni­a­nia mod­elu w naszym ekspery­men­cie — teś­cie użyteczności. Twierdze­nie, że użyteczność jest “stop­niem kilku wskaźników” to znowu niepre­cyzyjność autora. Prawdzie może być powiedze­nie, że wskaźniki użyte w bada­ni­ach wpły­wają zgod­nie z przyję­tym mod­elem teo­re­ty­cznym (np. wg ISO). Tak więc użyteczność nie jest żadnym “stop­niem”. A wpływ wskaźników wcale nie musi być prosty i lin­iowy, co w przy­padku krzy­wych uczenia jest wcale nie takie banalne. To właśnie ogólne miary użyteczności, posługują się wskaźnikami, ich wpływ na siebie jest banalny. Wpływ wielu zmi­en­nych na siebie jest badany w bada­ni­ach złożoności i zjawiskach chaosu. Pod­sumowu­jąc, tylko w tych wymienionych przez Ciebie mod­elach, pomiar jest uzyski­wany za pomocą konkret­nych wskaźników. Jed­nak są też inne sposoby pomi­aru, które nie składają wpływu tylko np. mogą badać efekt. Np. jeśli coś jest użyteczne to wiele osób zakupi dany towar itp.

    Usabil­ity jest (!) w potocznym języku syn­on­imem tych, podanych przez Ciebie określeń, jeśli mówimy o inter­fe­jsie! Co innego jeśli mówimy o usabil­ity jako pomi­arze inter­akcji HCI — wtedy fak­ty­cznie złożona miara para­metru “usabil­ity” odzwier­ciedla to na co wskazują miary z mod­elu teo­re­ty­cznego. Mieszanie tych spraw w jeden kubeł to pomyłka.

    Krótko mówiąc, autorze, proszę zas­tanów się zanim wrzu­cisz wszys­tko do jed­nego worka! Warto, żebyś zapoz­nał się też z meto­dami badań z użytkown­ikami, które od lat znane są w psy­chologii eksperymentalnej.

    Ad.2. “Nie ma żadnego ogól­nego stop­nia użyteczności” — to też jest częś­ciowa prawda. Jeśli czegoś nie da się zmierzyć bezpośred­nio, to nigdy nie będzie zmier­zone — racja?! …ale za to zawsze da się wymyślić model jak np ISO, który stara się zdefin­iować ogólny stopień użyteczności (prze­cież sam o tym piszesz, aby sobie kawałek dalej zaprzeczyć!). Posłużmy się przykła­dem, nie da się zmierzyć poziomu “zdrowia”, mogę zmierzyć wiele czyn­ników (samopoczu­cie, krew, RTG itp), aby stwierdzić jaki jest ogólny poziom mojego “zdrowia”. Czy to oznacza, że ogólny stopień zdrowia nie ist­nieje??? Naukowo oczy­wiś­cie, że nie ist­nieje, a jed­nak wiele z lekarzy zna mod­ele badań, które taki stopień określają. Każdy z nas z pewnoś­cią umie określić „ogólny poziom zdrowia”, bazu­jąc na objawach i odczu­ci­ach włas­nego organizmu.

    Naprawdę ist­nieje bardzo wiele artykułów na temat zin­te­growanych miar użyteczności i ogól­nych mod­eli usability.

    Twoja teo­ria ma też zasad­niczy błąd. Jeśli fak­ty­cznie usabil­ity można opisy­wać tylko wskaźnikiem, to w moim pry­wat­nym mod­elu empirycznym usabil­ity jest “przy­jaznoś­cią”, a cza­sem “wygodą” (sam taki model zbu­dowałem i potwierdz­iłem wcześniej, i co wtedy?!).

    Co więcej, jeśli nie brałoby się pod uwagę wskaźników np. niewer­bal­nych czy też danych jakoś­ciowych (jak np relaty­wne odczu­cie wygody z wyko­rzys­ta­nia inter­fe­jsu), to nigdy nie wiedzielibyśmy co jest wynikiem inter­akcji użytkown­ika z inter­fe­jsem, nigdy nie mielibyśmy poprawnych inter­pre­tacji.
    Mam nadzieję, że udało mi się wytłu­maczyć, że o tym co piszesz to lekkie pomieszanie. Więk­szość z tych rzeczy wynika z braku zna­jo­mości metodologii badań empirycznych HCI, jak i wiedzy naukowej i potocznej.

    Pawel

  2. diz says:

    Pawle, wiedzy naukowej i prak­ty­cznej (szczegól­nie) mi nie brakuje. Na co dzień mam sty­czność z artykułami z różnych Jour­nals, gdzie ofer­owane są różne mod­ele użyteczności, jakości, bazu­jące na różnych definic­jach, mające zmierzyć właśnie za pomocą miar, liczb, jakichś konkretów rozu­mi­aną przez Ciebie w poję­ci­ach seman­ty­cznych użyteczność. Ale da się to prze­nieść na zbiory rozmyte na przykład, i oce­niać użyteczność za pomocą reguł decyzyjnych if-then, dokład­nie tak samo, jak się to dzieje w wykry­wa­niu chorób za pomocą sys­temów eksper­c­kich. W tym artykule chci­ałem pokazać, jak ciężko jest zgodzić się na coś, co dogodzi wszys­tkim, gdyż różne wymi­ary użyteczności są też różnie poj­mowane przez spec­jal­istów z branży. Po to też są te normy, stan­dardy, aby cho­ciaż jakoś zmusić nas do wspól­nego mianown­ika. Zaś “przy­jazność” i “wygoda” też ma wskaźniki, na pewno nie bina­rne, ale ma.
    Co do badań — nie koniecznie (szczegól­nie ostat­nio) bada­nia są wykony­wane bezpośred­nio z użytkown­ikami. Ja się np. sku­piam w swoich bada­ni­ach nad meto­dami automaty­cznymi, gdzie wyko­rzys­tuje się wzorce zachować wykry­wanych za pomocą opro­gramowa­nia w ser­wisach webowych. Stąd też takie konkretne podejście.

  3. Źle mnie zrozu­mi­ałeś, bo nie chci­ałem w żaden sposób pod­ważać Two­jej wiedzy. Może za bardzo się rozpisałem, jed­nak chci­ałem pokazać, że to nie takie proste.

    Fak­ty­cznie masz rację, że dość różnie poj­mu­jemy poję­cia. Jed­nak coraz więk­sza liczba spotkań, for­mal­nych i niefor­mal­nych, wspólne pisanie artykułów tworzy pewna coraz bardziej do defin­iowaną przestrzeń dla użyteczności. Ci prawdziwi eksperci znają dość dobrze ISO i wyko­rzys­tują je choćby do opisu badań użyteczności. Tam normy ISO/CIF dość jed­noz­nacznie wskazują na defin­iowanie miary standary­zowane czy też własne.

    Ciekaw jestem bardzo Twoich badań automaty­cznych, bo z zakre­sie sys­temów złożonych i samej dynamiki inter­akcji wydaje mi się to za zadanie byna­jm­niej niełatwe. Miejmy nadzieję, że Ci się uda to zadanie, bo była by to wielka pomoc dla branży.

    Ważne abyś pamię­tał, że MY jako eksperci coraz częś­ciej zami­ast usabil­ity posługu­jemy się poję­ciem User Expeiri­ence, gdyż jak się okazuje jest lep­sze do szer­szej definicji sukcesu biznesowego.

    Tak jak nieużyteczny face­book czy N-K, użyteczność może mieć odwrotny efekt lub nie wpły­wać na wynik inter­akcji, bo motywacja nie maleje. Ciekaw jestem czy takie efekty też uwzględ­ni­asz w swo­jej pracy?

    Tak czy inaczej Twoja praca musi być niezłym wyzwaniem. Jak porównuję rozpoz­nanie choroby przez sys­tem eksper­cki z rozpoz­naniem użyteczności to widzę jedną zasad­niczą różnicę. Inter­akcja z inter­fe­jsem podlega zasadą dynamiki, czyli wcześniejsze doświad­czenia wpły­wają na kole­jne. Co powoduje, że możemy mieć do czynienia z dynamiką chaosu deter­min­isty­cznego, a określe­nie przestrzeni fazowych może tworzyć bardzo złożone wzory — tak jak u Lorentza. Wydaje mi się, że rozpoz­nanie choroby to raczej kwes­tia dobrego sprawdzenia wpływu wielu czyn­ników, ale nie mamy tutaj aspektu cza­sowego? Inter­akcja ksz­tał­towana jest przez poprzed­nie doświad­czenia, a sumaryczny efekt może nie być prosty.

    Krótko mówiąc, bardzo trudno jest ocenić użyteczność inter­fe­jsu bez (nielin­iowego ele­mentu) użytkown­ika. Wydaje mi się, że pod­jęte przez Ciebie zadanie jest bardzo ważne. Jeśli udało by się fak­ty­cznie szy­bko oce­niać i diag­no­zować “chorobę” to opty­mal­iza­cja mogłaby prze­b­ie­gać prze­cież automaty­cznie, odpowied­nio dopa­sowu­jąc się pod każdego użytkown­ika czy to początku­jącego czy zaawansowanego.

    Przepraszam za długie pisanie, ale Twoje zain­tere­sowa­nia, per­spek­tywa użyteczności i praca naukowa, wydają mi się niezwykle ciekawe i per­spek­ty­wiczne. Jeszcze raz życzę powodzenia i oczekuję na wyniki:)

  4. tomek says:

    Tak sobie Panowie dywagu­je­cie, a dla mnie przy­czyna prze­niesienia suwaka głośności na lewo jest dość oczy­wista. Ja z reguły ustaw­iam głośność filmu na youtube zaraz po jego włącze­niu — zakładam, że dalej już nie trzeba tłu­maczyć o co chodzi :)

    • diz says:

      @tomek: Zro­biłem krótki user-test wśród grupy 15–26 lat. Jako sen­sowną zmi­anę wskazało jedynie 3%!!! użytkown­ików…
      To samo ma ple­jada ze swoim play­erem — pow­ięk­sze­nie na full screen jest na dole po lewej, po najecha­niu na video, co jest już do kwadratu nieintuicyjne…

    • tomek says:

      Bym się kłócił…jak duża była ta grupa badaw­cza, skoro to krótki user-test? Dlaczego pytam, 3% wskazuje na to, że badałeś reakcję min. 33 użytkown­ików. Jeśli krótki, to pewnie sprawdza­łeś ich reakcję na konkretną zmi­anę, a wiadomo że zmi­ana zawsze jest zła i potrzeba trochę czasu zanim ludzie zmienią swoje nawyki.

      Tak sobie jeszcze myślę, że jeśli krótki i szy­bki test musi­ałeś pytać zna­jomych, a Ci z kolei są “specami” inter­netu i lubią kry­tykować — tak sobie tylko dywaguję ;)

      Play­era ple­jady nie znam, także się nie wypowiadam.

    • diz says:

      3 grupy (PWr), 4,6% dokład­nie (3 osoby), 18,46% (15) nie miała zda­nia.
      dziendobry.tvn.pl ->zerknij

    • tomek says:

      w zasadzie tu powinna być odpowedź:

      znalazłem i znów się ni do końca zgodzę, nie jest oczy­wiś­cie tam gdzie w pier­wszej kole­jności się szuka ale znaleźć można szy­bko, dzi­ała również dou­bleclick więc nie jest aż tak tragicznie.

      Pod­sumowu­jąc: uważam prze­niesie­nie reg­u­lacji głośności na lewo za niezły pomysł. Gen­er­al­nie nie robi mi to żadnej różnicy i abso­lut­nie takie czy inne ekspery­menty nie wpłyną na moją częs­totli­wość korzys­ta­nia z YT. Ser­wis jest użyteczny jak cholera (nie chodzi mi o usabil­ity) a to się liczy.

    • tomek says:

      a pro­pos wyników -> to tylko kole­jne potwierdze­nie, że demokracja jest złym ustrojem

      [znów mi się te komen­tarze źle wrzu­cają — coś nie tak z użytecznoś­cią ;) ]

  5. tomek says:

    znalazłem i znów się ni do końca zgodzę, nie jest oczy­wiś­cie tam gdzie w pier­wszej kole­jności się szuka ale znaleźć można szy­bko, dzi­ała również dou­bleclick więc nie jest aż tak tragicznie.

    Pod­sumowu­jąc: uważam prze­niesie­nie reg­u­lacji głośności na lewo za niezły pomysł. Gen­er­al­nie nie robi mi to żadnej różnicy i abso­lut­nie takie czy inne ekspery­menty nie wpłyną na moją częs­totli­wość korzys­ta­nia z YT. Ser­wis jest użyteczny jak cholera (nie chodzi mi o usabil­ity) a to się liczy.

  6. tomek says:

    a pro­pos wyników -> to tylko kole­jne potwierdze­nie, że demokracja jest złym ustro­jem :D

Zostaw odpowiedź

Zapisz się na maila lub RSS

Podaj swój adres e-mail:


RSS:

blip

Moje prezentacje

Użytkuję

  • www.keepgear.com
  • Zobacz mnie na GoldenLine