A digitális mosógép

Az elérhető digitális tartalom 10%-a szöveges adat, a többi jelenleg nem strukturált adat – főleg videó, kép és kisebb részt hanganyag. A keresések, adatrendezés jelentős része azonban nem ad megoldás ezekre a problémákra, így új szemlélet és új termékportfóliók kialakítására lenne szükség. Ráadásul eközben a szövegelemzés területén elért eredmények is csak lassan jutnak egy a Gartner szerint a mindennapi alkalmazások (“productivity phase on hype cycle”) körébe. A kihívás pedig az, hogy akár egy digitális mosógépben, a különféle adatforrásokat össze kellene keverni, minden forrásból kellene tudást, információt kinyerni. Ez csak egy üzenet volt azok közül, ami a X. SPSS adatbányászati konferencián elhangzott.

Az előadások egy része az IBM Watson körüli eseményekkel, megoldásokkal és fogásokkal foglalkozott; ezekről később még fogunk írni. Figyelemre méltó volt Kovács Gyula előadása az első hallásra furcsa “etikus CRM” témában, aki egyebek mellett arra hívta fel a figyelmet, hogy a kampányok, a targetálások és általában az adatbányászati modellek sok esetben azokat “az áldozatokat” preferálják, akik bár valóban (régi-)új ügyfelek, vásárlók lehetnek, de ennek nem modellbeli sajátossága van, hanem jellemző emberi gyengeség. Ebből is kiemelkednek azok, akik nem tudnak nemet mondani egy megkeresésnek, nem tudnak valamiről lemondani, vagy nem képeseket magukat megtartóztatni (mániákus fogyasztók), továbbá akik nem mérik fel vagy nem mérlegelik megfelelően a vásárlás/fogyasztás egyes aspektusait. A szűrés egyszerű is lehetne: nézni kellene, hogy a megcélzott személynek nem értékesítünk-e túl – és valljuk be, ez jelenleg nem jellemző. Pedig, a profitra nagyon is negatívan hat, ha egy-egy ilyen ügyfél “bedől”, “csődöt jelent” – márpedig éppen mi hajszoljuk ide a fogyasztóinkat.

Jó volt hallgatni Vada Gergely színes és tartalmas előadását a munkahelyi stressz méréséről. A stressz mérésre egy okos megoldással fiziológiai jellemzőket mértek munkatársakon, akik önbevallásos alapon számot adtak arról, hogy az adott nap, adott szakaszában mivel foglalatoskodtak. A méréssel párhuzamos egy személyiségi teszt segítségével megállapították a résztvevők fontosabb személyiségi jegyet. A biometriai adatok feldolgozásával azt vizsgálták, hogy az emberek hogyan reagálnak a napi rutin során ért hatásokra, illetve hogyan engedik ki a napi stresszt maguktól – és ezek hogyan illeszkednek a személyiségi jegyekhez. Bár a minta nem volt reprezentatív, bizonyos személyiségi vonások és bizonyos munkakörben eltöltött stressztűrő képesség között világos kapcsolatot sikerült “kiadatbányászkodni”, pl. egy adatbányászati szakértő akkor érzi jól magát a munkakörében, ha kreatív és kitartó.

A számmisztika és a horoszkóp esete a biztosítási eseményekkel ugyancsak izgalmas előadás volt, amelynek a legfőbb üzenet adatbányászat szempontjából: kerüld az úton a “barbie” színű (rózsaszín, ciklámen, lila, pink, stb.) autókat. És a bakok nem mennek az Aegon biztosítóhoz, de legalább döntően ők az áldozatok a közlekedésben. Az előadás szerint bár a legtöbben szeptemberben születnek (szeretet ünnepe, ugye), meg márciusban (hjaj, az a nyaralás) – nem értettük, hogy november 7. miért ünnep (ha már április 4. vagy február 23. nem volt az), Húsvét és Pünkösd meg még munkaszüneti napnak sem volt jelölve – de főleg tavasszal születik. De lényeg, hogy ennek ellenére a legtöbb ember január 1. napján születik (erre azért hümmögtünk egy páran), és döntően télen hal meg, azaz követjük a naptárakat és az évszakokat.

Cseh Zoltán egy új radiológiai eljárásról az FLT-PET képek diagnosztikai célú alkalmazásáról beszélt – és bár a téma igazán érdekes volt, az egyetlen dolog, ami megragadta a képzeletünket, hogy a kis mintás képfeldolgozást pixelenként vett idősorokkal kompenzálták. Azaz, 7 beteg felvételéből 7x képméretnyi (PET miatt szeleteket is hozzá lehet venni) idősort állítottak elő, amiben kihasználták, hogy a sugárzó testecskék nem fényességi szintet mérnek, így egy esetleges világításból eredő torzulás elhanyagolható – a világító pontok maguk a fotont (ilyen értelemben: fényt) kibocsátó pozitron-elektron találkozásból származnak. Az így keletkezett idősorokon végzett adatbányászat több-kevesebb sikerrel azonosította a daganatos régiókat.

Számunkra a legfontosabb előadás a Szabó Előd nevéhez fűződik, aki az Origoban végzett legújabb eredményekről számolt be. Bár nagyon sok érdekesség elhangzott a sikeres viselkedés alapú targetálás eredményeiről, számunkra különösen kedves volt, hogy az IBM nevéhez köthető SPSS konferencián az IBM Cognost (nem mellesleg piacvezető BI termék) az Origo projektjében az azt leváltó U1 Research Dashboard alkalmazása említésre került. Hasonlóan zene volt füleinknek, hogy a viselkedés alapú targetálás után a cikkajánló kapcsán hallhattuk az U1 Research nevét – immár publikusan mint az Origo belső elemző csapat, a Scarab és a Gravity riválisaként.