Busi­ness Intel­li­gence, Data Mining, Big Data – Buz­zwor­ds, die einem der­zeit die Ohren klin­geln las­sen. In News­let­tern. Auf Kon­fe­ren­zen. In Fach­zei­tun­gen und der Tages- und Wochen­pres­se. In Blogs und auf Twit­ter. Die Erhö­hung geht hin bis zum Ver­gleich: „Daten sind das neue Öl“. Doch nicht über­all wo Big Data drauf steht, ist auch Big Data drin. Und selbst wenn ein Big Data-Pro­jekt den Namen ver­dient, schei­tern doch 44 Pro­zent der Pro­jek­te. Dabei wol­len alle nur eins: Daten mit Hil­fe der rich­ti­gen Tech­no­lo­gi­en so nut­zen, dass sie Ent­schei­dun­gen ver­ein­fa­chen.

Wir wie­der­ho­len es ger­ne: Das aktu­el­le glo­ba­le Daten­vo­lu­men beträgt 2,8 Zetta­byte (2.800.000.000.000.000.000.000 Byte). Der Anteil der von Mobil­ge­rä­ten gene­rier­ten Daten wird bis Ende 2013 laut SAP 4 Mil­li­ar­den Ter­ra­byte betra­gen. Und es wer­den durch Digi­ta­li­sie­rung der Gesell­schaft jeden Tag mehr. Weil Unter­neh­men Pro­zes­se auto­ma­ti­sie­ren und neue Gad­gets das Leben immer trans­pa­ren­ter machen, ver­dop­pelt sich die glo­ba­le Daten­men­ge alle zwei Jah­re.

Was mit die­sen Daten geschieht? Eine For­schungs­grup­pe der Car­ne­gie Mel­lon Uni­ver­si­ty ver­sucht den Algo­rith­mus der Finanz­märk­te zu kna­cken. Rolls-Roy­ce opti­miert mit Big Data-Ana­ly­sen die War­tungs­zei­ten sei­ner Flug­zeug­mo­to­ren. Ford ver­bes­sert sei­ne glo­ba­le Pro­dukt­stra­te­gie. Ver­mark­ter nut­zen die Infor­ma­tio­nen für die Wer­be­aus­spie­lung pas­send zu den Inter­es­sen des ein­zel­nen Nut­zers.

Span­nen­de Pro­jek­te, die aller­dings nur der Anfang des­sen sind, was eigent­lich mög­lich ist. Laut IDC iView ana­ly­sie­ren Unter­neh­men weni­ger als 1 Pro­zent der vor­han­de­nen Daten. Und 44 Pro­zent aller Big Data-Pro­jek­te wer­den früh­zei­tig abge­bro­chen. Und das sind nur die, die nicht schon vor­ne­her­ein abge­lehnt wer­den.

Es fehlt an Wis­sen, Res­sour­cen und der rich­ti­gen Auf­be­rei­tung der Daten. Erst dann lässt sich damit arbei­ten. Big Data allei­ne nützt nichts. Wir brau­chen Gre­at Data.

In einem mit­tel­gro­ßen eCom­mer­ce Shop kom­men bei­spiels­wei­se pro Monat gut und ger­ne 10.000 Kun­den­mei­nun­gen zusam­men. Durch Kom­men­ta­re auf der Web­sei­te, E-Mails, Anru­fe im Kun­den­cen­ter, Face­book oder Twit­ter. Wer mehr wis­sen will als „90 Pro­zent posi­ti­ve Nut­zer­kom­men­ta­re“ braucht seman­ti­sche Tech­no­lo­gi­en.

Seman­ti­sche Tech­no­lo­gi­en extra­hie­ren Mei­nung und The­men aus den Daten. Von Text, Video, Audio­auf­zeich­nun­gen und Bil­dern. Sie hel­fen, aus der Viel­zahl unter­schied­lich kom­ple­xer Daten Sinn zu erschlie­ßen und im bes­ten Fal­le auto­ma­ti­sier­te Ent­schei­dun­gen zu tref­fen.

Wie das im gro­ßen Stil funk­tio­niert, hat Ray­id Gha­ni, Chef-Wis­sen­schaft­ler bei der Barack Oba­ma Wahl­kampf-Kam­pa­gne gezeigt. Anstatt sich auf das Bauch­ge­fühl zu ver­las­sen, ana­ly­sier­ten Gha­ni und sein Team rie­si­ge Daten­ber­ge. Sie ent­schie­den so, in wel­che Staa­ten das meis­te Geld für den Wahl­kampf inves­tiert wer­den soll­te. Sie leg­ten anhand seman­ti­scher Text­ana­ly­se die Betreff­zei­le für Wahl­kampf­mails fest.

Aber auch Unter­neh­men nut­zen seman­ti­sche Tech­no­lo­gi­en. Wenn es um Inhal­te für Web­sei­ten geht zum Bei­spiel. In Kom­bi­na­ti­on mit Per­so­na­li­sie­rungs­al­go­rith­men berech­nen Pro­gram­me, wel­che The­men zum User pas­sen. Seman­ti­sche Tech­no­lo­gi­en sor­gen dafür, dass das Pro­gramm die­se The­men in allen redak­tio­nel­len Bei­trä­gen erkennt und rich­tig aus­spielt.

Oder in der Aus­wer­tung von Nut­zer­kom­men­ta­ren. Man kann dank seman­ti­scher Tech­no­lo­gi­en her­aus­fin­den, ob ein Nut­zer das Preis-Leis­tungs­ver­hält­nis eines Pro­dukts super, Qua­li­tät durch­schnitt­lich, die Beschrei­bung im Online-Shop aber irre­füh­rend fin­det. Mit Blick auf nicht nur einen, son­dern zehn­tau­sen­de Kom­men­ta­re aus unter­schied­li­chen Kanä­len hat ein Unter­neh­men einen deut­li­chen Erkennt­nis­vor­sprung.

Fakt ist: Big Data ist mehr als ein Hype. Ana­ly­sie­ren Unter­neh­men nicht nur 1 Pro­zent, son­dern viel­leicht, 10, 20, 50 Pro­zent der ihnen zur Ver­fü­gung ste­hen­den Daten­men­gen – man kann erah­nen, wie vie­le Ent­schei­dun­gen nicht mehr rein intui­tiv gefällt wür­den.

Und trotz all­dem sind gro­ße Daten­men­gen eben nur der Roh­stoff. Zur Wäh­rung wer­den sie erst durch Men­schen, die mit stra­te­gi­schen Fra­ge­stel­lun­gen an die Daten her­an­tre­ten. Durch Ent­schei­der, die bereit sind, ent­spre­chen­de Res­sour­cen frei­zu­set­zen. Durch Deve­l­oper, die die rich­ti­gen Pro­gram­me beherr­schen. Dann wird Big Data zu Gre­at Data – ein kri­ti­scher Fak­tor für den Erfolg eines jeden Unter­neh­mens.
Quel­len und wei­ter­füh­ren­de Links: