Big Data

Veröffentlicht am Veröffentlicht in Werkstatt

BIG DATA - Pole­mik zum Tech­no­lo­gie­trend


Der Begriff Big Data

Wiki­pe­dia defi­niert zum Begriff: “→ BIG DATA bezeich­net den Ein­satz gro­ßer Daten­men­gen aus viel­fäl­ti­gen Quel­len mit einer hohen Ver­ar­bei­tungs­ge­schwin­dig­keit zur Erzeu­gung wirt­schaft­li­chen Nut­zens”.

Ich möch­te Big Data wie folgt ski­zie­ren.

BIG DATA ist ein IT-Technologietrend zur Daten­ver­ar­bei­tung gigan­ti­scher Daten­vo­lu­men unter­schied­lichs­ter Art …

… bestehend aus einem Bün­del von Maß­nah­men (Tools, Tech­no­lo­gi­en, IT-Architekturen, Soft­ware, Hard­ware), …

… das nicht Stich­pro­ben, son­dern mög­lichst jeg­li­che Daten nutzt, …

… um Pro­zesse, Din­ge, Vor­gän­ge (aus Tech­nik, Wis­sen­schaft, Gesell­schaft, Öko­no­mie, etc.) effi­zi­en­ter, trans­pa­rent und vor­her­seh­bar zu machen.

Bei­spie­le

Nach­fol­gen­de vier Anwen­dungs­fäl­le erwäh­ne ich hier zur Ver­deut­li­chung von BIG-DATA.

The­ma Wahl­for­schung – nicht ein Wahl­trend gilt es am Vor­abend einer Wahl durch Stich­pro­ben zu ermit­teln, son­dern das Wahl­er­geb­nis im vor­aus (!).

The­ma Nano­tech­no­lo­gie – nicht die Qua­li­tät eines Halb­lei­ters gilt es mit­tels Strah­len­phy­sik und Soft­ware zu ermit­teln, son­dern eine gewis­se Quan­ti­tät wird als Mus­ter im Vor­aus erkannt und ziel­ge­rich­tet ohne Rei­bungs­ver­lust mit einem resul­tie­ren­den Maß­nah­me­plan dar­auf zuge­steu­ert.

The­ma Medi­zin – Pri­mat hat nicht mehr eine Vor­sor­ge­un­ter­su­chung, in der auf­grund mög­li­cher Vor­be­din­gun­gen (z. B. Erb­krank­heit, Stress­fak­to­ren, Umwelt) unter­sucht wird, son­dern Pri­mat wird ziel­ge­rich­te­tes Suchen und Sicher­stel­len von Mus­tern schon vor der Zeu­gung, so dass ein neu zu gebä­ren­der Mensch alle gene­ti­schen Fak­to­ren eines idea­len Men­schen in einer kon­kret zu erwar­ten­den Umwelt (bio­lo­gisch, psy­cho­lo­gisch, phy­sio­lo­gisch, etc.) zu 100% erfüllt.

The­ma Pro­duk­ti­ons­pro­zes­se, u. a. Energy-Sektor – im Wert­schöp­fungs­pro­zess wird nicht mehr auf einen pro­gnos­ti­schen Bedarf reagiert, son­dern es wer­den bei immensen, viel­fäl­tigs­ten Vor­be­din­gun­gen kau­sal und quan­ti­ta­tiv Mus­ter ermit­telt und geschaf­fen, die nach­fol­gend eine abso­lu­te Kon­trol­le am Markt sicher­stel­len (digi­ta­le Wert­schöp­fung in Echt­zeit).

Nut­zen

BIG DATA im eige­nen LAN und WAN – außer­halb exter­ner Clouds sinn­voll ein­ge­setzt – unter Beach­tung von Anfor­de­run­gen aus Infor­ma­ti­ons­si­cher­heit und Qua­li­täts­ma­nage­ment – kann für Orga­ni­sa­tio­nen (Unter­neh­men, Ein­rich­tun­gen, Netz­wer­ke) einen Quan­ten­sprung bei Geschäfts­ent­schei­dun­gen, erheb­li­chen Tech­no­lo­gie­sprung und wirt­schaft­li­chen Nut­zen ein­lei­ten.

BIG DATA in der CLOUD – hier geht es m. E. um einen tie­fen Hin­ter­grund, der einen Nut­zen in Fra­ge stellt. Es geht um das nicht-propagierte Ziel ...

... gigan­ti­sche Daten­men­gen ver­schie­dens­ter Quel­len in Clouds zu bün­deln, ...

... dort die­ses Daten durch Mus­ter­er­ken­nung zu kana­li­sie­ren, ...

... die­se Clouds wie­der­um in den Hän­den immer Weni­ger zu kon­zen­trie­ren ...

... & ggf. nicht-legitimierten Benut­zern (z. B. NSA) zur Ver­fü­gung zu stel­len.

Pole­mik zum Tech­no­lo­gie­trend Big Data

Qua­li­täts­ma­nage­ment und sein Stra­te­gie­ziel Feh­ler­frei­heit sind immer mehr funk­tio­nell geprägt durch ein Trend­set­zen in allen Unter­neh­mens­pro­zes­sen. Es geht dar­um, neue Wege zu Wett­be­werbs­vor­tei­len, Nut­zen und Kun­den­zu­frie­den­heit zu erschlie­ßen. IT und Wert­schöp­fung in Orga­ni­sa­tio­nen sind dabei zuneh­mend und untrenn­bar ver­knüpft. Gro­ße Daten­men­gen bedür­fen neu­er Tech­no­lo­gie­trends – BIG DATA steht im Focus. BIG DATA – als Pro­duk­ti­ons­fak­tor. BIG DATA – die Ter­ri­to­ri­en der Zukunft?

Anlie­gen von BIG DATA ist es, Geschwin­dig­keit, Effi­zi­enz, Ana­ly­se­po­ten­ti­al, Nut­zen und Qua­li­tät sicher­zu­stel­len bei der Ver­ar­bei­tung unstruk­tu­rier­ter, gigan­ti­scher Daten­men­gen – mög­lichst in Echt­zeit. Es soll dabei unter­schied­lichs­te Daten­quel­len nut­zen. BIG DATA ist u. a. in der Lage, selb­stän­dig und ohne den Fak­tor Mensch bis dato ver­bor­ge­ne Mus­ter zu fin­den. BIG DATA ist die Ener­gie der Zukunft zur tech­no­lo­gi­schen Ver­selb­stän­di­gung. Hier tun sich nicht nur recht­li­che, son­dern vor allem ethi­sche Pro­ble­me auf.

Wie? Eine Umset­zung bedarf neu­er gekop­pel­ter Hard- und Software-Lösungen. Aktu­el­le und anste­hen­de neue Tech­no­lo­gi­en, u. a. Quanten-Computing, neue Algo­rith­men und sta­tis­ti­sche Ver­fah­ren, Vir­tu­al Rea­li­ty (Vir­tu­el­le Tech­ni­ken), NoS­QL (nicht-relationaler Ansatz für gro­ße Daten­ban­ken), Hadoop, wer­den das zuneh­mend mög­lich machen.

Trend: Bis 2020 wird sich das digi­ta­le Uni­ver­sum gegen­über 2010 fünf­zig mal ver­grö­ßern (!) auf unfass­ba­re 40 Zetta­byte (ZB) = 40.000.000.000.000.000.000.000 Byte. Das wären auf jeden Erd­be­woh­ner 5 Tera­byte an Daten.

Wie ver­wal­tet man die­se Daten­mas­sen? Belässt man es dezen­tral bei den Usern in loka­len Netz­wer­ken – die sich wie­der­um frei ver­net­zen kön­nen? Oder – schaf­fen sich Weni­ge eine zen­tra­le Datenmassen-Hoheit mit­tels tech­ni­scher Lösun­gen – ver­gleich­bar mit neu­er Hege­mo­nie­be­stre­bung (Neu­auf­tei­lung der Welt)?

Aktu­ell ist BIG DATA das Zau­ber­wort. Wird BIG DATA nach Vir­tua­li­sie­rung und CLOUD wie­der nur eine über die Stra­ße getrie­be­ne Sau, die Geld locker machen soll? Ande­rer­seits – es stür­zen auch auf uns ein rie­si­ge unstruk­tu­rier­te Daten­men­gen aus unter­schied­lichs­ten Quel­len (Mess­ergeb­nis­se, Sen­sor­da­ten, Ent­wick­lungs­da­ten, Daten aus Beschaf­fung, Dis­tri­bu­ti­on und Logis­tik, Geo- und Infra­struk­tur­da­ten, Controlling-Daten, Kun­den­be­zie­hungs­da­ten, sons­ti­ge betrieb­li­che Daten und Doku­men­te unter­schied­lichs­ter Art, Instal­la­tio­nen, Netz­wer­ke, Soci­al Media Res­sour­ces). Es geht nicht nur um das Hier und Heu­te – es geht um den stra­te­gi­schen Umgang mit Daten.

Sicher­heits­be­den­ken? Die haben staat­lich beru­fe­ne Daten­schutz­be­auf­trag­te hier­zu­lan­de nicht. BIG DATA kön­ne verfassungs- und daten­schutz­kon­form gestal­tet wer­den mit­tels anony­mi­sier­ter Daten­sät­ze und nach­träg­li­cher Iden­ti­fi­zie­rung. Im Ange­sicht von → XKey­score schwer zu glau­ben. Fakt ist – Com­pli­an­ce-Aspek­te, gera­de zum Schutz von Ver­brau­chern und Unter­neh­men, sind hoch gesteckt. Letzt­lich ist das aber nur Maku­la­tur, solan­ge bun­des­deut­sche Hoheit gemäß → Grund­ge­setz Arti­kel 2 Abs. 4 nicht das Vor­recht die­ses Lan­des und sei­ner gewähl­ten Regie­rung ist.

Geschäfts­nut­zen – gibt es den nur für Groß­un­ter­neh­men wie Goog­le oder diver­se Ser­vice­pro­vi­der? Wird Geschäfts­nut­zen auch für klei­ne mit­tel­stän­di­sche Unter­neh­men sicht­bar? Sehen auch die User ihren Nut­zen oder lie­fern sie nur die Daten?

Prak­ti­sche The­men & Zie­le von BIG DATA könn­ten sein: Kom­ple­xe Model­lie­rung und Simu­la­ti­on in For­schung und Ent­wick­lung, Hoch­ska­lier­bar­keit und Visua­li­sie­rung bis in mole­ku­la­re Struk­tu­ren, Opti­mie­rung der Wert­schöp­fungs­ket­te, Ent­wick­lung kau­sa­ler Zusam­men­hän­ge, Anwen­dungs­sze­na­ri­en, Daten­mas­sen in Echt­zeit behan­deln, pro-aktives Agie­ren, Siche­rung Feh­ler­frei­heit, Feh­ler­de­tek­ti­on vor Ein­tre­ten, Geschäftsprozess-Analyse-, -Model­lie­rung, -Opti­mie­rung in allen unter­neh­me­ri­schen Berei­chen. Wir kön­nen die­se Ket­te wei­ter fort­set­zen bis hin zum Soft­ware Engi­nee­ring als der „Pro­duk­ti­ons­tech­nik des 21.Jahrhunderts“ (z. B. im Anla­gen­bau und der Nano­tech­no­lo­gie).

Die Software-Entwicklung für BIG DATA wird ganz beson­de­ren Her­aus­for­de­run­gen und Mög­lich­kei­ten gegen­über­ste­hen. Hier wird das Pri­mat nicht mehr bei intel­li­gen­ten Algo­rith­men bestehen, son­dern bei der hohen Men­ge an Daten. Daten wer­den vor­der­grün­dig nicht gelei­tet – sie wer­den erforscht. Tra­di­tio­nell gab der User vor, wel­che Daten zu kana­li­sie­ren sind. Die Ent­wick­ler erstell­ten die Lösung. Der User nutz­te dies und mach­te bei Bedarf Neu­vor­ga­ben zu Rebuilds. Der erwei­ter­te Ansatz mit­tels BIG DATA besteht in der Ver­fol­gung einer explo­ra­ti­ven, for­schen­den Lösung. Defi­nier­te Daten­quel­len sind nach Mus­tern zu ana­ly­sie­ren mit­tels zu ent­wi­ckeln­der diver­ser BIG DATA Platt­for­men. Der User nutzt die Ergeb­nis­se und ent­schei­det bei Bedarf über ergän­zen­de neue Daten­quel­len.

Unab­hän­gig von Cloud? BIG DATA soll­te dabei auch im loka­len Netz­werk oder WAN mach­bar sein – ohne Cloud, als Insel­lö­sung – respek­ti­ve frei­er Wahl einer wei­te­ren Ver­net­zung. Dabei wach­sen die Daten­vo­lu­men expo­nen­ti­ell wei­ter. Mit die­sen Daten­mas­sen sichern sich auch Mit­tel­stands­un­ter­neh­men zeit­na­he Ana­ly­sen. Ein­fach geschluss­fol­gert: Gro­ße Daten = gro­ße Chan­cen, Ers­ter zu sein, recht­zei­tig Trends zu erken­nen, Pro­ble­men und Lösun­gen effi­zi­ent auf die Spur zu kom­men.

Daten­cha­os beherrscht uns zuneh­mend. Wo haben wir unse­re Daten in einer typi­schen Orga­ni­sa­ti­on (Fir­ma, Ein­rich­tung, etc.)? Orte, wie loka­les Pro­fil (Archiv), Vir­tu­el­ler Ser­ver, File-Server, rela­tio­na­le Datenbank-Systeme, ERP-System, CRM-System, CMS-System, Relationship-System, Enter­pri­se Wizard, Pro­jektmanagement-System, Intra­net, Extra­net, Inter­net, Soci­al Net­works, Mobilkom­mu­ni­ka­ti­on, Hun­der­te von Excel-Sheets, unend­li­che Prä­sen­ta­tio­nen, tau­sen­de Doku­mente bzw. Memos.

Vor­ge­hen? Wie beherr­schen wir das? Unse­re vie­len Daten­quel­len las­sen uns erst­mal immer die Kern­fra­ge klä­ren – wo fin­de ich das Gesuch­te. Die zwei­te Fra­ge dann – wie kana­li­sie­re ich das. Am Ende steht die Fra­ge – habe ich was über­se­hen. Vom Zeit­auf­wand reden wir nicht mehr. Eine Lösung muss wohl her.

Man könn­te das The­ma abtun, u. a. auf­grund aktu­el­ler Ereig­nis­se (Stich­punkt NSA-Datenwahn). Die Cloud hät­ten wir nur für Ande­re geschaf­fen, die unse­re Res­sour­cendurch­strei­fen. BIG DATA sei nun das Werk­zeug, unse­re kom­plet­te Daten-Welt in die­se Cloud zu stel­len.

Beden­kem? Abge­se­hen von mög­li­chen recht­li­chen Fra­gen (Daten­er­he­bung) gäbe es auch ethi­sche Beden­ken bei kon­kre­ten Anwen­dun­gen (Gene­tik, u. a. Genom-Sequenzierung als Euthanasie-Entscheidung im Vor­aus). Eine unge­ahn­teInno­va­ti­onswel­le könn­te wei­ter­hin die Fol­ge sein. Wür­de sie auch beherrsch­bar sein? Wäre die Zivi­li­sa­ti­on dazu bereit? Mas­si­ve kol­la­te­ra­le Fol­gen in Öko­no­mie, Wis­sen­schaft und Gesell­schaft wür­den sich auf­tun. Wäre dem so?

BIG DATA – das Ende der wis­sen­schaft­li­chen Theo­rie? Nein, auto­ma­ti­sier­te Kor­re­la­tio­nen in einer Machine-to-Machine-Communication kön­nen sich als wenig „durch­dacht“ erwei­sen. Letzt­lich kön­nen sie fal­si­fi­ziert und sogar gefähr­lich für Orga­ni­sa­tio­nen und Ein­zel­ne wer­den. Mög­li­che ver­selbst­stän­dig­te Pro­zess­a­b­lei­tun­gen ohne mensch­li­che Ein­fluss­nah­me, selbst in gesell­schaft­li­chen & hoheit­li­chen Pro­zes­sen, wären nicht mehr in der Welt des Sci­ence Fic­tion ange­sie­delt, son­dern im Heu­te.

Visi­on

Stell Dir vor ...

... die­ser Trend könn­te nur im glo­ba­len Kon­text betrach­tet und gelöst wer­den.

Nicht eine Zen­tra­li­sie­rung von Big-Daten in Clouds und den Hän­den weni­ger Pro­vi­der kann das Ziel sein. Das Ziel wäre eine Dezen­tra­li­sie­rung von Daten­mas­sen (ein­zel­nen Big Data Struk­tu­ren) in einer frak­tal orga­ni­sier­ten Welt (Ebe­ne).

Es gin­ge um frei­wil­li­ges Bereit­stel­len in Netz­wer­ken, neue Echtzeit-Technologien zur Nut­zen gro­ßer Daten­men­gen in einem Umfeld des Tei­lens.

Das geschä­he ana­log des Inter­nets oder einer dezen­tra­len Ener­gie­ver­sor­gung (Ener­gy Web), wo Jeder gefor­dert und geför­dert ist, in einem Umfeld von Geben und Neh­men. Dezen­tra­li­tät bedeu­tet Nut­zen für Alle und gerin­ge Anfäl­lig­keit für das Gan­ze.

Dezen­tra­li­tät eines frak­ta­len BIG DATA bedeu­tet die Mög­lich­keit von Kon­trol­le, stän­di­ger Erneue­rung und Par­ti­zi­pa­ti­on für alle Bestand­tei­le – wie in einem Orga­nis­mus, wie in einem Quan­ten­pro­zess der stän­di­gen Erneue­rung.

wolle-ing_stift-01-2

Hier kommentieren oder hinterfragen: