Maschinelles Lernen

 

  1. Was ist Machi­ne Learning?
  2. Wie lernt eine Maschi­ne?
  3. Anwen­dung und Ein­satz von Maschi­nel­lem Ler­nen
  4. Wei­te­re Begrif­fe rund um Maschi­nel­les Ler­nen

 

Was ist Machine Learning?

 

Maschi­nel­les Ler­nen ist ein Feld der Künst­li­chen Intel­li­genz. ‘Machi­ne Learning’ wen­det sta­tis­ti­sche Tech­ni­ken an, um Com­pu­tern die Fähig­keit zu ver­lei­hen, aus Daten zu ler­nen, ohne expli­zit pro­gram­miert zu sein.” Die­se Defi­ni­ti­on von “Maschi­nel­les Ler­nen” stammt von Arthur Samu­el, dem Erfin­der des Begrif­fes und einem der Pio­nie­re auf dem Gebiet Künst­li­che Intel­li­genz.

Die grund­le­gen­de Defi­ni­ti­on stammt aus dem Jahr 1959 und hat an Gül­tig­keit seit­her nichts ein­ge­büsst. Ver­än­dert haben sich seit­dem jedoch die Rah­men­be­din­gun­gen, Mög­lich­kei­ten und Ein­satz­ge­bie­te für maschi­nel­les Ler­nen. Machi­ne-Learning-Sys­te­me kön­nen heu­te enor­me Daten­men­gen ver­ar­bei­ten, dar­aus sehr prä­zi­se Vor­aus­sa­gen tref­fen und somitsehr viel­sei­tig ange­wen­det wer­den.

 

Wie lernt eine Maschine?

 

Maschi­nel­les Ler­nen ist ein Pro­zess. Die Fähig­keit einer Maschi­ne, Mus­ter zu erken­nen, kor­rekt zu inter­pre­tie­ren und dar­auf­hin rich­tig zu reagie­ren, wird erst durch das Trai­nie­ren mit Daten geschaf­fen. Der Lern­pro­zess kann auf zwei unter­schied­li­che Arten ver­lau­fen.

Beim “über­wach­ten Ler­nen” wird der Maschi­ne für jede Ein­ga­be auch die kor­rek­te Aus­ga­be for­mu­liert. Ein gutes Bei­spiel für über­wach­tes maschi­nel­les Ler­nen ist die Erken­nung von hand­ge­schrie­be­nen Buch­sta­ben. Dabei wer­den dem Machi­ne-Learning-Sys­tem Bil­der eines hand­schrift­li­chen ABC ein­ge­speist. Zu jedem die­ser Bil­der ist in den Meta­da­ten die von einem mensch­li­chen “Leh­rer” for­mu­lier­te Infor­ma­ti­on hin­ter­legt, um wel­chen Buch­sta­ben es sich jeweils han­delt. Auf die­se Wei­se lernt das Sys­tem in der Trai­nings­pha­se die unter­schied­li­chen Aus­prä­gun­gen, in denen Men­schen einen Buch­sta­ben schrei­ben. Ist das Trai­ning abge­schlos­sen, soll­te das Sys­tem aus dem Gelern­ten abs­tra­hie­ren kön­nen und Hand­schrif­ten ein­deu­tig erken­nen.

Dem gegen­über steht ein Ansatz, der als unbe­auf­sich­tig­tes Ler­nen bezeich­net wird. Wäh­rend über­wach­tes Ler­nen Mus­ter ent­deckt, bei denen das Sys­tem einen Daten­satz von “rich­ti­gen Ant­wor­ten” hat, fin­den beim unüber­wach­ten Ler­nen Machi­ne-Learning-Sys­te­me Mus­ter, wo wir es nicht tun. Dies kann dar­an lie­gen, dass die “rich­ti­gen Ant­wor­ten” nicht beob­acht­bar oder nicht mög­lich sind, oder dass es für ein bestimm­tes Pro­blem nicht ein­mal eine “rich­ti­ge Ant­wort” an sich gibt. Die Algo­rith­men sind dabei auf sich gestellt, Struk­tu­ren und Gemein­sam­kei­ten in den Daten zu erken­nen und dar­aus ein Lern­mo­dell zu erstel­len. Das führt dazu, dass sol­che Sys­te­me oft­mals eine Black Box sind, bei der auch die Pro­gram­mie­rer nicht wis­sen, wel­che Annah­men das Sys­tem aus den Daten gelernt hat.

Prak­tisch kommt unüber­wach­tes maschi­nel­les Ler­nen zum Bei­spiel dort zum Ein­satz, wo Anbie­ter von Mar­ke­ting-Daten rie­si­ge Daten­sät­ze scan­nen und Nut­zer in bestimm­te Clus­ter ein­ord­nen.

 

Anwendung und Einsatz von maschinellem Lernen

 

Die Grund­la­gen für Maschi­nel­les Ler­nen wur­den bereits in der Mit­te des ver­gan­ge­nen Jahr­hun­derts gelegt. Doch erst in den letz­ten Jah­ren ent­fal­tet sich das Poten­ti­al des Ansat­zes. Meh­re­re Trends begüns­ti­gen die rasan­te Wei­ter­ent­wick­lung des Fel­des und die Ein­satz­mög­lich­kei­ten des Machi­ne Learning in den letz­ten Jah­ren. Im Zuge der fort­schrei­ten­den Digi­ta­li­sie­rung sind mehr und mehr Daten vor­han­den, die sich zum Ler­nen ver­wen­den las­sen.

Com­pu­ter wer­den gleich­zei­tig per­for­man­ter, um gro­ße Daten­men­gen zu ver­ar­bei­ten. Einen Schub erlebt Machi­ne Learning daher auch, seit kom­ple­xe Gra­fik­pro­zes­so­ren mit meh­re­ren Ker­nen par­al­le­le Berech­nun­gen erlau­ben.

Mit zuneh­men­der Grö­ße des Daten­be­stan­des steigt auch die Not­wen­dig­keit, die Daten zu inter­pre­tie­ren, zu ord­nen und wei­ter­zu­ver­ar­bei­ten. Wis­sen­schaft­li­che Ent­wick­lun­gen fan­den so schnell Ein­gang in kom­mer­zi­ell genutz­te Anwen­dun­gen.

  • Spamer­ken­nung in E-Mails
  • Bil­der­ken­nung in Goog­le
  • Vor­her­sa­ge von Bör­sen­kur­sen oder der Nach­fra­ge von Pro­duk­ten
  • Text­über­set­zung von Anwen­dun­gen wie DeepL
  • Text­klas­si­fi­ka­ti­on zum Bei­spiel in Online-Preis­ver­glei­chern oder News-Por­ta­len
  • Sprach­er­ken­nung / Sprach­as­sis­tent wie in Siri, Cor­ta­na, Ale­xa etc.
  • Betrugs­er­ken­nung, z.B. für Payment-Anbie­ter und im E-Com­mer­ce

 

Weitere Begriffe rund um Maschinelles Lernen

 

Je umfas­sen­der künst­li­che Intel­li­genz und maschi­nel­les Ler­nen in den All­tag der Men­schen ein­drin­gen, des­to häu­fi­ger tau­chen die damit in Zusam­men­hang ste­hen­den Begrif­fe in den Medi­en auf.

Zu Unschär­fen und Ver­wechs­lun­gen kommt es oft zwi­schen den Kon­zep­ten Künst­li­che Intel­li­genz, Maschi­nel­les Ler­nen und Deep Learning. Der Zusam­men­hang ist im Grun­de ein­fach, mit den Kon­zep­ten ver­hält es sich wie bei einer rus­si­schen Matrjosch­ka. Die größ­te, äuße­re Pup­pe ist das Feld Künst­li­che Intel­li­genz. Maschi­nel­les Ler­nen ist ein Teil­ge­biet der Künst­li­chen Intel­li­genz, wäh­rend Deep Learning als Unter­dis­zi­plin des Maschi­nel­len Ler­nens gilt.

Das “Deep” in Deep Learning bezieht sich auf die Anzahl der Schich­ten, durch die die Daten trans­for­miert wer­den. Deep Learning nutzt im Pro­zess des maschi­nel­len Ler­nens hier­ar­chi­sche Schich­ten bzw. eine Hier­ar­chie zur Erken­nung von Mus­tern. So wer­den bei­spiels­wei­se in einem tie­fen neu­ro­na­len Netz­werk zur Bil­der­ken­nung zuerst ein­fa­che Kan­ten und Kon­tras­te in einem Bild erkannt, wäh­rend spä­te­re Schich­ten kom­ple­xe Struk­tu­ren erfas­sen.

Auto­ma­ti­sches maschi­nel­les Ler­nen ver­ein­facht durch weit­ge­hen­de Auto­ma­ti­sie­rung das Set­up eines Machi­ne-Learning-Sys­tems. Dabei wer­den ent­we­der der gesam­te Pro­zess oder aus­ge­wähl­te Schrit­te auto­ma­ti­siert, sodass für die ein­zel­nen Modu­le und Lern­schrit­te nicht je ein Exper­te benö­tigt wird. So kann zum Bei­spiel die Auf­be­rei­tung der Daten, die Aus­wahl von Merk­ma­len oder die Modell­aus­wahl auto­ma­ti­siert wer­den. Der Goog­le Dienst Cloud AutoML etwa ver­spricht, dass die Lösung selbst Anwen­dern mit gerin­gen Pro­gram­mier­kennt­nis­sen die Erstel­lung von Machi­ne-Learning-Sys­te­men wie Über­set­zungs­mo­del­len oder Model­len für natür­li­che Spra­che ermög­licht.

Ein wei­te­rer Begriff, der oft im Zusam­men­hang mit Machi­ne Learning fällt, ist “Data Mining”. Zwi­schen maschi­nel­lem Ler­nen und Data Mining bestehen vie­le Gemein­sam­kei­ten, aber auch signi­fi­kan­te Unter­schie­de. Maschi­nen­ler­nen basiert auf bekann­ten Merk­ma­len und fokus­siert auf Vor­her­sa­gen. Im Gegen­satz dazu kon­zen­triert sich Data Mining auf das Ent­de­cken unbe­kann­ter Eigen­schaf­ten in den Daten.

 

 

Quel­len & PDF: