{"id":4036,"date":"2018-05-17T01:21:35","date_gmt":"2018-05-16T23:21:35","guid":{"rendered":"http:\/\/dataminingsoccer.com\/de\/?page_id=4036"},"modified":"2018-05-17T08:04:01","modified_gmt":"2018-05-17T06:04:01","slug":"was-ist-data-mining","status":"publish","type":"page","link":"http:\/\/dataminingsoccer.com\/de\/unsere-analyse\/was-ist-data-mining\/","title":{"rendered":"Was ist Data Mining?"},"content":{"rendered":"<h2>Fussball Ergebnis Vorhersagen mittels Data Mining<\/h2><p><strong>Sinn &amp; Zweck des Data Mining<\/strong>: Beim Data Mining geht es darum, <strong>aus gro\u00dfen Datenmengen<\/strong> (versteckte, nicht triviale) <strong>Zusammenh\u00e4nge abzuleiten<\/strong>, die man f\u00fcr die (ex post) Analyse und (ex ante) Vorhersage sehr gewinnbringend einsetzen kann.<\/p>\n<p>Vergleichbare Ergebnisse k\u00f6nnen mit Standard-Statistikprogrammen idR. gar nicht, oder aber nur \u00fcber extremen Zeitaufwand errechnet werden. Konkrete Anwendungsbeispiele gibt es f\u00fcr nahezu jedes Unternehmen \u2013 auch f\u00fcr Ihres! Aus der Erfahrung l\u00e4sst sich dabei festhalten, dass der durch Data Mining generierte <strong>Mehrwert<\/strong> steigt, je nicht-trivialer und \u201e\u00fcberraschender\u201c die Ergebnisse sind, da Ihnen diese Erkenntnisse wichtige relative <strong>Wettbewerbsvorteile<\/strong> sichern k\u00f6nnen.<\/p>\n<p>Im Gegensatz zu einfacheren, schwerpunktm\u00e4\u00dfig linear arbeitenden Statistikprogrammen nutzt Data-Mining (bei Easy.Data.Mining im Hintergrund, f\u00fcr den Anwender verborgen) einen komplexen, multivariaten Ansatz. Data-Mining-Ergebnisse werden dabei u.a. in <strong>Muster oder Cluster<\/strong> eingeteilt, welche sehr unterschiedliche Kombinationen von Charakteristika aufweisen k\u00f6nnen.<\/p>\n<p>Als fiktives, <strong>anschauliches Initialbeispiel<\/strong> des Data-Mining k\u00f6nnte man hier eine KfZ-Versicherung sehen, die mit Data-Mining-Software feststellt, dass Kunden mit der Kombination \u201erotes Autos + Haustier + Berufgruppe XYZ\u201c deutlich weniger Unf\u00e4lle verursachen, w\u00e4hrend es ein zweites (wohlgemerkt anders geartetes Kunden-Cluster) gibt, in welchem deutlich mehr Unf\u00e4lle verursacht werden, und welches (offensichtlich anders) charakterisiert ist durch die Kombination \u201eHausnr. kleiner 23 + Alter gr\u00f6\u00dfer 35 + Familienstand ledig\u201c.<\/p>\n<p>Im Gegensatz zu herk\u00f6mmlichen Statistik-Programmen errechnet <strong>Data-Mining<\/strong> also <strong>in nur einem Vorgang<\/strong> die relevanten <strong>Treiber-Attribute f\u00fcr alle Cluster\/ Muster<\/strong> \u2013 welche in aller Regel <strong>ungleich (und damit viel wertvoller)<\/strong> sind als die Gesamtdurchschnittsbetrachtung einer statistischen Untersuchung der Gesamtdatenmenge.<\/p>\n<p>Eine zugleich elegante und sehr praktische Eigenschaft von Data-Mining-Programmen wie Data.Mining.Fox ist, dass die <strong>Qualit\u00e4t der mathematischen Vorhersagen mit Ihren eigenen Daten getestet<\/strong> werden kann \u2013 und zwar noch bevor Sie einen potenziell risikoreichen Feldversuch starten m\u00fcssen. Dazu wird das Vorhersagemodel mit einem Teil Ihrer historischen Daten berechnet, und dann auf einen zweiten Teil Ihre Daten angewandt (f\u00fcr welchen Sie die Ergebnisse zun\u00e4chst \u201everstecken\u201c). Sie k\u00f6nnen dann die berechneten Ergebnisse mit den Ihnen vorliegenden (\u201eversteckten\u201c) Realergebnissen vergleichen.<\/p>\n<p>Mithilfe von Data-Mining kann man also allgemein formuliert valide <strong>(ex-post) Analysen<\/strong> bzw. <strong>(ex-ante) Modelle f\u00fcr Vorhersagen<\/strong> erstellen, welche f\u00fcr ein beliebiges (Ziel-) Attribut (in obigem Bsp. die Schadensklasse) die relativen Abh\u00e4ngigkeiten der anderen Attribute berechnet \u2013 bzw. umgekehrt betrachtet: Data-Mining berechnet, durch welche Kombination von Attributen das Zielattribut bestimmt wird, und mit welcher Wahrscheinlichkeitsauspr\u00e4gung das Zielattribut in jedem Muster\/ Cluster eine bestimmte Auspr\u00e4gung annehmen wird.<\/p>\n<p><strong>Funktionsweise des Data Mining<\/strong><br \/>\nIn der Praxis kann man Data-Mining anschaulich anhand von einfachen, exemplarischen Datentabellen erkl\u00e4ren: Wenn man eine Tabelle hat, in der jede Zeile f\u00fcr einen Datensatz (der z.B. jeweils einen Kunden beschreibt) und jede Spalte f\u00fcr ein Attribut steht, so kann man ein Modell erstellen f\u00fcr die Vorhersage eines bestimmten Ziel-Attributs auf der Basis der restlichen Gr\u00f6\u00dfen.<\/p>\n<p>Beispiel:<\/p>\n<table border=\"1\">\n<tbody>\n<tr>\n<td><strong>Kunden-Nr.<\/strong><\/td>\n<td><strong>Einkommen<\/strong><\/td>\n<td><strong>Familienstand<\/strong><\/td>\n<td><strong>eigene Immobilie<\/strong><\/td>\n<td><strong>Kundenwert<\/strong><\/td>\n<\/tr>\n<tr>\n<td>0001<\/td>\n<td><strong>2700<\/strong><\/td>\n<td>ledig<\/td>\n<td>ja<\/td>\n<td>210<\/td>\n<\/tr>\n<tr>\n<td>0002<\/td>\n<td><strong>3600<\/strong><\/td>\n<td>verheiratet<\/td>\n<td>nein<\/td>\n<td>320<\/td>\n<\/tr>\n<tr>\n<td>0003<\/td>\n<td><strong>2400<\/strong><\/td>\n<td>verwitwet<\/td>\n<td>ja<\/td>\n<td>190<\/td>\n<\/tr>\n<tr>\n<td>\u2026<\/td>\n<td><strong>\u2026<\/strong><\/td>\n<td>\u2026<\/td>\n<td>\u2026<\/td>\n<td>.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Nach der Erstellung eines Vorhersagemodells f\u00fcr das Attribut \u201aKundenwert\u2018 kann man Vorhersagen erstellen f\u00fcr Kunden, von denen man a-priori nur die ersten drei Spaltenwerte kennt.<\/p>\n<p>Im Data-Mining k\u00f6nnen Tabellenspalten als Attribute sowohl Zahlenwerte als auch Texte enthalten. Au\u00dferdem sind Daten in der Praxis h\u00e4ufig unvollst\u00e4ndig. <strong>Leere Tabellenfelder ber\u00fccksichtigt Data.Mining.Fox<\/strong> aber auf eine mathematisch korrekte Art und Weise <strong>automatisch<\/strong>, das vorherige Ersetzen leerer Tabellenfelder durch den Benutzer ist daher nicht n\u00f6tig. Dadurch ist unser Data-Mining-Programm sehr geeignet f\u00fcr Datentabellen, wie sie in der Praxis auftreten: sehr gro\u00df, aber nicht immer in 100%iger Qualit\u00e4t.<\/p>\n<p>Das Data-Mining unterscheidet zwischen zwei Arten von Vorhersagemodellen:<\/p>\n<ol>\n<li><strong>Klassifikationsmodelle<\/strong>: diese Vorhersagemodelle entstehen, wenn die vorherzusagende Spalte <strong>nicht-numerische<\/strong> Werte enth\u00e4lt.<\/li>\n<li><strong>Regressionsmodelle<\/strong>: diese entstehen typischerweise, wenn die vorherzusagende Spalte <strong>numerische<\/strong> Werte enth\u00e4lt.<\/li>\n<\/ol>\n<p>Beispiele bezogen auf obige Datentabelle:<\/p>\n<table border=\"1\">\n<tbody>\n<tr>\n<td><\/td>\n<td><strong>vorherzusagende Spalte:<\/strong><\/td>\n<td><strong>die Vorhersage ergibt:<\/strong><\/td>\n<\/tr>\n<tr>\n<td><strong>Klassifikation:<\/strong><\/td>\n<td>\u201aeigene Immobilie\u2018<\/td>\n<td>Wahrscheinlichkeiten f\u00fcr \u201aja\u2018 und \u2019nein\u2018<\/td>\n<\/tr>\n<tr>\n<td><strong>Regression:<\/strong><\/td>\n<td>\u201aKundenwert\u2018<\/td>\n<td>eine Zahl<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>FAQ:<\/p>\n<p>?\u00a0\u00a0 Brauche ich als Anwender Data-Mining-Vorkenntnisse?<br \/>\n&gt;\u00a0\u00a0 Sie werden es kaum glauben m\u00f6gen \u2013 aber die Antwort hei\u00dft nein! Ein gesundes analytisches Verst\u00e4ndis in Kombination mit der in unsere Data.Mining.Fox\u00ae Software eingebauten Dokumentation, sowie ein hinreichendes Verst\u00e4ndis Ihrer Unternehmensdaten reichen bei Data.Mining.Fox\u00ae aus.<\/p>\n<p>?\u00a0\u00a0 Jemand hat mir gesagt, dass ich vor dem Gebrauch von Data-Mining-Software eine hohe Datenqualit\u00e4t sicherstellen muss \u2013 am besten via gro\u00df angelegtem Datenqualit\u00e4ts-Projekt und Data Warehouse-Aufbau. Stimmt das?<br \/>\n&gt;\u00a0\u00a0 Nein, nicht zwinged. Beide Projekte machen durchaus Sinn, kosten aber viel Geld und Zeit. Data.Mining.Fox\u00ae bietet hier integrierte und v.a. auch automatisierte Funktionalit\u00e4ten, die z.B. selbst bei fehlenden Datenfeldern valide Resultate erm\u00f6glichen \u2013 und zwar ohne jeweils alle fehlerhaften Datens\u00e4tze ganz zu verwerfen (d.h. die verbliebene Information fehlerhafter Datens\u00e4tze wird bestm\u00f6glich ber\u00fccksichtigt).<\/p>\n<p>?\u00a0\u00a0 Muss ich Daten vor der Anwendung von Data.Mining.Fox\u00ae mittels Skalierung oder Sampling bearbeiten, um z.B. auszugleichen, dass manche Felder gro\u00dfe und andere sehr kleine Werte enthalten, oder dass ich von einem Zielwert eine Auspr\u00e4gung A (z.B. Nicht-K\u00e4ufer) ganz oft und eine Auspr\u00e4gung B (K\u00e4ufer) viel seltener habe?<br \/>\n&gt;\u00a0\u00a0 Nein, das \u00fcbernimmt Data.Mining.Fox\u00ae ganz automatisch. Und im Gegenteil: mit der manuellen Daten-Manipulation w\u00fcrden Sie u.U. sogar die Ergebnisse massiv verf\u00e4lschen.<\/p>\n<p>? \u00a0 Ich habe geh\u00f6rt, dass ich gar nicht alle Daten mittels Data-Mining analysieren darf, selbst wenn ich Sie in meiner Datenbank gespeichert habe \u2013 das kann doch nicht sein, oder?<br \/>\n&gt; \u00a0 Doch! Sie sollten sich gut erkundigen, welche Daten Ihrer Kunden o.\u00e4. Sie in welcher Weise analysieren d\u00fcrfen. Das h\u00e4ngt im einzelnen davon ab, in welchem Land Sie unter welchen AGB wann mit wem wie zu den Daten gekommen sind. Daten sollten auf alle F\u00e4lle frei von pers\u00f6nlichen Daten und Informationen sein. Die Daten sollten lediglich in anonymisierter oder pseudonymisierter Form vorliegen damit Sie nicht gegen Datenschutz-Richtlinien und -Gesetze versto\u00dfen. Wir empfehlen Ihnen, sich im Zweifel rechtlich von einem Experten in Sachen Datenschutz beraten zu lassen.<\/p>\n<p>? \u00a0 Ist der Algorithmus hinter Data.Mining.Fox\u00ae der beste, den es gibt?<br \/>\n&gt;\u00a0\u00a0 Das m\u00f6chten wir so nicht behaupten. Wenn man die Resourcen Zeit, Geld und Personal nicht ber\u00fccksichtigt, dann lassen sich selbst ohne Data-Mining-Software hervorragende Ergebnisse errechnen. \u00dcberall da, wo aber eine oder mehrere dieser Resourcen knapp sind, erbringt der Algorithmus von Easy.Data.Mining&#x2122; sehr gro\u00dfe Vorteile im Hinblick auf die Qualit\u00e4t der Ergebnisse, welche Sie in wenig Zeit und geringem Aufwand erzielen k\u00f6nnen. Ein impliziter Vorteil ist dabei, dass sich hinter Data.Mining.Fox\u00ae nicht nur einer, sondern mehrere mathematische Konstrukte befinden, welche Ihnen die Aufgabe abnehmen, den besten Algorithmus f\u00fcr Ihr jeweiliges Problem selbst zu suchen.<\/p>\n<p>?\u00a0\u00a0 Was verbirgt sich hinter dem Algorithmus der Easy.Data.Mining&#x2122;?<br \/>\n&gt;\u00a0\u00a0 Data.Mining.Fox\u00ae nutzt eine intelligente Kombination aus multivariatem Ansatz, Entscheidungsb\u00e4umen und genetischen Algorithmen \u2013 unser GMDT&#x2122; (Genetic Multivariate Decision Trees). Dieses Kern-Prinzip wird durch weitere Kritierien erg\u00e4nzt \u2013 z.B. durch Schutzfaktoren gegen Over-Fitting, Konfidenzberechnungen, usw.<\/p>\n<p>? \u00a0 Kann ich die Windows-Version von Data.Mining.Fox\u00ae auch auf einer VM (Virtual Machine) laufen lassen?<br \/>\n&gt;\u00a0\u00a0 Ja. Zu beachten ist dabei u.a. nur, dass z.B. bei einer Windows-Version von Data.Mining.Fox\u00ae auf einer VM eines Apple Mac nicht auf die Java-Version von Mac zugegriffen werden kann, d.h. der Java-Ordner (z.B. \u201ejre1.6.0\u201c f\u00fcr Windows) muss in den Installations-Ordner kopiert werden (oder es muss alternativ Java f\u00fcr Windows komplett installiert werden). Au\u00dferdem kommt es bisweilen zu einer Fehlermeldung, die beim Start besagt, dass MSVCR71.dll nicht gefunden werden kann; um dieses Windows-Problem zu beheben (Anm.: dies hat nichts mit Easy.Data.Mining&#x2122; zu tun), muss diese dll aus dem Internet heruntergeladen werden und in den Ordner Windows\/System32 kopiert werden.<\/p>\n<p>?\u00a0\u00a0 Bei allen diesen tollen M\u00f6glichkeiten bei Easy.Data.Mining&#x2122; kann ich also mit dem einfach bedienbaren Programm Data.Mining.Fox\u00ae alle meine unternehmerischen Probleme l\u00f6sen, oder?<br \/>\n&gt;\u00a0\u00a0 Leider nicht ganz. Auch bei den besten Programmen sitzt ein wesentlicher Teil der Intelligenz weiterhin vor dem Computer: Ihre Mitarbeiter. Data.Mining.Fox\u00ae kann hier weit mehr automatisieren als viele andere Produkte, aber wenn ohne analytisches Verst\u00e4ndis und v.a. ohne ein Verst\u00e4ndnis f\u00fcr Ihr Gesch\u00e4ftsdaten vorgegangen wird, dann kann es auch mit Data.Mining.Fox\u00ae u.U. zu falschen Entscheidungen kommen.<\/p>\n<p>?\u00a0\u00a0 Wir vermissen die Produkteigenschaft XYZ in Data.Mining.Fox\u00ae \u2013 k\u00f6nnen Sie uns hier unkompliziert helfen?<br \/>\n&gt; \u00a0 Wir sind f\u00fcr solche Vorschl\u00e4ge immer sehr dankbar. Und wenn es sich um ein Feature handelt, welches ein vern\u00fcnftiges Verh\u00e4ltnis von Aufwand und Mehrwert aufweist und f\u00fcr andere Anwender sinnvoll ist, werden wir uns umgehend an die Umsetzung machen. Sollte es etwas Ausgefallenes sein, werdem wir zusammen mit Ihnen aber bestimmt trotzdem eine L\u00f6sung finden, die Ihnen weiterhilft.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Fussball Ergebnis Vorhersagen mittels Data MiningSinn &amp; Zweck des Data Mining: Beim Data Mining geht es darum, aus gro\u00dfen Datenmengen (versteckte, nicht triviale) Zusammenh\u00e4nge abzuleiten, die man f\u00fcr die (ex post) Analyse und (ex ante) Vorhersage sehr gewinnbringend einsetzen kann. Vergleichbare Ergebnisse k\u00f6nnen mit Standard-Statistikprogrammen idR. gar nicht, oder aber nur \u00fcber extremen Zeitaufwand errechnet &hellip; <a href=\"http:\/\/dataminingsoccer.com\/de\/unsere-analyse\/was-ist-data-mining\/\" class=\"more-link\"><span class=\"screen-reader-text\">Was ist Data Mining?<\/span> weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":3,"featured_media":0,"parent":156,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v14.8 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<meta name=\"robots\" content=\"index, follow\" \/>\n<meta name=\"googlebot\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<meta name=\"bingbot\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"http:\/\/dataminingsoccer.com\/de\/unsere-analyse\/was-ist-data-mining\/\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebSite\",\"@id\":\"http:\/\/dataminingsoccer.com\/de\/#website\",\"url\":\"http:\/\/dataminingsoccer.com\/de\/\",\"name\":\"Fu\\u00dfball-Ergebnis-Vorhersagen\",\"description\":\"basierend auf statistischen Analysen mittels Data-Mining.. Wir lieben Fu\\u00dfball! Wir lieben Zahlenspiele!\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":\"http:\/\/dataminingsoccer.com\/de\/?s={search_term_string}\",\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"de\"},{\"@type\":\"WebPage\",\"@id\":\"http:\/\/dataminingsoccer.com\/de\/unsere-analyse\/was-ist-data-mining\/#webpage\",\"url\":\"http:\/\/dataminingsoccer.com\/de\/unsere-analyse\/was-ist-data-mining\/\",\"name\":\"Was ist Data Mining? - Fu\\u00dfball-Ergebnis-Vorhersagen\",\"isPartOf\":{\"@id\":\"http:\/\/dataminingsoccer.com\/de\/#website\"},\"datePublished\":\"2018-05-16T23:21:35+00:00\",\"dateModified\":\"2018-05-17T06:04:01+00:00\",\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"http:\/\/dataminingsoccer.com\/de\/unsere-analyse\/was-ist-data-mining\/\"]}]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","_links":{"self":[{"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/pages\/4036"}],"collection":[{"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/comments?post=4036"}],"version-history":[{"count":4,"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/pages\/4036\/revisions"}],"predecessor-version":[{"id":4054,"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/pages\/4036\/revisions\/4054"}],"up":[{"embeddable":true,"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/pages\/156"}],"wp:attachment":[{"href":"http:\/\/dataminingsoccer.com\/de\/wp-json\/wp\/v2\/media?parent=4036"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}